Github 上有許多成熟的 PyTorch NLP 代碼和模型, 可以直接用于科研和工程中。本文介紹其中一下 Star 過千的時下熱點項目。
AllenNLP 2504 Star
AllenNLP,是AI2公司家的開源項目,致力于成為 PyTorch 下 NLP 算法研究和實現(xiàn)的全能平臺。AllenNLP 的設計理念是: 模塊化和輕量級。它將 NLP中個各種需求進行了非常好的封裝,包括:padding, masking 等等。特別的,AllenNLP 對實驗非常友好,實驗流程和參數(shù)有Json文件配置,并行、重現(xiàn)完全不是問題,而且每一步都有豐富的 log 記錄你想記錄的一切。
AllenNLP 自身實現(xiàn)了包括:命名實體識別、語義角色標注、閱讀理解在內(nèi)的多種常用算法。AllenNLP是由艾倫人工智能研究所(Allen Institute for Artificial Intelligence)與華盛頓大學(University of Washington)和其他機構(gòu)的研究人員密切合作建立和維護的。
DrQA 2374 Star
https://github.com/facebookresearch/DrQA
DrQA 是 facebook 開源的開放式閱讀理解智能問答算法。原論文發(fā)布在 ACL2016上, 名字是:Reading Wikipedia to Answer Open-Domain Questions
鏈接:
http://www.zhuanzhi.ai/paper/ec2483da392a7e054eeb0f0a58d3ddee。
DrQA是一個用于閱讀理解的系統(tǒng),適用于開放領(lǐng)域的問答。特別是,DrQA致力于解決大規(guī)模機器閱讀理解。在這種情況下,算法在一個非常大的非結(jié)構(gòu)化文檔語料庫中尋找問題的答案。因此,系統(tǒng)必須將文檔檢索(查找相關(guān)文檔)與文本的機器理解(識別來自這些文檔的答案)結(jié)合起來。
faieseq 1711 Star
https://github.com/pytorch/fairseq
fairseq是facebook 開源的一個序列建模工具包,而并不是單純的某個模型的實現(xiàn)。
它允許研究人員和開發(fā)人員為機器翻譯、自動摘要、語言模型和其他文本生成任務訓練自定義模型。它提供了各種Seq2seq 的模型的實現(xiàn),包括:
Convolutional Neural Networks (CNN)
Dauphin et al. (2017): Language Modeling with Gated Convolutional Networks
Gehring et al. (2017): Convolutional Sequence to Sequence Learning
NewEdunov et al. (2018): Classical Structured Prediction Losses for Sequence to Sequence Learning
NewFan et al. (2018): Hierarchical Neural Story Generation
Long Short-Term Memory (LSTM) networks
Luong et al. (2015): Effective Approaches to Attention-based Neural Machine Translation
Wiseman and Rush (2016): Sequence-to-Sequence Learning as Beam-Search Optimization
Transformer (self-attention) networks
Vaswani et al. (2017): Attention Is All You Need
NewOtt et al. (2018): Scaling Neural Machine Translation
OpenNMT-py 1558 Star
https://github.com/OpenNMT/OpenNMT-py
OpenNMT 全稱是Open Source Neural Machine Translation in PyTorch(PyTorch 開源神經(jīng)翻譯模型), 致力于研究促進新idea 在神經(jīng)翻譯,自動摘要,看圖說話,語言形態(tài)學和許多其他領(lǐng)域的發(fā)展。
作為自動翻譯的平臺型項目, OpenNMT 當然也支持各種文本數(shù)據(jù)預處理,包括各種 RNN 單元,各種 attention機制,花式日志,語音轉(zhuǎn)文本,看圖說話等等。
DeepNLP-models-Pytorch 1256 Star
https://github.com/DSKSD/DeepNLP-models-Pytorch
最后,給大家介紹的是DeepNLP-models in PyTorch。這個庫,是韓國的Kim Sungdong同學,在看完 CS224的課后,用 PyTorch 將其中的模型都實現(xiàn)了一遍, 包括:
-
人工智能
+關(guān)注
關(guān)注
1800文章
48083瀏覽量
242156 -
GitHub
+關(guān)注
關(guān)注
3文章
476瀏覽量
16856 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22228 -
pytorch
+關(guān)注
關(guān)注
2文章
808瀏覽量
13501
原文標題:GitHub獲贊過千:PyTorch 自然語言處理項目Top 5
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
目前常用的自然語言處理開源項目/開發(fā)包大匯總
分享幾個在GitHub上嵌入式相關(guān)的開源項目
通過Cortex來非常方便的部署PyTorch模型
2018 年 2 月份 GitHub 上最熱門的開源項目
NLP-Progress庫NLP的最新數(shù)據(jù)集、論文和代碼
Leap Motion公布了一款開源AR頭顯原型設計Project North Star
PyTorch版《動手學深度學習》開源了
NLP 2019 Highlights 給NLP從業(yè)者的一個參考
10月份GitHub上最熱門的Python開源項目上榜詳情
GitHub 40K Star工程師求職記分享
2020年11月Github上最熱門的11個開源項目

關(guān)于OCR 你想了解的可能都在這兒了

那些年在pytorch上踩過的坑

RT-Thread 新里程碑達成——GitHub Star 破萬!

評論