方向是自然語言處理的同學們有福啦,為了跟蹤自然語言處理(NLP)的進展,有大量仁人志士在 Github 上維護了一個名為 NLP-Progress 的庫。它記錄了幾乎所有NLP任務的 baseline 和 標準數據集,同時還記錄了這些問題的state-of-the-art。
Github
https://github.com/sebastianruder/NLP-progress
官方網址
https://nlpprogress.com/
整理報道
huaiwen
NLP-Progress 同時涵蓋了傳統的NLP任務,如依賴解析和詞性標注,和一些新的任務,如閱讀理解和自然語言推理。它的不僅為讀者提供這些任務的 baseline 和 標準數據集,還記錄了這些問題的state-of-the-art。
下面小編簡單列舉了幾個NLP-Progress 記錄的任務:
Coreference resolution 共指消解
Dependency parsing 依存分析
Dialogue 對話
Domain Adaption 領域遷移
Entity Linking 實體鏈接
Language modeling 語言模型
Machine translation 機器翻譯
Multi-task learning 多任務學習
Multi-modal 多模態
Named entity recognition 命名實體是被
Natural language inference 自然語言推理
Part-of-speech tagging 詞性標注
Question answering 問答
Relation prediction 關系預測
Relationship extraction 關系抽取
Semantic textual similarity 語義文本相似性
Semantic parsing 語義分析
Semantic role labeling 語義角色標注
Sentiment analysis 情感分析
Summarization 文本照耀
Taxonomy learning 分類結構學習
Temporal processing 時序分析
Text classification 文本分類
Word sense disambiguation 詞義消岐
。。。
。。。
對于每一個任務,NLP-Progress都會簡單介紹一下這個任務是做什么的,并詳細列出公開的標準數據集,以及在該數據集上各個模型目前的排名情況。比如,比較火的Question answering 問答系統任務,它的組織形式如下:
具體到某一個開放數據集,如 Quasar, 貢獻者會簡單介紹該數據集的組成,然后列出論文排行榜,其中每一行都包括:模型,效果,文章名和鏈接,以及代碼鏈接。
還等什么,趕緊去 Star一下。
-
代碼
+關注
關注
30文章
4780瀏覽量
68529 -
數據集
+關注
關注
4文章
1208瀏覽量
24690 -
nlp
+關注
關注
1文章
488瀏覽量
22033
原文標題:NLP-Progress記錄NLP最新數據集、論文和代碼: 助你緊跟NLP前沿
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論