學習nlp方法大致可以分為二種。
第一種,在實踐中學習,找一個特定的任務,譬如文本分類、情感分析等。然后以做好任務為導向的去挖掘和這一個任務相關的知識點。由于沒有系統的學習,肯定會遇到各種各樣的攔路虎問題,當遇到不懂的概念時,利用百度/谷歌查閱相關資料去理解學習這個概念,若是概念難懂,就多看不同的人對這些概念的理解,有的時候有些人能深入淺出的講解一些很不錯的資料,個人覺得這種有目的性的實踐學習方式學來的東西更加印象深刻。
這樣也在潛移默化中鍛煉了個人能力(獨立查找資料/文獻是一種極其重要的能力),又能達成某些目的。這樣過了一段時間之后,好像懂很多東西了,但是好像又有很多方面不了解,其實這就是在某個點有點深度了,但是廣度還不夠。
如果此時有大把閑置的時間,就可以去刷刷那些不錯的系統性課程,刷課的時候會發現很多概念理解起來輕松多了,或者說似曾相識(理解的知識點又得到了復習并再次確認自己的理解了的知識點和這些老師講的是否一致)。
第二種,就是一上來就是刷課刷書,把理論什么的都梳理一遍,然后根據課程把課后作業都敲一遍并且理解。
這樣系統的學習雖然會花上很長的時間,但是也會讓你對知識體系有個全面的認識,之后你再進去某個小點(比如文本分類等)的深入探索,會發現很多東西都理解學習過。
其實你已經有了知識的廣度,但是對某個點的知識深度還欠缺,此時就按需深挖即可,當然,這個過程肯定也不輕松。
其實這二種學習方法我覺得都挺不錯,根據自身具體情況具體分析,交叉使用,效果應該更佳。現在回過頭來看,我之前的學習方法更像第一種。
最近想從頭開始學一些基礎知識,以查漏補缺,所以收集了一大波不錯的資料,作為新年大禮包送給初學者們,往下看,你想要的都在后面,記得看完免費的贊來一個喲!!!
編程語言
初學者推薦python,安裝方法可以選擇純python安裝也可以選擇Anaconda方式安裝。IDE推薦pycharm。
此外,強烈推薦初學者使用jupyter來學習代碼,感覺真的超級贊。
對于新手應該如何學python,個人覺得最重要的是寫,排除那種特別優秀的人,相信大部分人都可以歸入到我亦無他,唯手熟爾。因此前期的代碼量是必不可少的,即使在不熟悉的語法情況下對著敲也不失為一種不錯的方法,總而言之,要敲,要實踐,從而達到手熟。
有人會問,那我一開始敲什么呢?初學者建議把python基本語法敲一遍,可以配合jupyter,這樣可以很方便的敲完一個方法就能實時運行展示效果。然后敲一些基礎的python包的基本用法,譬如最基本的numpy、pandas、matlibplot三劍客。
個人建議一開始沒必要對里面的每個方法都去深究,這樣做會很費時而且可能正反饋也不大,把簡單的基本的用法敲幾遍熟悉,在這個過程中,要慢慢鍛煉一種能力:碰到問題能夠獨立通過百度/谷歌解決。以后會發現這種能力尤為重要。
自然語言處理初學者首先要了解熟悉nlp領域的基本術語、任務定義以及一些基本算法,前期可以結合一些不錯的工具實踐,比如經典的jieba、hanlp、snownlp、stanfordcorenlp、spaCy、pyltp、nltk、textblob、gensim、scikit-learn等,以及最近的pkuseg、flair等等。通過這些熟悉比如任務的輸入輸出、評價指標以及應用場景等等。
書籍推薦
個人覺得從頭到尾的看書對于初學者來說不太友好,但是必備的工具書放在手邊經常查閱是必不可少的。比如周志華老師的西瓜書《機器學習》、李航的《統計學習方法》、宗成慶的《統計自然語言處理》以及花書《Deep Learning》等等。另外一些比較有意思的書譬如《數學之美》也可以讀讀,通俗易懂的語言會讓你對這個領域產生興趣,最后推薦一本培養機器學習思維的書《Machine Learning Yearning》。
-
算法
+關注
關注
23文章
4607瀏覽量
92835 -
python
+關注
關注
56文章
4792瀏覽量
84627 -
nlp
+關注
關注
1文章
488瀏覽量
22033
原文標題:強推 | 學習自然語言處理(NLP)的學習方法和資料合集
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論