此處我們暫且不論文科生,理科生工科生課程大多在大一會(huì)有高等數(shù)學(xué)和線性代數(shù)兩門課,機(jī)器學(xué)習(xí)大約需要多少數(shù)學(xué)知識(shí)呢?個(gè)人覺得如果你是想從事機(jī)器學(xué)習(xí)算法基層工作,偏做數(shù)學(xué)學(xué)術(shù)的同學(xué),你可以本科兩年左右把高代、數(shù)分這些主干課過一遍,至于大三的一些實(shí)分析、復(fù)分析、泛函實(shí)變這些,個(gè)人覺得機(jī)器學(xué)習(xí)極少用到這些,當(dāng)然也可能是我程度還不夠深入,我的建議是大家不要浮躁地一開始就拿著代碼開始擼項(xiàng)目,但是也不要讀成書呆子,大家一定要明白一個(gè)觀點(diǎn),如果你不想成為陳景潤(rùn)那樣的數(shù)學(xué)家,大可不必花上大把時(shí)間在各種各樣的數(shù)學(xué)專業(yè)書上。那么回到我們的問題機(jī)器學(xué)習(xí)到底需要多少數(shù)學(xué)知識(shí)呢?從我個(gè)人學(xué)習(xí)經(jīng)驗(yàn),鄙人在學(xué)校大約學(xué)過高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、概率論與數(shù)理統(tǒng)計(jì)這四門主干課,平均分大約在88分左右,至于為什么平均分沒上95,是因?yàn)閷?shí)在是懶得復(fù)習(xí)每本書那一章背的讓人頭疼的公式,機(jī)器學(xué)習(xí)需要的數(shù)學(xué)大約是高數(shù)微分積分思想那塊(泰勒展開可以好好復(fù)習(xí)復(fù)習(xí))、線性代數(shù)基礎(chǔ)書加上部分求導(dǎo)(矩陣的跡這些)、概率論與數(shù)理統(tǒng)計(jì)(貝葉斯看看,然后是分布那塊),這幾塊內(nèi)容實(shí)在在這幾本書算是基本內(nèi)容了,很簡(jiǎn)單。之前見過一些,有的可能會(huì)說這些操作在現(xiàn)在流行的平臺(tái)都有許多包能用巴拉巴拉的,但是不要忘了我們雖然不是“造房子”的人,但是最基本的一些東西還是希望同學(xué)們?cè)趯W(xué)習(xí)的過程中去證明證明。在已有比較好的數(shù)學(xué)基礎(chǔ)上去看機(jī)器學(xué)習(xí)的算法會(huì)輕松很多,也解決了部分同學(xué)一心趴倒在數(shù)學(xué)坑里的問題(執(zhí)著于數(shù)學(xué)的科研小伙伴請(qǐng)忽略我這一大段話,統(tǒng)計(jì)學(xué)大佬惹不起)。
好啦,以上就是機(jī)器學(xué)習(xí)在數(shù)學(xué)方面的要求。接下來我們可以愉快地學(xué)習(xí)機(jī)器學(xué)習(xí)啦。
這里我說說我的入門,一開始很榮幸一個(gè)大佬給我講了機(jī)器學(xué)習(xí)一些思想,順便安利了我輩楷模Andrew ng,一開始在網(wǎng)易云看了一遍帶massac的視頻,憋的不要不要,很多地方一知半解,練習(xí)也較少,看完之后懵懵懂懂吧,當(dāng)時(shí)是邊刷周志華老師的西瓜書(這個(gè)不必說了吧,另一個(gè)大佬,據(jù)說最近評(píng)上了ieee fellow的亞洲主席來著),當(dāng)時(shí)大約是大二上學(xué)期結(jié)束后的寒假,痛并快樂著。過了一段時(shí)間,朋友圈另外一個(gè)大佬alexa哈哈,瘋狂在刷coursera,抱著萌新心態(tài)一搜,不得了哇(coursera為ng所創(chuàng)立),然后不知不覺刷完了stanford的ml課程,并做完了所有練習(xí)。做的同時(shí)二刷周志華老師的西瓜書,痛并快樂著。
不得不說ml博大精深,看了很久很久,我發(fā)現(xiàn)自己還是停留在學(xué)習(xí)階段,也就是怎么說,在有的人看來屌屌的,但是實(shí)際上讓我立馬接一個(gè)項(xiàng)目,感覺壓力山大啊。這時(shí)候我打開的B乎,手動(dòng)滑稽臉,發(fā)現(xiàn)李航老師的《統(tǒng)計(jì)學(xué)習(xí)方法》,這個(gè)評(píng)價(jià)不是一般的好,繼續(xù)買書刷書,刷完感覺數(shù)學(xué)功底理解上升了一個(gè)層次。以上書籍都很安利的。后來alexa大佬在刷華盛頓大學(xué)的ml課程,據(jù)說也很nice,但是課程量太大加上后來國家某局狂搞vpn,沒得看,算是小遺憾了。
刷完統(tǒng)計(jì)學(xué)習(xí)方法對(duì)不對(duì),不得不再吹一句,機(jī)器學(xué)習(xí)也是大學(xué)科,類別是真的多。轉(zhuǎn)眼到大二下學(xué)期的暑假,看大佬無聊的時(shí)候演示一波R的文本分詞,著實(shí)歡喜,自學(xué)了一波R語言(ps那時(shí)的我執(zhí)著于用octave處理一切問題),美滋滋。當(dāng)然我繼續(xù)搜淘寶,淘到一本機(jī)器學(xué)習(xí)實(shí)踐,看來是harrinton大佬寫的,很nice帶源碼,小伙伴們刷起吧,不解釋,不過這本書沒刷完因?yàn)槠渌恍╉?xiàng)目耽誤了。(python也是真滴好用,當(dāng)然包這一塊強(qiáng)推anaconda,conda指令有些坑處我自己慢慢爬出來的,有問題的同學(xué)可以留言)。
搞了一波事情,發(fā)覺無聊了,這時(shí)候來了本深度學(xué)習(xí),還是yoshia bengio大佬,別說了,再貴都買,目前刷了五章, 一直炒現(xiàn)飯,我給自己本科要求是不玩深度學(xué)習(xí),但是進(jìn)來了還是看看吧,就是玩玩,沒指望自己能玩轉(zhuǎn)卷積這些,只是看看。近期什么狀態(tài)呢,(⊙o⊙)…
其實(shí)從暑假后期開始,我重心轉(zhuǎn)向托福了,打算年底刷一波分,然后再投入到令人向往的事業(yè)來hhhh,不過現(xiàn)在看起來又要重新進(jìn)坑了。兩個(gè)教授給我發(fā)出申請(qǐng),給研究生講講我的學(xué)習(xí)方法交流交流,maybe已經(jīng)走在大部分人前面,現(xiàn)在是想劃水劃不動(dòng)了,每周跟著一幫研究生開組會(huì),過起了研究生+本科生雙重生活。文中如有冒犯請(qǐng)別跟小人一般見識(shí),現(xiàn)在是大三狗了,只能劃兩年,出國跟著某苦逼導(dǎo)師消耗自己兩三年的生命投身科研吧,當(dāng)然就是說說,有大佬帶就好,現(xiàn)在處于不想自己帶隊(duì)的狀態(tài),手上有一手資源,但是不想用23333,感謝讓我再休息一陣子哈哈哈哈,勞模下線了。如果想了解細(xì)節(jié)可以留言,我有時(shí)間有想法了可以不定期更新一兩波干貨。鄙人愛好較多,歡迎找我打橋牌啊之類的,棋現(xiàn)在不想約了,小提琴處于想拉就拉的狀態(tài),為bigbang著迷的程序猿,balabala當(dāng)日記寫著玩哈哈。
感謝大學(xué)兩年以來幫助過我的學(xué)長(zhǎng)學(xué)姐們,感謝我最親愛的honey,沒錯(cuò)就是你呀!
忘了怎么打分割線了,姑且這樣湊合吧。出去交換了一波準(zhǔn)大四來補(bǔ)全一下。(不知道算不算畫蛇添足2333)
之前說的大約是需要不是很多的數(shù)學(xué)就能開干,但是要知道很多東西看起來不難,但是越深入是越難的。對(duì)于想做機(jī)器學(xué)習(xí)(AI大類)相關(guān)的同學(xué)要明白自己有什么資源,自己想達(dá)到什么程度,自己想做什么。上學(xué)期出去交換一學(xué)期,期間零零碎碎做了網(wǎng)絡(luò)+嵌入式的app項(xiàng)目,也做了一些GAN相關(guān)的東西,聽了幾位業(yè)界蠻有名的大牛講座。思路太多下面慢慢整理(最近刷GRE也順帶繼續(xù)刷toefl真是累)。
如果你是大一/大二同學(xué),請(qǐng)好好學(xué)習(xí)數(shù)學(xué)的同時(shí)刷完李航的《統(tǒng)計(jì)學(xué)習(xí)方法》,(最近大家都在看,似乎是國內(nèi)院校神書)這本書蠻薄的,前前后后因?yàn)閷?shí)習(xí)各種事詳細(xì)看了好幾遍,至今也不敢說自己完全都會(huì),甚至前兩天和一個(gè)研究生學(xué)長(zhǎng)討論一下把我問住了,只能說這本書中許多問題需要深入思考:為什么要用這個(gè)方法、這個(gè)方法為什么好、這個(gè)方法還能用在哪里。其實(shí)在平時(shí)學(xué)習(xí)與看書這件事不沖突。
還有幾本實(shí)踐書,《python實(shí)踐》大約是這么寫,harrington寫的,主要是基礎(chǔ)算法的實(shí)例。然后是《tensorflow深度學(xué)習(xí)框架》這本是科大學(xué)長(zhǎng)安利,出到了第二版,也挺不錯(cuò)。實(shí)踐書,算法書都挺不錯(cuò),同類型多看看也差不多了,主要提高coding和對(duì)這些問題的思考,比如這些算法背后的一些哲學(xué)思想(開玩笑2333)。
至于周老師的西瓜書,可以當(dāng)作reference之類的看,里面工程內(nèi)容也很多,如果有能力(看完李航老師書的前提下)跳過算法部分,專注工程的一些trick。還有一點(diǎn)是不管用什么方法,coding是要有的,我的blog基本上囊括了machine learning的一些基本算法。當(dāng)然了,等你看完這幾本,其實(shí)你還沒入門。。。
哈哈,當(dāng)然是騙你的,如果你弄透了,基本在ml這塊就沒問題,可以繼續(xù)進(jìn)階啦。這里你可以有很多基礎(chǔ)的東西要看,比如CNN對(duì)不對(duì),CNN基礎(chǔ)的論文大概二十篇左右,我在我的blog有詳細(xì)列出了其中比較重要的條目以及閱讀意見。然后是RNN呀LSTM呀RF呀FPGA呀GAN呀這些,當(dāng)然我沒羅列完,大約就是各種網(wǎng)絡(luò)模型,再加上各種優(yōu)化方法,當(dāng)然還有純convex流派,這個(gè)大大大佬應(yīng)該是都會(huì)的,頂會(huì)上再厲害的東東也是有數(shù)學(xué)那么些東西的,籠統(tǒng)來說就是你這里哪里加了個(gè)function,然后這樣optimize就很好,然后證明兩頁略這種。這些論文加起來大約200篇左右,最好是能實(shí)現(xiàn)一些,然后實(shí)操一些。
同時(shí)比賽也可以玩玩呀,ACM,阿里的,kaggle上的都不錯(cuò),可以拿得出手,鍛煉鍛煉。(當(dāng)然還有JData,TX社交網(wǎng)絡(luò),攜程滴滴這些)還有數(shù)學(xué)建模之類,以及各種互聯(lián)網(wǎng)+之類的比賽水水。PS數(shù)學(xué)建模玩的好真能保送北大,因?yàn)閲愂菚?huì)排名的,隔壁寢就保了。(當(dāng)然ACMworld final也能保,同實(shí)驗(yàn)室的學(xué)長(zhǎng)15final打了世界30多吧,毅然決然放棄博,感覺他考個(gè)toefl就能上MIT,后來去了pony投奔樓教主,稅后嘿嘿嘿)學(xué)校211弱渣,碰巧大牛還是有的。
還有些別類例如R, scala, swift 這些語言也是相關(guān)。whatever, 語言只是工具據(jù),當(dāng)然也有各自擅長(zhǎng)吧,如果非要選一個(gè)當(dāng)然是r了,對(duì)初學(xué)者或者是外系同學(xué)比較友好(學(xué)好英文自然懂R語言qaq),據(jù)我所知數(shù)學(xué)和經(jīng)濟(jì)大類一般都是用r語言做分析(在***交換的舍友一天到晚用r做高維數(shù)據(jù)的證明,coding估計(jì)比我還多)。除了計(jì)算機(jī)外,時(shí)間序列也很不錯(cuò),之前做過很久的經(jīng)濟(jì)方面的東西,但是苦于沒有學(xué)計(jì)量經(jīng)濟(jì)學(xué),所以后面arma, arima, garch這些都學(xué)的很艱難,當(dāng)然也發(fā)現(xiàn)LSTM也不是總是好用,用time series的方法也不見得就比新的方法差多少,差的是修仙調(diào)參罷了。
總之就是這么多,本科發(fā)paper還是比較難。(我指的是CVPR,emmm以及稍微比CVPR低一些的IEEE子會(huì)的一些)因?yàn)殡S便水水真的不好哇,雖然感覺CVPR也挺多灌水嫌疑文章,雖然我們寫不出來,但是你仔細(xì)看多了,水不水難道看不出嘛,評(píng)價(jià)水不水大約就是別人用起來爽不爽(引用量)、對(duì)社會(huì)效益大不大(會(huì)不會(huì)有公司看中你請(qǐng)你帶實(shí)驗(yàn)室去賺錢)。當(dāng)然了做AI感覺最好還是碩士往上走,但是讀碩士肯定得拿出來論文,雖然很多學(xué)校要求不高,但是你得想清楚競(jìng)爭(zhēng)力在哪兒。paper可能你在學(xué)校更有環(huán)境發(fā)(如果能去滴滴實(shí)驗(yàn)室or)
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8408瀏覽量
132573
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論