毫無(wú)疑問(wèn),數(shù)據(jù)科學(xué)如今已經(jīng)成為并將持續(xù)是最熱門(mén)的職業(yè)選擇領(lǐng)域,很多人一個(gè)猛子扎進(jìn)了這一領(lǐng)域當(dāng)中。但是,這個(gè)21世紀(jì)最熱門(mén)的職業(yè)并不一定適合所有人,這不是說(shuō)數(shù)據(jù)科學(xué)不值得,恰恰相反它幾乎就是為了解決實(shí)際問(wèn)題而生的。
當(dāng)然啦,本文僅代表作者觀點(diǎn),可能存在一定偏頗。不同國(guó)家地區(qū)的職業(yè)設(shè)置以及各人掌握的技能存在差異,因而每個(gè)人看世界的角度都不一樣。我只從我的經(jīng)驗(yàn)和角度聊聊我的想法。
入行以來(lái),筆者每天花費(fèi)10到12小時(shí)在數(shù)據(jù)科學(xué)領(lǐng)域中,撰寫(xiě)了將近100篇相關(guān)文章,自認(rèn)為已有資格對(duì)這個(gè)領(lǐng)域里的某些現(xiàn)象發(fā)表一點(diǎn)見(jiàn)解,那些現(xiàn)象令人失望卻鮮有人提及。對(duì)筆者而言,實(shí)用數(shù)據(jù)科學(xué)是最有趣的領(lǐng)域之一,尤其是在進(jìn)一步深入學(xué)習(xí)之后更有體會(huì)。
然而,為了數(shù)據(jù)科學(xué)而從事數(shù)據(jù)科學(xué)的意義何在呢?這么說(shuō)吧,除非是研究人員,否則全職從事這個(gè)行業(yè)幾乎沒(méi)有任何意義。花費(fèi)大量時(shí)間訓(xùn)練模型的理由何在呢?模型會(huì)被應(yīng)用在網(wǎng)頁(yè)和/或者手機(jī)app中嗎?是會(huì)被用來(lái)解決一些實(shí)際問(wèn)題嗎?還是只會(huì)被閑置在電腦上呢?
數(shù)據(jù)科學(xué)似乎正在成為軟件開(kāi)發(fā)的另一個(gè)分支。這不見(jiàn)得是壞事,現(xiàn)如今模型訓(xùn)練和優(yōu)化(只要用對(duì)工具)幾乎全部都是自動(dòng)化的,而“數(shù)據(jù)科學(xué)家”需要做的,僅僅是以恰當(dāng)?shù)姆绞綔?zhǔn)備數(shù)據(jù),以及向上級(jí)匯報(bào)工作。
這或許是件好事,你有了更多時(shí)間去做有趣的事情,從而交付整個(gè)數(shù)據(jù)包并實(shí)際解決問(wèn)題,而不會(huì)將模型閑置在電腦上。
但是,如果計(jì)劃在這個(gè)領(lǐng)域謀求一份全職工作,請(qǐng)先讀一讀本文,看看行業(yè)光鮮外表下的其它方面,了解進(jìn)入這個(gè)行業(yè)的優(yōu)勢(shì)和可能存在的劣勢(shì)是很有必要的。
1.不關(guān)心業(yè)務(wù)
先說(shuō)明一下,除了在Medium和TDS上發(fā)表博文以外,筆者還是一個(gè)全職的數(shù)據(jù)科學(xué)家。筆者所就職的公司并不專(zhuān)門(mén)從事于數(shù)據(jù)科學(xué)的某個(gè)分支,僅僅是一家以咨詢(xún)?yōu)橹鞯腎T公司。
這意味著筆者并不專(zhuān)注于一個(gè)項(xiàng)目或一個(gè)產(chǎn)品,而是同時(shí)推進(jìn)三到五個(gè)不同行業(yè)的不同項(xiàng)目。是的,筆者并不精通于那些行業(yè)里的任何一個(gè)。這可能是很多人不喜歡數(shù)據(jù)科學(xué)工作的原因,你對(duì)所工作的領(lǐng)域了解不多,從業(yè)者也并不愿意去學(xué)習(xí)那么多東西。
不過(guò),對(duì)于某些在相關(guān)領(lǐng)域從事數(shù)據(jù)科學(xué)的人而言,情況可能并非如此。假設(shè)一個(gè)人已經(jīng)在X領(lǐng)域接受了專(zhuān)業(yè)教育,并且對(duì)數(shù)學(xué)和統(tǒng)計(jì)學(xué)掌握得不錯(cuò),因而被聘用在該領(lǐng)域里從事大量重?cái)?shù)據(jù)型工作,這就皆大歡喜了。
我所指的是通才型數(shù)據(jù)科學(xué)家,就是那種從一個(gè)項(xiàng)目轉(zhuǎn)移到另一個(gè)項(xiàng)目工作,但是感覺(jué)自己從來(lái)沒(méi)有做出實(shí)際貢獻(xiàn)的人。
2.缺乏全局觀
這個(gè)缺點(diǎn)對(duì)數(shù)據(jù)科學(xué)領(lǐng)域的通才和專(zhuān)家都適用。
假設(shè)有某個(gè)項(xiàng)目團(tuán)隊(duì)的app需要“數(shù)據(jù)科學(xué)魔法”的加持,于是邀請(qǐng)了一位數(shù)據(jù)科學(xué)家參加會(huì)議。這位數(shù)據(jù)科學(xué)家一定會(huì)被問(wèn)到這些問(wèn)題:
· 你的模型可以做到這點(diǎn)嗎?
· 這些現(xiàn)代神經(jīng)網(wǎng)絡(luò)可以用在10KB的數(shù)據(jù)集上嗎?
· 你能只用30行數(shù)據(jù)做一個(gè)預(yù)測(cè)模型嗎?
這就是問(wèn)題所在了。在完全不了解項(xiàng)目及其架構(gòu)的情況下,就必須很快提供一個(gè)最先進(jìn)的解決方案,也就是所謂的全局觀問(wèn)題。
對(duì)于專(zhuān)家型數(shù)據(jù)科學(xué)家可能還沒(méi)那么麻煩,因?yàn)樗麄冎辽倬邆淞四承╊I(lǐng)域的專(zhuān)業(yè)知識(shí),并且了解如何去適應(yīng)全局,這使他們能夠相對(duì)輕松地完成工作。
3.老板是商人
外行領(lǐng)導(dǎo)內(nèi)行這件事很容易鬧出一些荒謬的困難。如果你的上級(jí)不是數(shù)據(jù)相關(guān)領(lǐng)域的專(zhuān)家,那么他們對(duì)于數(shù)據(jù)科學(xué)的了解與任何一個(gè)普通人從新聞里了解到的沒(méi)什么兩樣。
不過(guò),這個(gè)問(wèn)題帶來(lái)的影響大小在不同的國(guó)家是不同的,畢竟不同國(guó)家的工作和生活文化可能存在很大差距。
而這帶來(lái)了一個(gè)潛在的問(wèn)題,團(tuán)隊(duì)可能接到一項(xiàng)任務(wù),其研究工作需要數(shù)月才能完成,但是從商業(yè)角度來(lái)說(shuō)這不太可行。理想的情形是,部門(mén)主管能夠理解特定解決方案所需要的時(shí)間之長(zhǎng)和工作量之大,然后在上一級(jí)那邊幫忙交流疏通,但這樣的主管可遇而不可求。
這時(shí)就是良好的人際交往能力派上用場(chǎng)的時(shí)候了。給你的老板解釋清楚為什么花一兩個(gè)月去搜查100項(xiàng)用不上的東西,這不是一件輕松愉快的事情,但掌握人際交往和項(xiàng)目展示的技巧可能會(huì)讓局面更好一點(diǎn)。
在筆者看來(lái),只有在有實(shí)際問(wèn)題需要解決時(shí),只深耕于數(shù)據(jù)科學(xué)和預(yù)測(cè)建模的全職數(shù)據(jù)科學(xué)家才有立足之地。歸根結(jié)底,數(shù)據(jù)科學(xué)只是一種技能,不應(yīng)用于解決業(yè)務(wù)問(wèn)題就毫無(wú)價(jià)值。如果不關(guān)心相關(guān)業(yè)務(wù),或者僅僅是不了解業(yè)務(wù)情況,都可能讓工作無(wú)法順利開(kāi)展。
所以,是否要入行,還請(qǐng)你三思。
-
自動(dòng)化
+關(guān)注
關(guān)注
29文章
5592瀏覽量
79387 -
模型
+關(guān)注
關(guān)注
1文章
3255瀏覽量
48905 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
165瀏覽量
10076
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論