如果你是一個數據科學的求職者,那么你一定想知道在你的簡歷上應該寫些什么技能會有更大的概率接到面試。如果你想進入這個領域,你可能已經多次想要知道哪些技術可以成為一個有吸引力的候選人。
本篇將告訴你答案。
作為熱門語言,Python成為機器學習工程師的首選語言并不令人驚訝。此外,由于需要從頭開始實現算法并在大數據環境中部署ML模型,因此C ++和Scala等相關語言也很重要。 總的來說,與其他兩個角色相比,語言的需求似乎更加分散。總的來說,機器學習工程師的主要語言是:Python,Scala,Java,C ++,Lua,SQL,Javascript,Matlab,CSS和C#。
▍成為一名數據工程師,SQL是必須的技能
數據工程師常常處理數據庫,而SQL是數據庫的語言,所以SQL是數據工程師必備的語言。Python雖然很重要,但對于數據工程師而言,Scala和Java更為重要,因為這些語言可以幫助他們處理更大的數據。
總的來水,數據工程師的主要語言是:SQL,Scala,Java,Python和Lua。
▍Scala是數據科學中第二大進口語言
當我們對比不同的角色時,驚奇的發現,Scala不是第二個就是第三個。 所以我們可以說數據科學中的前三種語言是Python,SQL和Scala。如果你正在考慮學習一門新語言,也可以考慮使用Scala。
▍Spark是除數據工程師之外的首選大數據技能
僅對于數據工程師而言,Hadoop比Spark更多,但總的來說,Spark絕對是首先應該學習的大數據框架。Cassandra對工程師而言比科學家更重要,而Storm似乎只與數據工程師有關。
總的來說,數據科學的大數據技術是:Spark,Hadoop,Kafka,Hive。
▍TensorFlow是深度學習的王者
數據工程師的職位描述中幾乎沒有提到深度學習框架,因此該角色幾乎是不需要DL框架的。而更多使用DL框架的是機器學習工程師,這表明了機器學習工程師更多地是處理機器學習建模,而不僅僅是部署模型。另外,TensorFlow在深度學習的領域中是占據著主導地位的。盡管Keras作為高級深度學習框架在數據科學家中也是非常受歡迎的,但它幾乎與機器學習工程師沒什么關系,這也表明ML從業者們大多都使用較低級別的框架,比如TensorFlow。
總的來說,數據科學中最重要的幾個深度學習框架是:TensorFlow,Torch,Caffee,MXNet。
▍AWS是云計算平臺的主導
▍計算機視覺是機器學習中大部分需求的來源
對于一般數據科學家而言,自然語言處理是最大的ML應用領域,其次是計算機視覺,語音識別,欺詐檢測和推薦系統。但對于機器學習工程師而言,最大的需求卻來自計算機視覺,而自然語言處理則一直是第二。另一方面,不論是計算機視覺還是自然語言處理,與數據工程師都沒什么關系。
如果你想成為一個數據科學家,可以選擇各種類型的項目,根據你想要進入的領域展示專業知識,但對于機器學習工程師而言,計算機視覺則是最佳選擇。
▍Tableau是必會的可視化工具
可視化工具主要是數據科學家所需要的,很少會有人提到數據工程師和機器學習工程師。 盡管如此,Tableau可是說是所有角色的首選。但對于數據科學家而言,Shiny,Matplotlib,ggplot和Seaborn也同樣得重要。
▍每個人都必須會Git,而Docker僅適用于工程師
下面,我們將使用詞云來探索上面提到的每個角色最常用的一些關鍵詞,然后結合相應的技能為所有數據科學角色構建理想的描述。
▍數據科學家:更關注機器學習
數據科學家一直被視為需要統計,分析,機器學習和商業知識的全方位專業。然而,現在從詞云比重看來,數據科學家們更多地關注機器學習而不是其他的一些東西。
▍機器學習工程師:研究,系統設計和構建的
與數據科學家相比,機器學習工程師會有一個更集中的組合,包括研究,設計和工程。顯然,解決方案,產品,軟件和系統是主要的主題。當然,伴隨著這些,有研究,算法,ai,深度學習和計算機視覺。從詞云看出,商業,管理,客戶等術語也很重要,這可以在項目的進一步迭代中進一步研究。
▍數據工程師才是真正的專家
與機器學習工程師相比,數據工程師擁有更加專注的產品組合。顯然,重點是通過設計和開發pipelines來支持產品,系統和解決方案。 對于數據工程師來說,比較高的要求包括了專業技能,數據庫,測試,環境和質量。機器學習也同樣很重要,因為pipelines主要用于支持機器學習模型部署數據需求。
▍Python現在是數據科學的首選語言
有很多人爭論:Python和R,哪個是數據科學的首選語言。市場需求報告告訴我們Python是現代的領導者。同樣值得注意的是,R比SAS更少提及。因此,如果您正在考慮進入數據科學,可以將你的學習重點放在Python上。而SQL作為數據庫語言,是數據科學家第二重要的語言。 由于數據科學家職業的廣泛性,其他語言也扮演著重要角色。
總的來說,數據科學家的主要語言是:Python,SQL,Scala,Lua,Java,SAS,R,C ++和Matlab。
結語
這就是數據科學技能分析的全部了??戳吮酒嘈趴梢詭椭懔私庹衅刚吒⒅厥裁醇寄埽钪匾氖强梢詭椭阕龀鲇嘘P如何定制簡歷和學習哪些技術的決策。
-
SQL
+關注
關注
1文章
767瀏覽量
44175 -
機器學習
+關注
關注
66文章
8424瀏覽量
132766 -
python
+關注
關注
56文章
4798瀏覽量
84810
原文標題:數據科學大佬的簡歷上都有哪些技能?
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論