隨著互聯(lián)網(wǎng)事業(yè)的蓬勃發(fā)展,編程語言越來越火爆。Java編程工程師收入高、業(yè)內(nèi)需求量大,備受人們青睞。不過隨著大數(shù)據(jù)的爆發(fā),很多Java工程師想抓住這一趨勢,轉(zhuǎn)型大數(shù)據(jù)方向。那么,Java程序員轉(zhuǎn)大數(shù)據(jù)工程師容易嗎?該如何學(xué)習(xí)呢?
Java程序員轉(zhuǎn)大數(shù)據(jù)工程師有很好的基礎(chǔ)條件
對于Java程序員,大數(shù)據(jù)的主流平臺hadoop是基于Java技術(shù)開發(fā)的,所以Java程序員往大數(shù)據(jù)開發(fā)方向轉(zhuǎn)行從語言環(huán)境上更為順暢,另外很多基于大數(shù)據(jù)的應(yīng)用框架也是Java的,所以在很多大數(shù)據(jù)項目里Java語言的確是可以派上用場的。所以,Java程序員轉(zhuǎn)大數(shù)據(jù)工程師是具備很好的基礎(chǔ)條件的。
當(dāng)然,hadoop核心價值在于提供了分布式文件系統(tǒng)和分布式計算引擎,對于大部分公司而言,并不需要對這個引擎進(jìn)行修改。這時候除了熟悉編程,你通常還需要學(xué)習(xí)數(shù)據(jù)處理和數(shù)據(jù)挖掘的一些知識。尤其是往數(shù)據(jù)挖掘工程師方向發(fā)展,則你需要掌握更多的工具和知識。
Java程序員轉(zhuǎn)大數(shù)據(jù)職位的學(xué)習(xí)路線圖:
第一步:分布式計算框架
掌握 hadoop和spark分布式計算框架,了解文件系統(tǒng)、消息隊列和Nosql數(shù)據(jù)庫,學(xué)習(xí)相關(guān)組件如hadoop、MR、spark、hive、hbase、redies、kafka等;
第二步:算法和工具
學(xué)習(xí)了解各種數(shù)據(jù)挖掘算法,如分類、聚類、關(guān)聯(lián)規(guī)則、回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等,熟練掌握一門數(shù)據(jù)挖掘編程工具:Python或者Scala。目前主流平臺和框架已經(jīng)提供了算法庫,如hadoop上的Mahout和spark上的Mllib,你也可以從學(xué)習(xí)這些接口和腳本語言開始學(xué)習(xí)這些算法。
第三步:數(shù)學(xué)
補充數(shù)學(xué)知識:高數(shù)、概率論和線代
第四步:項目實踐
1、開源項目:tensorflow:Google的開源庫,已經(jīng)有40000多個star,非常驚人,支持移動設(shè)備;
2、參加數(shù)據(jù)競賽:Kaggle和國內(nèi)天池數(shù)據(jù)競賽
3、通過企業(yè)實習(xí)獲取項目經(jīng)驗
如果你僅僅是做大數(shù)據(jù)開發(fā)和運維,則可以跳過第二步和第三步,如果你是側(cè)重于應(yīng)用已有算法進(jìn)行數(shù)據(jù)挖掘,那么第三步也可以先跳過。
總結(jié):
Java工程師可以更容易理解hadoop的框架和生態(tài),很多大數(shù)據(jù)saas級產(chǎn)品也是Java技術(shù)開發(fā)的,因此Java基礎(chǔ)是轉(zhuǎn)行大數(shù)據(jù)的一個很好的起點。但大數(shù)據(jù)是一個更為寬廣的領(lǐng)域,具有跨界知識和能力的人才會更受企業(yè)青睞。隨著人工智能時代的到來,大數(shù)據(jù)將迎來黃金發(fā)展的10年,如果你已經(jīng)做好準(zhǔn)備,那么就立即開始行動吧!
-
工程師
+關(guān)注
關(guān)注
59文章
1569瀏覽量
68504 -
JAVA
+關(guān)注
關(guān)注
19文章
2966瀏覽量
104702 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8882瀏覽量
137401
發(fā)布評論請先 登錄
相關(guān)推薦
評論