色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師能合二為一嗎?

倩倩 ? 來(lái)源:IT168 ? 2020-07-25 10:17 ? 次閱讀

越來(lái)越多的企業(yè)關(guān)注AI,企業(yè)組織也意識(shí)到擁有相關(guān)人才和技能非常重要。特別是最近對(duì)AI、機(jī)器學(xué)習(xí)(ML)、非ML預(yù)測(cè)分析和“大數(shù)據(jù)”的應(yīng)用,使得數(shù)據(jù)科學(xué)家的需求有了顯著的增長(zhǎng),未來(lái)還將繼續(xù)。事實(shí)上,對(duì)數(shù)據(jù)科學(xué)家的巨大需求導(dǎo)致許多企業(yè)和組織出現(xiàn)了人才短缺,然而,80%的AI項(xiàng)目與數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)工程有關(guān),也許企業(yè)組織應(yīng)該尋找更多的數(shù)據(jù)工程師而不是數(shù)據(jù)科學(xué)家?

許多企業(yè)、供應(yīng)商和初創(chuàng)企業(yè)常常混淆數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,雖然二者有相似之處,但是其工作內(nèi)容有很大不同,其中包含兩個(gè)迥異的技能,魚(yú)與熊掌不易兼得。

數(shù)據(jù)科學(xué)家vs數(shù)據(jù)工程師

在2000年代中期,數(shù)據(jù)科學(xué)家職位開(kāi)始出現(xiàn),O’Reilly在文章中提到:“對(duì)數(shù)據(jù)科學(xué)家需求的增長(zhǎng)是由大型互聯(lián)網(wǎng)公司驅(qū)動(dòng)的。谷歌、Facebook、LinkedIn和亞馬遜都以創(chuàng)造性地使用數(shù)據(jù)而聞名:不僅僅是儲(chǔ)存數(shù)據(jù),還將其轉(zhuǎn)化為價(jià)值。毫無(wú)疑問(wèn),任何希望從數(shù)據(jù)中獲得價(jià)值的企業(yè)組織都在關(guān)注數(shù)據(jù)科學(xué)和數(shù)據(jù)科學(xué)家。

數(shù)據(jù)科學(xué)家起源于統(tǒng)計(jì)建模和數(shù)據(jù)分析的發(fā)展,具有高級(jí)數(shù)學(xué)和統(tǒng)計(jì)、高級(jí)分析以及越來(lái)越多的機(jī)器學(xué)習(xí)/人工智能的背景。毫無(wú)疑問(wèn),數(shù)據(jù)科學(xué)家的重點(diǎn)是數(shù)據(jù)科學(xué),也就是說(shuō),如何從海量數(shù)據(jù)中提取有用的信息,以及如何將業(yè)務(wù)和科學(xué)信息需求轉(zhuǎn)化為信息和數(shù)學(xué)語(yǔ)言。為了能從海量信息中獲得見(jiàn)解,數(shù)據(jù)科學(xué)家需要掌握統(tǒng)計(jì)學(xué)、概率、數(shù)學(xué)和算法知識(shí)。這些數(shù)據(jù)科學(xué)家通常只是為了運(yùn)行程序、對(duì)數(shù)據(jù)進(jìn)行高級(jí)分析這類特定需要而學(xué)習(xí)編程,因此,數(shù)據(jù)科學(xué)家通常只寫最少最簡(jiǎn)易的代碼,能完成數(shù)據(jù)科學(xué)任務(wù)以及提供干凈的數(shù)據(jù)進(jìn)行分析即可。數(shù)據(jù)科學(xué)家創(chuàng)建假設(shè),對(duì)數(shù)據(jù)進(jìn)行測(cè)試和分析,然后將其結(jié)果以便于查看和理解的形式呈現(xiàn)給組織中的其他人。

但是如果沒(méi)有大量的干凈數(shù)據(jù),數(shù)據(jù)科學(xué)家就無(wú)法完成自身工作。提取、清理和移動(dòng)數(shù)據(jù)實(shí)際上并不是數(shù)據(jù)科學(xué)家的職責(zé),而是數(shù)據(jù)工程師的職責(zé)。數(shù)據(jù)工程師擁有編程、技術(shù)方面的專業(yè)知識(shí),以前曾參與過(guò)數(shù)據(jù)集成、中間件、分析、業(yè)務(wù)數(shù)據(jù)門戶和ETL操作。數(shù)據(jù)工程師的重心和技能集中在大數(shù)據(jù)和分布式系統(tǒng)上,可以使用JavaPython、Scala等編程語(yǔ)言腳本工具,擁有技術(shù)經(jīng)驗(yàn)。數(shù)據(jù)工程師面臨的挑戰(zhàn)是如何從各種各樣的系統(tǒng)中獲取結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),解決不“干凈”的數(shù)據(jù)例如字段缺失、數(shù)據(jù)類型不匹配等與數(shù)據(jù)相關(guān)的問(wèn)題。數(shù)據(jù)工程師要使用編程、集成、體系結(jié)構(gòu)和系統(tǒng)技能來(lái)清理所有數(shù)據(jù),并將其放入一種格式和系統(tǒng)中,然后數(shù)據(jù)科學(xué)家就可以使用該格式和系統(tǒng)來(lái)分析、建立數(shù)據(jù)模型并為組織提供價(jià)值。數(shù)據(jù)工程師的角色就是設(shè)計(jì)、構(gòu)建和安排數(shù)據(jù)的工程師。

數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師能合二為一嗎?

雖然數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的角色似乎截然不同,但數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師有許多共同的特點(diǎn)和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對(duì)系統(tǒng)操作的總體熟練程度。

盡管有很多共性重疊的部分,但是數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的工作重點(diǎn)仍有差異,因此不太可能兩個(gè)角色合二為一。更重要的是,在招聘數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師時(shí),要確保問(wèn)對(duì)了問(wèn)題,從候選人身上找到正確的技能。

更重要的是,隨著數(shù)據(jù)科學(xué)興起的代碼學(xué)院、研討會(huì)和培訓(xùn)班引出了新問(wèn)題:這些培訓(xùn)和代碼學(xué)院的重點(diǎn)是數(shù)據(jù)科學(xué)背后的科學(xué),還是數(shù)據(jù)工程背后的工程、編程,更糟的是,這些活動(dòng)是否只是泛泛研究了一點(diǎn)囫圇吞棗地教學(xué)而混淆了細(xì)分的需求,比如應(yīng)該關(guān)注大數(shù)據(jù)和ML分析的哪些領(lǐng)域?

雖然看起來(lái)您可以在科學(xué)角色中做一點(diǎn)工程工作,或者在工程角色中做一點(diǎn)科學(xué)工作,但是混合角色可能會(huì)不利于企業(yè)組織在ML或數(shù)據(jù)科學(xué)的成功。那些被迫從事數(shù)據(jù)工程工作而沒(méi)有相關(guān)背景、技能或資質(zhì)的數(shù)據(jù)科學(xué)家很容易錯(cuò)誤配置、誤用技術(shù),或者編寫效率低、成本高、浪費(fèi)時(shí)間的程序。同樣地,要求從根本上具有工程背景的人學(xué)習(xí)復(fù)雜的數(shù)據(jù)科學(xué)數(shù)學(xué),可能會(huì)導(dǎo)致組織對(duì)其信息得出錯(cuò)誤的結(jié)論,產(chǎn)生災(zāi)難性結(jié)果。專業(yè)化是很重要的,好比醫(yī)生要做檢查,抽血師負(fù)責(zé)抽血。醫(yī)生可以為你抽血,抽血師可以了解化驗(yàn)結(jié)果,但你為什么要拿自己的舒適和健康去冒險(xiǎn)呢?

數(shù)據(jù)科學(xué)家在企業(yè)組織中處于什么位置?

為了從數(shù)據(jù)中獲得價(jià)值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學(xué)和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實(shí)。企業(yè)組織可能需要多個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對(duì)于大多數(shù)企業(yè)組織來(lái)說(shuō),擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學(xué)家更有意義。因?yàn)閿?shù)據(jù)科學(xué)家已經(jīng)學(xué)會(huì)處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對(duì)數(shù)據(jù)集運(yùn)行分析相比,移動(dòng)和清理數(shù)據(jù)的工作量更大。

此外,數(shù)據(jù)科學(xué)家在企業(yè)組織應(yīng)該向誰(shuí)報(bào)告可能是錯(cuò)的,有的數(shù)據(jù)科學(xué)家向技術(shù)團(tuán)隊(duì)報(bào)告,這是沒(méi)有意義的。數(shù)據(jù)科學(xué)家通常不會(huì)詢問(wèn)特定技術(shù)的實(shí)施和數(shù)據(jù)分析,其所面臨的挑戰(zhàn)特定的業(yè)務(wù)線。因此,數(shù)據(jù)科學(xué)家應(yīng)該向業(yè)務(wù)戰(zhàn)略決策相關(guān)人員報(bào)告。

有以業(yè)務(wù)為中心的工具嗎?

如果數(shù)據(jù)科學(xué)和數(shù)據(jù)工程確實(shí)是組織中獨(dú)立的角色,那么將它們所需的工具應(yīng)該是分開(kāi)的。許多進(jìn)入數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)領(lǐng)域的供應(yīng)商正在混淆視聽(tīng),使事情變得更加混亂。他們聲稱工具是為數(shù)據(jù)科學(xué)家準(zhǔn)備的,但是其一切主要功能和特性都是為數(shù)據(jù)工程師準(zhǔn)備的,在上面點(diǎn)綴一些數(shù)據(jù)科學(xué)的特性是沒(méi)有意義的。對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō),需要一個(gè)分析的、面向數(shù)據(jù)的、以模型為中心的工具,而不是在數(shù)據(jù)清理、移動(dòng)數(shù)據(jù)和將數(shù)據(jù)從私有環(huán)境遷移到云環(huán)境等方面的工具。這就像給一個(gè)駕駛教練一輛車的零件,然后說(shuō):“自己造這輛車,然后教別人如何駕駛它。”

數(shù)據(jù)科學(xué)家需要的是以數(shù)據(jù)科學(xué)為中心的工具,而不是以工程和編程為中心的工具。現(xiàn)在,這些工具越來(lái)越多,讓數(shù)據(jù)科學(xué)家可以進(jìn)行數(shù)據(jù)挖掘或預(yù)測(cè)分析。然而,隨著數(shù)據(jù)科學(xué)家越來(lái)越深入業(yè)務(wù)領(lǐng)域,以業(yè)務(wù)為中心的工具是更合適的,例如,幾十年前,如果您希望以類似電子表格的格式操作大量數(shù)據(jù),這就涉及到編程,但是像Excel這樣的工具引入了數(shù)據(jù)透視表這樣的東西,現(xiàn)在業(yè)務(wù)經(jīng)理能夠執(zhí)行各種分析。Excel等工具將數(shù)據(jù)科學(xué)功能或以業(yè)務(wù)為中心的數(shù)據(jù)挖掘和分析工具嵌入到產(chǎn)品中只是時(shí)間問(wèn)題。

隨著數(shù)據(jù)科學(xué)家的人才缺口繼續(xù)擴(kuò)大,新的工具將會(huì)出現(xiàn),這些工具是為了允許非技術(shù)人員(即業(yè)務(wù)人員)運(yùn)行、測(cè)試和分析數(shù)據(jù)而創(chuàng)建的,戰(zhàn)略業(yè)務(wù)經(jīng)理將開(kāi)始學(xué)習(xí)數(shù)據(jù)科學(xué),數(shù)據(jù)科學(xué)家仍然需要運(yùn)行非常復(fù)雜的數(shù)據(jù)分析工具。然而,隨著越來(lái)越多易用工具的出現(xiàn),大多數(shù)情況下基本分析將更多地轉(zhuǎn)移到業(yè)務(wù)方。企業(yè)中ML和數(shù)據(jù)科學(xué)相關(guān)工具和技術(shù)也越來(lái)越大有可為。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 工程師
    +關(guān)注

    關(guān)注

    59

    文章

    1569

    瀏覽量

    68504
  • 數(shù)據(jù)科學(xué)

    關(guān)注

    0

    文章

    165

    瀏覽量

    10053
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這點(diǎn)在西湖大學(xué)的科研項(xiàng)目中已得到體現(xiàn)。 成立于2018年的西湖大學(xué)是由施公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵(lì)科學(xué)家們探索AI與各學(xué)科交叉融
    的頭像 發(fā)表于 12-12 15:59 ?153次閱讀
    西湖大學(xué):<b class='flag-5'>科學(xué)家</b>+AI,科研新范式的樣本

    硬件工程師入門的基礎(chǔ)元器件知識(shí)

    概述了IGBT在電力轉(zhuǎn)換中的重要角色及其發(fā)展。 硬件工程師入門基礎(chǔ)知識(shí) ()基礎(chǔ)元器件認(rèn)識(shí)() tips:學(xué)習(xí)資料和數(shù)據(jù)來(lái)自《硬件工程師
    的頭像 發(fā)表于 12-10 10:19 ?480次閱讀
    硬件<b class='flag-5'>工程師</b>入門的基礎(chǔ)元器件知識(shí)

    使用MATLAB培養(yǎng)醫(yī)療人工智能領(lǐng)導(dǎo)者和增強(qiáng)工程課程

    全球各地的高校都在使用 MATLAB 和 Simulink 開(kāi)展教學(xué)與科研,幫助未來(lái)的工程師科學(xué)家掌握未來(lái)世界工程項(xiàng)目與科學(xué)研究所要求的重要能力。讓我們
    的頭像 發(fā)表于 10-31 16:37 ?266次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    和數(shù)量直接影響到模型的準(zhǔn)確性和可靠性。因此,數(shù)據(jù)獲取、處理、分析和質(zhì)量控制在AI for Science中至關(guān)重要。此外,數(shù)據(jù)驅(qū)動(dòng)的研究范式也促使科學(xué)家從傳統(tǒng)的假設(shè)驅(qū)動(dòng)轉(zhuǎn)向更加靈活和開(kāi)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    如何激發(fā)科學(xué)家的創(chuàng)新思維。AI不僅僅是工具,更是種思維方式,它鼓勵(lì)我們跳出傳統(tǒng)框架,以數(shù)據(jù)驅(qū)動(dòng),探索未知。這種思維方式的轉(zhuǎn)變,不僅促進(jìn)了科學(xué)
    發(fā)表于 10-14 09:12

    小米手機(jī)部工程師榮獲國(guó)家技術(shù)發(fā)明獎(jiǎng)等獎(jiǎng)

    日前,全國(guó)科技大會(huì)、國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)大會(huì)、兩院院士大會(huì)在北京召開(kāi)。大批貢獻(xiàn)卓越的科學(xué)家和標(biāo)志性成果獲得了國(guó)家科技獎(jiǎng)勵(lì)。其中,我們也有位小米人帶著作品參與到了其中,并獲得了國(guó)家級(jí)獎(jiǎng)項(xiàng)
    的頭像 發(fā)表于 08-16 10:39 ?665次閱讀

    創(chuàng),1:1復(fù)刻工程師的職場(chǎng)現(xiàn)狀

    工程師
    揚(yáng)興科技
    發(fā)布于 :2024年07月19日 18:30:07

    新華社:突破性成果!祝賀我國(guó)科學(xué)家成功研發(fā)這傳感器!

    6月25日,新華社以《突破性成果!祝賀我國(guó)科學(xué)家標(biāo)題,報(bào)道了由我國(guó)科學(xué)家研發(fā)的傳感器成果。 我國(guó)科學(xué)家研發(fā)高通道神經(jīng)探針實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè) 神經(jīng)探針是
    的頭像 發(fā)表于 06-27 18:03 ?485次閱讀
    新華社:突破性成果!祝賀我國(guó)<b class='flag-5'>科學(xué)家</b>成功研發(fā)這<b class='flag-5'>一</b>傳感器!

    前OpenAI首席科學(xué)家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因?yàn)樘K茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學(xué)家,并在去年在OpenAI董事會(huì)上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?520次閱讀

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    嵌入式軟件工程師和硬件工程師的區(qū)別? 嵌入式軟件工程師 嵌入式軟件工程師是軟件開(kāi)發(fā)領(lǐng)域中的種專業(yè)工程師
    發(fā)表于 05-16 11:00

    谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?486次閱讀

    飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào)

    ? ? ?飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào) 1月19日上午,首屆 “國(guó)家工程師獎(jiǎng)” 表彰大會(huì)在北京人民大會(huì)堂隆重舉行。81 名個(gè)人被授予 “國(guó)家卓越工程師” 稱號(hào),50
    的頭像 發(fā)表于 01-19 19:22 ?1715次閱讀
    飛騰首席<b class='flag-5'>科學(xué)家</b>竇強(qiáng)榮獲 “國(guó)家卓越<b class='flag-5'>工程師</b>” 稱號(hào)
    主站蜘蛛池模板: 秋霞午夜理论理论福利无码| 九色91精品国产网站| 亚洲中文无码永久免费| 久久嫩草影院网站| qvod欧美电影| 幸福草电视剧演员表介绍| 久久国产精品无码视欧美| gogo免费在线观看| 性色少妇AV蜜臀人妻无码| 牢记永久免费网址| 干性感美女| 一级做a爰片久久毛片免费| 欧美在线视频一区| 国产午夜精品不卡视频| 20岁αsrian男同志免费| 日韩一区精品视频一区二区| 极品虎白在线观看| videossexo乌克兰| 亚洲国产精品久久人人爱| 美女网站免费看| 国产精品大陆在线视频| 稚嫩挤奶h调教h| 软糯白嫩双性受h| 久久青草热热在线精品| 扒开腿狂躁女人GIF动态图| 亚洲欧美自拍明星换脸| 欧美末成年videos丨| 国自精品三七区| writeas雷狮直播| 亚洲深夜在线| 日本久久久| 久久国产精品久久国产精品| 高H辣肉办公室| 最近韩国HD免费观看国语 | 99精品国产在热| 午夜一区欧美二区高清三区| 蜜柚视频网在线观看免费| 国产精品自在在线午夜精品| 99九九精品视频| 亚洲人日本人jlzzy| 日韩毛片大全|