色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一些數據科學家在工作中最常遇到的“奇葩”需求

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-08 09:44 ? 次閱讀

編者按:數據科學家是21世紀“最性感”的工作,幾乎所有人都為之瘋狂——無論什么產品,只要在醒目位置標上“人工智能”,它就不僅賣得掉,還賣得火。但是,這也產生了不少問題。以往我們談及設計人員工作時,總會拿不懂PS是Photoshop的甲方作為笑談,現在這樣的事也同樣發生在數據科學家身上,縱然有心解釋,社會刻板印象還是會讓他們百口莫辯。

如果說現代設計已經在人們生活中存在了幾十年,許多甲方客戶還對它了解甚少;那機器學習才剛剛嶄露頭角,人們對它還僅限于眼熟,或是只讀過幾篇吹得天花亂墜的軟文。常言道,隔行如隔山。很多時候,雖然專業人士眼里的常識別人不一定懂,但其他行業起碼還有銷售幫襯,可以很好地充當對接橋梁。而數據科學家就不一定有這個待遇了。

現在,人們對機器學習、人工智能的偏見是社會性的,這里面包括公司銷售。舉個不靠譜的例子,當銷售們和客戶宣傳時,他們會把實際效果吹成“占領月球”,客戶一聽非常滿意,超出自己預期,于是要求立即啟動“占月”項目。歸根結底,數據科學家能做的頂多是把他們送到月球,然后把他們丟在那片荒無人煙的地方。至于開發占領?不可能的。

下面列出了一些數據科學家在工作中最常遇到的“奇葩”需求,雖然看起來有些滑稽,但它們都是真實經歷。如果你想成為數據科學家,你可以先熟悉一下它們,提前鍛煉一顆強健的心臟;如果你是客戶,你也可以通過它們規避不少麻煩,至少談判時,坐在對面的數據科學家不會一臉了無生趣。

1.“我們想要一個AI模型……它可以解決‘這個’問題”

現如今,我們通過簡單的探索性數據分析,就能解決80%的產業分析問題。既然如此,為什么你們還想用機器學習呢?對于這樣精確到目標的需求,構建任何機器學習模型都是矯枉過正,在這些問題上用AI是徒勞的,企業也沒法從中看到新技術帶來的改變。從某種程度上來說,殺雞焉用牛刀?

誠然,高級分析看起來很拉風,通過投資這項技術,企業可以在技術上“引領”行業,試問有那家公司不喜歡塑造自己先進、光彩的創新形象?但是每一個數據科學家都有義務引導客戶正確使用技術,而不是濫用,以保證機器學習這把牛刀不會誤傷他人。所以,大家在做數據分析時,請用美觀的分析工具說服自己的客戶,讓他們看到數據背后的完整價值。

到目前為止,人工智能最大的危險在于人們覺得自己理解它,而這個結論下得太早了。——MIRI創始人 Eliezer Yudkowsky

2.“這些數據給你……你給我出一些商業洞見”

通常客戶會認為自己的責任只是移交數據,他們中的有些人甚至連需求都不提,丟下一堆數據就走,然后期待數據科學家能總結出一些零零散散的、非常有見地的建議。最好這些建議還能“擲地有聲”,讓公司一夜間就改頭換面。

不幸的是,數據科學家的工作不是文學寫作,一個人憑空想是想不出什么操作性強的業務建議的。他們需要和公司業務人員保持長期的、富有成效的交流對話,以了解這家公司能做什么,不能做什么。在整個項目期間,雙方要安排一個“驗收”期,共同評判建議的具體效果。

如果你連提出一個正確的問題都不會,那你將一無所獲。——美國統計學家 W. Edward Deming

3.“造個模型,能跳過不必要的分析,節約時間那種”

數據預處理和探索性分析的重要性毋庸置疑,但很多數據分析師同仁可能在處理數據前就把它們忘了。鑒于此,一些客戶就希望機器學習能刪除其中“不必要的分析”,在保證結果準確的同時縮短分析時間,提高效率。

其實數據分析是機器學習和所有高級分析的必要步驟,它們同根同源。如果不了解數據,無法從數據中找出異常值和潛在模式,那機器學習模型就是兩眼一抹黑,什么都干不了。所以客戶應該給數據分析預留足夠的時間,并指定討論時間,方便數據分析師或數據科學家能發現有趣的的東西和及時分享。

一個煉金師在找尋黃金時,會發現許多更具價值的其他物品。——叔本華

4.“我們有上周的數據,你能預測未來6個月的情況嗎?”

這個問題幾乎是所有數據科學家都沒法避免的。總有那么一些人,拼拼湊湊幾行數據,就指望AI能像巫女的水晶球一樣給個“預兆”。也總有那么一些人,一點數據都沒有,還想讓AI去填補這些空白。

對機器學習來說,數據的數量和質量至關重要,如果客戶不在乎“廢料進,廢品出”,做數據分析就可以了。一些有用的統計技術確實可以四兩撥千斤地處理這類問題,從少量數據中提煉盡可能多的信息,比如插入缺失值(impute)、人工合成數據(SMOTE算法)和使用面向小數據的簡單模型。為了避免客戶失望,記得定義一些界限來解釋為什么結果會那么差。

數據量和分析技術性能之間的關系

5.“你去建個模,兩禮拜夠不夠?”

突然推翻原定計劃,卻還要求成果保質保量——這是所有項目都可能出現的問題。其他行業是怎么補救的,我們暫且不提,反正機器學習建模不可以。它的時間一旦計劃好了,就改不了了,尤其是在原定時間就捉襟見肘的情況下。也許客戶會有疑問:現在GPU算力大幅提高了,各種API也都有了,你們這群數據科學家到底在磨蹭啥?

事實上,盡管行業內出現了像Auto-ML這樣的進展,但建模過程還是得依賴大量手動操作。數據科學家必須要痛苦地在一輪又一輪的迭代中檢查統計結果、比較模型和檢查成因。這些是沒法自動化的,至少現在還沒有自動化。如果客戶實在不理解,建議給個例子讓他直接體驗一下。

建模既是實驗,也是藝術創作,里程碑驅動的項目計劃并不總是現實的。

6.“能不能把這個變量換了,重新跑下模型?”

當數據科學家終于把建好的商業模型交給客戶看時,后者也會習慣性地提一些“調試”要求,其中最常見的是:“你能不能替換這個變量,然后重新運行模型”?表面上看這只是個小改動,但事實上,這個小改動卻意味著把在世界杯上踢足球改成在NBA打籃球。

雖然機器學習是高度迭代的,但它的核心目標是為給定變量篩選正確的影響因子,并映射它們的關系。這個要替換的變量是模型的重要組成部分,不能說改就改。所以如果客戶想投資AI技術,他們應該努力學習一些基本工作原理。如果遇到這樣完全不懂的客戶,數據科學家也有必要給出預警,防止他們事后處處不滿。

7.“我們模型的準確率可以達到100%嗎?”

看到“錯誤率”就宛如看到“瘟神”,這是很多人的誤區。人們都喜歡盲目追求等級,客戶也總覺得越靠近100%,模型就越好。然而當準確率超越其他因素成為唯一焦點后,數據科學家就又該頭疼了:你們要這么一個精度很高,但沒法實際應用的復雜模型有什么用?

2009年,BellKor's Pragmatic Chaos拿下Netflix Prize百萬美金競賽冠軍,雖然Netflix到現在還一直夸這個模型有多好,但它從沒上線過。為什么?因為這個高精度復雜模型背后的工程成本太高了。如果一個模型只有精度卻不能實際應用,它對普通企業的意義又在哪兒?一個好的工程模型應該兼具準確率、穩定性、簡單性和業務可解釋性,并在之中達到平衡。

工程模型:實現精細平衡和權衡

8.“這模型訓練好了,以后能一直保持高性能嗎?”

虛擬產品也是產品,當模型訓練完,客戶自然還要關心一下它的使用壽命。因此他們常問的問題還有:“這個模型是不是會一直這么聰明啊?”“未來我們業務發展了,它跟不跟得上變化啊?”

很不幸,機器學習模型不會自動貫徹終身學習。它還只是個孩子,你們千萬要不斷耐心教導它!通常情況下,模型需要每隔幾周或幾個月進行一次快速復習,就像學校里為了考試苦苦掙扎的學生。更重要的是,如果公司業務發生明顯變化,這個復習頻率要加快,模型可能還要回爐學習點新東西。

盡管發展很快,但這就是當今分析行業的情況,所以如果想投資AI技術,做好模型維護和更新的時間、金錢預算吧!

小結

到現在為止,我們已經介紹了數據科學家工作生活中可能會遇到的8個關鍵誤解,它們隱藏在機器學習建模的6個步驟中:

導致這些誤解產生的原因有兩個,一是客戶對行業基礎知識缺乏了解,二是雙方對具體效果的預期錯位。了解這些內容有助于數據科學家在遇到麻煩時溫和、友善地向客戶說明情況,而不是一臉無奈或是一肚子火氣,最后被迫向客戶屈服。

如果你在生活中也遇到過類似的困擾,歡迎留言指出,幫助更多同行總結經驗,也讓客戶和銷售更了解自己的工作。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7133

    瀏覽量

    89376
  • 人工智能
    +關注

    關注

    1794

    文章

    47622

    瀏覽量

    239584
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132912

原文標題:是什么讓數據科學家頻頻受挫?機器學習的甲方&乙方

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創新科研新范式。這點在西湖大學的科研項目中已得到體現。 成立于2018年的西湖大學是由施公院士領銜創辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家們探索AI與各學科交叉融
    的頭像 發表于 12-12 15:59 ?225次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了種全新的科學研究范式,即數據驅動的研究范式,這種范式強調從大量
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第章人工智能驅動的科學創新學習心得

    如何激發科學家的創新思維。AI不僅僅是工具,更是種思維方式,它鼓勵我們跳出傳統框架,以數據為驅動,探索未知。這種思維方式的轉變,不僅促進了科學方法的革新,也為解決全球性挑戰提供了新的
    發表于 10-14 09:12

    受人眼啟發!科學家開發出新型改良相機

    新型事件相機系統與標準事件相機系統對比圖。 馬里蘭大學計算機科學家領導的個研究小組發明了種照相機裝置,可以改善機器人觀察周圍世界并做出反應的方式。受人眼工作原理的啟發,他們的創新型
    的頭像 發表于 07-22 06:24 ?341次閱讀
    受人眼啟發!<b class='flag-5'>科學家</b>開發出新型改良相機

    中國科學家發現新型高溫超導體

    據新華社報道,我國科學家再立新功,又新型高溫超導體被發現。 復旦大學物理學系趙俊團隊利用高壓光學浮區技術成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導的體超導電性,而且超導體積分數達到
    的頭像 發表于 07-19 15:14 ?753次閱讀

    新華社:突破性成果!祝賀我國科學家成功研發這傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家》為標題,報道了由我國科學家研發的傳感器成果。 我國科學家研發高通道神經探針實現獼猴全腦尺度神經活動監測 神經探針是種用來記錄神經活動
    的頭像 發表于 06-27 18:03 ?544次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發這<b class='flag-5'>一</b>傳感器!

    前OpenAI首席科學家創辦新的AI公司

    消息在業界引起了廣泛關注,因為蘇茨克維曾是OpenAI的聯合創始人及首席科學家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發表于 06-21 10:42 ?549次閱讀

    科學家研制出款新型柔性X射線探測器

    英國科學家開發出種有機半導體材料,并利用其研制出款新型柔性X射線探測器。這種探測器不僅“身段”更柔軟,可貼合需要掃描物體的形狀,從而提高患者篩查的準確性,降低腫瘤成像和放射性治療的風險,而且成本
    的頭像 發表于 06-13 06:29 ?344次閱讀

    ADP5600EP引腳連接到地,導致CPOUT引腳在工作中測量到總是與地短路,為什么?

    我的EP引腳連接到地,導致CPOUT引腳在工作中測量到總是與地短路,我對此很困惑
    發表于 05-23 08:18

    本源量子參與的國家重點研發計劃青年科學家項目啟動會順利召開

    2024年4月23日,國家重點研發計劃“先進計算與新興軟件”重點專項“面向復雜物理系統求解的量子科學計算算法、軟件、應用與驗證”青年科學家項目啟動會暨實施方案論證會在合肥順利召開。該項目由合肥綜合性國家科學中心人工智能研究院(安
    的頭像 發表于 05-11 08:22 ?797次閱讀
    本源量子參與的國家重點研發計劃青年<b class='flag-5'>科學家</b>項目啟動會順利召開

    伺服電機在工作中常見的問題有哪些?該怎么處理?

    ??伺服電機作為現代工業自動化的核心組件,它的穩定運行對于整個生產流程至關重要。但就像任何機器樣,伺服電機也會遇到一些頭疼的問題。今天,就讓我來給大家科普下伺服電機
    的頭像 發表于 03-16 08:42 ?822次閱讀

    VNL5090N3TR-E低邊驅動芯片在工作中片損壞的原因?

    VNL5090N3TR-E,低邊驅動芯片在工作中發現片損壞。 我們想弄清楚損壞的原因,奈何請第三方切片分析太貴。 在此請教各位大佬:1、具體的失效模式和電路圖有嗎?2、想了解這顆芯片的實際損壞條件
    發表于 03-14 06:01

    NVIDIA首席科學家Bill Dally:深度學習硬件趨勢

    Bill Dally于2009年1月加入NVIDIA擔任首席科學家,此前在斯坦福大學任職12年,擔任計算機科學系主任。Dally及其斯坦福團隊開發了系統架構、網絡架構、信號傳輸、路由和同步技術,在今天的大多數大型并行計算機中都可以找到。
    的頭像 發表于 02-25 16:16 ?1250次閱讀
    NVIDIA首席<b class='flag-5'>科學家</b>Bill Dally:深度學習硬件趨勢

    PCB設計工作中常見的錯誤有哪些?

    站式PCBA智造廠家今天為大家講講PCB設計工作中常見的錯誤有哪些?PCB設計中最常見到的六個錯誤。PCB設計是電子產品制造中非常關鍵的環。它的質量直接關系到整個產品的性能和穩定性
    的頭像 發表于 02-21 09:32 ?605次閱讀
    PCB設計<b class='flag-5'>工作中</b>常見的錯誤有哪些?

    康奈爾大學科學家研制出5分鐘快速充電鋰電池

    鋰離子電池如今廣泛應用于電動汽車及智能手機領域。其優點包括輕巧、抗震、環保,但充電時間較長及承受大功率電涌的能力不足。隨著最新研究成果發布,科學家找到了種獨特的銦陽極材料,與鋰離子電池內的陰極材料實現良好配合。
    的頭像 發表于 01-26 09:57 ?710次閱讀
    康奈爾大學<b class='flag-5'>科學家</b>研制出5分鐘快速充電鋰電池
    主站蜘蛛池模板: 韩国电影real在线观看完整版| 成人影片大全| 在线观看成人免费| 欧美乱子YELLOWVIDEO| 色窝窝777欧美午夜精品影院| 国产精品自拍| 亚洲99精品A片久久久久久| 国产精品久久久久久人妻精品流| 色婷婷激情AV精品影院| 国产精品第1页| 亚洲成人综合在线| 精品视频在线播放| 一个人免费观看完整视频日本| 久久合| 2022国产精品不卡a| 男男腐文污高干嗯啊快点1V1| 97无码欧美熟妇人妻蜜| 妻子的妹妹在线| 国产成人精品一区二区三区视频 | 一个人的HD高清在线观看| 久久re这里视频只精品首页| 最近中文字幕高清中文字幕MV| 欧美日韩免费看| 刮伦人妇A极一片| 亚洲国产中文字幕在线视频| 久久中文字幕综合不卡一二区| a久久99精品久久久久久蜜芽| 少妇精品无码一区二区三区| 黄页免费观看| 99久久精品一区二区三区| 日韩一区精品视频一区二区| 国产在线精品国自产拍影院午夜| 影音先锋电影资源av| 欧美亚洲曰韩一本道| 国产精品人妻无码久久久2022| 影音先锋 av天堂| 日日久久狠狠8888偷偷色| 果冻传媒独家原创在线观看| 91交换论坛| 无码欧美XXXXX在线观看裸| 九九免费高清在线观看视频|