本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載
作者:澤南、蛋醬、小舟
NeurIPS 接收論文中,29% 的作者有中國大學的本科學位,但他們在畢業后有 54% 會去美國攻讀研究生博士,這其中又有 90% 選擇留美工作。劍橋大學的 2020 版《AI 全景報告》寫出了 AI 領域哪些值得關注的新觀察?
人工智能是基礎科學與工程實踐結合的技術領域,近年來已經融合了越來越多的其他方向。在數字化逐漸成型的今天,AI 將為技術進步產生推動作用。
近日,劍橋大學的 2020 版《AI 全景報告》終于出爐,這是該年度報告的第三期。和往年一樣,該報告援引的數據來自知名科技公司和研究小組。新版 AI 全景報告以幾個方面分別介紹了人工智能領域最近一段時間的發展趨勢:研究、人才、業界、政策和未來展望。
該調查的兩位主要作者 Nathan Benaich 與 Ian Hogarth 均來自劍橋大學。
一、人工智能研究進展
人工智能領域的發展雖然伴隨著開源的框架和活躍的社區,但在今年報告的開頭,我們還是需要以數據說話,首先明確一點:AI 研究的開放性并沒有我們想象的那么高。
在深度學習框架上,正如我們最近所感受到的,在各個 AI 頂會的論文中,研究人員已經廣泛使用了 PyTorch,其搶占了大部分原來 TensorFlow 的位置。
在 GitHub 上,PyTorch 相比 TensorFlow 也有更多的新研究實現:據統計現在約有 47% 的實現是基于 PyTorch 的,而 TensorFlow 的大約為 18%。
另一方面,大尺寸模型正在推動著 NLP 領域的技術進步,OpenAI 的 GPT-3 等新研究已經把深度學習模型的參數數量推到了千億。根據目前的云服務算力價格,訓練每 1000 參數的模型平均需要 1 美元,擁有 1750 億參數的 GPT-3 可能需要花費百萬美元級別的費用,有專家認為這一數字超過了 1000 萬美元。高昂的訓練費用,讓研究人員們在探索新方向時遭遇了挑戰。
在 AI 模型訓練需求越來越多算力的同時,傳統計算機架構卻在逐漸接近摩爾定律的終點。MIT 等大學的研究稱,科學家如果希望將 ImageNet 數據集圖像分類任務的錯誤率從 11.5% 降到 1%,可能需要數百億美元的投入。
不過,人們也在研究提高模型效率的方法,OpenAI 的統計表明:自 2012 年起,訓練深度學習神經網絡進行 ImageNet 圖像分類要想達到特定的水平,其所需的算力每 16 個月減半。
毋庸置疑的是,GPT-3、BERT 等模型已經讓 NLP 領域的研究進入了新的階段。現在甚至出現了自動翻譯編程語言的無監督機器翻譯工具。在 GitHub 上把 C++ 函數翻譯至 Java 準確率達到 90%。
技術的快速發展源于人工智能領域的高研究力度。據統計,全球有關 AI 方法(深度學習、NLP、計算機視覺、強化學習等)的論文數量自 2017 年起每年增長 50%,在 2020 年,我們可能將會看到超過 21000 篇 AI 領域的新論文。
不過,當前的大多數機器學習應用是通過統計來實現功能的,其忽略了人類學習知識的重要方法——因果推理。在為患者尋找診療方案等任務中,因果推理是更好的方式。Judea Pearl、Yoshua Bengio 等人工智能先驅者都認為,因果推理是使得機器學習系統更好地泛化,更強大穩健,并為決策作出更大貢獻的新方向。
二、AI 人才:美國占主導
人工智能領域研究者的分布情況近幾年呈現出幾種新的趨勢。
人才流動
首先,學術界面臨人才外流的情況,美國許多研究教授離開大學,前往科技公司任職。從 2004 年至 2018 年,谷歌、DeepMind、亞馬遜、微軟已經從美國大學聘請了 52 位終身教授。卡內基梅隆大學、華盛頓大學和伯克利大學在同一時期失去了 38 名教授。值得注意的是,僅 2018 年一年就有 41 位 AI 教授離開。
從 AI 頂會的角度看,在中國有過教育經歷的研究者近幾年為 AI 領域的研究做出了突出貢獻。以人工智能國際頂會 NeurIPS 2019 為例,接收論文的作者中有 29% 都曾在中國獲得本科學位。
但是從國內的大學畢業后,繼續在 NeurIPS 上發表論文的畢業生中有 54% 都去了美國。
在人工智能領域里,美國仍然是國際研究的中心,有 90% 在美國畢業的留學博士都會留美繼續工作。
而非美國籍的 AI 博士畢業生畢業之后很有可能到大型科技公司就職,而美國籍的博士畢業生更有可能去初創公司就職或加入學術界的研究行列。
與此同時,許多 AI 領域的美國博士畢業生畢業之后會前往英國和中國就職。
接下來我們再從研究機構的角度分析一下 AI 領域的概況。
以 NeurIPS 2019 為例,谷歌、斯坦福、卡內基梅隆大學、MIT 和微軟發表的論文數量位居前五。
人才供不應求
作為當下最熱門的研究領域之一,AI 領域的人才需求不斷增長。許多一流大學也在擴大 AI 專業的招生規模。以斯坦福為例,最近幾年斯坦福 AI 領域的學生是 1999-2004 年的十倍之多,與 2012-2014 年相比 AI 領域學生數量也是翻了一倍。盡管如此,來自 Indeed 的數據顯示,招聘職位的數量仍約為求職者數量的三倍。
但不可避免的是,2020 年人工智能領域的人才市場受到了新冠疫情的嚴重影響。根據領英發布的數據,2020 年機器學習領域職位原本強勁的增長趨勢在 2 月受到打擊,開始下滑。
三、業界快速發展
人工智能設計的藥物,在日本已經開始了一期臨床試驗。在人工智能醫療領域,眾多創業公司收集了巨額資金,實現了「平臺戰略」。
在新冠疫情期間,眾多科技公司也快速將 AI 醫療影像識別技術投入了實用化。最近一段時間里,美國醫療保險和醫療補助服務中心提出了基于深度學習的醫療成像產品費用標準。AI 系統可以快速掃描胸透等多種醫療影像,并將篩查結果提交給人類專家,排除非敏感因素。
說到人工智能最引人關注的自動駕駛。自 2018 年以來,在加利福尼亞州擁有自動駕駛汽車測試許可的 66 家公司中,只有 3 家被允許在沒有安全駕駛員的情況下進行測試,其分別為 Waymo(谷歌)、Nuro 和 AutoX。
即使在政策最為開放的加州,迄今為止自動駕駛汽車的行駛里程相比人類也是微不足道——自動駕駛汽車公司在 2019 年的自動駕駛里程比 2018 年增加了 42%。但這僅相當于 2019 年有駕照加州駕駛員行駛里程的 0.000737%。
使用每次人工干涉之前,汽車自動駕駛的行駛里程作為評判標準,其實不一定是最客觀的。在美國一些州,駕駛員雙手完全脫離方向盤的行駛里程并沒有記錄。
不過最近,我們看到了這項數據的新變化。百度的自動駕駛已經達到了人工每次干涉之間 18,050 英里,超過了 Waymo(谷歌)的 13,219 英里。對于不斷加強 AI 投入的百度來說,最近的投入已經開始得到回報。
自動駕駛領域的公司,必須要有強大的資金支持。13 億美元被亞馬遜收購的 Zoox,其自 2015 年以來收獲的融資已超過了 9.55 億美元,Zoox 最新的估值約為 32 億美元。交易文件顯示,Zoox 在 2020 年初每個月要燒掉 3000 萬美元。
國內的出行公司滴滴最近也把自動駕駛業務剝離,并從軟銀遠景基金等機構籌集了 5 億美元。今年 7 月,滴滴在上海推出了自動駕駛汽車服務。
目前,自動駕駛系統中的大多數機器學習算法只專注于車輛周圍的事物,并基于工程量巨大的手寫規則。研究人員正在開發類似于 AlphaGo,學習大量人類駕駛經驗進行訓練的新算法。最近,Waymo、Uber 和 Lyft 都展示了模仿學習和逆強化學習的新技術。
自動駕駛等領域的發展也需求大量算力,Graphcore、英偉達等公司今年推出的新一代芯片成為了人們的希望。
政策變化
除了 AI 研究方向之外,人工智能應用的快速落地也引起了人們對于隱私和倫理的擔憂。
人臉識別技術正面臨著前所未有的爭議
目前,世界上 50% 的地方都允許使用人臉識別技術,只有 3 個國家 (比利時、盧森堡、摩洛哥) 部分禁止該技術,只允許在特定情況下使用。
那些頭部科技公司,對于人臉識別技術的使用也更加謹慎:
微軟刪除了其 1000 萬張人臉的數據庫——這是目前可用的最大數據庫。數據庫中的人臉是從網絡上抓取的,并未取得當事人的許可。
亞馬遜宣布一年內暫停警方使用其面部識別工具 Rekognition,以便「國會有足夠時間制定適當的規定」。
IBM 宣布放棄其人臉識別產品及技術。
紐約大都會運輸署 (MTA) 要求蘋果允許乘客戴口罩時啟用 FaceID,以防止新冠病毒擴散。
這一年以來,人臉識別技術所面臨的爭議比以往都要洶涌。
美國繼續在軍用 AI 系統上投入大量資金
隨著機器學習技術的落地,軍方在該方面的探索也越來越多,盡管我們尚不清楚這一趨勢對現實世界的影響程度。
美國總務管理局和美國國防部聯合人工智能中心授予博思艾倫咨詢公司一份為期 5 年、總共 8 億多美元的訂單,內容簡介中包括「數據標簽、數據管理、人工智能產品開發」等關鍵詞。
在國防層面,還有更多與此相關的 AI 公司正在獲得豐厚的政府合同和風險投資。戴爾旗下 Pivotal 軟件公司獲得了美國國防部 1.21 億美元的合同,還有一些從事無人機、高分辨率衛星地圖、信息管理等業務的公司獲得了大量風險投資,例如 Anduril、Rebellion、Skydio。
美國國防部高級研究計劃局(DARPA)組織了一場虛擬空戰大賽,一眾 AI 系統相互競爭,最終勝出的「選手」、蒼鷺系統公司開發的頂級 AI 以 5:0 的成績擊敗了人類飛行員。
從 AlphaGo、AlphaStar 到 AlphaDogfight,借助深度強化學習技術,人工智能正在更多的領域擊敗頂尖人類選手。這也充分說明,在游戲對戰環境中所訓練的取勝技術,可以迅速遷移到軍事環境中。被擊敗的飛行員表示:「作為戰斗機飛行員,我們往常的標準操作方法已經不起作用了。」
美國國防部長 Mark T. Esper 表示,這些在模擬戰斗環境中訓練的算法,將在 2024 年應用于真實世界的戰爭中,包括全尺寸戰術飛機。機器學習將對未來世界的戰爭產生結構性影響,他指出:「那些率先利用最新迭代技術的人,往往會在未來戰場上占據決定性優勢。」
兩大 AI 頂會采用全新的道德規范
NeurIPS 和 ICLR 都提出了新的倫理規范,但并未強制代碼和數據共享。以人工智能領域最頂級會議 NeurIPS 為例:
NeurIPS 將創建一個專門的子團隊,由機器學習和倫理學交叉領域的專家組成。
NeurIPS 現在要求論文作者提交關于「該工作可能產生的更廣泛的影響,包括道德方面以及未來的社會影響」。
鑒于 Facebook 和谷歌等公司在 NeurIPS 中的影響力日益增強,因此「作者必須提供明確披露資金來源以及競爭利益點」。
NeurIPS「強烈鼓勵」共享數據和模型,但沒有強制性規定。
在這方面,機器學習領域落后于生命科學領域,例如在 Nature 期刊上發表論文的條件之一是,作者必須「及時向讀者提供材料、數據、代碼和相關協議」。
華為在智能手機領域的主導性增強,并在機器學習技術上大量投資
這也是 9 年來第一次由蘋果和三星之外的公司占據了市場領先地位,但到了 2020 年 9 月中旬,由于美國的制裁,華為面臨著芯片供應的困境。
使用美國芯片制造設備的外國公司必需獲得美國政府的許可,才能向華為提供某些芯片。華為消費者業務 CEO 余承東在中國信息化百人會 2020 年峰會上表示:「我們手機業務現在很困難,芯片供應困難,很缺貨。」
華為的麒麟 AI 芯片由臺積電代工,受到美國制裁政策影響,臺積電接受的最后一筆訂單是在 2020 年 5 月 15 日。目前,華為正嘗試向中芯國際(SMIC)尋求芯片制造方面的支持。
但臺積電在研發支出和半導體制造方面仍占據業內主導地位。臺積電的研發費用與中芯國際的收入相當,前者是目前唯一商用 5nm 制造工藝 (N5) 的制造商,目前正致力于 3 納米制造工藝 ,其功率效率比 7 納米高出 2 倍,性能比 7 納米高出 33% 。不久之前,中芯國際也表示,2020 年會將資本支出增至 67 億美元(高于原定目標 31 億美元)。
未來展望:8 個趨勢
在最后一部分,劍橋 2020 年度 AI 全景報告給出了關于未來 12 個月的 8 項趨勢預測。
原文標題:劍橋大學:PyTorch 已 碾 壓 TensorFlow
文章出處:【微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
微軟
+關注
關注
4文章
6591瀏覽量
104027 -
AI
+關注
關注
87文章
30758瀏覽量
268903 -
人工智能
+關注
關注
1791文章
47206瀏覽量
238278 -
機器學習
+關注
關注
66文章
8408瀏覽量
132572
原文標題:劍橋大學:PyTorch 已 碾 壓 TensorFlow
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論