日前,在《自然》雜志醫學版上報道了一則谷歌AI團隊的最新人工智能研究成果——預測肺癌。
通過一套卷積神經網絡算法,谷歌 AI 部門建立了一種端到端的分析方法,僅從CT圖像就可以預測肺癌的風險。
在 6716個測試病例中,這套人工智能系統能夠以 94% 的準確率發現極小的惡性肺結節,打敗了6名放射專家(并非普通醫生)。
在無先前 CT 掃描圖像的情況下,該系統的表現超越所有 6 位放射醫學專家。而在有先前 CT 掃描圖像的情況下,兩者表現不相上下。
而參與測試的 6 位放射專家,有平均 8 年( 4 年到 20 年)的讀片經驗。
相比“傳統”射科醫生的行醫方法,醫生必須審查數百個單獨的2D 掃描切片以發現問題,而腫瘤可能會很微小導致難以察覺,這種新的機器學習算法則可以分析高通量的 3D 肺部圖像,不僅可以對整體腫瘤進行預測,還可以通過肺結節識別細微的惡性組織。再加上先前的掃描數據對比,就可以用來評估肺結節的生長速度。
相關論文共同作者,美國西北大學醫學院 Mozziyar Etemadi 博士表示,3D 檢測早期肺癌的能力比人眼檢測 2D 圖像要敏感得多。事實上,新系統在技術上可以納入 4D 范疇,因為它不僅僅是一次 CT 掃描,而是包括了當前和先前共計兩次的掃描,所以可以檢測出肺結節隨時間的生長變化。
2019 年 5 月 7 日,Lily Peng 在 2019 年開發者大會上稱,他們研發的人工智能技術可以比醫生早一年查出肺癌,使患者存活的概率提升 40% 。
毫無疑問,通過谷歌的這項技術,可以造福更很多人。在 2015 年,中國肺癌的發病和死亡例數分別達 73萬 和 61 萬,發病率和死亡率非常接近,其主要原因是臨床診斷病例多已為晚期,失去了手術機會。
然而,或許有一天我們分享不到這份成果。對于華為中興事件的反思,面對美國接下來可能在各方面實施的技術封鎖,中國人工智能的發展還需要再加把勁。
我國AI進展——算法的錯位缺失
我們以前討論電腦或者移動終端時,離不開硬件、軟件和應用的范疇。討論人工智能時,同樣離不開硬件、算法和數據這三個要素。
簡單來說,中美人工智能發展在硬件上的差距,遠沒有在算法的差距來得大。
計算機硬件技術的發展一直伴隨著通用性和專用性的矛盾,通用的設計普適性強,但對于某一類特殊計算,性能就會打折扣,如果做個比喻的話,就是瑞士軍刀和菜刀的區別,也可謂術業有專攻。
在這樣的背景下,人們開始研發用于神經網絡算法和機器學習的專用芯片。
如今,以通用圖形處理器(GPGPU)為基礎的NVIDA在深度學習市場占有一席之地,谷歌憑借16年發布的張量處理器(TPU)成為后起之秀。
通過與自家的人工智能開發系統TensorFlow相結合,谷歌也形成了一套完整的人工智能開發環境。
國內人工智能芯片創新同樣非常活躍,在人工智能芯片的競賽中與國外不相上下。其中的明星企業就是最近兩年來被反復提及的獨角獸公司“寒武紀”,取名借用地質學“寒武紀”時代的概念,比喻即將到來的人工智能大爆發時代。
寒武紀Cambricon-1H8
此外,百度深度學習實驗室前主任余凱創立的地平線也同樣值得關注。一年多時間就完成了Intel和SK領投的兩輪過億融資。
但是無論是寒武紀還是地平線,都還無法和美國企業完全抗衡,美國不僅有NVIDIA和谷歌,還有英特爾、微軟和IBM等一批大企業每年將巨資投向人工智能領域。
至于另一大要素——數據,鑒于中國龐大的互聯網人口,深度學習所需要的大數據則可以由國內用戶提供。
人工智能發展所需的三個要素中,算法是目前我們最薄弱的一環。不論是前面提到的谷歌AI卷積神經網絡測癌算法,或是NVIDIA此前大火的GauGAN畫圖,都證明了美國企業的領先,而我國在這方面的發展屬于相對滯后的。
在2019年長江商學院和清華大學公布的兩份報告中,均指出了中國人工智能發展基礎薄弱。
長江商學院人工智能與制度研究中心主任許成鋼教授對記者表示,在人工智能領域,中國發表的論文總數雖然超過了美國,卻在深度學習、機器人流程自動化、以及包括推理學習等在內的其他領域,從發表總數和引用率方面,與美國的差距顯著。
對有高質量、高影響力的千級論文(是指每一篇論文被引用的數字超過了1000次),中國與美國差距巨大,中國只有個別的論文影響力能達到這個水平。
為什么中國很多論文從來不被引用?許成剛認為的癥結之一在于我國科研機構只注重數量,不注重深度。 “我個人分析,在中國體制內大學有一個SCI現象,即就是教授的水平高低,或者職稱評定,就是看教授發了多少篇SCI文章(美國科學資訊研究所采用的期刊文獻檢索工具),不管你這篇文章到底有多大的影響力。”
知乎一篇相關問答下也不難看到,論文換湯不換藥的做法幾乎已成為除頂級機構之外相當普遍的做法。
這也導致了我國空有4倍于英國的論文發表數量,然而論文影響力竟反而不如英國的結果。
同時,幾乎93%的中國研究者使用人工智能開源軟件包,這也是美國的機構開發提供的。中美兩國人工智能研究者使用最多的軟件庫就是前面提到的Google TensorFlow。在2018年初,中美研究人員對此的關注人數,分別達到將近9000人和約7000人。
整體上中、美AI研究者關注美國機構開發的開源AI軟件包的數字,相當于他們關注中國機構開放的軟件包數字的20幾倍。這表明中國研究者在基本算法方面,對美國開源軟件包的嚴重依賴。
新智元創始人楊靜18年曾對《環球時報》記者表示,人工智能平臺分硬件和軟件,核心技術一直掌握在西方手里,比如芯片技術。此外,中國沒有主流開源框架也是很可怕的,深度學習、強化學習等算法的研究也落后于西方。
在牛津大學最新完成的一份報告《解碼中國AI夢》里,作者也得出了相同的結論。除了數據,中國在硬件、人才、算法和產業等方面,仍然落后于美國。但編寫這份報告的Jeffery Ding仍表示, “我認為AI是中國第一個真正有機會制定游戲規則的技術領域。”
實際上,正是由于中國龐大的互聯網人口,提供了強大的數據基礎,在市場的導向之下才使得我國的人工智能更偏重具體應用。對此,IDC公司在一份報告中稱:“數據或許不會出現在資產負債表上,但數據是一個公司最寶貴的無形資產。中國初創企業尤其懂得如何利用海量數據打造雙贏的商業生態。”
人工智能競賽終將走向人才競爭
科技競爭的本質最終還是人才的競爭,美國人工智能相關的從業人員和公司數量現在也遙遙領先。
2012年前,中國活躍的人工智能創業公司還要多于美國,但是在2012年卻被美國反超,美國與人工智能有關的企業數量遠超中國。
據《中國人工智能指數2018》分析,美國的人工智能工程師遠比中國多。
據領英(LinkedIn)人才數據庫顯示,中國的AI人才總數為5萬人,而美國的AI人才總數為83萬人。美國AI人才總數是中國的16.5倍之多。并且,中國人工智能領域工作10年以上的人才不到39%,相比之下,美國超過71%的人工智能領域的人工作了10年以上。
來源:長江商學院《中國人工智能指數報告》
“在中國,人工智能是更年輕的行業,而在美國雖然領域是年輕的,但是里面的多數人并不年輕,是有充分經驗的。”許成剛說。
人才分布方面,中國在智能交通/自動駕駛,智能/精準營銷, 硬件/GPU/智能芯片需求比例要多于美國,但美國在算法、機器學習的方面,美國不但人才的比例比中國大,人才總數也是中國的20多倍。
來源:清華大學中國人工智能發展報告2018
但隨著美國對外開放的收縮,也給了很多海外的技術型人才回國發展的機會。
實際上,早在2017 年 12 月美國發表的“國家安全戰略”中便公開表示:將限制 世界上所有去美國學習STEM 專業(科學、技術、工程、數學)的留學生簽證。
根據南華早報的說法,在美國 363341 名中國學生中,約有 36% 在 STEM 領域學習。
這次美方設置的障礙,可能將會給更多在美國的中國留學生,在美尋求工作的中國人帶來危機和恐懼。
站在人工智能角逐的角度來看,美國反而在這方面有點自縛手腳的意思。
澎湃新聞:美國埃默里大學涉嫌歧視華人教授
但五矩認為,最為關鍵的一環還是在于國內要加強對于基礎教育的重視和投入。
“我關心教育不是關心華為,是關心我們國家。如果不重視教育,實際上我們會重返貧窮的。”5月26日晚間,華為創始人、CEO任正非在央視《面對面》節目中說道,因為這個社會最終要走向人工智能的。
在任正非看來,能與基礎研究相提并論的是基礎教育。他認為,我國目前基礎研究方面水平不夠,和基礎教育跟不上直接相關。為此,他曾自費請權威機構的專家進行中國基礎教育狀況的調查研究。
評論
查看更多