電子發(fā)燒友早八點(diǎn)訊:作為人工智能國(guó)際頂級(jí)會(huì)議,由美國(guó)人工智能協(xié)會(huì)(American Association for Artificial Intelligence)組織的AAAI大會(huì)在美國(guó)舊金山召開(kāi),在今年的大會(huì)上中國(guó)面孔成為不可忽視的力量。在2571篇投稿論文中,中國(guó)和美國(guó)的投稿數(shù)量分別占到31%和30%,雖然在被接收論文數(shù)量上,中國(guó)還是低于美國(guó),但數(shù)量已經(jīng)大幅提升。
一個(gè)小插曲則是,今年的AAAI大會(huì)原計(jì)劃在新奧爾良召開(kāi),由于和中國(guó)春節(jié)沖突,AAAI Fellow、AAAI現(xiàn)任執(zhí)委楊強(qiáng)教授和幾位教授緊急向組委會(huì)發(fā)送郵件,使得最終破格更改了時(shí)間和地點(diǎn)。
可見(jiàn),中國(guó)在AI領(lǐng)域正在蓄勢(shì),逐步成長(zhǎng)為中堅(jiān)力量。據(jù)《烏鎮(zhèn)指數(shù):全球人工智能發(fā)展報(bào)告》,在全球人工智能專利數(shù)量方面,中國(guó)以15745個(gè)緊跟在美國(guó)26891個(gè)之后位列第二,日本以14604個(gè)排名第三。值得一提的是,三國(guó)占總體專利的73.85%。
華人勢(shì)力
“不僅僅是學(xué)者,來(lái)參會(huì)的中國(guó)公司也變多了。”楊強(qiáng)表示。從今年的活動(dòng)贊助商而言,百度、騰訊和亞馬遜、IBM一并成為金牌贊助商,小i機(jī)器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中,百度、騰訊、華為、360、今日頭條、攜程等中國(guó)公司的人工智能團(tuán)隊(duì)也有出現(xiàn)。
百度研究院院長(zhǎng)林元慶對(duì)第一財(cái)經(jīng)記者說(shuō),過(guò)去幾年里,她在參加國(guó)際上人工智能領(lǐng)域的頂級(jí)會(huì)議中,確實(shí)可以看到參加會(huì)議的華人非常多,而且在過(guò)去幾年里增長(zhǎng)很快。他認(rèn)為這同時(shí)也和國(guó)內(nèi)幾家公司在人工智能領(lǐng)域的投入有關(guān)系。
“中國(guó)人適合做人工智能,世界上43%的人工智能論文都是中國(guó)人寫的。”創(chuàng)新工場(chǎng)創(chuàng)始人李開(kāi)復(fù)(微博)曾向第一財(cái)經(jīng)表示。根據(jù)美國(guó)白宮此前發(fā)布的《國(guó)家人工智能研究與發(fā)展策略規(guī)劃》來(lái)看,從2013年到2015年,SCI收錄的論文中,“深度學(xué)習(xí)”或“深度神經(jīng)網(wǎng)絡(luò)”的文章增長(zhǎng)了約6倍,按照文章數(shù)量計(jì)算,美國(guó)已經(jīng)不再是世界第一。在增加“文章必須至少被引用過(guò)一次”附加條件后,中國(guó)在2014年和2015年都超過(guò)美國(guó),位居前列。
“這一輪人工智能并不是一個(gè)新的革命,而是18世紀(jì)工業(yè)革命自動(dòng)化的一個(gè)延續(xù),技術(shù)一旦掌握到手里,可以迅速擴(kuò)展到做全世界的生意,所以這對(duì)于中國(guó)起到了一個(gè)彎道超車的作用。”楊強(qiáng)表示。
中國(guó)人數(shù)學(xué)好、刻苦努力無(wú)疑為中國(guó)發(fā)展人工智能提供了良好的基礎(chǔ),但更大的驅(qū)動(dòng)力在于產(chǎn)業(yè)需求。一方面對(duì)于傳統(tǒng)企業(yè)而言,需要新技術(shù)來(lái)推動(dòng)產(chǎn)業(yè)變革,“中國(guó)的經(jīng)濟(jì)結(jié)構(gòu)還有很多不合理、低效率的地方,通過(guò)人工智能浪潮,就形成了一種新的競(jìng)爭(zhēng)。”楊強(qiáng)強(qiáng)調(diào)。
對(duì)于互聯(lián)網(wǎng)巨頭或新興獨(dú)角獸公司而言,同樣需要借助人工智能技術(shù),激發(fā)已經(jīng)存儲(chǔ)的海量數(shù)據(jù),提升服務(wù)精準(zhǔn)度,創(chuàng)造潛在盈利機(jī)會(huì),“互聯(lián)網(wǎng)大市場(chǎng)孕育的應(yīng)用到C輪需要人工智能。”李開(kāi)復(fù)表示。例如今日頭條在借助人工智能技術(shù),將新聞內(nèi)容和視頻進(jìn)行重新排序,實(shí)現(xiàn)資訊分發(fā)的千人千面,美圖也利用人像數(shù)據(jù)庫(kù),對(duì)數(shù)據(jù)進(jìn)行標(biāo)記、結(jié)構(gòu)化,優(yōu)化圖像算法。
“全世界只有中美兩國(guó)有如此大量的數(shù)據(jù)、大規(guī)模的計(jì)算和應(yīng)用場(chǎng)景,在應(yīng)用層面中美基本處于同一起跑線。”地平線機(jī)器人技術(shù)創(chuàng)始人兼首席執(zhí)行官余凱向第一財(cái)經(jīng)表示。余凱曾擔(dān)任百度研究院副院長(zhǎng)、深度學(xué)習(xí)實(shí)驗(yàn)室(IDL)主任,帶領(lǐng)的團(tuán)隊(duì)將深度學(xué)習(xí)技術(shù)成功應(yīng)用于廣告、搜索、圖像、語(yǔ)音等方面,在此之前他也曾在美國(guó)NEC研究院、西門子數(shù)據(jù)研究部、微軟亞洲研究院工作。
在余凱看來(lái),中國(guó)有世界上最大的互聯(lián)網(wǎng)公司,且擁有搜索、社交、電商、互聯(lián)網(wǎng)金融等很好的應(yīng)用場(chǎng)景,“大規(guī)模的計(jì)算平臺(tái)都需要大規(guī)模的應(yīng)用場(chǎng)景,在小實(shí)驗(yàn)室是做不了的,年輕人在這樣的工作環(huán)境中會(huì)得到持續(xù)的鍛煉,包括工程實(shí)驗(yàn)?zāi)芰Α?duì)算法的理解等。”
“最大的優(yōu)勢(shì)是人多,這種優(yōu)勢(shì)體現(xiàn)在三個(gè)層面,人多意味著市場(chǎng)大,有更強(qiáng)的驅(qū)動(dòng)力去把這件事情做好。其次針對(duì)社會(huì)服務(wù)層面,需要很多數(shù)據(jù)。第三,人才基數(shù)比較大,冒出頂尖人才相對(duì)多一些。”第四范式創(chuàng)始人、首席執(zhí)行官戴文淵告訴記者,“從數(shù)據(jù)量、投入的人力財(cái)力來(lái)看,中美之間沒(méi)有多少差距,且中國(guó)更有優(yōu)勢(shì)。”
中美差異
但將論文數(shù)量視為中國(guó)人工智能發(fā)展水平有失公允,雖然在靠近商業(yè)價(jià)值應(yīng)用層面中美并駕齊驅(qū),但在基礎(chǔ)性、原創(chuàng)性研究、創(chuàng)新土壤、人才儲(chǔ)備層面,中國(guó)相較美國(guó)還存在不小的差距。
“國(guó)內(nèi)更多是技術(shù)的落地、產(chǎn)業(yè)化和應(yīng)用,國(guó)外仍然有很多人在公司和研究院做前沿研究,包括尋求方法論上的突破,我們擅長(zhǎng)把事情做得更細(xì)致,相對(duì)而言突破性和奠基性的工作還不夠多。”地平線機(jī)器人技術(shù)聯(lián)合創(chuàng)始人、算法副總裁黃暢告訴第一財(cái)經(jīng)。
黃暢畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,曾在美國(guó)南加州大學(xué)和NEC美國(guó)研究院擔(dān)任研究員,2012年加入百度美國(guó)研發(fā)中心,2013年和余凱參與組建百度深度學(xué)習(xí)研究院,任高級(jí)科學(xué)家、主任研發(fā)架構(gòu)師。在黃暢看來(lái),做研究無(wú)外乎尋找新的問(wèn)題和研究新的方法,而在這兩方面國(guó)內(nèi)和國(guó)外相比還存在不小的差距。
楊強(qiáng)認(rèn)為,深度學(xué)習(xí)是不斷發(fā)展的,研究領(lǐng)域的領(lǐng)導(dǎo)者應(yīng)該是開(kāi)拓新的領(lǐng)域,而不是在原有的基礎(chǔ)上深挖。“把一個(gè)10層的深度模型拓展到100層甚至1000層,我覺(jué)得這個(gè)確實(shí)是一個(gè)進(jìn)步,中國(guó)人目前是這個(gè)層次,但這些在我看來(lái)并不是一個(gè)原創(chuàng)。”楊強(qiáng)舉例說(shuō)道。
“現(xiàn)在很多高校是看教授和學(xué)生的論文達(dá)標(biāo)情況,頂級(jí)會(huì)議論文的發(fā)表對(duì)學(xué)生申請(qǐng)?jiān)盒!⒔淌谠u(píng)級(jí)、申請(qǐng)科研經(jīng)費(fèi)等都有幫助,真正做出突破性理論研究,不迎合考核體系的非常少。”戴文淵直言。在他看來(lái),雖然有相當(dāng)數(shù)量的人參與到人工智能研究,但優(yōu)秀的研究成果并不與參與人數(shù)的激增成正比。
余凱認(rèn)為,有一些中國(guó)學(xué)生很擅長(zhǎng)“刷分”、“刷榜”。“別人做到99.5%,我做了99.7%,并不一定有實(shí)質(zhì)性突破,世界也沒(méi)有因?yàn)檫@個(gè)刷分而變得不一樣。原創(chuàng)性的創(chuàng)新需要不一樣的思考,現(xiàn)在講深度學(xué)習(xí)比較多,所有的人都進(jìn)行深度學(xué)習(xí),而不是思考What is wrong ?How to be different?”余凱強(qiáng)調(diào)。
在人工智能領(lǐng)域浸染十年有余的戴文淵也有同樣的感受,“很多人用力的方向有問(wèn)題,準(zhǔn)確率達(dá)到99.1%、99.15%或者99.2%,其實(shí)沒(méi)有什么差別,并不應(yīng)該把精力用在這些地方,而應(yīng)該關(guān)注不到60分的領(lǐng)域,去把它做及格。”
回歸至深度學(xué)習(xí)的歷史發(fā)展脈絡(luò)來(lái)看,正是一個(gè)邊緣化課題走向主流技術(shù)的路徑。早在上世紀(jì)80年代初期,深度學(xué)習(xí)學(xué)派的開(kāi)山人物Hinton一直堅(jiān)持神經(jīng)網(wǎng)絡(luò)的探索,但受限于當(dāng)時(shí)的電腦速度、數(shù)據(jù)量等問(wèn)題,深度學(xué)習(xí)理論是一項(xiàng)邊緣化的研究,當(dāng)時(shí)AI的主流研究方向與之截然相反,推崇小樣本學(xué)習(xí),主推SVM學(xué)習(xí)。
正是以Hinton為代表的一群人對(duì)深度學(xué)習(xí)的堅(jiān)持,才一步步將邊緣課題變成人工智能核心技術(shù)。“十年前進(jìn)入這個(gè)領(lǐng)域,中國(guó)學(xué)生都在學(xué)優(yōu)化理論,現(xiàn)在一窩蜂地學(xué)習(xí)深度學(xué)習(xí),很少有人在懷疑深度學(xué)習(xí)是不是最優(yōu)解,就像之前很少有人去思考優(yōu)化是不是最優(yōu)解。”戴文淵說(shuō)道。
人員成本居高不下
在余凱看來(lái),中美之間的差距表現(xiàn)在兩方面,一方面是人才儲(chǔ)備的匱乏,很多高校在很長(zhǎng)時(shí)間內(nèi)并沒(méi)有人工智能專業(yè),而在美國(guó)基本上大的院校都有人工智能教授。以美國(guó)卡梅隆大學(xué)為例,設(shè)有專門的機(jī)器人研究所,其中光教授就有100多位,縱向而言,中國(guó)布局的時(shí)間也比較晚。
早在2012年余凱回國(guó)在百度成立了人工智能團(tuán)隊(duì),擔(dān)任百度人工智能研究院執(zhí)行院長(zhǎng),在他的記憶里,當(dāng)時(shí)在高校招人非常困難,很多是在招進(jìn)百度之后再自己培養(yǎng)。
其次從產(chǎn)業(yè)鏈而言,谷歌(微博)或者Facebook的人工智能團(tuán)隊(duì)不僅可以從斯坦福等院校招人,還可以從微軟、IBM、HP等大公司挖走人工智能領(lǐng)域的人才,“當(dāng)時(shí)別的企業(yè)還想著從百度挖人,無(wú)論從科研教育還是整個(gè)產(chǎn)業(yè)界,起步都是晚的,規(guī)模還是小的。”
至今余凱仍會(huì)頻繁去美國(guó)參加一些學(xué)術(shù)會(huì)議,讓自己保持更多的思考,“國(guó)外技術(shù)創(chuàng)業(yè)比較多,大家探討的是數(shù)學(xué)公式及算法,而在中國(guó)大部分在講趨勢(shì)、概念,如果PPT上放上公式就變得很無(wú)聊,心態(tài)比較浮躁。”
資本驅(qū)動(dòng)之下,人工智能成為創(chuàng)業(yè)最火熱的領(lǐng)域,也在加速人才的流動(dòng)。根據(jù)華創(chuàng)資本發(fā)布的《2016早期企業(yè)薪酬調(diào)研報(bào)告》來(lái)看,人工智能和大數(shù)據(jù)領(lǐng)域類的早期企業(yè)在過(guò)去一年的員工離職率高達(dá)44%,人員流動(dòng)活躍。
“付不起工資、搶不到人”成為人工智能企業(yè)在人才招聘方面面臨的最大博弈。“人才比較少,需要的公司又多,人工智能的人員成本因此居高不下。”戴文淵表示,“我們想要尋找突破常規(guī)的人才,需要找到能夠?qū)?0分的東西做到60分甚至80分的人才,例如目前做深度學(xué)習(xí)的人有很多,但遷移學(xué)習(xí)的人才就非常少。”
“德才兼?zhèn)洹笔怯鄤P選人的標(biāo)準(zhǔn),所謂德即對(duì)人工智能本身的熱情,愿意為之做長(zhǎng)期奮斗,而不是短期的。“大部分人是在趕時(shí)髦,如果冰天雪地的時(shí)候心還是熱的,那才叫熱情”,才則是數(shù)學(xué)功底、統(tǒng)計(jì)功底、編程能力等等。
“優(yōu)秀的人才、優(yōu)質(zhì)的研究成果永遠(yuǎn)匱乏,好比人工智能領(lǐng)域論文從每年800篇漲到3000篇,但真正出色的論文在數(shù)量上基本不會(huì)有太大變化,許多人是在隨大流、挖坑灌水、解決細(xì)枝末節(jié)的問(wèn)題,產(chǎn)生的真實(shí)價(jià)值并不大。”黃暢補(bǔ)充道。
與O2O、電商等產(chǎn)業(yè)不同,人工智能的技術(shù)創(chuàng)新仍舊需要長(zhǎng)期且基礎(chǔ)性的理論研究工作,如何從頂層設(shè)計(jì)出發(fā),加強(qiáng)人工智能基礎(chǔ)理論研究和核心技術(shù)突破,加強(qiáng)人工智能科研人才、技術(shù)人才的培養(yǎng)與引進(jìn),才是人工智能發(fā)展的持續(xù)動(dòng)力。
人工智能挑戰(zhàn)
一派繁榮之下,正視人工智能的作用變得更為重要。“相較于告訴人們?nèi)斯ぶ悄苣茏鍪裁矗壳案匾姆吹故歉嬖V人們,人工智能不能做什么。”余凱笑著說(shuō)道。結(jié)合當(dāng)下的發(fā)展情況人工智能仍然面臨諸多挑戰(zhàn)。
首要挑戰(zhàn)就是數(shù)據(jù)不足的問(wèn)題。眾所周知,人工智能建立在海量數(shù)據(jù)基礎(chǔ)之上,通過(guò)大數(shù)據(jù)訓(xùn)練,來(lái)優(yōu)化算法模型,以人臉識(shí)別技術(shù)為例,訓(xùn)練這一算法模型需要至少百萬(wàn)級(jí)別的圖片數(shù)據(jù)。
目前人工智能主要是監(jiān)督式學(xué)習(xí),有監(jiān)督的訓(xùn)練就需要帶標(biāo)簽的數(shù)據(jù),因此數(shù)據(jù)的質(zhì)量和精準(zhǔn)度及輸出結(jié)果密切相關(guān)。“如何剔除數(shù)據(jù)中的噪音、垃圾信息,獲取優(yōu)質(zhì)且?guī)в袠?biāo)簽的數(shù)據(jù)成為新挑戰(zhàn),也正是因?yàn)檫@個(gè)原因,半監(jiān)督式甚至無(wú)監(jiān)督式學(xué)習(xí)方法必然成為未來(lái)的研究熱點(diǎn)。”黃暢說(shuō)道。
另一大挑戰(zhàn)在于深度學(xué)習(xí)的推廣和場(chǎng)景遷移能力不足,每個(gè)領(lǐng)域的數(shù)據(jù)都需要重新收集、標(biāo)準(zhǔn)和再訓(xùn)練,很難進(jìn)行跨領(lǐng)域推廣。這些挑戰(zhàn)也是人工智能工業(yè)界和學(xué)術(shù)界急需突破的問(wèn)題。“在招聘的過(guò)程中,學(xué)習(xí)深度學(xué)習(xí)的人很多,而懂得遷移學(xué)習(xí),具備思辨能力的人很少。”戴文淵表示。反映到人才培養(yǎng)和教育而言,如何引導(dǎo)并鼓勵(lì)學(xué)生進(jìn)行跨領(lǐng)域、原創(chuàng)性的探索研究尤為重要。
例如今年AAAI最佳論文來(lái)自斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的Russell Stewart、Stefano Drmon,他們所撰寫的論文《用物理和特定領(lǐng)域知識(shí)讓神經(jīng)網(wǎng)絡(luò)進(jìn)行不帶標(biāo)簽的監(jiān)督學(xué)習(xí)》,就是將物理知識(shí)與深度學(xué)習(xí)相結(jié)合,通過(guò)跨領(lǐng)域研究給AI帶來(lái)新的啟發(fā)。
聲明:電子發(fā)燒友網(wǎng)轉(zhuǎn)載作品均盡可能注明出處,該作品所有人的一切權(quán)利均不因本站轉(zhuǎn)載而轉(zhuǎn)移。作者如不同意轉(zhuǎn)載,即請(qǐng)通知本站予以刪除或改正。轉(zhuǎn)載的作品可能在標(biāo)題或內(nèi)容上或許有所改動(dòng)。
評(píng)論
查看更多