王海峰是百度首席技術(shù)官,也是上海人工智能戰(zhàn)略咨詢專家委員會(huì)成員。在2019世界人工智能大會(huì)召開之際,王海峰接受解放日?qǐng)?bào)。上觀新聞?dòng)浾邔TL,分享了他對(duì)人工智能熱點(diǎn)話題的看法。
問:您認(rèn)為,人工智能技術(shù)意味著什么?
答:眾所周知,自18世紀(jì)60年代起,人類經(jīng)歷了三次工業(yè)革命,分別以機(jī)械技術(shù)、電氣技術(shù)和信息技術(shù)為核心驅(qū)動(dòng)力。當(dāng)今,我們正身處第四次工業(yè)革命浪潮之中,而人工智能技術(shù)則是這次工業(yè)革命的核心驅(qū)動(dòng)力量。人工智能技術(shù)將滲入到人們生產(chǎn)生活的各個(gè)角落,人工智能正將人類社會(huì)帶入智能時(shí)代。
問:自從“人工智能”一詞為公眾所熟悉,有關(guān)“人工智能是否會(huì)取代人類”的爭(zhēng)議就一直不斷。您如何看待這個(gè)問題?
答:當(dāng)前,部分公眾對(duì)人工智能認(rèn)識(shí)不足,存在一定的恐慌情緒,認(rèn)為人工智能會(huì)取代人類的工作、會(huì)威脅到人類。所以,讓公眾對(duì)人工智能有正確認(rèn)知和合理期待,是人工智能從業(yè)者,也是全社會(huì)需要解決的問題。
目前的人工智能技術(shù)整體而言依賴大數(shù)據(jù)、大模型和大的計(jì)算能力,這之中依舊有很多問題需要解決。現(xiàn)階段,人工智能在特定應(yīng)用、特定場(chǎng)景上的能力超過了人類,但想全面達(dá)到甚至超越人類還有很長(zhǎng)的路要走,尤其是在語言與知識(shí)等認(rèn)知技術(shù)上,還有很大的發(fā)展空間。
人工智能的使命不是替代人類,而是為人類服務(wù)。人工智能能夠比人類更出色地完成某些任務(wù),比如重復(fù)性、基礎(chǔ)性或者純體力工作;但是也有很多能力機(jī)器是不能替代人類的,比如科學(xué)家、工程師、藝術(shù)家等需要?jiǎng)?chuàng)造性的工作。
未來,人類將更多地充當(dāng)管理者的角色,機(jī)器只是輔助人類做出決定。全社會(huì)對(duì)于人工智能應(yīng)抱有正確的認(rèn)識(shí)和預(yù)期,不能過高,也不能畏懼,這樣才能更好地?fù)肀斯ぶ悄堋?/p>
問:您更看重哪些領(lǐng)域的人工智能探索?
答:想要?jiǎng)?wù)實(shí)地推動(dòng)人工智能發(fā)展,首先要看到人工智能發(fā)展過程中面臨的機(jī)遇和挑戰(zhàn)。我認(rèn)為人工智能領(lǐng)域的探索,要從理論基礎(chǔ)、應(yīng)用技術(shù)、產(chǎn)業(yè)基礎(chǔ)、應(yīng)用系統(tǒng)四個(gè)層面同時(shí)展開。
在基礎(chǔ)理論層面,小樣本、低能耗、可解釋是人工智能目前面臨的最大挑戰(zhàn)。人工智能,尤其是深度學(xué)習(xí)的發(fā)展離不開大數(shù)據(jù)和大的計(jì)算能力,但強(qiáng)大算力的背后,是巨大的能耗在支撐。另一方面,深度神經(jīng)網(wǎng)絡(luò)的結(jié)果很難解釋,難以賦以物理意義。目前在這方面的探索包括遷移學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)、對(duì)抗生成網(wǎng)絡(luò)以及符號(hào)與神經(jīng)網(wǎng)絡(luò)的結(jié)合等等。因此,人工智能理論研究要探索如何讓人工智能像人類一樣、實(shí)現(xiàn)小樣本學(xué)習(xí)、能耗低,且真正地被理解。
在應(yīng)用技術(shù)上,感知技術(shù)與認(rèn)知技術(shù)仍然是未來的重要方向,尤其是認(rèn)知技術(shù)。與聽覺、視覺相關(guān)的感知技術(shù),在深度學(xué)習(xí)的這一波紅利里得到了巨大的發(fā)展。但自然語言理解和知識(shí)圖譜等認(rèn)知技術(shù),還有很多問題亟待解決。同時(shí),融合感知與認(rèn)知技術(shù)的多模態(tài)深度語義理解會(huì)進(jìn)一步發(fā)展。
產(chǎn)業(yè)基礎(chǔ)層面,軟硬結(jié)合很重要,深度學(xué)習(xí)框架和AI芯片逐漸成為人工智能發(fā)展的新趨勢(shì),也是新的產(chǎn)業(yè)機(jī)會(huì)。另外,隨著5G的到來,邊緣計(jì)算也成為人工智能發(fā)展不可忽視的一環(huán)。
在應(yīng)用系統(tǒng)層面,多技術(shù)綜合應(yīng)用、結(jié)合場(chǎng)景的系統(tǒng)性創(chuàng)新至關(guān)重要。隨著人工智能與各行各業(yè)的融合越來越深入,真正落地的產(chǎn)業(yè)應(yīng)用往往是多種技術(shù)的綜合應(yīng)用,需要結(jié)合特定場(chǎng)景、業(yè)務(wù)需求及數(shù)據(jù)特點(diǎn),實(shí)現(xiàn)系統(tǒng)性的創(chuàng)新,才能切實(shí)為現(xiàn)有業(yè)務(wù)提升效率,或者發(fā)展新的業(yè)務(wù)模式。
總結(jié)而言,人工智能系統(tǒng)和生物、和人一樣,是不斷進(jìn)化的。人工智能系統(tǒng)在應(yīng)用場(chǎng)景中,與環(huán)境、用戶互相作用,不斷產(chǎn)生新數(shù)據(jù),不斷學(xué)習(xí),沉淀知識(shí),改進(jìn)算法,越來越強(qiáng)大。
問:在百度的人工智能研究中,是否對(duì)這四個(gè)層面有所涉及?
答:百度從2010年開始人工智能技術(shù)布局和基礎(chǔ)能力積累,2016年9月正式發(fā)布的百度大腦是百度人工智能技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成。在百度大腦的研發(fā)和業(yè)務(wù)實(shí)踐中,對(duì)理論基礎(chǔ)、應(yīng)用技術(shù)、產(chǎn)業(yè)基礎(chǔ)、應(yīng)用系統(tǒng)均有涉及。
目前,百度大腦已經(jīng)形成完整的技術(shù)體系,并全方位開放人工智能技術(shù)能力。其核心技術(shù)進(jìn)入“多模態(tài)深度語義理解”階段,能夠?qū)ξ淖帧⒙曇簟D像等多模態(tài)的數(shù)據(jù)和信息進(jìn)行深層次多維度的語義理解。今年7月發(fā)布的百度大腦5.0,AI算法、計(jì)算架構(gòu)和應(yīng)用場(chǎng)景融合創(chuàng)新,成為“軟硬一體AI大生產(chǎn)平臺(tái)”,打通了人工智能產(chǎn)業(yè)化應(yīng)用落地的全流程,從深度學(xué)習(xí)技術(shù)及平臺(tái)到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型開發(fā)平臺(tái),以及最終的部署和集成,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化,深度賦能開發(fā)者,加速產(chǎn)業(yè)智能化進(jìn)程。
問:能否請(qǐng)您以百度大腦5.0為例,簡(jiǎn)要介紹一下百度人工智能技術(shù)的進(jìn)展及應(yīng)用?
答:百度大腦5.0在語音、視覺、知識(shí)圖譜、語義理解等核心技術(shù)層面持續(xù)創(chuàng)新,保持世界領(lǐng)先水平;在算力層面,實(shí)現(xiàn)面向人工智能的計(jì)算架構(gòu),發(fā)布AI芯片;同時(shí)不斷完善和升級(jí)深度學(xué)習(xí)開源開放平臺(tái)百度飛槳,降低人工智能技術(shù)門檻,促進(jìn)人工智能應(yīng)用落地。
比如在語音識(shí)別方面,成功將注意力模型應(yīng)用于大規(guī)模線上語音識(shí)別系統(tǒng),準(zhǔn)確率進(jìn)一步提升。該技術(shù)已經(jīng)在智能音箱和語音輸入法等產(chǎn)品中應(yīng)用,實(shí)現(xiàn)高精準(zhǔn)的中英文混合語音識(shí)別。
在語音合成方面,風(fēng)格遷移技術(shù)把聲音中的音色、風(fēng)格、情感等不同元素解耦分離,獨(dú)立組合,靈活控制合成的聲音;同時(shí)只需錄制20句話,就可以制作一個(gè)人的專屬聲音。
自然語言理解方面,結(jié)合知識(shí)和語義理解,發(fā)布可持續(xù)學(xué)習(xí)的知識(shí)增強(qiáng)語義理解框架ERNIE。首先結(jié)合先驗(yàn)知識(shí)和海量數(shù)據(jù)構(gòu)建預(yù)訓(xùn)練任務(wù),然后學(xué)習(xí)其中的語言、實(shí)體、關(guān)系、知識(shí)等等各種信息,模型能力可以持續(xù)增強(qiáng),提升效果,快速應(yīng)用。
百度大腦5.0還在機(jī)器同傳領(lǐng)域取得了突破。綜合聯(lián)合詞向量解碼、語篇翻譯模型等新技術(shù),實(shí)現(xiàn)高準(zhǔn)確、低時(shí)延的機(jī)器同傳,并發(fā)布了語音到語音的機(jī)器同傳系統(tǒng)“DuTongChuan(度同傳)”以及全球首個(gè)中文-英文演講場(chǎng)景語音翻譯數(shù)據(jù)集(BSTC)。有機(jī)會(huì)試用一下就能發(fā)現(xiàn),百度的機(jī)器同傳效果已經(jīng)媲美人類譯員。
以上只是百度大腦5.0在語音和自然語言處理領(lǐng)域的部分技術(shù)進(jìn)展及應(yīng)用。整體上,百度大腦布局完整,核心技術(shù)領(lǐng)先。一方面,百度大腦是百度業(yè)務(wù)強(qiáng)有力的技術(shù)支撐;另一方面,百度大腦也是全方位開放的,助力合作伙伴和開發(fā)者,加速人工智能技術(shù)落地應(yīng)用,賦能各行各業(yè)轉(zhuǎn)型升級(jí),促進(jìn)社會(huì)經(jīng)濟(jì)變革。
百度搜索、信息流、百度地圖、百度輸入法等產(chǎn)品基于百度大腦的AI能力變得更加智能。比如,百度智能搜索可以更深入地理解用戶需求、高效地連接人與信息、提升用戶體驗(yàn);百度地圖,充分利用百度大腦的技術(shù)優(yōu)勢(shì),成為業(yè)內(nèi)智能化水平最高、搭載的人工智能技術(shù)最強(qiáng)最豐富的地圖,實(shí)現(xiàn)了全流程AI化數(shù)據(jù)生產(chǎn),為用戶提供路線規(guī)劃、智能語音助手、步行AR導(dǎo)航、實(shí)時(shí)路況、個(gè)性化推薦、智能旅游導(dǎo)覽等智能出行服務(wù)。
還有,基于百度大腦技術(shù)能力,百度智能家居、自動(dòng)駕駛等領(lǐng)域處于全球領(lǐng)先水平,擁有智能語音交互開放生態(tài)“小度助手(DuerOS)”,以及智能駕駛開放生態(tài)“Apollo”。此外,面向企業(yè)及開發(fā)者的智能云計(jì)算服務(wù)平臺(tái)“百度智能云”,為各行業(yè)智能化轉(zhuǎn)型提供解決方案,促進(jìn)數(shù)字中國(guó)建設(shè)。
問:對(duì)于當(dāng)下人工智能的研發(fā)和應(yīng)用情況,您有什么建議或意見?
答:從研究的層面看,我認(rèn)為人工智能的基礎(chǔ)研究還相對(duì)薄弱,而基礎(chǔ)研究是關(guān)乎人工智能核心競(jìng)爭(zhēng)力的關(guān)鍵領(lǐng)域,亟需加強(qiáng)。從應(yīng)用層面看,我覺得要避免對(duì)人工智能期望過高。眼下,部分產(chǎn)業(yè)、資本、公眾等抱有人工智能“無所不能”的想法,有大量資金涌入人工智能領(lǐng)域;但以當(dāng)下的技術(shù)條件和環(huán)境,不是所有的產(chǎn)業(yè)都能用人工智能解決核心問題,期望過高會(huì)給人工智能產(chǎn)業(yè)發(fā)展帶來泡沫化風(fēng)險(xiǎn)。從另一個(gè)角度來說,技術(shù)也不是要做到100%的準(zhǔn)確率才能應(yīng)用,效果達(dá)到一定程度,就可以投入應(yīng)用,讓人工智能技術(shù)在場(chǎng)景化的應(yīng)用中持續(xù)進(jìn)化,同時(shí)更深入地推動(dòng)人工智能的產(chǎn)業(yè)應(yīng)用落地。所以在今年的百度AI開發(fā)者大會(huì)上,我們多次提及的關(guān)鍵詞之一就是“產(chǎn)業(yè)智能化”,百度也會(huì)更關(guān)注技術(shù)和不同行業(yè)的融會(huì)貫通,促進(jìn)產(chǎn)業(yè)智能化發(fā)展。
-
百度
+關(guān)注
關(guān)注
9文章
2272瀏覽量
90490 -
人工智能
+關(guān)注
關(guān)注
1792文章
47425瀏覽量
238964 -
工業(yè)革命
+關(guān)注
關(guān)注
0文章
107瀏覽量
15829
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論