2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將于9月21日-22日在青島膠州召開。南京大學人工智能學院俞揚教授將出席大會,并擔任人工智能青年論壇共同主席。
俞揚在2011年博士畢業后,留校加入計算機科學與技術系、機器學習與數據挖掘研究所(LAMDA)從事教學與科研工作,主要研究領域為人工智能、機器學習、強化學習。他還入圍了2018年度IEEE Intelligent Systems評選的國際“人工智能10大新星”名單,是該次國內高校唯一入選者。
近年來的爆發讓人工智能成為當下最火熱的風口行業之一,機器學習又是其中的先驅領域。作為這方面的專家,俞揚如何評價這一輪行業發展熱潮?我們對他的觀點和思考作了梳理,一起來看。
人工智能不是一蹴而就,要靠厚積薄發
2016年圍棋人機大戰中,DeepMind開發的AlphaGo以4:1的絕對優勢,橫掃人類頂級選手柯潔、韓國名將李世石,讓世人對智能的力量大為驚嘆。
俞揚通過拆解AlphaGo的訓練“秘密”,指出了它驚艷亮相背后的成功路徑。
AlphaGo的基礎框架是“蒙特卡洛樹搜索”。在俞揚看來,這是一種聰明的搜索算法,它可以成功避免很多無效搜索,但現在也只能達到業余棋手五段、六段的水平,遠不具備與人類頂尖棋手對話交鋒的實力。
在此基礎上,AlphaGo引入了“機器學習”,通過學習人類歷史上高手對弈的棋局數據,模擬人類走法,如果碰到沒有見過的棋局,則以過往相似棋局作為參考。它雖然可以學習,但無法理解這些走法背后的玄機。此外,AlphaGo還通過“強化學習”,自己與自己對弈來提升水平。
俞揚指出,這種學習機制并不是新事物。AlphaGo涉及的所有算法部件都是現成的,“蒙特卡洛樹搜索”已經發展了十年,強化學習也經歷了數十年的發展。AlphaGo的突破在于,人們以卓越的工程水平實現了這些技術的結合,用成百上千的CPU和數百個顯卡實現了加速計算。
AlphaGo的例子清晰地表明,人工智能近年來的成功并不是一蹴而就的,而是許多年基礎研究的成果。既然我們希望人工智能的發展能夠更多的造福于未來生活,就要做好長期基礎研究的探索和積累,這樣才能做到厚積薄發。
人工智能發展的“奇點”還未來臨
人工智能在人機對弈、圖像識別、語音識別等領域的進步,引發了行業內外的強烈關注和熱切討論。作為機器學習領域的專家,俞揚如何看待這些進步呢?
俞揚曾對媒體表示,雖然人工智能迎來了第3次發展熱潮,但“人工智能威脅論”尚不成立,人工智能發展“奇點”還未來臨。他提出,不要混淆“技術進步”和“社會進步”的概念。以蒸汽機為例,它帶來了工業革命,人類生產力得到巨大提高,顛覆性地改變了人類社會的生產生活面貌,但在這一過程中,要注意原理和工藝的區別。蒸汽機的原理自誕生起就不再出現變化,人類不斷改造和升級的,是蒸汽機的工藝水平。正是因為后者的不斷提升,才讓蒸汽機效率更高、價格更低、使用更安全方便,進而廣泛普及開來,推動了社會進步。如果依照“奇點”理論來推算,蒸汽機應當迅速發展,但工程工藝的精化無法克服其原理上的先天缺陷,后來還是被內燃機所取代。今天我們在汽車、飛機上已經看不到蒸汽機的影子了。
人工智能的決定權依然在人
關于人工智能的能力邊界問題 ,一直以來都存在不同的聲音。人工智能有沒有權限做決策?如果有,這一權限應該多大?
2018年3月,一輛自動駕駛的Uber在美國亞利桑那州撞倒了一位推著自行車的女性,致其身亡,這是自動駕駛導致行人死亡的第一例事故。事件迅速發酵,引發了關于人工智能安全問題的廣泛討論。
對此,俞揚明確表示,人工智能作為一個工具,如何使用,目前來看決定權依然在人,系統的設計者和商業(應用)的提供人員需要對此負責。他說,“我們必須清楚地知道人工智能會做出什么樣的決策。對人工智能的應用范圍,以及應用結果的預期,一定要有約束”。在人工智能決策相關的問題上,人類一定要慎之又慎,環境是否可控,是否經過了可理解性的測試,決定了它是否可以用在關鍵的場所。否則,產品就存在重大缺陷。
在高效強化學習方面的探索
俞揚介紹道機器學習可以有“機械學習”、“示教學習”、“類比學習”和“歸納學習”等多種類型。自20世紀80年代以來,歸納學習成為機器學習中被研究最多、應用最廣的分支。歸納學習又分為監督學習、無監督學習和介于二者之間的弱監督學習。
強化學習可以看作是一種弱監督學習,它的數據標記需要靠自己探索來獲得,往往需要經過多次決策的探索才能獲得標記。
俞揚指出,強化學習在現實社會的應用還很少。當前強化學習主要有兩個經典方法:一是對值函數的學習;二是策略搜索方法。但這兩個方法對于樣本的需求量都極其大,在真實物理環境中的應用很難得到滿足。俞揚以狗舉例,讓狗聽懂“趴下”只需半個小時,這個過程大概有二十個樣本。由此可見機器強化學習的能力與生物相比,還有很大差距。即目前強化學習方法的樣本利用率很低,這種低效可能來源于優化能力、方法論等多個方面的局限。
2017年,俞揚介紹過自己在提高機器強化學習能力方面的一些探索。近期,他的研究更關注模擬器的構建。俞揚認為強化學習落地的主要瓶頸在于需要大量試錯,而現實環境難以承受試錯代價,構建模擬器可能是突破瓶頸的一條可行途徑。2017年開始,俞揚與阿里巴巴合作,成功構建了“虛擬淘寶”,模擬了購物的買家?!疤摂M淘寶”模擬器用于訓練強化學習,從而避免了試錯代價,最終訓練出的模型,直接上線測試,獲得了2%的性能提升。俞揚認為“零試錯”是強化學習能夠得以推廣應用的關鍵門檻,并且看好強化學習未來落地應用的前景。
-
人工智能
+關注
關注
1791文章
47350瀏覽量
238759 -
DeepMind
+關注
關注
0文章
130瀏覽量
10877
原文標題:CCAI 2019 | 俞揚:人工智能的決定權依然在人
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論