IBM人工智能與人類辯手唇槍舌戰,雖敗猶榮
據外媒報道, IBM 開發了一個名為Debater的機器人,近日它在一場辯論賽中與一名人類辯手唇槍舌戰,辯論的主題是政府是否應該給幼兒園提供補貼。當然大家真正想知道的是,人工智能(AI)是否能在辯論中戰勝人類。
Debater的辯論對手名為哈里什·納塔拉揚(Harish Natarajan),是2016年世界辯論錦標賽的決賽選手。數百名觀眾觀看這場辯論賽后,更加傾向于贊同他的觀點,而不是IBM Debater的??梢娫谥R、說服力和辯論技巧上,人類(至少是那些擁有牛津大學和劍橋大學學位的人)仍然能夠占據上風。
相較于1997年IBM的計算機深藍在國際象棋中擊敗人類,以及2017年人工智能在圍棋中戰勝最優秀的棋手,這次人類辯手獲得的勝利可能并不是那么吸引眼球。但IBM的這個機器人顯示,在存在歧義的場景下,以及進行辯論時,AI仍然可以派上用常這和僅僅通過計分來判斷誰贏誰輸的情況有很大的不同。
“真正令我印象深刻的,是IBM Debater與人類合作時可能發揮出來的價值,” 納塔拉揚在辯論后表示。他說,IBM的人工智能能夠挖掘大量的信息,并為這些知識提供有用的背景。
這是IBM Debater第二次和人類進行公開辯論賽。它在第一次公開比賽中,它擊敗了一位辯手,但卻落敗于另一位辯手。不過這一次,它的對手納塔拉揚的實力遠遠更強 —— IBM研究人員本來也預計Debater這次會輸。
計算機的說服力
IBM Debater這次雖然失敗了,但毫無疑問,在某個角度上它仍然是贏家:你會認真聽它在說什么,并不僅僅是因為它是一臺計算機。它很好地將自己的論點分解為幾個部分,并利用各種研究數據來支持它們。雖然它做得不算完美,但也沒有出現牛頭不對馬嘴的情況。
并且,它好像還有點喜歡說教人類?!盀槿鮿萑后w提供機會,這是所有人的道德義務,”IBM Debater說。
Debater以 IBM云計算基礎架構為依托,使用了一組功能強大的機器。
在這場辯論中,雙方都有15分鐘的時間做準備——不過IBM Debater可以利用新聞文章和學術研究論文中的100億個句子。雙方輪流發言,反駁另一方的論點,最后還要總結自己的論點。
比賽的計分規則是看看有多少人改變了想法。在辯論之前,79%的人贊成政府為幼兒園提供補貼,但觀看了辯論之后,該數字下降了17個百分點,為62%。
在如今這個時代,蘋果的Siri、亞馬遜的Alexa和谷歌Assistant都能很好地理解我們的問題,并用語音進行回答,所以我們常常忘記可以與計算機交談是一件多么了不起的事情。 IBM Debater則更進一步,可以一次連講幾分鐘。
“它非常迷人,聽起來很人性化,”辯論賽的主持人約翰·唐納(John Donvan)說。
但是,你的筆記本電腦上可能不會很快就能安裝類似 Debater這樣的東西。它主要是在功能強大的服務器上運行的——這個服務器擁有28個處理核心和768GB的內存,大約是高端筆記本電腦的50倍。而且還有四個服務器提供支持,其中每個都有64GB的內存和2TB硬盤。
政府應該給幼兒園提供補貼嗎?
在這場辯論中,Debater是正方,贊成給幼兒園提供補貼。人類辯手納塔拉揚是反方。
Debater表示,幼兒園“為整個社會帶來利益。我們有責任支持幼兒園?!比绻⒆觽兡苓M入好的幼兒園,他們以后會生活得更好,特別是來自貧困家庭的孩子。
納塔拉揚則反駁說,幼兒園補貼“只不過是政治作秀,獲得好處的是中產階級,而不是最弱勢群體?!彼€找出了Debater的假設中的一些漏洞,例如,Debater的一個假設是補貼真的可以改善窮人的教育狀況。
Debater在這場辯論中的表現比以前有所提高。它掌握的一個新能力是進行平行論證 —— 比如,對醫療系統提供補貼可能是有益的。另外,它的反駁能力也更強了。當納塔拉揚表示,有些孩子可能無法從3歲或4歲的學齡前競爭活動中受益之后,IBM抓住了這一觀點進行反駁。“對方辯手認為,幼兒園是有害的。”它說。
“從去年6月以來,我們一直在努力改進這個AI系統,”該項目的首席研究員諾姆·斯洛尼姆(Noam Slonim)說。 Debater的源材料是學術出版物和新聞文章,現在已經擴展到了2018年底的最新資料。
大家在討論IBM的人工智能辯論技術。從左到右:首席研究員諾姆·斯洛尼姆、IBM Debater項目的屏幕、項目經理倫特·阿霍諾夫,以及人類辯手納塔拉揚。
迄今為止最具挑戰性的比賽
對于IBM的辯論AI來說,這場比賽的難度是迄今為止最大的。
“與我們之前面對的辯手相比,納塔拉揚的水平高得多,他獲勝的場數刷新過世界紀錄。”這個AI項目的經理倫特·阿霍諾夫(Ranit Aharonov)表示。
這場辯論賽是在IBM Think大會上舉行的。“AI表現得很棒,這也是一個很好的展示,但我們應該專注于如何利用這種技術,開發出具有商業可行性的東西出來,” 阿霍諾夫說。
他們的設想是用它來幫助公司理解員工或客戶的觀點,或幫助媒體和政府吸引公眾討論有爭議的問題?!拔覀兛煲瓿傻谝粋€用例了,” 阿霍諾夫說。
這是因為Debater項目背后的技術,看重的是現實生活世界中的復雜和細微差別,而不是棋類游戲中的那種非贏即輸。
“我們正走出AI的舒適區,進入更加說不清道不明的地帶,”斯洛尼姆說。
評論
查看更多