如果AI可以終身學(xué)習(xí)會(huì)怎樣?科學(xué)家們已經(jīng)開發(fā)出一種新的深度神經(jīng)網(wǎng)絡(luò)框架,允許人工智能系統(tǒng)更好地學(xué)習(xí)新的任務(wù),同時(shí)更少地忘記他們在以前的任務(wù)中所學(xué)的東西。
美國陸軍的一個(gè)項(xiàng)目為深度神經(jīng)網(wǎng)絡(luò)開發(fā)了一個(gè)新的框架,它允許人工智能系統(tǒng)更好地學(xué)習(xí)新任務(wù),同時(shí)更少地忘記他們在以前任務(wù)中學(xué)到的東西。
由軍方資助的北卡羅萊納州立大學(xué)的研究人員也證明了使用框架學(xué)習(xí)新的任務(wù)可以使人工智能更好地執(zhí)行以前的任務(wù),這一現(xiàn)象稱為反向轉(zhuǎn)移。
“陸軍需要準(zhǔn)備好在世界任何地方作戰(zhàn),因此它的智能系統(tǒng)也需要準(zhǔn)備好,” 陸軍研究辦公室智能系統(tǒng)(美國陸軍作戰(zhàn)能力開發(fā)司令部陸軍研究實(shí)驗(yàn)室的一個(gè)組成部分)的項(xiàng)目經(jīng)理Mary Anne Fields博士說道:“我們希望陸軍的智能系統(tǒng)能在世界各地的戰(zhàn)場上執(zhí)行任務(wù)時(shí)不斷獲得新的技能,而不要忘記已經(jīng)訓(xùn)練掌握的技能。例如,在進(jìn)行城市操作時(shí),輪式機(jī)器人可能會(huì)學(xué)習(xí)在人口密集的城市該如何行進(jìn),但它仍然需要在以前遇到的環(huán)境(如森林)中高效工作。”
研究團(tuán)隊(duì)提出了一種新的持續(xù)學(xué)習(xí)框架,稱為“學(xué)習(xí)成長”(Learn to Grow),它將網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和模型參數(shù)學(xué)習(xí)分離開來。在實(shí)驗(yàn)測試中,它優(yōu)于以往的持續(xù)學(xué)習(xí)方法。
“深度神經(jīng)網(wǎng)絡(luò)人工智能系統(tǒng)是為學(xué)習(xí)狹小范圍任務(wù)而設(shè)計(jì)的,”該論文的合著者、北卡羅來納州立大學(xué)博士生李錫來(音譯)說道。因此,在學(xué)習(xí)新任務(wù)時(shí),可能會(huì)發(fā)生以下幾種情況之一:
◆系統(tǒng)在學(xué)習(xí)新任務(wù)時(shí)會(huì)忘記舊任務(wù),這稱為災(zāi)難性遺忘。
◆系統(tǒng)會(huì)忘記一些它們知道的關(guān)于舊任務(wù)的事情,同時(shí)不學(xué)習(xí)去做新的任務(wù)。
◆系統(tǒng)可以在添加新任務(wù)的同時(shí)將舊任務(wù)解決——這限制了改進(jìn)并很快導(dǎo)致人工智能系統(tǒng)太大而無法有效運(yùn)行。
持續(xù)學(xué)習(xí),又稱終身學(xué)習(xí)或?qū)W著學(xué)習(xí)(learning-to-learn)正試圖解決這個(gè)問題。”
要理解“學(xué)會(huì)成長”框架,請將深層神經(jīng)網(wǎng)絡(luò)想成布滿多層的管道。原始數(shù)據(jù)進(jìn)入管道的頂部,任務(wù)輸出從底部出來。管道中的每一個(gè)“層”都是一個(gè)計(jì)算,它操縱數(shù)據(jù)以幫助網(wǎng)絡(luò)完成其任務(wù),例如識別數(shù)字圖像中的對象。管道中的層有多種排列方式,它們對應(yīng)于網(wǎng)絡(luò)的不同“架構(gòu)”。
當(dāng)要求一個(gè)深層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個(gè)新的任務(wù)時(shí),“學(xué)習(xí)成長”框架首先通過搜索執(zhí)行一個(gè)稱為顯式神經(jīng)架構(gòu)優(yōu)化的操作。這意味著,當(dāng)網(wǎng)絡(luò)到達(dá)其系統(tǒng)中的每一層時(shí),它可以決定執(zhí)行以下四項(xiàng)操作之一:
◆跳過該層
◆用和以前的任務(wù)相同的方式使用該層
◆在該層上附加一個(gè)輕量級適配器,這會(huì)稍微修改該層
◆創(chuàng)建一個(gè)全新的層
這種體系結(jié)構(gòu)優(yōu)化有效地布局了完成新任務(wù)所需的最佳拓?fù)洌╰opology)或者一系列層。一旦完成,網(wǎng)絡(luò)就使用新的拓?fù)浣Y(jié)構(gòu)來訓(xùn)練自己如何完成任務(wù)——就像其他任何深度學(xué)習(xí)人工智能系統(tǒng)一樣。
“我們已經(jīng)使用多個(gè)數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),我們發(fā)現(xiàn),新任務(wù)與以前的任務(wù)越相似,現(xiàn)有層執(zhí)行新任務(wù)的重疊程度就越高,” 李錫來說道:“更有趣的是,在經(jīng)過優(yōu)化或“學(xué)習(xí)”的拓?fù)浣Y(jié)構(gòu)下,接受過執(zhí)行新任務(wù)培訓(xùn)的網(wǎng)絡(luò)幾乎不會(huì)忘記執(zhí)行舊任務(wù)所需的內(nèi)容,即使舊任務(wù)不相似。”
研究人員還進(jìn)行了實(shí)驗(yàn),將“學(xué)習(xí)成長”框架的學(xué)習(xí)新任務(wù)能力與其他幾種持續(xù)學(xué)習(xí)方法進(jìn)行比較,發(fā)現(xiàn)“學(xué)習(xí)成長”框架在完成新任務(wù)時(shí)具有更好的準(zhǔn)確性。
為了測試在學(xué)習(xí)新任務(wù)時(shí)每個(gè)網(wǎng)絡(luò)可能忘記了多少,研究人員隨后測試了每個(gè)系統(tǒng)在執(zhí)行舊任務(wù)時(shí)的準(zhǔn)確性——而“學(xué)習(xí)成長”框架再次優(yōu)于其他網(wǎng)絡(luò)。
“在某些情況下,‘學(xué)習(xí)成長’框架實(shí)際上在執(zhí)行舊任務(wù)方面做得更好,”Salesforce Research的研究主管、該論文的合著者之一熊才明(音譯)說,“這被稱為反向轉(zhuǎn)移,當(dāng)你發(fā)現(xiàn)學(xué)習(xí)一個(gè)新任務(wù)會(huì)使你更好地完成一個(gè)舊任務(wù)時(shí)就會(huì)發(fā)生這種情況。我們一直在人們身上看到這一點(diǎn),但在人工智能上就很少見。”
菲爾茲說:“陸軍的這項(xiàng)投資擴(kuò)展了當(dāng)前最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),這些技術(shù)將指導(dǎo)我們的陸軍研究實(shí)驗(yàn)室研究人員開發(fā)機(jī)器人應(yīng)用,如智能機(jī)動(dòng)和學(xué)習(xí)識別新物體。”這項(xiàng)研究使人工智能更接近于為我們的作戰(zhàn)人員提供可部署在戰(zhàn)場上的有效無人系統(tǒng)。”
論文 《 學(xué)習(xí)成長:克服災(zāi)難性遺忘的持續(xù)結(jié)構(gòu)學(xué)習(xí)框架》將于6月9日至15日在加利福尼亞長灘舉行的第36屆機(jī)器學(xué)習(xí)國際會(huì)議上發(fā)表。論文的共同主要作者包括數(shù)控州電氣與計(jì)算機(jī)工程助理教授吳天福(音譯)博士、北卡羅來納州立大學(xué)博士生李錫來和Salesforce Research的周穎波。論文由Salesforce Research的Richard Socher和Caiming Xiong合著。
這項(xiàng)工作也得到了國家科學(xué)基金會(huì)的支持。李錫來在Salesforce AI Research做暑期實(shí)習(xí)生時(shí)完成了部分工作。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4773瀏覽量
100885 -
AI
+關(guān)注
關(guān)注
87文章
31090瀏覽量
269415 -
人工智能
+關(guān)注
關(guān)注
1792文章
47408瀏覽量
238914
原文標(biāo)題:美國陸軍研究實(shí)驗(yàn)室:新框架讓AI可以終身學(xué)習(xí)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論