回想在校期間,很多同學(xué)會(huì)在課間休息時(shí)從書(shū)桌里掏出魔方或嫻熟或略顯笨拙地轉(zhuǎn)動(dòng)起來(lái),甚至上課時(shí)有些同學(xué)也會(huì)悄悄地在桌下轉(zhuǎn)動(dòng)手中的魔方。現(xiàn)在,“人工智能” 也對(duì)這款益智玩具產(chǎn)生了興趣,期待用更加智能的方式實(shí)現(xiàn)魔方的復(fù)原。
近日,諾丁漢大學(xué)(University of Nottingham)副教授 Colin G. Johnson 帶領(lǐng)的研究小組開(kāi)發(fā)出一種深度學(xué)習(xí)技術(shù),可以從一套樣本解決方案中學(xué)習(xí) “適應(yīng)度函數(shù)” 并用它來(lái)解決魔方復(fù)原問(wèn)題。該研究相關(guān)論文于 2 月 24 日發(fā)表在 Expert Systems 上,題目為《用逐級(jí)深度學(xué)習(xí)方法解決魔方問(wèn)題》(Solving the Rubik's cube with stepwise deep learning)。
將打亂的魔方復(fù)原是一個(gè)相對(duì)復(fù)雜的問(wèn)題,但研究人員決定將這一復(fù)雜的問(wèn)題轉(zhuǎn)換為多個(gè)簡(jiǎn)單的問(wèn)題來(lái)解決,他們認(rèn)為 “解決任何難題最多需要 20 步”。因此,他們將逐級(jí)學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)作為本次設(shè)計(jì)方案的兩種主要方法。對(duì)應(yīng)到魔方復(fù)原中,該技術(shù)會(huì)一步步地去嘗試解決,而不是一次性學(xué)習(xí)復(fù)原魔方的整體方案。
換句話說(shuō),就是這種技術(shù)會(huì)通過(guò)嘗試轉(zhuǎn)動(dòng)一個(gè)部件使魔方呈現(xiàn)更簡(jiǎn)單的形態(tài),也就是把一個(gè)復(fù)雜的問(wèn)題拆解成若干個(gè)相對(duì)簡(jiǎn)單的小問(wèn)題,先學(xué)習(xí)解決一個(gè)小問(wèn)題的方案,然后經(jīng)過(guò)對(duì)這一步驟的數(shù)次重復(fù),最終達(dá)到魔方復(fù)原的效果。其實(shí),該種方案也意味著,整體解決方案的每一步都要比上一步更加容易。
該技術(shù)會(huì) “反其道而行之”,從魔方一步步打亂的過(guò)程中學(xué)習(xí)怎樣將混亂的魔方復(fù)原。具體操作起來(lái)就是,將拼好的魔方標(biāo)記為 “0”,進(jìn)行一次旋轉(zhuǎn)后的魔方標(biāo)記為 “1”,再旋轉(zhuǎn)一次后標(biāo)記為 “2”…… 以此類(lèi)推。每個(gè)狀態(tài)都與一個(gè)數(shù)字配對(duì),該數(shù)字代表該狀態(tài)下距離目標(biāo)的步數(shù)。因此,學(xué)習(xí)的過(guò)程也是建立模型的過(guò)程,最終實(shí)現(xiàn)從數(shù)據(jù)庫(kù)中抽取任意一個(gè)狀態(tài),預(yù)測(cè)將需要多少步才能到達(dá)目標(biāo)狀態(tài),該步驟就與其被標(biāo)記的數(shù)字相對(duì)應(yīng)。
圖|計(jì)算機(jī)學(xué)習(xí)魔方復(fù)原的數(shù)據(jù)(來(lái)源:Expert Systems)
然后,用特定的深度學(xué)習(xí)網(wǎng)絡(luò)構(gòu)建魔方復(fù)原培訓(xùn)集,并在其中搜索出當(dāng)下的混亂狀態(tài)和已經(jīng)解決后的狀態(tài)。
接下來(lái),通過(guò)模擬數(shù)千次轉(zhuǎn)動(dòng)來(lái)估算魔方的混亂程度。完成了魔方的混亂程度估計(jì)之后,Johnson 開(kāi)發(fā)的技術(shù)將通過(guò)深度神經(jīng)網(wǎng)絡(luò)的方式識(shí)別魔方復(fù)原前的一步,接下來(lái)是復(fù)原前的第二步、第三步…… 把這些數(shù)據(jù)積累起來(lái)再去解決魔方的復(fù)原問(wèn)題將會(huì)非常容易,最終可以通過(guò)這些準(zhǔn)備工作找出把混亂魔方復(fù)原的路徑。
Johnson 解釋道:"與其嘗試學(xué)習(xí)如何解決將整個(gè)魔方復(fù)原,不如學(xué)習(xí)怎樣把復(fù)原魔方這一較為復(fù)雜的問(wèn)題轉(zhuǎn)換為更容易的問(wèn)題,然后使用更簡(jiǎn)單的方法來(lái)解決它。"
圖|深度學(xué)習(xí)框架解決魔方問(wèn)題的步驟(來(lái)源:Expert Systems)
目前,Johnson 僅將該方案用于魔方的復(fù)原,但他也表示,這只是一個(gè)示例,其實(shí)該技術(shù)也可用于解決一些更加復(fù)雜的問(wèn)題。“比如消除留聲機(jī)、早期唱片中舊錄音的噪音。” 具體而言是,如果他設(shè)計(jì)的技術(shù)能學(xué)到一個(gè) “原始的聲音”、一個(gè)比 “原始的聲音” 多一點(diǎn)噪音的聲音以及一個(gè)比 “原始的聲音” 多一點(diǎn)再多一點(diǎn)的聲音…… 那么最終將通過(guò)這種循序漸進(jìn)的方式還原最 “純凈的聲音”。
Johnson 表示,相比其他方式,他設(shè)計(jì)的這種逐級(jí)學(xué)習(xí)更加有效,也更能凸顯分步處理的優(yōu)勢(shì)。不過(guò),他也表示,該種訓(xùn)練框架將需要比傳統(tǒng)方案更多的對(duì)特定領(lǐng)域的知識(shí)。以本文為例,訓(xùn)練解決魔方的框架就需要復(fù)原魔方的能力。
未來(lái)該技術(shù)將可能用于解決科學(xué)工程的很多其他問(wèn)題,如用來(lái)學(xué)習(xí)和更好地理解蛋白質(zhì)在細(xì)胞內(nèi)折疊的方式,從蛋白質(zhì)呈現(xiàn)的三維結(jié)構(gòu)點(diǎn)序列可以倒推其是怎樣折疊成最終形態(tài)的。
原文標(biāo)題:復(fù)原混亂的魔方需要幾步?諾丁漢大學(xué)團(tuán)隊(duì)用深度學(xué)習(xí)告訴你
文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
人工智能
+關(guān)注
關(guān)注
1791文章
47201瀏覽量
238271 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121113
原文標(biāo)題:復(fù)原混亂的魔方需要幾步?諾丁漢大學(xué)團(tuán)隊(duì)用深度學(xué)習(xí)告訴你
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論