當你向Facebook上傳了一張你朋友的照片后,這張照片就進入了一個復雜的幕后處理過程。算法迅速行動并分析照片的每一個像素,直到將朋友的名字和這張照片匹配起來。這類型的前沿技術也被用在了自動駕駛汽車上,使得自動駕駛汽車能夠從背景中區分行人和其它車輛。
這項技術也可以用來區分μ介子和電子嗎?很多物理學家相信這一點。在該領域的研究人員正著手運用它來分析粒子物理數據。
支持者們希望利用深度學習節省實驗時間、金錢和人力,讓物理學家們做其它不太繁瑣的工作。另一些人希望能提高實驗的結果,相比以前使用的任何算法,這個算法能使他們更好地識別粒子和分析數據。盡管物理學家們不認為深度學習是萬能的,但一些人認為它可能在應對即將到來的數據處理危機中起到關鍵作用。
直至今日,計算機科學家們仍經常人工編寫算法,一個任務往往需要無數個小時的復雜計算機語言工作。“我們仍然做著不錯的科學工作,”費米國立加速器實驗室的科學家Gabe Perdue說,“但是我認為科學工作還可以做得更好。”
而如果要使用深度學習,我們則需要一種不同的人類輸入。
一種實現深度學習的方法是使用卷積神經網絡(CNN)。CNN是模擬人類視覺感知建模的。人類用自身的神經元網絡處理圖像;CNN通過輸入層節點(node)來處理圖像。人們通過向網絡送入預處理的圖像來訓練CNN。通過學習這些輸入,算法會不斷調整各節點的權重并因此學會識別模式和相關點。由于算法不斷修正這些權重,預測結果會變得越來越準確,甚至超越人類。
卷積神經網絡以通過將多個權重綁在一起的方式來縮短分解數據處理的步驟,這意味著必須調整的算法元素更少。
CNN出現于90年代末。但是近年來隨著許多方面的突破(如處理圖形的硬件價格降低、訓練數據集不斷擴增以及CNN架構本身的創新),越來越多的研究人員開始使用它們。
CNN的發展導致語音識別、翻譯以及其它傳統上由人類完成的任務的進步。一家Alphabet(谷歌母公司)旗下位于倫敦的公司DeepMind使用CNN創建了AlphaGo,這個計算機程序在3月份打敗了世界排名第二的圍棋選手,圍棋是比國際象棋更復雜的策略棋盤游戲。
CNN使得我們可以更從容地處理大量的基于圖像的數據,而之前我們對這些數據束手無策——高能物理學中經常會碰到這種圖像數據。
進入物理學領域
隨著大數據和具有處理大量信息所必需的計算能力的圖形處理單元(GPU)的出現,CNN在2006年開始得到大規模運用。Perdue說:“從那之后,精確度有了很大的提高,人們也還一直在繼續高速地創新。”
大約一年前,各類高能物理實驗的研究人員開始考慮將CNN引入他們的實驗的可能性。“我們把物理問題變成了:‘我們能否分辨一輛自行車和汽車?’”SLAC國家加速器實驗室研究員Michael Kagan說,“我們只想弄清楚如何以正確的方式重組問題。”
在大多數情況下,CNN將用于粒子識別和分類以及粒子軌跡重建。一些實驗已經使用CNN來分析粒子的相互作用,其準確性很高。例如,NOvA中微子實驗的研究人員已經將CNN應用到了其數據上。
“CNN 本來是用于識別動物和人的圖片,但它也能很好的用于物理領域的識別,”費米實驗室科學家Alex Himmel 說,“預測結果非常好——相當于我們的檢測器多產生了30% 的數據。”
從事大型強子對撞機(LHC/Large Hadron Collider)實驗的科學家們希望借助深度學習來使他們的實驗更自動化,CERN 物理學家Maurizio Pierini 說:“我們正試圖在一些任務上取代人。用人來看管比用計算機看管要昂貴得多。”
在檢測器物理學以外,CNN 也被證明是有用的。在天體物理學方面,一些科學家正在開發可以發現新的引力透鏡的CNN;引力透鏡是指可以扭曲來自它們后面的遙遠星系的光的大型天體(如星系團(galaxy clusters))。對望遠鏡數據掃描以尋找引力透鏡扭曲現象的過程是非常耗時的,并且普通的模式識別程序難以區分它們的特征。
“公平地說,在使用這些工具時,我們僅僅涉及了很淺的部分,”在費米實驗室的NOvA 實驗項目工作的威廉瑪麗學院博士后研究員Alex Radovic 說。
未來的數據盛宴
一些科學家認為神經網絡可以幫助應對他們預見的即將到來的數據處理危機。
計劃于2025年推出的升級版大型強子對撞機將產生大約10倍的數據。暗能量光譜儀(Dark Energy Spectroscopic Instrument)將收集大約3500萬個宇宙物體的數據,大型綜合巡天望遠鏡(Large Synoptic Survey Telescope)將捕獲近400億個星系的高分辨率視頻。
數據量一定會飛速增長,但從前計算機芯片處理能力的指數級增長預計將會陷入停頓。這意味著處理更大量的數據將越來越昂貴。
“對于10倍的碰撞次數,你可能需要超過100倍的處理能力,”Pierini 說。“用傳統的做事方式,我們會走入死胡同。”
然而,并不是所有的實驗都適用于該技術。
“我認為有時這會是正確的工具,但它不會一直是正確的,”Himmel 說,“數據與自然圖像越不相似,神經網絡的有用性越低。”
大多數物理學家都同意,CNN 不適合剛剛啟動的實驗中的數據分析,因為神經網絡對于計算過程不是很透明。“這會很難說服人們相信他們已經發現了新的東西,”Pierini 說,“我認為用紙和筆做事情仍然是有價值的。”
在某些情況下,運用CNN 的挑戰將超過獲益。例如,如果數據尚未轉換為圖像格式,則需要將其轉換為圖像格式。并且神經網絡需要大量的數據用于訓練——有時不得不模擬數百萬的圖像。即使這樣,模擬也不如真實數據那么好。因此,神經網絡必須用實際數據和其它交叉檢查進行測試。
“一個高標準的物理學家能夠接受任何新事物,”德克薩斯大學阿靈頓分校的物理學副教授Amir Farbin 說,“需要跨越很多障礙去說服大家這是對的。”
展望未來
對于那些相信CNN 結果的人,CNN 意味著更快的物理學和值得期待的未知。
一些人希望用神經網絡來檢測數據中的異常,這可以指示檢測器中的缺陷或者為新發現指引線索。為了尋找新發現,研究人員可以只是讓 CNN 遍歷數據并試圖找到突出點,而不是一定要找到具有特定標志的新事物。“不必指定要搜索的新物理的領域,”Pierini 說,“這里獲取數據的方式更開放。”
日后,研究人員甚至可能開始采用無監督學習來處理物理數據。無監督學習,顧名思義,是指可以無需人工指導就訓練大量數據的算法。科學家可以傳輸給該算法相應的數據,然后該算法就能從中得出結論。
“如果你足夠聰明,你可以使用它來做所有類型的事情,”Perdue 說,“如果它能夠推斷新的自然規律或類似定律,這將是驚人的。”
“但是,”他補充道,“那樣的話,我也要去尋找新的工作了。”
評論
查看更多