隨著信息科技的進(jìn)步,數(shù)據(jù)的收集變得十分便利。不同來源的信息與數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù),又可以進(jìn)一步影響著我們的生活,并提升我們的生活品質(zhì)。近日,在英特爾召開的主題為“顛覆性研究 開啟計算未來十年”的“2020英特爾研究院開放日”上,英特爾高級院士、副總裁、英特爾研究院院長Rich Uhlig率眾專家為我們分享了英特爾研究院在集成光電、神經(jīng)擬態(tài)計算、量子計算、保密計算和機(jī)器編程五個領(lǐng)域所做的前沿研究及其科研成果。
Rich介紹說:“我們認(rèn)為這五個領(lǐng)域能夠真正大規(guī)模釋放數(shù)據(jù)價值,并且變革人們與數(shù)據(jù)互動的方式。其實未來早已到來,只是分布不均。英特爾的目標(biāo)是讓每個人都能獲得百億億次級計算。”英特爾正致力于多個數(shù)量級的提升,他們將其簡稱為“追求1000倍提升”(In pursuit of 1000X)”
集成光電 集成光電旨在將光科學(xué)與大規(guī)模芯片生產(chǎn)的成本效益相結(jié)合。眾所周知,光互連(optical)在長距離、遠(yuǎn)程和地下傳輸中占主導(dǎo)地位,而電氣互連(electrical)在短距離、主板互連(board to board)和封裝互連(package to package)中占主導(dǎo)地位。
英特爾首席工程師、英特爾研究院PHY研究實驗室主任James Jaussi介紹說:“英特爾的愿景是將光互連引入到服務(wù)器中,為此他們開發(fā)出了硅光子技術(shù),讓光互連具備硅的高產(chǎn)量、低成本等屬性。”借助集成光電技術(shù),英特爾能夠?qū)?I/O 數(shù)量從幾百萬個擴(kuò)展到幾十億個,實現(xiàn) 1000 倍的提升。據(jù)介紹,未來的光鏈路將讓所有的I/O連接直接從英特爾的服務(wù)器封裝中發(fā)出,全面覆蓋整個數(shù)據(jù)中心。這項技術(shù)將徹底改變數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),并釋放數(shù)據(jù),顯著提高數(shù)據(jù)傳輸效率。
雖然這項技術(shù)已經(jīng)取得了長足的進(jìn)步,已經(jīng)為客戶提供了超過 400 百萬個英特爾 100G 收發(fā)器產(chǎn)品。不過目前鑒于硅光子模塊和運(yùn)行功率的成本和物理體積,光互連I/O還不適合短距離傳輸。這也是英特爾要跨越的下一個巨大障礙。此外,James預(yù)測說:“展望通信和數(shù)據(jù)中心性能的未來,光互連和電氣互連方法之間有一個明顯的拐點,主要原因有兩點:首先,我們正快速接近電氣性能的物理極限。
如果不進(jìn)行根本性創(chuàng)新,高能效電路設(shè)計將存在諸多限制。第二是 I/O 功耗墻。計算的帶寬需求大約每三年翻一番。遺憾的是,電氣性能擴(kuò)展跟不上帶寬需求的增長速度,導(dǎo)致了I/O“功耗墻”,即I/O 功耗會逐漸高于所有現(xiàn)有的插接電源,導(dǎo)致無法計算。”
光互連技術(shù)涉及六大技術(shù)要素:光產(chǎn)生、光放大、光檢測、光調(diào)制、CMOS 接口電路和封裝集成。最近,英特爾在其他五大技術(shù)構(gòu)建模塊上實現(xiàn)了重大創(chuàng)新,這也加速實現(xiàn)其為集成光電構(gòu)建的關(guān)鍵技術(shù)模塊的愿景。James認(rèn)為,這些構(gòu)建模塊將從根本上革新計算 I/O,并徹底改變未來的數(shù)據(jù)中心通信趨勢。
首先是光調(diào)制。傳統(tǒng)硅調(diào)制器體積巨大,占據(jù)過多空間,因此放置在 IC 封裝上的成本很高。英特爾實現(xiàn)的一個最新突破就是開發(fā)了微型微射線調(diào)制器。它們的體積縮小了 1000 倍,因此服務(wù)器封裝上可以放置幾百個這樣的器件。
第二項突破是光探測--全硅光電探測器(all-silicon photo detector)。幾十年來,業(yè)界一直認(rèn)為硅幾乎不具備光探測能力。英特爾證明了事實并非如此。這項突破的一個主要優(yōu)勢是降低了成本。
第三個是光放大。它和激光器一樣重要。如果要降低總功耗,那么集成半導(dǎo)體光學(xué)放大器將是不可或缺的技術(shù)。因此,如果沒有集成激光器,就不可能有這些放大器。
最后,英特爾通過協(xié)同集成將CMOS 電路和硅光子技術(shù)整合起來。今年二月,英特爾發(fā)布了 3D 堆疊 CMOS 電路,在該電路中兩個 IC 上下堆疊,與光子直連。截至目前,其他公司沒有展示過將集成激光器、半導(dǎo)體光學(xué)放大器、全硅光電探測器和微型環(huán)調(diào)制器集成在一個與CMOS硅緊密集成的單個技術(shù)平臺上。
神經(jīng)擬態(tài)計算
近幾年,隨著深度學(xué)習(xí)的出現(xiàn),人工智能領(lǐng)域取得了驚人的進(jìn)展,但與此同時,進(jìn)展的代價是人工智能系統(tǒng)功耗不斷增加。訓(xùn)練一個現(xiàn)代人工神經(jīng)網(wǎng)絡(luò)需要使用數(shù)千臺集群服務(wù)器,功耗高達(dá)數(shù)百萬瓦。它正逐漸變成人工智能不斷發(fā)展、以及廣泛普及的瓶頸。那么,如何才能將人工智能任務(wù)的能效提高 1000 倍呢?
英特爾試圖找到一種更通用的人工智能架構(gòu),能實時解決各種類型的問題,從規(guī)劃問題到優(yōu)化問題并且能夠以比今天的常規(guī)方法快得多的速度,實現(xiàn)模式匹配和深度學(xué)習(xí)模型所能做到的,并且使用更加節(jié)能的解決方案。它是一種非常基本的、自下而上的角度,直接從神經(jīng)科學(xué)中獲取靈感。目標(biāo)是要開發(fā)出比現(xiàn)有的更通用的可編程架構(gòu)。
2015年英特爾開始以現(xiàn)代神經(jīng)科學(xué)理解作為靈感開發(fā)了一種新型計算機(jī)架構(gòu)。相比傳統(tǒng)計算機(jī)架構(gòu),神經(jīng)擬態(tài)架構(gòu)完全模糊了內(nèi)存和處理之間的界限。和大腦一樣,它利用的是數(shù)據(jù)連接、數(shù)據(jù)編碼和電路活動中所有形式的稀疏(sparsity)。處理就發(fā)生在信息到達(dá)時,二者同步進(jìn)行。計算是數(shù)百萬個簡單處理單元之間動態(tài)交互的發(fā)展結(jié)果,就像大腦中的神經(jīng)元一樣。
這種新型計算機(jī)架構(gòu)旨在將能效、實時數(shù)據(jù)處理速度、學(xué)習(xí)數(shù)據(jù)的效率等提升多個數(shù)量級。英特爾高級首席工程師、英特爾研究院神經(jīng)擬態(tài)計算實驗室主任Mike Davies 介紹說:“我們的目標(biāo)是支持廣泛的工作負(fù)載,而不僅僅只有深度學(xué)習(xí)。因為大腦解決問題的范圍很大,所以我們認(rèn)為這個目標(biāo)是可以實現(xiàn)的。我們認(rèn)為還可以將這種架構(gòu)從邊緣擴(kuò)展到數(shù)據(jù)中心,鑒于自然界中大腦容量的巨大差異,從螞蟻到鸚鵡,再到人類的大腦。”
2017 年英特爾發(fā)布了首款神經(jīng)擬態(tài)研究芯片Loihi。該芯片采用英特爾主流的14 納米制程技術(shù)制造而成。相比其他神經(jīng)擬態(tài)芯片,Loihi 具有前所未有的靈活性、集成性和速度。它還具有片上學(xué)習(xí)功能,遠(yuǎn)遠(yuǎn)超出了目前使用的所有芯片。Loihi 沒有深度學(xué)習(xí)硬件中普遍存在的浮點數(shù)和乘法累加器單元。
Loihi 沒有片外內(nèi)存接口。和大腦一樣,所有計算都在芯片上進(jìn)行,通過二進(jìn)制脈沖信息和低精度信號。內(nèi)存來源于芯片神經(jīng)元之間的連接。Loihi 采用同質(zhì)架構(gòu),將許多小神經(jīng)擬態(tài)核實例化,每個核的大小只有針頭的一部分。通過將神經(jīng)擬態(tài)結(jié)構(gòu)從幾核擴(kuò)展到幾百核,可以將小型的專用工作負(fù)載擴(kuò)展至 CPU 或 GPU 大小的芯片。甚至還可以無縫排列這些芯片。
此外,英特爾特別成立了英特爾神經(jīng)擬態(tài)研究社區(qū),簡稱 INRC,借此與世界各地不同類型的學(xué)術(shù)界、政府實驗室和企業(yè)的研究人員交流合作。到截至目前,INRC 已經(jīng)發(fā)表了40 多篇經(jīng)過同行評審的論文,其中許多論文中都記錄了量化結(jié)果,證明這項技術(shù)能夠帶來有效的性能提升。部分機(jī)器人工作負(fù)載顯示,Loihi 的功耗比傳統(tǒng)解決方案低 40-100 倍。Mike表示:“盡管 Loihi 的基準(zhǔn)評測結(jié)果令人驚嘆,但我們?nèi)匀蝗狈y(tǒng)一的編程框架將這些示例整合到更大規(guī)模的功能系統(tǒng)中。這些問題代表著神經(jīng)擬態(tài)研究的最前沿。”
據(jù)介紹,短期內(nèi),由于成本問題,該技術(shù)要么僅適用于邊緣設(shè)備、傳感器等小規(guī)模設(shè)備,要么僅適用于對成本不敏感的應(yīng)用,如衛(wèi)星、專用機(jī)器人。隨著時間的推移,英特爾預(yù)計內(nèi)存技術(shù)的創(chuàng)新能夠降低成本,讓神經(jīng)擬態(tài)解決方案擴(kuò)大適用范圍,運(yùn)用于各種需要實時處理數(shù)據(jù)但受限于體積、重量、功耗等因素的智能設(shè)備。今年是英特爾針對神經(jīng)擬態(tài)計算研究的第五年,他們非常看好神經(jīng)擬態(tài)計算的前景,并且堅信,神經(jīng)擬態(tài)計算未來將幫助各種應(yīng)用實現(xiàn)巨大突破。Mike分享說:“我們將在 2021 年第 1 季度發(fā)布下一代Lava軟件開發(fā)框架的開源版本,以此能夠觸及到更龐大的軟件開發(fā)人員社區(qū)。”
量子計算
量子計算是近年來一個非常活躍的研究領(lǐng)域,如果我們能夠解決相關(guān)的科學(xué)與工程問題以支持它們大規(guī)模運(yùn)行,它們將變得非常強(qiáng)大。比如設(shè)計新藥物和改進(jìn)藥物會對醫(yī)療健康產(chǎn)生重要影響,而這也是量子計算未來的一個潛在應(yīng)用領(lǐng)域。其他應(yīng)用領(lǐng)域包括設(shè)計新型材料和化學(xué)催化劑。在這些應(yīng)用領(lǐng)域,很多材料都是經(jīng)典計算機(jī)無法模擬的。
英特爾高級首席工程師、英特爾研究院量子應(yīng)用與架構(gòu)總監(jiān)Anne Matsuura認(rèn)為:“商用級量子計算機(jī)將支持模擬這些材料,方便將來設(shè)計具有獨特屬性的材料、化學(xué)用品和藥物。但目前僅僅有 100 個量子位甚至數(shù)千個量子位的量子計算系統(tǒng),我們需要開發(fā)包含數(shù)百萬個量子位的全棧商用級量子計算系統(tǒng),才能達(dá)到量子實用性來解決這類復(fù)雜問題。”據(jù)介紹,英特爾的量子研究主要集中在自旋量子位技術(shù)、低溫控制技術(shù)和全棧創(chuàng)新等關(guān)鍵領(lǐng)域。每一個領(lǐng)域都旨在解決通往量子計算可擴(kuò)展性道路上的關(guān)鍵挑戰(zhàn),英特爾正在系統(tǒng)地布局每一個領(lǐng)域,以實現(xiàn)量子擴(kuò)展。
首先,擴(kuò)展量子的最大挑戰(zhàn),就是如何批量生產(chǎn)高質(zhì)量量子位。重點其實并不只是量子位的數(shù)量。目前我們看到的小型量子計算系統(tǒng)中所使用的量子位,其質(zhì)量對于商用級量子系統(tǒng)來說是遠(yuǎn)遠(yuǎn)不夠的。我們需要壽命足夠長、相互之間連接性足夠強(qiáng)的量子位,以便擴(kuò)展至包含數(shù)百萬量子位的商用級量子計算機(jī),能夠在實際的應(yīng)用領(lǐng)域執(zhí)行有效的量子程序或量子算法。自旋量子位與英特爾的晶體管技術(shù)非常相似,可提供最佳的發(fā)展路徑。英特爾量子研究的優(yōu)勢在于,他們構(gòu)建量子位的晶圓廠實際上同樣用于開發(fā)最新、最出色的制程節(jié)點。
量子計算面對的第二個挑戰(zhàn)是量子位控制。英特爾在這一領(lǐng)域取得了巨大進(jìn)展。當(dāng)前,量子位主要由許多機(jī)架(rack)的控制電路進(jìn)行控制,這些電路通過復(fù)雜的布線連接至量子位,并且被放置在低溫冰箱中,以防止熱噪聲和電噪聲影響脆弱的量子位。對于商用級量子計算系統(tǒng),需要將數(shù)百萬根導(dǎo)線引入量子位室(qubit chamber)。這樣不具備可擴(kuò)展性。英特爾采用支持可擴(kuò)展互連的低溫量子位控制芯片技術(shù),以解決這一挑戰(zhàn),并開發(fā)了世界一流的低溫控制芯片,該芯片基于 22 納米 FinFET 技術(shù),可以在低溫冰箱內(nèi)進(jìn)行集成。
量子計算面對的第三個挑戰(zhàn)是糾錯。全面糾錯需要數(shù)十個量子位形成一個邏輯量子位。英特爾正在開發(fā)抗噪量子算法和錯誤抑制技術(shù),幫助在目前的小型量子位系統(tǒng)上運(yùn)行這些算法。
量子計算面對的第四個挑戰(zhàn)是,需要可擴(kuò)展的全棧量子計算機(jī)。由于量子計算是一種全新的計算類型,運(yùn)行程序的方式完全不同,因此需要開發(fā)量子專用的軟件、硬件和應(yīng)用。這也意味著,從應(yīng)用、編譯器、量子位控制處理器、控制電路,到量子位芯片器件,量子計算的整個堆棧都需要采用全新組件。英特爾正在開發(fā)整個量子計算堆棧的所有組件,并這些量子組件協(xié)同工作。
英特爾正在逐步實現(xiàn)商用級量子計算的愿景。Anne分享說:“英特爾發(fā)展量子計算的方法就是利用英特爾的優(yōu)勢,特別是利用英特爾在芯片和電路制造工藝方面的專長。目標(biāo)是達(dá)到數(shù)百萬個量子位的規(guī)模,并且我們相信,我們所選擇的自旋量子位技術(shù)在低溫測試和控制方面所取得的進(jìn)步,集成光子以及所采用的全棧系統(tǒng)方法,將引領(lǐng)我們率先實現(xiàn)這一目標(biāo)。”
保密計算
釋放數(shù)據(jù)潛力除了傳輸數(shù)據(jù)方面的挑戰(zhàn)外,保護(hù)數(shù)據(jù)隱私也是當(dāng)前所面臨的障礙之一,尤其是在醫(yī)療、金融服務(wù)等許多領(lǐng)域,數(shù)據(jù)所有者可能需要遵循相關(guān)法規(guī),最大的數(shù)據(jù)集往往都被限制在所謂的數(shù)據(jù)孤島中。然而,這些數(shù)據(jù)孤島對使用機(jī)器學(xué)習(xí)工具從數(shù)據(jù)中獲取重要洞察造成了巨大障礙。為了解決這些問題,英特爾一直在推動保密計算的發(fā)展。
本世紀(jì)初,英特爾研究院就開始研究如何隔離應(yīng)用,結(jié)合硬件訪問控制技術(shù)和加密技術(shù),以提供保密性和完整性保護(hù)。例如最新的英特爾軟件保護(hù)擴(kuò)展(Software Guard Extensions )技術(shù),它將保密性、完整性和認(rèn)證功能整合在一起,確保使用中的數(shù)據(jù)安全無虞。英特爾研究院安全智能化項目組首席工程師Jason Martin介紹,當(dāng)前加密解決方案主要用于保護(hù)在網(wǎng)絡(luò)中發(fā)送以及存儲的數(shù)據(jù)。但數(shù)據(jù)在使用過程中依然容易遭遇攻擊。保密計算旨在保護(hù)使用中的數(shù)據(jù)。為此,英特爾提供數(shù)據(jù)保密性以防止機(jī)密泄露,提供執(zhí)行完整性以防止計算被篡改,并提供認(rèn)證功能,以驗證軟硬件的真實性。此外,英特爾還在研究另一種不需要解密數(shù)據(jù)的方法,叫做同態(tài)加密(homomorphic encryption)。
據(jù)了解,完全同態(tài)加密是一種全新的加密系統(tǒng),它允許應(yīng)用在不暴露數(shù)據(jù)的情況下,直接對加密數(shù)據(jù)執(zhí)行計算操作。該技術(shù)已逐漸成為委托計算中用于保護(hù)數(shù)據(jù)隱私的主要方法。例如,這些加密技術(shù)允許直接對加密數(shù)據(jù)進(jìn)行云計算,不需要信任云基礎(chǔ)設(shè)施、云服務(wù)或其他使用者。傳統(tǒng)加密要求云服務(wù)器訪問密鑰,才能解鎖數(shù)據(jù)用于處理。同態(tài)加密允許云對密文或加密數(shù)據(jù)執(zhí)行計算操作,然后將加密結(jié)果返回給數(shù)據(jù)所有者,從而簡化并保護(hù)了這一過程。結(jié)果表明,任何計算都可以由加法和乘法構(gòu)成。Jason分享說:“在完全同態(tài)加密中,你可以用任意復(fù)雜度的算法對加密數(shù)據(jù)執(zhí)行這些基本操作。之后解密數(shù)據(jù)時,這些操作適用于純文本。”
不過,Jason也表示,目前仍存在一些挑戰(zhàn),阻礙了完全同態(tài)加密的采用。在傳輸和存儲數(shù)據(jù)時,傳統(tǒng)加密機(jī)制的開銷相對來說可以忽略不計,但在完全同態(tài)加密中,同態(tài)密文的篇幅比純數(shù)據(jù)大得多,有時候大 1,000-10,000 倍。數(shù)據(jù)激增將導(dǎo)致計算激增。密文的增加,要求處理能力隨之增加。處理開銷不僅會隨著數(shù)據(jù)的增加而增加,還會隨著計算復(fù)雜性的增加而增加。就是因為這些巨大的開銷,導(dǎo)致同態(tài)加密尚未得到廣泛使用。英特爾正在研究新的軟硬件方法,希望普及這項技術(shù),并與生態(tài)系統(tǒng)和標(biāo)準(zhǔn)機(jī)構(gòu)開展合作。
機(jī)器編程
編程目前出現(xiàn)了兩種對立的趨勢。首先,計算資源變得越來越異構(gòu)化,因為我們對某些種類的工作負(fù)載進(jìn)行了專業(yè)化處理。所以需要專家級的程序員,因為他們非常了解硬件以及如何最大限度地利用硬件。但與此同時,軟件開發(fā)人員越來越青睞于使用更抽象的語言,以提高工作效率。這反過來會導(dǎo)致硬件難以發(fā)揮出它本身的性能。并且這種差距正在擴(kuò)大。為此。英特爾一直致力于引入新的方法教計算系統(tǒng)自己編程,即機(jī)器編程。
機(jī)器編程與機(jī)器學(xué)習(xí)有很大的不同,機(jī)器編程是教系統(tǒng)自己編程。它的核心原則是,人類向機(jī)器表達(dá)他(她)的意圖,機(jī)器會自動創(chuàng)建完成該意圖所需的所有軟件。自動生成軟件領(lǐng)域是機(jī)器編程的核心重點。機(jī)器編程實際上是構(gòu)建系統(tǒng),然后由系統(tǒng)自行構(gòu)建自己的軟件系統(tǒng)。而硬件系統(tǒng)作為副產(chǎn)品,也隨之構(gòu)建起來。英特爾致力于讓機(jī)器編程同時從兩個方向發(fā)力。首先,希望機(jī)器編程系統(tǒng)能夠提高編碼員和非編碼員的工作效率。第二,希望確保機(jī)器編程系統(tǒng)生成的是高質(zhì)量、快速、安全的代碼。如果做不到這兩點,就不能真正地幫助到開發(fā)人員。
基于這兩個核心價值觀,英特爾首席科學(xué)家、英特爾研究院機(jī)器編程研究主任及創(chuàng)始人Justin Gottschlich認(rèn)為,機(jī)器編程關(guān)鍵的第一步是改進(jìn)軟件調(diào)試(Debug)。軟件Debug在本質(zhì)上就是識別、分析和糾正軟件缺陷的過程。然而,Debug嚴(yán)重影響了程序員的工作效率。2017 年劍橋大學(xué)開展的一項調(diào)查顯示,美國程序員平均花費 50%的時間用在Debug上,這是很長的時間。除了提高魯棒性,英特爾還希望能夠減少Debug時間。
Justin介紹,機(jī)器編程有三大支柱,分別是意圖(intention)、創(chuàng)造(invention)和適應(yīng)(adaptation)。這三大支柱,是英特爾創(chuàng)新方法的核心驅(qū)動力之,也是許多學(xué)術(shù)界和產(chǎn)業(yè)界合作伙伴的核心驅(qū)動力之一。Justin分享說,英特爾已經(jīng)開發(fā)了兩個具體的系統(tǒng),現(xiàn)在正在將它們集成到生產(chǎn)級系統(tǒng)中。
l 2019年,英特爾在NeurIPS 上發(fā)布第一個可以自動檢測性能漏洞的機(jī)器編程系統(tǒng)。這個系統(tǒng)實際上發(fā)明了用于檢測性能問題的測試。有了這個系統(tǒng),人類不用編寫一行代碼。最重要的是,同一個系統(tǒng)可以自動將發(fā)明的測試應(yīng)用于不同的硬件架構(gòu)上。這就解決了硬件異構(gòu)問題。
l 2020年,英特爾構(gòu)建了第二個系統(tǒng),并且已經(jīng)在NeurIPS 2020上展示了這項研究。該系統(tǒng)也是嘗試查找漏洞,但它不僅限于查找性能漏洞,它可以在無人監(jiān)督的情況下識別漏洞。在機(jī)器學(xué)習(xí)領(lǐng)域,這意味著它可以在沒有任何人類生成的數(shù)據(jù)標(biāo)簽下學(xué)習(xí)。最近該系統(tǒng)剛剛突破了從超過 10 億行代碼中學(xué)習(xí)的極限。并且每次添加更多數(shù)據(jù),它似乎都能學(xué)到以前沒有觀察到的新事物。
責(zé)任編輯:xj
原文標(biāo)題:英特爾披露集成光電、神經(jīng)擬態(tài)計算、量子計算等五大前沿最新進(jìn)展
文章出處:【微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英特爾
+關(guān)注
關(guān)注
61文章
9950瀏覽量
171695 -
量子計算
+關(guān)注
關(guān)注
4文章
1095瀏覽量
34941 -
神經(jīng)計算
+關(guān)注
關(guān)注
0文章
12瀏覽量
4131
原文標(biāo)題:英特爾披露集成光電、神經(jīng)擬態(tài)計算、量子計算等五大前沿最新進(jìn)展
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論