近日,人工智能國際頂會ICML 2020公布了論文收錄結果,阿里巴巴7篇論文入選,是入選論文數(shù)量最多的中國科技公司。ICML是機器學習領域全球最具影響力的學術會議之一,今年接受率僅為21.8%。
根據(jù)ICML官方顯示,阿里7篇論文涵蓋在圖像識別、自然語言處理、搜索推薦等領域的研究成果,其中一篇《Boosting Deep Neural Network Efficiency with Dual-Module Inference》,提出了一種全新的AI推理方法,可大幅減少AI對計算和內(nèi)存資源的消耗,能將推理速度提升3倍。
近年來AI模型變得越來越復雜化,尤其是類似語言AI這類復雜模型,給計算、內(nèi)存資源帶來了新的挑戰(zhàn)。目前,業(yè)界通用的解決方法是采用更先進的計算性能來運行AI任務,例如采用GPU、FPGA或者NPU等異構計算,但該方法并沒有從根源上解決問題。
阿里巴巴達摩院設計出了一種“AI雙腦思考”的方法,能讓大型神經(jīng)網(wǎng)絡像人類一樣學會“快思考”與“慢思考”,從而進行高效且準確的推理過程。
該方法被稱為“雙模推理”, 即將一個復雜任務拆分成兩個任務,例如在復雜AI推理任務過程中,可以先以很小的資源運行“小網(wǎng)絡”,同時分析哪些網(wǎng)絡的區(qū)域較為敏感,然后只對敏感區(qū)域在“大網(wǎng)絡”中運行計算。
達摩院的科學家從理論上證明了雙模推理的可行性,且在CPU上實現(xiàn)了該方法。實際效果顯示,該方法能在保證模型精度的基礎上,在語言模型上減小40%的訪存,達到1.54倍-1.75倍的性能提升,同時可以在僅損耗0.5%精度基礎上,提升3倍的推理速度。
近年來,阿里在AI領域迎來了基礎研究與產(chǎn)業(yè)應用成果雙爆發(fā)的階段。三年前,阿里巴巴成立了內(nèi)部研究機構達摩院,深入AI研究前沿。據(jù)了解,阿里AI已在國際頂級技術賽事上獲得了近60項世界第一,500多篇論文入選國際頂會。同時,阿里AI落地了多項重大研究成果,全面賦能各行各業(yè)。達摩院醫(yī)療AI團隊疫情期間研發(fā)的AI診斷技術,已在全球近600家醫(yī)院落地,完成50余萬例臨床診斷。
責任編輯:tzh
-
cpu
+關注
關注
68文章
10855瀏覽量
211615 -
AI
+關注
關注
87文章
30763瀏覽量
268917 -
人工智能
+關注
關注
1791文章
47208瀏覽量
238303
發(fā)布評論請先 登錄
相關推薦
評論