7月15日,由全球知名電子科技媒體<電子發燒友>主辦的“AI+語音/圖像”智能技術線上論壇圓滿舉行,本次論壇邀請到來自知存科技、萊迪思、聲揚科技、清微智能、希爾貝殼等企業的專家和領導進行精彩的技術分享。
在電子行業內卷嚴重的時候,人工智能是為數不多還在快速增長的行業之一。電子發燒友總經理張迎輝表示,以前人們對于人工智能的技術定義,是非常高大上,非常前沿的,經過三年的AI技術落地,不少朋友將人工智能技術的定義,改成了減少人力工作的智能技術。
知存科技:存算一體芯片的發展、挑戰和未來
本次論壇,知存科技CEO王紹迪帶來的主題是《存算一體芯片的發展、挑戰和未來》,知存科技成立于2017年,并且公司團隊早在2012年就開始存算一體技術研發,2018年完成國內首個存算一體芯片流片,2020年發布首個存算一體芯片產品WTM1001,2021年WTM1001量產,并發布第二代產品WTM2101。
據王紹迪介紹,近十年來摩爾定律開始放緩,而存儲器在更早的時候摩爾定律就接近終結,比如DRAM工藝現在進行到10-20nm之間,一般在15-17nm工藝,Flash一般是20-40nm之間的工藝流程,存儲器的工藝實際上比邏輯芯片更老,這導致存儲器的速度在過去10-20年里都很難提升。
這就造成了存儲墻瓶頸,一是數據搬運慢,存儲容量越來越大,存儲器帶寬速度沒有增加,CPU速度越來越快,核數從雙核、四核、八核,到幾千核、上萬核,這導致每個核能使用的存儲器資源越來越少,數據量大,做運算的時候,大部分時間都消耗在數據搬運上,運算速度受到存儲帶寬的影響,無法進一步提升。
二是搬運能耗大,據王紹迪介紹,在28nm工藝下,32bit數加法功耗基本是0.1/0.9pJ,乘法是3.1/3.7pJ,當把64bit數從8KB SRAM中取出,消耗功耗10pJ,從1MB SRAM中拿出,消耗功耗100pJ,說明存儲器越大,從中取出一個數需要的功耗也越大,如果從芯片外部DRAM中取出來,需要消耗2000pJ,搬運功耗是運算功耗的幾百倍。
現在大部分芯片都采用馮諾依曼架構,上述存儲墻瓶瓶頸與此有關,為了解決這些問題,出現了3D Xpoint、3D封裝等方案,用于減少搬運耗時和功耗大的問題,不過這些還都是采用馮諾依曼架構,存算一體與這些方法有所不同,存算一體可以理解成用存儲器去做運算,存算一體芯片也像是計算芯片。
存儲一體的應用場景廣泛,包括可穿戴、智能IPC、移動終端、AR/VR、智能駕駛、數據中心等,不同應用場景,對存算一體芯片的算法和算力的要求也不一樣。
知存科技第二代產品WTM2101,是一款基于RISC-V的存算一體芯片,該芯片包括存算一體MPU,用于實現深度學習算法,RISC-VCore,加速單元,RAM,以及Audio codec,可以處理外面麥克風采集來的數據,這顆存算一體芯片可以用來做一些算法級的應用,比如語音識別、語音增強、血壓/血糖、心電算法等。
萊迪思:CrossLink-NX FPGA助力網絡邊緣AI
萊迪思亞太區資深市場開拓經理林國松分享了《使用超低功耗FPGA在網絡邊緣實現毫瓦級人工智能》的主題演講。
2020年萊迪思營收達到4.08億美元,過去四年的出貨量超過10億片。主要聚焦在通信計算(39%)、工業和汽車(37%)、消費電子和其他(24%)。萊迪思FPGA的產品定位在小尺寸、低功耗、安全、可靠設計和易于使用。
ABI Research數據顯示,截至2024年,設備端AI推理功能預計將覆蓋60%的設備。
網絡邊緣應用的性能要求,包括1-500GOPS,功耗要求低于50mW,0.5-5TOPS算力的,功耗要求低于5W,大于10TOPS的,功耗要求低于50W。
萊迪思sensAI推出一系列FPGA產品,例如比較新的CrossLink-NX,還有IP CORE,開發軟件等。
下圖右側是萊迪思的FPGA,左側顯示有訓練模型,通過萊迪思開發的神經網絡編譯器轉化成量化的權重和指令。此外,通過FPGA設計使用人工智能訓練后的量化權重和指令,達到AI功能的實現。
最近,萊迪思推出全新的sensAI Studio。方便客戶更快的配置訓練環境,令客戶專注于開發AI功能。sensAI Studio能夠快速搭建訓練的網絡,優化開發流程。
萊迪思通過軟件優化的設計方法,目前可支持到Tensorflow Lite,在標準環境訓練完成后通過編譯器進行轉換,再植入到FPGA器件上。
CrossLink-NX
CrossLink-NX 系列 FPGA 的設計采用了全新的Lattice Nexus技術平臺,結合了28 nm FD-SOI 制造工藝與 Lattice的全新 FPGA 架構,針對小尺寸、低功耗應用進行了優化。
例如,在針對圖像的AI處理參考設計中,傳感器的圖像數據傳給FPGA器件,進行神經網絡加速,輸出結果給MCU。
從性能上看,NX-40K提供60fps每秒速率,是上一代產品的12倍,功耗方面,與上一代相比功耗減半。這兩項指標在與MCU相比也有顯著的優勢。
CrossLink-NX提供17-40K邏輯單元,大量嵌入式存儲和DSP模塊,具有瞬間啟動,支持硬核PCIe等。在器件內部,由于增強了嵌入式存儲器,將所有AI的計算過程在FPGA片上實現。省去外部RAM,有助于降低功耗,提升幀率和性能。
它重點應用于超低功耗人員偵測,超低功耗關鍵詞和手熱檢測,多個目標的檢測和計數,以及片上注冊和識別物體。
萊迪思提供快速原型設計的模塊化平臺,包括UPduino Shield開發板,和嵌入式視覺開發套件。前者重點是超低功耗,后者是對性能要更高求的應用。此外,軟件工具方面提供神經網絡編譯器。還提供CNN Plus加速器IP,可簡化神經網絡在CrossLink-NX的實現。
網絡邊緣AI的算法持續推陳出新,FPGA具有可拓展的性能應對各類應用案例,可以靈活應對,且具有靈活的計算資源、超低功耗和可編輯硬件等特性。萊迪思CrossLink-NX FPGA以高性能數據處理、低功耗運行且尺寸較小的特性,為客戶提供網絡邊緣 AI/ML 推理解決方案。
聲揚科技謝基有:語音交互智能分析在產業數字化的應用
聲揚科技是業界領先的語音交互智能分析平臺與新型知識服務提供商,為金融、公安、政府、IoT和互聯網行業提供了“以用戶為中心”的語音智能化解決方案。聲揚科技產品VP謝基有在本次線上論壇介紹了“語音交互智能分析在產業數字化的應用”。
語音交互全流程 / 聲揚科技
AI語音分析已經在諸多汽車場景中的得到了應用,比如車內降噪和身份核驗等。然而復雜的車內聲音空間,對前端語音處理來說是一項巨大的挑戰。車內存在多聲道、音量大和非線性失真大的問題,噪聲的存在同樣不可忽視,比如風噪、地面胎噪、空調出風口噪聲、引擎噪聲和振動噪聲等。
車內聲音處理 / 聲揚科技
聲揚科技的車載前端雙音區拾音車規芯片解決了這些挑戰,為車內語音交互系統提供了雙音區拾音、人聲分離和超強降噪功能。聲揚科技還為客戶提供智能車載操作系統,通過聲紋識別來確認車主身份,從硬件與系統上大幅提升人車語音交互體驗。
在數字金融的運用上,智能語音可以助力產業數字化轉型升級,用于金融風控反欺詐、APP聲紋登錄、聲紋開卡等操作和管理。聲揚科技也是中國工商銀行總行聲紋識別項目的唯一供應商,FinVoice智能語音認證系統已在多場景上線,用戶量達4.16億。
聲揚科技擁有全棧語音技術儲備,基于深度神經網絡、機器學習、深度學習等人工智能前言理論打造了多項自主可控的原創計算機聽覺技術,覆蓋了前端聲學信號采集、語音信號處理、后端特征提取識別等全流程,構建了以聲紋識別為特色的1+N智能語音算法體系。在智能語音技術上,聲揚科技具備自動防錄音攻擊、超短語音驗證、跨信道等優勢,而且系統資源占用低,支持高并發和海量千萬級數據庫檢索。
北京清微智能于義:可重構計算芯片高效解決兩大AI場景中的痛點問題
7月15日,在電子發燒友主辦的AI線上技術峰會上,來自北京清微智能科技有限公司的首席架構師于義帶來了精彩演講。
“AIoT產業是多種技術融合,賦能各行業的產業,整體市場潛在空間超過十萬億,智能時代的支撐就是計算力,計算力的不斷提升催生新的需求和產品。”于義表示,“智能化主要體現在感知智能化、分析智能化和控制智能化,具體表現在智慧城市、智能制造、智能家居、智能駕駛、智能零售等場景需要強大計算力。”
AIoT產業對于芯片的要求體現在四點:高算力、高能效、靈活性、安全性。比如視頻跟蹤需要高算力,來支持智能識別的應用;高能效意味著芯片在有限的能量下完成更多的智能任務,靈活性主要聚焦萬物智能,芯片應用多種多樣,具備靈活性適配各種算法、各種應用;安全性,表現為數據安全,智能時代的安全性要求用戶數據安全被訪問、被處理。
傳統的計算架構無法滿足AIoT計算需求,可重構智能芯片是基于可重構數據流/控制流計算架構的AI芯片類型,具有按需即時重構、高能效、低功耗、通用性特點,被《國際半導體技術路線圖》評為最具前景的未來計算架構,美國電子復興計劃(ERI)將可重構計算技術列為未來美國在電子行業一直保持領導地位的核心關鍵技術,是后摩爾時代的顛覆性技術之一,也是各國爭相搶占的科技制高點。
清微智能成立于2018年7月,公司核心創業團隊來自清華大學微電子所,可重構計算技術已經在清華大學經歷了10年的探索,公司在2016年到2018年連續推出了Think Series系列芯片,性能和水平處于業界領先。清微智能是可重構計算芯片領導企業,核心技術指標領跑全球,在產品應用上,也是第一個將可重構芯片真正商用落地的企業。于義表示,清微智能的核心可重構技術包括:四元編程重構計算模式、低功耗設計、融合存內計算的可重構架構、異步電路驅動可重構技術。
于義介紹說,2018年10月,清微智能進行了Pre-A輪融資,2019年6月量產了超低功耗的智能語音Soc芯片TX210。2020年10月,清微智能量產了全球首款多模態智能計算芯片TX510芯片,這款芯片在智能安防、金融支付、航空航天等領域交付客戶。2021年4月,清微智能量產了全球首款集成獨立NPU的藍牙Soc芯片TX231,已應用于多款TWS耳機、平板、手環;2021年11月,清微智能即將量產圖像芯片TX511,采用分布式可重構處理核心,芯片性能將有數十倍提升,12月份還會推出更高端的810系列。公司與TSMC、平頭哥有深度合作。
希爾貝殼:算法+數據的開源如何實踐與語音模型評測方案
北京希爾貝殼科技有限公司 CEO卜輝帶來《算法+數據的開源如何實踐與語音模型評測方案》主題演講。隨著AI技術的成熟與應用迭代,中國智能語音市場將保持約25%的增長速度,預計到2023年,智能語音產業規模將超600億。
語音技術大致分為語音識別技術(ASR)、語音合成技術(TTS)、聲紋識別技術(VPR)。隨著技術的不斷迭代,語音技術已經應用到移動設備、汽車、家居、金融等各個場景中,卜輝強調,語音識別技術的應用核心是算力、算法的支持。
隨著開源力量的崛起,市場的需求也越來越多。語音技術的開源主要是集中在海外的早期開源軟件系統及算法,但國內的AI開發環境優于國外,例如目前全球最大的語音技術開發社區Kaldi在國內擁有很多開發者。
希爾貝殼自成立之初聚焦于場景數據服務,建立了開源數據項目。在疫情的影響下,越來越多的企業采用會議辦公模式。卜輝認為,在會議場景下,對于說話人的跟蹤、特點對象的內容轉寫、噪聲等等,還有很多技術的點需要研究。為此,希爾貝殼發布了多通道中文會議語音數據庫AISHELL-4。
卜輝介紹,AISHELL-4是一個通過麥克風陣列實錄的八通道中文普通話會議場景語音數據集,包含211場會議,每場會議4至8人,數據集共120小時左右。同時提供了準確的音字轉寫文本及時間戳信息,方便研究者進行諸如前端處理、語音識別、說話人分割等單獨任務,并可以進行聯合優化。
語音識別的準確率是通過數據集的評估可以體現具體的性能指標。卜輝圖提到,面向場景語音識別模型的評測數據集評估規范建設可以推動智能語音技術的規范化。
希爾貝殼認為,隨著整體AI算法環境的提升,語音識別技術不再是單項落地,聽覺、視覺、自然語言處理結合將成為趨勢,面向場景ASR模型的測試評估數據集也將重要的評估方式。未來,希爾貝殼將研發建設不完善的語言數據,同時結合圖像、感知等的數據來形成多模態智能語音數據。
完整論壇視頻回放,請點擊:https://webinar.elecfans.com/replay/656.html

-
語音
+關注
關注
3文章
390瀏覽量
38237 -
智能
+關注
關注
8文章
1718瀏覽量
117873 -
知存科技
+關注
關注
0文章
59瀏覽量
4178
發布評論請先 登錄
相關推薦
AI+管理賦能企業升級 金蝶云?星空AI創新私享會成功舉辦

京東方2025年首場技術策源地論壇成功舉辦
HarmonyOS NEXT 應用開發練習:AI智能語音播報
2024軟通動力AI+數字孿生創新發展論壇圓滿落幕
直面行業痛點,引領行業發展 -比創達 “AI&EMC,電磁兼容” 高峰論壇圓滿落幕

中興通訊AI創新生態論壇成功舉辦
開啟全新AI時代 智能嵌入式系統快速發展——“第六屆國產嵌入式操作系統技術與產業發展論壇”圓滿結束
阿丘科技成功入選“北京市通用人工智能產業創新伙伴計劃”,AI+工業視覺實力再獲肯定

智能化學會“數智低碳出海驅動新質生產力技術交流論壇”圓滿成功

古瑞瓦特新能源光伏儲能技術培訓會議圓滿成功!

立景創新C輪融資圓滿成功,估值飆升至155億元
德施曼智能鎖,走向AI+大時代——2024德施曼全球新品發布會圓滿收官

評論