在人工智能發展浪潮中,大模型的開源與閉源之爭一直是業內的熱點話題。隨著技術的不斷進步和應用場景的日益豐富,如何降低大模型的使用門檻,讓更多人能夠便捷地應用于實際業務場景,成為了推動行業發展的關鍵所在。而開源大模型,無疑是這一進程中具有里程碑意義的重要一步。
近日,2024開放原子開發者大會暨首屆開源技術學術大會——開源大模型落地實踐分論壇上,武漢人工智能研究院院長、中國科學院自動化研究所副總工程師王金橋,武漢大學教授葉茫,騰訊機器學習平臺專家、混元大模型預訓練負責人孫興武,北京智源人工智能研究院數據研究組負責人劉廣,小米AI技術專家張俊博,阿里云智能集團技術專家馬騰,中國科學院自動化研究所副研究員、武漢人工智能研究院算法架構師易東,Monkey大模型一作、華中科技大學碩士生楊彪等多位深耕開源大模型的技術專家,深入探討了開源大模型的前沿技術進展、應用創新及行業落地實踐。本論壇由開放原子開源基金會、中國通信學會主辦,CSDN、武漢人工智能研究院協辦。
王金橋在致辭中強調了開源對大模型生態發展的推動作用,以及它在降低技術門檻、促進技術創新方面的價值。他提到,盡管開源大型模型已取得顯著成就,但還需面對數據質量、隱私保護、模型解釋性以及安全可靠性等挑戰。他期望通過不懈努力,進一步促進開源社區的繁榮發展,推動技術共享的進程。
在主題內容分享環節,葉茫分享了團隊在多模態大模型微調、持續學習和輕量化等方面的研究,特別是跨模態目標檢索系統的開發,以及無人機場景下的工業檢索和夜間場景下可見光與紅外圖像的跨模態匹配等工作。
孫興武介紹了騰訊混元大模型在技術和應用上的最新成果,包括自研星脈高性能計算網絡及其Angel訓練框架,以及廣告推薦、代碼生成、AI客服等多個業務場景的應用案例。
劉廣聚焦于高質量數據集的構建及其對模型性能的重要性,介紹了BGE向量模型及Aquila語言模型,并強調了中文互聯網最大規模的數據集CCL3.0的價值。他指出,通過定義高質量數據的標準并結合小模型驗證效果的方法,可以有效提高模型的表現力。
張俊博介紹了XIAOMI DASHENG聲音預訓練模型。該模型具有優秀的場景區分能力和環境音識別能力,只需簡單幾行代碼就能達到SOTA級別的性能,不僅適用于音頻表征任務,還可以作為多模態大模型的一部分,提供穩定的音頻編碼服務。
馬騰分享的Mooncake項目,是一個用于優化大模型推理服務的開源項目。采用P/D分離架構和KVCache緩存池提升吞吐量,減少算力開銷,支持多種通訊協議和存儲方式,適配多種推理框架,增強了分布式部署能力。
易東講解了“紫東太初”多模態大模型的研發歷程和發展方向,展示了在醫療、教育、政務等多個領域的應用實例,并公布了FAST SAM、FLAP等多個開源項目,這些項目進一步豐富了多模態大模型的應用生態。
最后,楊彪介紹了Monkey多模態大模型及其在文檔智能中的應用,通過切塊處理提高圖片分辨率和更詳細的標注數據進行微調,提出了TEXTMonkey,針對文檔領域進行優化,實現了更高的精度和更好的可解釋性。
如今,各行各業都已進入智能化升級關鍵階段,開源大模型的創新已無處不在。通過服裝模特AI生成技術,企業可以降低拍攝海報的人力成本;通過跨領域合作,實現了文本指令區域編輯和動圖生成,為智能電視提供了更豐富的用戶體驗;通過多模態情感語義理解基礎模型,不僅有助于提升情感意圖識別的準確性,還為精神疾病診斷提供了新的思路,類似的案例不勝枚舉。
總體而言,在開源生態中,大模型在眾多應用場景中均展現出良好的性能表現。眾多企業不僅在大模型的微調、持續學習和輕量化等領域進行了深入研究,而且正積極推動這些技術在具體業務場景中的廣泛應用和落地實施。
-
人工智能
+關注
關注
1791文章
47341瀏覽量
238726 -
開源
+關注
關注
3文章
3362瀏覽量
42526 -
大模型
+關注
關注
2文章
2474瀏覽量
2779
原文標題:從理論到實踐,開源大模型在多領域的應用探索
文章出處:【微信號:開放原子,微信公眾號:開放原子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論