3月28日,初創公司Databricks宣布其開源AI模型DBRX面世,宣稱為目前全球功能最強的開源大語言模型,超過了Meta公司的Llama 2系列產品。
據了解,DBRX模型運用的是Transformer架構,內置參數高達1320億,擁有由16個專家網絡組成的復雜系統。每次進行推理時,僅需使用其中的四個專家網絡就能激活360億的復雜參數。
公司在博客文章中詳解道,就算與Meta公司的 Llama 2-70B、法國MixtralAI公司的Mixtral以及馬斯克旗下xAI公司研發的Grok-1這些知名開源模型相比,DBRX仍在語言理解、編程、數學和邏輯等多個領域表現出色。
具體來說,DBRX在語言理解性能上得分73.7%,領先于GPT-3.5的70.0%、Llama 2-70B的69.8%、Mixtral的71.4%以及Grok-1的73.0%;而在編程能力測試中,得分為70.1%,傲視群雄地拋離GPT-3.5的48.1%、Llama 2-70B的32.3%、Mixtral的54.8%以及Grok-1的63.2%;至于數學水平,DBRX得分66.9%,同樣優于包括GPT-3.5在內的其他競品。
據悉,DBRX模型的構建借鑒了MegaBlocks的研究成果及開源項目,每秒能高速處理大量數據。Databricks堅信,這種性能卓越性必將引領未來開源MoE模型的創新發展。
-
AI
+關注
關注
87文章
30996瀏覽量
269297 -
模型
+關注
關注
1文章
3254瀏覽量
48878 -
Meta
+關注
關注
0文章
271瀏覽量
11397
發布評論請先 登錄
相關推薦
評論