商湯科技發布5.0多模態大模型,綜合能力全面對標GPT-4 Turbo
4月23日,商湯科技董事長兼CEO徐立在2024商湯技術交流日上發布了行業首個云、端、邊全棧大模型產品矩陣,能夠滿足不同規模場景應用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。
此外對于文生視頻徐立也表示商湯科技很快就會發布相關的平臺產品。
備受矚目的商湯科技“日日新SenseNova” 5.0多模態大模型獨特地采用了混合專家(MoE)架構,能夠無縫支持多達10T Tokens的中英文訓練數據,并在此基礎上,推理合成數據更是可高達數千億Token。尤為值得一提的是,該模型在進行推理計算時,其上下文窗口可以擴展至約200K Token范圍,使得其綜合能力中的知識、推理、數學、代碼等方面均能全面對標GPT-4Turbo。
商湯科技的領導團隊表示,這是業界首個真正意義上的“云、端、邊”全棧大模型產品矩陣,旨在滿足各種規模場景的應用需求。他們堅信,公司的技術領先地位將進一步加速生成式AI向產業落地的全面躍遷,從而實現大模型的按需所取。
商湯科技的董事長兼首席執行官徐立先生表示,在遵循尺度定律(Scaling Law)的原則下,商湯科技始終致力于推動自身大模型的研發工作,并將持續探索大模型能力的KRE三層架構(知識-推理-執行),不斷突破大模型能力的邊界。他充滿信心地指出,“我們深信,2024年將會是端側大模型爆發的重要年份。”
據了解,自去年4月首次亮相以來,商湯科技的“日日新SenseNova”大模型體系已經成功推出了五個重大版本迭代。而此次的更新重點則集中在提升了知識、數學、推理以及代碼能力等多個方面,全面對標GPT-4 Turbo,并在主流客觀評測中達到甚至超過了GPT-4 Turbo的水平。
-
商湯科技
+關注
關注
8文章
508瀏覽量
36083 -
大模型
+關注
關注
2文章
2423瀏覽量
2640
發布評論請先 登錄
相關推薦
評論