定義一種全新的“定制化”模式。
百川智能依然保持著一如既往的快節奏。
12月19日,百川智能宣布開放基于搜索增強的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超長上下文窗口的基礎上,還增加了搜索增強知識庫的能力。
即日起,API用戶可上傳文本資料來創建自身專屬知識庫,從而根據自身業務需求打造更完整、高效的智能解決方案。
2個多月前的9月25日,百川智能便發布了Baichuan2-53B閉源大模型,全面升級了Baichuan1-53B的各項能力。作為首批通過備案的大模型企業之一,百川智能此次還開放了Baichuan2-53B API接口,正式進軍to B領域,開啟商業化進程。
在當天的媒體溝通會上,百川智能創始人、CEO王小川,百川智能聯合創始人、聯席總裁洪濤,百川智能技術聯創陳煒鵬及百川智能商用業務部總經理李劍共同出席,為「甲子光年」等媒體解答了百川智能在to B模式中最新的技術與商業思考。
1.行業模型之外,大模型to B的第二條路
在過去一年對大模型商業化的討論中,行業大模型一直被認為是大模型在B端商業落地的主要路徑。
而百川智能此次走出了一條不同的路。
百川智能認為,企業自有數據/知識庫是企業的核心競爭力。大模型如果不能與企業自有數據/知識庫進行結合,對企業而言是沒有價值的。
如何將大模型與企業自有數據/知識庫更好地相結合呢?
一個已經為人熟知的方法是,打造行業大模型。然而,基于特定數據預訓練或微調垂直行業大模型需要高密度的技術人才團隊、大量的算力支持,并且每更新一次數據都要重新訓練或微調模型。
這種方式不僅成本高昂、靈活性差,更關鍵的是不能保證訓練的可靠性和應用的穩定性,多次訓練后仍會出現問題。
此外,大部分企業數據,都是結構化的數據,也不適合SFT(Supervised fine-tuning,有監督微調),模型無法準確記憶結構化信息,就會帶來幻覺。
針對這些痛點,行業摸索了一套基本操作,即“向量數據庫+長上下文窗口”。而百川智能在此基礎上進一步完善了大模型技術棧,拓展至四個維度:
向量數據庫,百川智能在向量檢索c-mteb位列第一
長窗口Baichuan2-192K,一次可輸入35萬字
實現稀疏檢索(索引庫)與向量搜索并行,模型的可用率從80%提升至95%
搜索系統和大模型對齊
具體來看,百川智能將向量數據庫升級為搜索增強知識庫,提升了大模型獲取外部知識的能力;把搜索增強知識庫和超長上下文窗口結合,讓模型可以連接全部企業知識庫以及全網信息,能夠替代絕大部分的企業個性化微調,解決99%企業知識庫的定制化需求。 這套技術棧背后,也反映了百川智能對于大模型更深層次的思考。 在百川智能的技術思考中,大模型+搜索增強是大模型時代的新計算機——
大模型類似于計算機的CPU,通過預訓練將知識內化在模型內部,然后根據用戶的Prompt生成結果;
上下文窗口可以看做計算機的內存,存儲了當下正在處理的文本;
互聯網實時信息與企業完整知識庫共同構成了大模型時代的硬盤。
那么,百川智能如何將這套技術棧真正落地在商業場景呢?
2.用“產品化”取代“項目化”
事實上,無論王小川還是他所召集的搜狗“舊部”,過往的工作經驗更多集中在to C領域。此次帶領百川智能進軍to B,無疑會面臨諸多挑戰。
洪濤告訴「甲子光年」:“企業真正要用好大模型的起點,是把企業知識和大模型結合,而這也是最大的困難。”
王小川認為,to B要面對的最大需求是定制化,光靠調用API可能不夠。
“我們今天用搜索增強最大的意愿不是解決幻覺問題,而是解決大模型可定制化的問題。如何讓企業的私有數據為模型所用,讓模型為企業服務,是大模型to B商業化過程中要解決的關鍵問題。”王小川表示。
在上一波以計算機視覺為核心的AI浪潮中,AI公司變成了集成商,需要下場做很重交付的定制化項目,往往利潤很低,甚至越做越虧。如何避免在定制化項目中“越做越虧”的故事在大模型的商業化路上重演,是所有大模型創業公司今天要面對的一大難題。
在王小川的判斷中,定制化是客戶天生的需求,to B企業真正要避免的是“項目化”。
所以,基于上述技術棧,百川智能定義了一種全新的“定制化”方式——用“產品化”取代“項目化”。
“整體來看,一些能盈利的to B公司賣的大多是產品。我們目前打造的可配置、可調整的搜索增強知識庫,就是希望用產品的方式,以更低的成本解決客戶的定制化需求。客戶提出的各種需求可以通過我們不同的產品組合來解決, 我們不需要單獨開發一套全新的數據庫。”洪濤進一步解釋道。
據「甲子光年」觀察,百川智能并不直接針對某個行業做“企業服務”,而是基于不同的場景需求,構建大模型解決問題的能力。這些能力最終可被應用在多個行業。
在眾多場景中,百川智能主要瞄準有兩大特征的場景——有大量文本數據,并且需要與客戶打交道,如客服場景。
目前,和大多數企業類似,百川智能為企業提供API調用、云上部署以及本地部署三種大模型部署方式。
在此次溝通會中,王小川還透露了C端產品的最新信息。
王小川表示,C端產品依然是百川智能十分看重的方向。關于C端超級應用的定義,王小川認為:“以往做應用更多是在造工具,我們要求它以更精確的方式和我們互動,提高我們的效率。但今天,我們要造的是新物種,是一種人類的伙伴。”
王小川進一步透露,百川智能的C端產品第一重心是醫療方向,產品預計會在明年上線。
-
API
+關注
關注
2文章
1505瀏覽量
62170 -
大模型
+關注
關注
2文章
2489瀏覽量
2859
原文標題:百川智能發布Baichuan2 Turbo系列API,或將替代行業大模型|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論