性能拼不動了,必須上AI競爭
掌握智能入口的一方,就能成為應用的真正入口。
大模型會和手機廠商自研的操作系統深度結合,提供更好的系統級體驗,這很關鍵。
手機軟件體驗上的差異,可以解決現在手機廠商們硬件差不多、只能靠外觀來區分的問題。
大模型的競爭,會讓手機產品的[智力水平]表現出來,這也是為什么手機廠商們現在熱衷于大模型的原因之一。
從AI定義汽車到AI定義手機、PC,大模型的注入會改變手機市場的銷量格局。
以前因為硬件配置過剩,有人一部手機用5年都不換,大模型的升級體驗可能會讓人有換機的理由,從而帶動手機行業的銷售增長。
?
手機大廠無不例外,加入新一輪競賽
在7月,榮耀手機推出了一款名為Magic V2的折疊屏手機,該手機自稱是全球首款原生的集成AI大模型的國產手機。
在10月,榮耀CEO趙明宣布,榮耀Magic6系列將搭載第三代驍龍8移動平臺,并支持70億參數的端側AI大模型。
在8月的華為開發者大會上,華為終端BG CEO余承東宣布,盤古大模型已經接入華為HarmonyOS 4及華為小藝智慧助手。
這意味著華為P60和Mate 60用戶可以通過小藝智能助手體驗這一大模型的功能。
?
同一個月,小米創始人、董事長兼CEO雷軍發布了小米自研的兩個輕量級大模型MiLM,參數分別為64億和13億。
在10月底,小米正式推出了將AI大模型植入澎湃OS系統的小米14手機。
OPPO在10月宣布了自主訓練的AI大模型——安第斯大模型(AndesGPT),該模型已經接入新小布助手AndesGPT。
預計在12月前,AndesGPT的能力將被正式接入ColorOS 14新系統。
在11月,vivo發布了旗艦新品X100系列,聲稱這是全球首個百億大模型在終端調通的大模型手機。
而三星則在11月展示了其AI大模型[高斯]。預計搭載這一AI大模型的Galaxy S24系列手機要到明年上半年才會發售。
至于蘋果,目前還沒有官宣其AI大模型的消息。但據分析,蘋果計劃最早在2024年年底將生成式AI技術整合到iPhone和iPad中。
選擇端側部署,看上去最劃算
當前,AI大模型接入手機存在兩種選擇:云端部署和端側部署。
目前,大多數廠商選擇在端側部署輕量級大模型,而在云端部署的則是千億級AI大模型。
為了平衡內存、執行速度、功耗和成本等問題,現階段的[端云協同]是手機廠商部署大模型時的普遍選擇。
手機廠商想要實現大野心,端側大模型可是個好工具。
要知道,手機廠商不提供云服務,也就沒法拿到便宜的云服務。
而要滿足億萬用戶的需求,背后得有強大算力支持,這可不好辦。
好在端側大模型可以讓手機廠商省下這筆錢,讓商業計劃更靠譜。
另外,手機廠商在用端側AI上可是有優勢的。
像華為、小米、VIVO 這些廠家,都是自研的大模型。
在出廠前,手機和芯片公司就得跟它調整好多次,讓它跟硬件更匹配。
現在端側大模型很依賴內存,手機廠商也能優先給自己的終端大模型用內存。
如果需要調用云端大模型的話成本非常高,但如果在手機端側運行大模型,則不會產生推理成本。
云端部署用于解決復雜的需要大算力、大參數模型的問題;
而端側部署則主要用于運行數據安全性高、需要實時反饋、網絡條件較差的輕量化問題。
綜上所述,手機廠商在布局AI大模型時通常會選擇云端和端側的協同部署方式。
?
芯片廠商懂客戶訴求,盡可能滿足AI需求
就像手機鏡頭一樣,生成式模型的支持能力可能會成為核心硬件賣點。
生成式模型的最終解決方案需要軟硬件結合設計,這對于有自研芯片能力的手機廠商非常有利。
因為這些手機廠商可以同時掌握模型和硬件的設計,實現最高效率的解決方案。
給手機系統做芯片的公司,像高通和聯發科,得提供完整的參考設計。
說到高通,他們把手機端的生成式模型搞到了核心位置。
例如,高通發布的驍龍8 gen3支持包括Meta Llama2、Chat GPT等在內的多模型生成式AI。
其可處理的大模型參數超過100億,推理速度達到了每秒20個token。
此外,聯發科發布生成式AI移動芯片天璣9300,集成第七代AI處理器APU 790,支持在終端運行10億、70億、130億參數的AI大模型。
結合內存硬件壓縮技術NeuroPilot Compression來減少AI大模型對終端內存的占用;
聯發科的AI開發平臺NeuroPilot支持Android、Meta Llama 2、百度文心一言大模型、百川智能百川大模型等主流AI大模型。
英偉達在手機芯片方面的嘗試,自從十多年前的Tegra系列之后,好像就沒什么動靜了。
但是,今年聽說英偉達要跟聯發科合作,聯發科的下一代旗艦手機芯片可能會用英偉達的GPU。
看來,英偉達在手機生成式模型領域還是有機會的。
?
? 廠商口中的“大”,現階段有待商榷
為了讓大型AI模型適應手機,制造商不得不采取一些策略對其進行大幅壓縮,例如通過剪枝、蒸餾和量化等技術手段。
以vivo為例,他們可能通過連續的模型裁剪和蒸餾,將參數從1750億降低到僅10億,這種操作是否過于牽強。
我們應該認識到,大型AI模型并不僅僅是參數數量的簡單疊加,它的真正價值在于深度學習中的[深度]。
因此,當把一款千億參數的模型剪裁到幾十億參數時,勢必會失去一些原有的學習深度。
對于AI的日常應用來說,可能影響不大,但對于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。
即便小米宣稱其端側模型能與云端模型相提并論,但這其中的細節仍不容忽視。
擁有13億參數的端側模型自然難以與擁有千億參數的云端模型相比。
從這些層面出發,當前手機上的大型AI模型實現方式似乎有點[矯枉過正]。
對于普通用戶而言,他們并不真正關心模型的參數數量,而更關心能為他們帶來什么價值。
vivo和小米的這些嘗試固然值得鼓勵,但也應該反思其真正的目的和意義。
?
結尾:
當然,自研大模型是個[無限燒錢]的競爭,投入動輒數十億元起。
投入大模型需要強大資金儲備做后盾,以大模型驅動手機軟、硬件的每一次進化背后都是[鈔能力]。
但無可否認,在智能手機出貨量持續下滑的行業態勢下,大模型或許會成為手機行業突破自身創新窘境和模式局限性的一個機遇。
審核編輯:黃飛
?
評論
查看更多