色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LLM之外的性價比之選,小語言模型

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2024-06-03 05:15 ? 次閱讀



電子發燒友網報道(文/周凱揚)大語言模型的風靡給AI應用創造了不少機會,無論是效率還是創意上,大語言模型都帶來了前所未有的表現,這些大語言模型很快成為大型互聯網公司或者AI應用公司的殺手級產品。然而在一些對實時性要求較高的應用中,比如AI客服、實時數據分析等,大語言模型并沒有太大的優勢。

在動輒萬億參數的LLM下,硬件需求已經遭受了不小的挑戰。所以面對一些相對簡單的任務,規模較小的小語言模型(SLM)反而更加適合。尤其是在端側的本地AI模型,在低功耗算力有限的邊緣AI芯片支持下,小語言模型反而更適合發揮最高性能,而不是促使硬件一味地去追求更大規模模型的支持。

微軟Phi

2023年,微軟推出了一個基于Transformer架構的小語言模型Phi-1,該模型只有13億參數,且主要專注于基礎的Python編程,實現文本轉代碼。整個模型僅僅用到8塊A100 GPU,耗時四天訓練完成的。

這也充分說明了小語言模型的靈活性,在LLM普遍需要成百上千塊GPU,花費數十乃至上百天的時間完成模型的訓練時,SLM卻只需要千分之一的資源,就可以針對特定的任務打造適合的模型。

近日,微軟對Phi模型進行了全面更新,推出了Phi-3-mini、Phi-3-small和Phi-3-medium三個版本。其中Phi3-mini是一個38億參數的小語言模型,同步推出的Phi-3-small和Phi-3-medium分別為70億參數和140億參數的模型。

Phi-3-mini有支持4K和128K兩個上下文長度的版本,也是這個規模的模型中,第一個支持到最高128K上下文長度的版本,微軟聲稱其性能甚至超過不少70億參數的大模型。通過在搭載A16芯片的iPhone 14上測試,在純粹的設備端離線運行下,Phi-3-mini可以做到12 token每秒的速度。

谷歌Gemma


在Gemini模型獲得成功后,基于大語言模型框架Gemini,谷歌也開發了對應的輕量小語言模型Gemma。Gemma分為20億參數和70億參數的版本,其中20億參數的Gemma可以在移動設備和筆記本電腦上運行,而70億參數的版本則可以擴展至小型服務器上。雖然資源占用不高,但Gemma在各項基準測試中,依然可以與更大規模的模型相媲美,比如130億參數的Llama-2等。

此外,谷歌不僅提供了預訓練版本的Gemma,也支持通過額外的訓練來實現模型調優,用于修改Gemma模型的行為,提高其在特定任務上的表現,比如通過人類語言互動進行訓練,提高聊天機器人中響應式對話輸入的表現等。

?
Gemma與Llama-2的性能對比/谷歌


在對運行設備的要求上,Gemma自然比不上大哥Gemini,但谷歌與英偉達合作,針對從數據中心到云端再到RTX AI PC的GPU都進行了優化,這樣一來不僅具有廣泛的跨設備兼容性,也能確保擴展性和高性能的雙重優勢。

寫在最后


小語言模型的出現為行業帶來了新的選擇,尤其是在大多數大模型應用還是在不斷燒錢的當下,小語言模型加速落地的同時,也提供了訓練成本更低的解決方案。但與此同時,小語言模型的缺陷依然不可忽視,比如其規模注定了無法存儲足夠的“事實性知識”,其次這類小語言模型很難做到多語言支持。但我們必須認清小語言模型的存在并不是為了替代大語言模型,而是提供一個更加靈活的模型方案。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3226

    瀏覽量

    48807
  • 大模型
    +關注

    關注

    2

    文章

    2423

    瀏覽量

    2641
  • LLM
    LLM
    +關注

    關注

    0

    文章

    286

    瀏覽量

    327
收藏 人收藏

    評論

    相關推薦

    什么是LLMLLM在自然語言處理中的應用

    隨著人工智能技術的飛速發展,自然語言處理(NLP)領域迎來了革命性的進步。其中,大型語言模型LLM)的出現,標志著我們對語言理解能力的一次
    的頭像 發表于 11-19 15:32 ?523次閱讀

    如何訓練自己的LLM模型

    訓練自己的大型語言模型LLM)是一個復雜且資源密集的過程,涉及到大量的數據、計算資源和專業知識。以下是訓練LLM模型的一般步驟,以及一些關
    的頭像 發表于 11-08 09:30 ?507次閱讀

    使用LLM進行自然語言處理的優缺點

    自然語言處理(NLP)是人工智能和語言學領域的一個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型語言模型
    的頭像 發表于 11-08 09:27 ?412次閱讀

    新品|LLM Module,離線大語言模型模塊

    LLM,全稱大語言模型(LargeLanguageModel)。是一種基于深度學習的人工智能模型。它通過大量文本數據進行訓練,從而能夠進行對話、回答問題、撰寫文本等其他任務
    的頭像 發表于 11-02 08:08 ?308次閱讀
    新品|<b class='flag-5'>LLM</b> Module,離線大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>模塊

    LLM模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對
    的頭像 發表于 07-24 11:38 ?858次閱讀

    模型LLM與ChatGPT的技術原理

    在人工智能領域,大模型(Large Language Model, LLM)和ChatGPT等自然語言處理技術(Natural Language Processing, NLP)正逐步改變著人類
    的頭像 發表于 07-10 10:38 ?809次閱讀

    llm模型本地部署有用嗎

    在當今的人工智能領域,LLM(Large Language Model,大型語言模型)已經成為了一種非常受歡迎的技術。它們在自然語言處理(NLP)任務中表現出色,如文本生成、翻譯、摘要
    的頭像 發表于 07-09 10:14 ?478次閱讀

    llm模型有哪些格式

    LLM(Large Language Model,大型語言模型)是一種深度學習模型,主要用于處理自然語言處理(NLP)任務。
    的頭像 發表于 07-09 09:59 ?596次閱讀

    LLM模型和LMM模型的區別

    LLM(線性混合模型)和LMM(線性混合效應模型)之間的區別如下: 定義: LLM(線性混合模型)是一種統計
    的頭像 發表于 07-09 09:57 ?921次閱讀

    llm模型和chatGPT的區別

    LLM(Large Language Model)是指大型語言模型,它們是一類使用深度學習技術構建的自然語言處理(NLP)模型
    的頭像 發表于 07-09 09:55 ?1035次閱讀

    LLM模型的應用領域

    在本文中,我們將深入探討LLM(Large Language Model,大型語言模型)的應用領域。LLM是一種基于深度學習的人工智能技術,它能夠理解和生成自然
    的頭像 發表于 07-09 09:52 ?575次閱讀

    語言模型(LLM)快速理解

    自2022年,ChatGPT發布之后,大語言模型(LargeLanguageModel),簡稱LLM掀起了一波狂潮。作為學習理解LLM的開始,先來整體理解一下大
    的頭像 發表于 06-04 08:27 ?961次閱讀
    大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>(<b class='flag-5'>LLM</b>)快速理解

    了解大型語言模型 (LLM) 領域中的25個關鍵術語

    1.LLM(大語言模型)大型語言模型(LLMs)是先進的人工智能系統,經過大量文本數據集的訓練,可以理解和生成類似人類的文本。他們使用深度學
    的頭像 發表于 05-10 08:27 ?1247次閱讀
    了解大型<b class='flag-5'>語言</b><b class='flag-5'>模型</b> (<b class='flag-5'>LLM</b>) 領域中的25個關鍵術語

    深圳特信屏蔽器|GPS屏蔽器價格:性價比,實惠又實用

    深圳特信屏蔽器|GPS屏蔽器價格:性價比,實惠又實用
    的頭像 發表于 04-18 09:05 ?507次閱讀

    2023年大語言模型(LLM)全面調研:原理、進展、領跑者、挑戰、趨勢

    大型語言模型(LLM)是基于人工智能的先進模型,經過訓練,它可以密切反映人類自然交流的方式處理和生成人類語言。這些
    的頭像 發表于 01-03 16:05 ?1158次閱讀
    2023年大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>(<b class='flag-5'>LLM</b>)全面調研:原理、進展、領跑者、挑戰、趨勢
    主站蜘蛛池模板: 网友自拍区视频精品| 中文字幕成人| 操中国老太太| 久久精品国产清白在天天线| 色婷婷粉嫩AV精品综合在线| 4399亚洲AV无码V无码网站| 国产日韩亚洲精品视频| 欧美gv明星| 在线观看日韩一区| 国产真实乱对白精彩| 日韩一区二区三区免费体验| 19十主播福利视频| 国语自产拍在线视频普通话| 色婷婷亚洲精品天天综合影院| 99久久香蕉国产线看观看| 精品三级久久久久电影网1| 我的家庭女教师| 岛国大片在线播放免费| 木凡的天空在线收听| 淫品色影院| 午夜免费福利| 亚洲伊人久久一次| WWW婷婷AV久久久影片| 九九热在线视频| 亚洲国产高清福利视频| 俄罗斯美女性生活| 青青伊人精品| G0GO人体大尺香蕉| 男人的天堂色偷偷| 自拍视频亚洲综合在线精品| 久9视频这里只有精品123| 亚洲va精品中文字幕| 国产国拍亚洲精品永久软件| 日韩高清特级特黄毛片| japanese from色系| 男人把女人桶到爽免费看视频| 1区2区3区4区产品不卡码网站| 久久观看视频| 一二三四视频免费社区5| 娇小萝被两个黑人用半米长| 亚洲国产在线精品国偷产拍|