關于 LLaMA 2 的全部資源,如何去測試、訓練并部署它。
LLaMA 2 是一個由 Meta 開發的大型語言模型,是 LLaMA 1 的繼任者。LLaMA 2 可通過 AWS、Hugging Face 等提供商獲取,并免費用于研究和商業用途。LLaMA 2 預訓練模型在 2 萬億個標記上進行訓練,相比 LLaMA 1 的上下文長度增加了一倍。它的微調模型則在超過 100 萬個人工標注數據下完成。
這篇博客包含了所有的相關資源,以幫助您快速入門。包括以下跳轉:
LLaMA 2 是什么?
在 LLaMA 游樂場試玩
模型背后的研究工作
模型的性能有多好,基準測試
如何正確地去提示聊天模型
如何使用 PEFT 訓練模型
如何部署模型進行推理
和其他資源
來自 Meta 官方的公告可以在這里找到: https://ai.meta.com/llama/
LLaMA 2 是什么?
Meta 發布的 LLaMA 2,是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本,并且具有商業許可證。LLaMA 2 有 3 種不同的大小——7B、13B 和 70B 個可訓練參數。與原版 LLaMA 相比,新的改進包括:
在 2 萬億個標記的文本數據上進行訓練
允許商業使用
默認使用 4096 個前后文本視野 (可以被擴展)
70B 模型采用了分組查詢注意力 (GQA)
可由此獲取 Hugging Face Hub
在 LLaMA 游樂場試玩
有幾個不同的游樂場供與 LLaMA 2 來測試聊天:
HuggingChat 允許你通過 Hugging Face 的對話界面與 LLaMA 2 70B 模型聊天。這提供了一個簡潔的方法來了解聊天機器人的工作原理。
Hugging Face Spaces 有三種大小的 LLaMA 2 模型 7B、13B 和 70B 可供測試。交互式演示可以讓您比較不同的大小模型的區別。
Perplexity 他們的對話 AI 演示提供 7B 和 13B 的 LLaMA 2 模型。你可以與模型聊天并且反饋模型響應的不足。
LLaMA 2 背后的研究工作
LLaMA 2 是一個基礎大語言模型,它由網絡上公開可獲取到的數據訓練完成。另外 Meta 同時發布了它的 CHAT 版本。CHAT 模型的第一個版本是 SFT (有監督調優) 模型。在這之后,LLaMA-2-chat 逐步地經過人類反饋強化學習 (RLHF) 來進化。RLHF 的過程使用了拒絕采樣與近端策略優化 (PPO) 的技術來進一步調優聊天機器人。Meta 目前僅公布了模型最新的 RLHF(v5) 版本。若你對此過程背后的過程感興趣則請查看:
Llama 2: 開源并已微調的聊天模型
Llama 2: 一個超贊的開源大語言模型
Llama 2: 全面拆解
LLaMA 2 的性能有多好,基準測試?
Meta 聲稱 “Llama 2 在眾多外部基準測試中都優于其他開源的語言模型,包括推理、編程、熟練程度與知識測驗” 關于其性能你可以在這里找到更多信息:
Hugging Face 開源大語言模型排行榜
Meta 官方公告
如何提示 LLaMA 2 Chat
LLaMA 2 Chat 是一個開源對話模型。想要與 LLaMA 2 Chat 進行高效地交互則需要你提供合適的提示詞、問題來得到合乎邏輯且有幫助的回復。Meta 并沒有選擇最簡單的提示詞結構。以下是單輪、多輪對話的提示詞模板。這個模板遵循模型的訓練過程,在此詳細描述 LLaMA 2 論文. 你也可以看一看 LLaMA 2 提示詞模板.
單輪對話
[INST]<> {{system_prompt}} < > {{user_message}}[/INST]
多輪對話
[INST]<> {{system_prompt}} < > {{user_msg_1}}[/INST]{{model_answer_1}}[INST]{{user_msg_2}}[/INST]{{model_answer_2}}[INST]{{user_msg_3}}[/INST]
如何訓練 LLaMA 2
因 LLaMA 2 為開源模型,使得可以輕易的通過微調技術,比如 PEFT,來訓練它。這是一些非日適合于訓練你自己版本 LLaMA 2 的學習資源:
擴展指引: 指令微調 Llama 2
在 Amazon SageMaker 上微調 LLaMA 2 (7-70B)
使用 PEFT 技術微調
Meta 提供的 Llama 模型示例以及方案
在本地機器上微調 LLAMA-v2 最簡單的方法 !
如何部屬 LLaMA 2
LLaMA 2 可以在本地環境中部署 (llama.cpp),使用這樣已管理好的服務 Hugging Face Inference Endpoints 或通過 AWS, Google Cloud, and Microsoft Azure 這樣的服務器平臺.
使用文本生成接口與推理終端來部署 LLama 2
使用 Amazon SageMaker 部署 LLaMA 2 70B (即將完成)
在你的 M1/M2 Mac 上通過 GPU 接口來本地部署 Llama-2-13B-chat
原文作者: Philschmid
譯者: Xu Haoran
審核編輯:黃飛
-
AI
+關注
關注
87文章
30728瀏覽量
268886 -
聊天機器人
+關注
關注
0文章
339瀏覽量
12304
原文標題:LLaMA 2 - 你所需要的一切資源
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論