英偉達公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神經架構搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具備更準確和更高效的運算效率;能夠大幅降低運行成本。
通過NAS技術微調;大幅降低了內存消耗、計算復雜性;Llama-3.1-Nemotron-51B AI 模型在單個H100 GPU上的表現非常優秀,在推理過程中可以在單個 GPU 上運行 4 倍以上的工作負載。這使得單片H100 GPU即可處理更大型的推理任務;這無疑是顯著的降低了訓練成本。這為AI提供了高效、經濟的方案。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
英偉達
+關注
關注
22文章
3770瀏覽量
90984 -
AI大模型
+關注
關注
0文章
315瀏覽量
305
發布評論請先 登錄
相關推薦
Meta推出Llama 3.3 70B,AI大模型競爭白熱化
在今年的AI領域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時,馬斯克的xAI也宣布其Grok模型從今
Llama 3 與開源AI模型的關系
在人工智能(AI)的快速發展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術的創新,還促進了全球開發者社區的合作。Llama 3,作為一個新興的
Llama 3 模型與其他AI工具對比
Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術架構、性能表現、應用場景、定制化能力、開源與成本等方面。以下是對Llama 3
NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據
Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式
英偉達震撼發布:全新AI模型參數規模躍升至80億量級
8月23日,英偉達宣布,其全新AI模型面世,該模型參數規模高達80億,具有精度高、計算效益大等優勢,適用于GPU加速的數據中心、云及工作站環
Meta Llama 3.1系列模型可在Google Cloud上使用
我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄
Meta發布全新開源大模型Llama 3.1
科技巨頭Meta近期震撼發布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標志著Meta在
NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型
借助 NVIDIA AI Foundry,企業和各國現在能夠使用自有數據與 Llama 3.1 405B 和 NVIDIA Nemotron
發表于 07-24 09:39
?706次閱讀
Meta即將發布超強開源AI模型Llama 3-405B
在人工智能領域的激烈競爭中,Meta公司再次擲出重磅炸彈,宣布將于7月23日正式發布其最新力作——Llama 3-405B,一個擁有驚人4050億參數的開源大模型。這一舉措不僅標志著M
英偉達開源Nemotron-4 340B系列模型,助力大型語言模型訓練
近日,英偉達宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發者們打開了通往高性能大型語言
英偉達首席執行官黃仁勛:AI模型推動英偉達AI芯片需求
近來,以ChatGPT為代表的AI聊天機器人已經導致英偉達AI芯片供應緊張。然而,隨著能夠創造視頻并進行近似人類交流的新型AI
Meta推出最新版AI代碼生成模型Code Llama70B
Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B,并稱其為“目前最大、最優秀的模型”。這一更新標志著Meta在AI代
評論