微軟研究院近期公開(kāi)發(fā)布了Phi-3系列AI模型,該系列包括mini版(38億參數(shù))、small版(70億參數(shù))以及medium版(140億參數(shù))。
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過(guò)3.3萬(wàn)億token的強(qiáng)化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過(guò)Mixtral 8x7B及GPT-3.5;此外,該模型可在手機(jī)等移動(dòng)設(shè)備上運(yùn)行,并在phi-2模型(27億參數(shù))的基礎(chǔ)上,進(jìn)一步融合了嚴(yán)格篩選的網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù)。
盡管phi-3-mini在語(yǔ)言理解和推理方面已能匹敵大參數(shù)模型,但在TriviaQA等特定任務(wù)中仍受限于模型規(guī)模。
值得注意的是,phi-3-small和phi-3-medium兩款模型在MMLU測(cè)試中的得分分別達(dá)到了75.3和78.2。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
微軟
-
移動(dòng)設(shè)備
-
強(qiáng)化學(xué)習(xí)
相關(guān)推薦
2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個(gè)版本:mini(3.8B參數(shù))、small(7B參數(shù))以及medium(14B參數(shù))。
發(fā)表于 08-30 16:58
?640次閱讀
GPT-4. GPT-4o mini的定價(jià)為每百萬(wàn)輸入標(biāo)記15美分和每百萬(wàn)輸出標(biāo)記60美分,比之前的前沿模型便宜了一個(gè)數(shù)量級(jí),比GPT-3.5 Turbo便宜了60%以上。
發(fā)表于 07-21 10:20
?1095次閱讀
Anthropic 發(fā)布Claude 3.5 Sonnet最新模型 新模型在推理、知識(shí)和編碼能力評(píng)估方面超越了以前的版本和競(jìng)爭(zhēng)對(duì)手
發(fā)表于 06-21 15:43
?842次閱讀
Phi-3-vision 是一種小型多模式語(yǔ)言模型(SLM),主要適用于本地人工智能場(chǎng)景。其模型參數(shù)高達(dá) 42 億,上下文序列包含 128k 個(gè)符號(hào),可滿足各種視覺(jué)推理和其他任務(wù)需求。
發(fā)表于 05-28 11:35
?506次閱讀
據(jù)悉,Phi-3-vision 作為微軟 Phi-3 家族的首款多模態(tài)模型,繼承自 Phi-3-mini 的文本理解能力,兼具輕巧便攜特性
發(fā)表于 05-27 15:56
?499次閱讀
近日,英特爾宣布針對(duì)微軟的Phi-3家族開(kāi)放模型,成功驗(yàn)證并優(yōu)化了其跨客戶端、邊緣及數(shù)據(jù)中心的AI產(chǎn)品組合。這一重要舉措旨在提供更為靈活和高效的AI
發(fā)表于 05-27 11:47
?678次閱讀
近日,英特爾針對(duì)微軟的多個(gè)Phi-3家族的開(kāi)放模型,驗(yàn)證并優(yōu)化了其跨客戶端、邊緣和數(shù)據(jù)中心的AI產(chǎn)品組合。
發(fā)表于 05-27 11:15
?592次閱讀
5 月 22 日,微軟Build 2024大會(huì)在美正式開(kāi)幕。薩提亞·納德拉CEO、董事長(zhǎng)宣布,OpenAI新款旗艦模型GPT-4o已經(jīng)在Azure AI Studio上線,并開(kāi)放API
發(fā)表于 05-22 11:18
?520次閱讀
NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開(kāi)源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開(kāi)源庫(kù),用于優(yōu)化從 PC 到云端的 NVIDIA GPU 上運(yùn)行的大語(yǔ)言
發(fā)表于 04-28 10:36
?591次閱讀
Meta決定將Llama 3的80億參數(shù)版開(kāi)源,以期讓更多人能夠接觸到尖端的AI技術(shù)。全球范圍內(nèi)的開(kāi)發(fā)者、研究員以及對(duì)AI充滿好奇的人士均可參與其中,進(jìn)行游戲開(kāi)發(fā)、模型構(gòu)建與實(shí)驗(yàn)探索。
發(fā)表于 04-19 10:21
?874次閱讀
“我們的模型在識(shí)別各種類型實(shí)體方面都有顯著提升,即使是小尺寸模型,在屏幕實(shí)體識(shí)別準(zhǔn)確性上也已超過(guò)原有的系統(tǒng)5%以上。在與GPT-3.5和GPT-4.0的比較中,小型
發(fā)表于 04-02 11:23
?499次閱讀
起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級(jí)至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓
發(fā)表于 03-13 13:42
?752次閱讀
近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude
發(fā)表于 03-05 09:58
?678次閱讀
近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越
發(fā)表于 03-05 09:49
?704次閱讀
近日,人工智能領(lǐng)域迎來(lái)了一場(chǎng)革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵指標(biāo)上展現(xiàn)出卓越
發(fā)表于 03-05 09:42
?674次閱讀
評(píng)論