色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

可商用多語(yǔ)言聊天LLM開源,性能直逼GPT-4

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-05-25 11:14 ? 次閱讀

SambaNova 與 Together 兩家公司合作開源了可商用的 BLOOMChat,一個(gè) 1760 億參數(shù)的多語(yǔ)言聊天大語(yǔ)言模型 (LLM)。由 BLOOM (176B) 在助理式的對(duì)話數(shù)據(jù)集上進(jìn)行指導(dǎo)調(diào)整,并支持多種語(yǔ)言的對(duì)話、問題回答和生成性答案。

根據(jù)介紹,BLOOMChat 是一個(gè)新的、開放的、多語(yǔ)言的聊天 LLM。SambaNova 和 Together 使用 SambaNova 獨(dú)特的可重構(gòu)數(shù)據(jù)流架構(gòu)在 SambaNova DataScale 系統(tǒng)上訓(xùn)練了 BLOOMChat;其建立在 BigScience 組織的 BLOOM 之上,并在 OpenChatKit、Dolly 2.0 和 OASST1 的 OIG 上進(jìn)行了微調(diào)。目前,BLOOM 已經(jīng)是最大的多語(yǔ)言開放模型,在 46 種語(yǔ)言上進(jìn)行了訓(xùn)練。

在針對(duì)英語(yǔ)、中文、法語(yǔ)、阿拉伯語(yǔ)、西班牙語(yǔ)、印度語(yǔ)這 6 種語(yǔ)言的評(píng)測(cè)中,GPT-4 的勝率為 54.75%,BLOOMChat 的勝率為 45.25%,稍弱于 GPT-4。但與其它 4 種主流的開源聊天 LLM 相比,BLOOMChat 在 65.92% 的時(shí)間內(nèi)表現(xiàn)更優(yōu)。且在使用 BLOOMChat 進(jìn)行跨語(yǔ)言 NLP 任務(wù)的初步研究中,BLOOMChat 在 WMT 翻譯基準(zhǔn)中的表現(xiàn)要優(yōu)于其他 BLOOM 變體和主流開源聊天模型。

“我們確實(shí)想指出,與我們比較的這些模型中,有些并不適合多語(yǔ)言環(huán)境。但由于開源社區(qū)中沒有替代品,所以才有了現(xiàn)在的比較。我們的研究結(jié)果表明,使用正確的技術(shù),可以在開源 LLM 之上構(gòu)建以實(shí)現(xiàn)強(qiáng)大的多語(yǔ)言聊天功能。我們希望我們的研究結(jié)果和 BLOOMChat checkpoint 的發(fā)布能夠?yàn)殚_源社區(qū)的持續(xù)討論做出貢獻(xiàn),并激發(fā) LLM 領(lǐng)域的進(jìn)一步發(fā)展。”

項(xiàng)目團(tuán)隊(duì)使用定性和定量措施來評(píng)估了 BLOOMChat 的多語(yǔ)言聊天能力以及跨語(yǔ)言任務(wù)能力。共做了 3 種不同場(chǎng)景的實(shí)驗(yàn)測(cè)評(píng),評(píng)測(cè)了英語(yǔ)、中文、阿拉伯語(yǔ)、法語(yǔ)、西班牙語(yǔ)和印度語(yǔ)。

實(shí)驗(yàn)一:人類偏好排序

旨在將 BLOOMChat 模型在多種語(yǔ)言中的聊天能力與現(xiàn)有的開源模型以及選定的封閉源模型進(jìn)行比較。使用了 “OpenAssistant Conversations”附錄 E 中的 22 個(gè)英文問題作為基準(zhǔn)。首先讓一些人類志愿者將這 22 個(gè)英文問題手動(dòng)翻譯成他們各自的母語(yǔ);然后讓另一組不同的志愿者,在匿名的前提下評(píng)價(jià)每個(gè)模型所給出的回答。

將 BLOOMChat 與 OpenAssistant-30B、LLaMA-Adapter-V2-65B 和 BLOOMZ (176B) 三種開源模型進(jìn)行了比較:

586afb58-fa9a-11ed-90ce-dac502259ad0.png

51 名志愿者在所有模型和 6 種語(yǔ)言中共提交了 1158 次比較。如上圖所示,BLOOMChat (65.92%) 明顯優(yōu)于其它幾個(gè)開源模型。

與GPT-4 相比:

587f9e14-fa9a-11ed-90ce-dac502259ad0.png

實(shí)驗(yàn)二:模型質(zhì)量評(píng)估

此實(shí)驗(yàn)旨在驗(yàn)證 BLOOMChat 生成的多種語(yǔ)言文本的質(zhì)量。

5894d23e-fa9a-11ed-90ce-dac502259ad0.png

81.8% 的回答被歸類為 “正確” 或 “可接受但有輕微缺陷”。盡管只在英語(yǔ)數(shù)據(jù)集上進(jìn)行了微調(diào),但 BLOOMChat 在每種語(yǔ)言中都獲得了超過 70% 的 “正確” 或 “可接受” 評(píng)級(jí)。

實(shí)驗(yàn)三:WMT 翻譯任務(wù)

為了初步了解模型解決跨語(yǔ)言 NLP 任務(wù)的能力,評(píng)估了模型在 WMT 翻譯任務(wù)上的翻譯能力。

58b8ddbe-fa9a-11ed-90ce-dac502259ad0.png

總體而言,BLOOMChat 在翻譯任務(wù)中的表現(xiàn)明顯優(yōu)于其他 BLOOM 變體和開源聊天模型,但和 GPT-4 還有一定差距。

此外,BLOOMChat 團(tuán)隊(duì)也坦承了一些該模型的局限性:

BLOOMChat 有時(shí)可能會(huì)生成聽起來合理但事實(shí)不正確或與主題無(wú)關(guān)的回復(fù)信息。

BLOOMChat 可能在單個(gè)回復(fù)中無(wú)意間切換語(yǔ)言,影響輸出的連貫性和可理解性。

BLOOMChat 可能會(huì)產(chǎn)生重復(fù)的短語(yǔ)或句子,導(dǎo)致回復(fù)內(nèi)容缺乏吸引力和有效信息

BLOOMChat 在生成代碼或解決復(fù)雜數(shù)學(xué)問題方面的性能可能會(huì)受到限制。

BLOOMChat 可能無(wú)意中生成含有不適當(dāng)或有害內(nèi)容的回復(fù)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3368

    瀏覽量

    42567
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    529

    瀏覽量

    10295
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24737
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    293

    瀏覽量

    353

原文標(biāo)題:可商用多語(yǔ)言聊天LLM開源,性能直逼GPT-4

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Llama 3 與 GPT-4 比較

    沿。 一、技術(shù)架構(gòu) Llama 3和GPT-4都是基于深度學(xué)習(xí)的自然語(yǔ)言處理(NLP)模型,但它們的設(shè)計(jì)理念和技術(shù)細(xì)節(jié)有所不同。 Llama 3 采用了一種創(chuàng)新的混合架構(gòu),結(jié)合了傳統(tǒng)的Transformer模型和最新的神經(jīng)網(wǎng)絡(luò)技術(shù)。這種架構(gòu)使得Llama 3在處理復(fù)雜的
    的頭像 發(fā)表于 10-27 14:17 ?386次閱讀

    ChatGPT 的多語(yǔ)言支持特點(diǎn)

    )技術(shù)迎來了巨大的挑戰(zhàn)和機(jī)遇。ChatGPT,作為一個(gè)領(lǐng)先的語(yǔ)言模型,其多語(yǔ)言支持的特點(diǎn)成為了它在眾多應(yīng)用場(chǎng)景中不可或缺的優(yōu)勢(shì)。 1. 多語(yǔ)言理解能力 ChatGPT 的多語(yǔ)言支持首先
    的頭像 發(fā)表于 10-25 17:30 ?816次閱讀

    llm模型和chatGPT的區(qū)別

    ,有許多不同的LLM模型,如BERT、GPT、T5等。 ChatGPT是一種基于GPT(Generative Pre-trained Transformer)模型的聊天機(jī)器人。
    的頭像 發(fā)表于 07-09 09:55 ?1139次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯(cuò)

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì),其獨(dú)特的作用在于,讓人們能夠用GPT-4來查找GPT-4的錯(cuò)誤。
    的頭像 發(fā)表于 06-29 09:55 ?559次閱讀

    OpenAI API Key獲取:開發(fā)人員申請(qǐng)GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語(yǔ)言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項(xiàng)目,如開發(fā)一個(gè)ChatGPT聊天應(yīng)用,不僅是實(shí)
    的頭像 發(fā)表于 06-24 17:40 ?2427次閱讀
    OpenAI API Key獲取:開發(fā)人員申請(qǐng)<b class='flag-5'>GPT-4</b> API Key教程

    開發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價(jià)格詳情指南

    ,高達(dá)每分鐘1000萬(wàn)字符。 速度 :GPT-4o的速度是GPT-4 Turbo的兩倍。 視覺能力 :在視覺能力相關(guān)的評(píng)估中,GPT-4o表現(xiàn)優(yōu)于GPT-4 Turbo。
    的頭像 發(fā)表于 05-29 16:00 ?1.2w次閱讀
    開發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價(jià)格詳情指南

    阿里云正式發(fā)布通義千問2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
    的頭像 發(fā)表于 05-13 11:16 ?1004次閱讀

    阿里云發(fā)布通義千問2.5大模型,多項(xiàng)能力超越GPT-4

    阿里云隆重推出了通義千問 2.5 版,宣稱其“技術(shù)進(jìn)步,全面超越GPT-4”,尤其是在中文環(huán)境中的多種任務(wù)(如文本理解、文本生成、知識(shí)問答及生活建議、臨時(shí)聊天及對(duì)話以及安全風(fēng)險(xiǎn)評(píng)估)方面表現(xiàn)出色,超越了GPT-4
    的頭像 發(fā)表于 05-09 14:17 ?977次閱讀

    這個(gè)多語(yǔ)言包 怎么搜不到

    大家好,這個(gè)多語(yǔ)言包怎么搜不到 seven language lib 誰(shuí)有離線包不 感謝分享,
    發(fā)表于 03-24 10:06

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級(jí)至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無(wú)疑將使得
    的頭像 發(fā)表于 03-13 13:42 ?749次閱讀

    語(yǔ)言模型(LLMs)如何處理多語(yǔ)言輸入問題

    研究者們提出了一個(gè)框架來描述LLMs在處理多語(yǔ)言輸入時(shí)的內(nèi)部處理過程,并探討了模型中是否存在特定于語(yǔ)言的神經(jīng)元。
    發(fā)表于 03-07 14:44 ?645次閱讀
    大<b class='flag-5'>語(yǔ)言</b>模型(LLMs)如何處理<b class='flag-5'>多語(yǔ)言</b>輸入問題

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    3的出現(xiàn)意味著打開了一個(gè)全新的世界,其系列模型在推理,數(shù)學(xué),編碼,多語(yǔ)言理解和視覺方面,都樹立了全新的行業(yè)新基準(zhǔn)。 也正是因?yàn)镃laude 3的出現(xiàn),全球最強(qiáng)AI模型一夜易主,曾經(jīng)被認(rèn)為不可一世
    的頭像 發(fā)表于 03-06 22:22 ?683次閱讀
    新火種AI|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude 3振奮人心!

    OpenAI推出ChatGPT新功能:朗讀,支持37種語(yǔ)言,兼容GPT-4GPT-3

    據(jù)悉,“朗讀”功能支持37種語(yǔ)言,且能夠自主識(shí)別文本類型并對(duì)應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是,該功能對(duì)GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態(tài)交互”(multimodal capab
    的頭像 發(fā)表于 03-05 15:48 ?958次閱讀

    全球最強(qiáng)大模型易主,GPT-4被超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude 3系列在推理、數(shù)學(xué)、編碼、多語(yǔ)言理解和視覺方面全面超越了包括GPT-4在內(nèi)的所有大型模型,重新樹立了行業(yè)基準(zhǔn)。
    的頭像 發(fā)表于 03-05 09:58 ?676次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成功擊敗了此前被廣泛認(rèn)為是全球最強(qiáng)AI模型的GPT-4,樹立了新的行業(yè)基準(zhǔn)。
    的頭像 發(fā)表于 03-05 09:49 ?701次閱讀
    主站蜘蛛池模板: 伊人网久久网| 欧美性视频xxxxhd| 久久亚洲伊人| 人妻插B视频一区二区三区| 亚洲国产精品综合久久一线| z0000性欧美| 久久ZYZ资源站无码中文动漫| 日本伦子欲| xxxx69日本| 欧美激情社区| 99免费在线观看| 嫩小xxxxbbbb| 97一期涩涩97片久久久久久久| 久久学生精品国产自在拍| 一级毛片视频免费| 久久精品国产亚洲AV蜜臀| 亚洲综合AV色婷婷五月蜜臀| 狠狠干狠狠色| 一本道手机无码在线看| 久久合| 亚洲天堂999| 国产亚洲精品久久7777777| 无码一区二区三区| 国产精品-区区久久久狼| 日日摸夜夜添夜夜爽出水| www.99在线| 人妻兽虐曲| 扒开她的黑森林让我添动态图| 久久足恋网| jazzjazzjazz欧美| 嗯啊好爽视频| 97无码人妻精品1国产精东影业| 狂操空姐电影| 中文字幕一区久久久久| 国产伦精品一区二区三区免费观看 | 美女扒开腿让男生桶爽免费APP| 曰本真人00XX动太图| 久久re视频这里精品青| 在线观看插女生免费版| 啦啦啦 中文 日本 韩国 免费 | 动漫美女禁区|