色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

全球首款支持 8K(8192)輸入長度的開源向量模型發布

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-11-02 14:53 ? 次閱讀

作為多模態人工智能技術領域的翹楚,Jina AI 的愿景是鋪平通往多模態 AI 的未來之路。今天,Jina AI 在向著該愿景前進的路上,達成了一個重要里程碑。我們正式發布了自主研發的第二代文本向量模型:jina-embeddings-v2,是全球唯一能支持 8K(8192)輸入長度的開源向量模型。

據 MTEB 排行榜顯示,jina-embeddings-v2 與 OpenAI 的專有模型 text-embedding-ada-002 在性能方面不相上下。目前,僅 OpenAI 與 Jina AI 兩家人工智能技術公司推出了 8k 長度的 Embedding 模型。

自該模型發布,迅速登上 HackerNews 榜首,并長時間霸榜,在全球范圍內引發了業內人士的廣泛討論。

0c5df42a-779c-11ee-939d-92fbcf53809c.png

其中,“8K 長度”和“開源”這兩點特別受到業界的矚目,正如 HackerNews 上讀者的評論所言,支持 8k 輸入長度的 jina-embeddings-v2在表達能力和計算效率之間取得了可喜的平衡,而其中的關鍵,就在于它的獨特優勢 —— 用更小的維度來實現高效的表征

0c841628-779c-11ee-939d-92fbcf53809c.png

雖然 text-embedding-ada-002 已經廣泛應用于各種不同場景,但其 1536 維度的輸出對于數據量巨大和價格敏感的開發者來說并不友好。jina-embeddings-v2 通過提供 768(base)和 512(small)兩種輸出維度的選擇,賦予了開發者更大的靈活性。這更意味著開發者可以實現更低的計算和存儲成本,適用于更多的實際落地的場景。

0c9170e8-779c-11ee-939d-92fbcf53809c.png

在 Jina AI,我們堅信開源技術之于創新、合作與社區力量的催化作用,所以 我們第一時間將模型開源,期待和社區一起共同打造開源 AI 生態。

0c9c67be-779c-11ee-939d-92fbcf53809c.png

向量模型與 8k 輸入長度

在傳統的自然語言處理任務中,通常會將文本轉化為一組數字進行表示,也就是向量。向量模型用于生成向量表示,被廣泛應用于檢索、分類、聚類或語義匹配等任務。

在大模型時代,向量模型的重要性進一步增強。尤其是在檢索增強生成(RAG)場景中,它成為了一個核心組件,用于解決大模型的上下文長度限制、幻覺問題和知識注入問題。因為大模型通常有上下文長度的限制,我們需要一個有效的方法來壓縮、存儲和查詢大量的信息。這就是向量模型的用武之地。在 RAG 系統中,文檔首先被轉化為向量。隨后,大模型可以快速地查詢這些向量,找到與當前上下文相關的文檔,再基于這些文檔生成回復。

然而,目前的大部分開源向量模型都是僅支持最大 512 長度(大約 500 個漢字)的輸入長度,這使得開發者無法表征長文本的語義。jina-embeddings-v2 支持最大 8k 長度的輸入,突破了長文本向量表示的瓶頸,讓開發者可以更自由的對文本信息進行不同語義顆粒度的完整表示,從而更精準的表示文本語義。這不僅可以幫助開發者提高 RAG 場景下大模型回復的準確性,而且適用于各種處理長文本的場景,例如處理數十頁的報告綜述、長篇故事推薦等。

與 text-embedding-ada-002 模型對比測試

與 OpenAI 的 text-embedding-ada-002 相比,jina-embeddings-v2 展現出不俗的實力。下表為兩模型的性能對比。

0ca9aa5a-779c-11ee-939d-92fbcf53809c.png

值得注意的是,jina-embeddings-v2 在文本分類任務、檢索任務、檢索重排任務、和文本摘要任務上的得分都超過了 text-embedding-ada-002

擁抱開源

OpenAI 已經為我們展示了 8K 上下文長度模型的潛力,但 jina-embeddings-v2 不僅與其齊頭并進,還做出了更大膽的決策:完全開源!這意味著任何人都可以使用、修改和進一步優化這款模型。

不僅如此,當我們與 OpenAI 的模型進行直接比較時,jina-embeddings-v2 在多個關鍵指標上展現出了優越的性能。考慮到 jina-embeddings-v2 是開源的,我們堅信通過社區的集體智慧和努力,我們將有機會超越目前的標桿。

正是因為我們堅信開放和共享的價值,我們希望與全球的研究者、工程師和 AI 愛好者共同努力,不斷完善和推進這款模型。我們也在計劃中繼續拓展功能,例如提供更多語言的支持,以及開發更為強大的 API 平臺。

特點和優勢

全新的向量模型發布,再次證明了我們在技術創新上面的決心,jina-embeddings-v2 并非對前代模型的簡單修訂,而是經過了深入研發和優化后的全新設計,我們團隊付出了很多努力,從數據收集、處理再到模型調優,使得 v2 模型在性能表現上有了質的飛躍。

此外,jina-embeddings-v2 支持 8K 輸入長度,與其他領先的向量模型相比,在長文本任務中展現出了明顯的優勢,突顯了其擴展上下文長度的實際價值。這一特點也為很多實際應用提供了更多可能性,比如法律文件解讀、醫學文獻研究、深入的文學分析、金融數據洞察和聊天機器人的應答優化等等。

對于想要使用 jina-embeddings-v2 的開發者和研究者,我們在 Huggingface 平臺上提供了兩種規模的模型,以適應不同場景和需求:

jina-embeddings-v2-base-en

大小:0.27G(fp16),0.54G(fp32)

參數數量:1.37 億

適用場景:適合處理需要高精度的大型任務

jina-embeddings-v2-small-en

大小:0.07G

參數數量:0.33 億

適用場景:特別為輕量級的應用場景設計,如移動端應用或那些計算能力有限的設備上的任務

回顧本次發布歷程,Jina AI 創始人兼 CEO 肖涵博士說:

“在 AI 技術快速發展的今天,始終保持前沿并向公眾開放最新研究成果是我們的核心追求。有了 jina-embeddings-v2,我們達成了一個重要的里程碑。我們不僅開發了全球首款開源 8K 上下文長度的模型,而且其性能能夠與 OpenAI 這樣的行業巨頭相匹敵。Jina AI 的目標很明確:我們希望推動 AI 民主化,讓更多的人能夠使用且受益,而不只是那些擁有大量資源的大公司。今天,我可以很自豪地說,我們朝著這一愿景邁出了堅實的一步。”

展望未來

Jina AI 深信開源的魔力,并致力于為 AI 社區構建前沿且易于接入的工具。接下來,我們還會推動以下幾項重要工作:

分享學術成果:為了讓社區更好地了解 jina-embeddings-v2 的性能和特點,團隊將很快發布一篇詳細的學術文章,深入介紹模型的技術細節,以及和其他模型的比較分析。

API 平臺:我們正在努力構建一個 Embedding API 平臺,其功能和 OpenAI 類似,幫助用戶能夠根據自己的需求,更輕松地使用我們的向量模型。

多語言支持:Jina AI 正著手引入多語種,下一步計劃推出德文/英文以及中文/英文雙語模型,并進一步增強我們模型的能力。

編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • API
    API
    +關注

    關注

    2

    文章

    1499

    瀏覽量

    61962
  • 聊天機器人
    +關注

    關注

    0

    文章

    339

    瀏覽量

    12304
  • 自然語言處理

    關注

    1

    文章

    618

    瀏覽量

    13552
  • OpenAI
    +關注

    關注

    9

    文章

    1079

    瀏覽量

    6481

原文標題:Jina AI 推出全球首款開源 8K 向量模型,比肩 OpenAI

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里云全球首次互聯網8K直播背后的技術解讀

    摘要: 3月28日,云棲大會·深圳峰會現場,阿里云發布并現場演示了阿里視頻云最新8K互聯網直播解決方案。這是全球發布的首個8K視頻云解決方案
    發表于 04-08 10:55

    夏普8K電視評測 一優秀的電視產品

    2017年8月31日,夏普于上海正式發布全球8K電視,同一時間同步
    的頭像 發表于 08-28 14:53 ?4229次閱讀

    三星8K QLED量子點電視亮相,8K陣營又添新成員!

    當初夏普一意孤行并推出全球消費級8K電視之際,相信無論是業內人士還是消費者都頗不看好,畢竟4K才剛剛落地,夏普便迫不及待的奉上了
    發表于 10-10 11:05 ?1184次閱讀

    夏普正式發布第二代8K超高清電視,并公布了8K+AIoT生態融合戰略

    在顯示領域,夏普的創新和領先一直都是處于無敵的狀態,曾發明了世界第一臺液晶電視,而在8K方面,2009年就開始研發,2016年8K信號交換機,2017年推出全球
    發表于 10-29 10:41 ?2184次閱讀

    全球支持HDMI2.1規范8K視頻處理芯片

    加速推動8K視頻播放設備發展 先進視覺影像SoC應用技術領導廠商Socionext Inc.(“ 索喜科技 ”或者“公司”)宣布成功開發全球支持HDMI2.1規范的
    的頭像 發表于 11-03 10:43 ?1.1w次閱讀

    TCL發布了X10系列QLED 8K TV 是彩電行業全程8K電視

    國內知名家電企業TCL于3月12日在上海1933老場坊舉辦了春季新品發布會,發布會上帶來了彩電、空調、洗衣機等家電新品,彩電類發布了X10系列QLED 8K TV,是彩電行業
    發表于 03-22 11:17 ?2260次閱讀

    微軟的Project Scarlett Xbox控制臺以及LG電子發布全球8K OLED電視

    此外,RTD2893芯片還能夠通過USB / PCIe實現HDMI 2.1 8K輸入和輸出以及視頻比特流傳輸,并支持包括HDR格式在內的所有8K視頻處理,使其成為極具成本競爭力的
    的頭像 發表于 08-04 07:45 ?2969次閱讀

    全球8K口袋全景相機QooCam 8K正式發布

    作為全球8K口袋全景相機,QooCam 8K通過軟硬件創新突破諸多技術限制,其卓越性能全方位超越行業水準,重新定義VR相機新標準。
    的頭像 發表于 11-08 10:13 ?3226次閱讀

    全球8K口袋全景相機QooCam在北京發布

    QooCam 8K搭載兩顆200°視場角的魚眼鏡頭,保證360度超高清畫面采集,可錄制8K/30fps超高清畫面,是全球
    的頭像 發表于 11-08 17:16 ?3649次閱讀

    全球基于IGZO技術100英寸8K GOA顯示面板點亮

    據人民看點報道,作為全球完全自主設計開發的、基于IGZO技術的超高清8K GOA顯示面板,該產品的成功點亮標志著成都中電熊貓顯示科技有限公司在迎戰未來
    的頭像 發表于 01-03 11:05 ?3178次閱讀

    海信發布全球8K Pro雙屏電視 以世界級畫質打造家庭云中心

    3月18日,帶有鮮明“技術極客”標簽的中國彩電行業老大海信正式發布全球85英寸8K Pro雙屏電視,針對消費需求痛點,在畫質、內容、音質
    發表于 03-19 08:40 ?599次閱讀

    海信發布8K HDR雙屏電視U9 創造出8K電視分區紀錄

    3月18日消息 根據海信官方的消息,3月18日下午,海信視像副總裁王偉公布了85英寸8K Pro雙屏電視U9,官方稱海信85U9E是全球 8K
    發表于 03-19 14:09 ?845次閱讀

    借助AI技術,海信發布全球8K Pro雙屏電視

    帶有鮮明“技術極客”標簽的中國彩電行業老大海信正式發布全球85英寸8K Pro雙屏電視,針對消費需求痛點,在畫質、內容、音質、交互等方面
    的頭像 發表于 05-20 16:23 ?3727次閱讀

    當我們在談 8K8K 是什么

    電影的標準格式 8192x4320,而 8K 電視的標準比例是 16:9,百分百的屏幕占比為 7680x4320。只是畫幅的比例略有不同,8K 電視 3300 萬像...
    的頭像 發表于 12-08 22:23 ?3350次閱讀

    新型支持8K 60GHz畫面的HDMI線纜發布

    海外廠商Key Digital昨天發布了該品牌支持8k 60Hz畫面的HDMI線纜,長度分別
    發表于 03-02 17:36 ?2392次閱讀
    主站蜘蛛池模板: 伊人久久大香网| 奇米网一区二区三区在线观看| 国产精品亚洲二线在线播放| 99热在线观看精品| 久久久久久久网站| 北原多香子qvod| BLACKED太粗太长| 99久久做夜夜爱天天做精品| 网友自拍偷拍| 四虎影视永久无码精品| 美女视频黄a视频全免费网站色窝| 干丝袜美女| 国产99精品视频| 2020亚洲 欧美 国产 日韩| 十8禁用B站在线看漫画| 色情www日本欧美| 日本久久久久久久做爰片日本| 拍戏被CAO翻了H| 琪琪色原网20岁以下热热色原网站| 男生jj插入女生jj| 精品国产国偷自产在线观看| 好想被狂躁A片免费久99| 国产97碰免费视频| 国产欧美日韩综合精品一区二区 | 少妇伦子伦情品无吗| 亚洲 欧美 国产 综合 在线| 国产久久亚洲美女久久| 国产免费久久爱久久啪| 国产在线精品亚洲第1页| 护士们的母狗| swag合集120部| 豆奶视频在线高清观看| 国产精品一区二区三区免费| 国模大胆一区二区三区| 巨污全肉np一女多男| 破苞流血哭泣 magnet| 神电影院午夜dy888我不卡| 无码毛片内射白浆视频| 一本色道久久综合亚洲精品| 97超碰97资源在线观看| 11 13加污女qq看他下面|