色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中文多模態對話數據集

jf_78858299 ? 來源:NLP工作站 ? 作者:NLP工作站 ? 2023-02-22 11:03 ? 次閱讀

寫在前面

早起刷arxiv,刷到一篇中文多模態對話數據集,分享給大家,全名為《TikTalk: A Multi-Modal Dialogue Dataset for Real-World Chitchat》,即一個真實閑聊多模態數據集,共包括38703個視頻和相應367670個對話。

paper: https://arxiv.org/pdf/2301.05880.pdf
github: https://github.com/RUC-AIMind/TikTalk

介紹

隨著大量預訓練語言模型在文本對話任務中的出色表現,以及多模態的發展,在對話中引入多模態信息已經引起了大量學者的關注。目前已經提出了各種各樣的多模態對話數據集,主要來自電影、電視劇、社交媒體平臺等,但這些數據與真實世界的日常聊天對話之間還是存在一些差距。

  • 對話形式過于同質化。 視頻中的現場評論缺乏明確背景,更偏向于評論,并充斥著重復的數據用來活躍氣氛。而從影視劇中提取出來的對話內容或解說員根據指定圖片提出的對話內容,都不是現實對話場景中自然生成的聊天,而是為了推動情節發展設計的一些人物臺詞或高度依賴形象。
  • 缺乏對話的時間順序。 現實世界的多模態對話場景可能包含具有時間順序的不同上下文,而目前大多數數據集中的靜態圖片所能提供的信息有限,限制了對話參與者在主題方面的多樣性。并且不同的語言語境中存在著獨特的表達方式和流行文化,很難進行翻譯或遷移到其他語言。

圖片因此,該論文提出了具有獨特特色的中文多模態對話數據集-TikTalk。TikTalk是基于視頻的真實世界人類聊天語料庫,是開放域的,并由用戶自發生成非故意創建的數據集。其中,與圖像、音頻和外部知識相關的回復占比分別為42%、10%和34%,如圖1(a)所示,聊天源于視頻內容,圖1(b)中的“其他表演”和舞蹈分析需要一些外部知識,圖1(c)中的對話建立在音頻內容之上。圖片最后采用排名、相關性和多樣性三種度量指標對現有生成模型進行分析,發現模型與人類表現仍有很大差距,在TikTalk數據集上有相當大的改進空間。

TikTalk Dataset

TikTalk數據集從抖音上采集,其抖音擁有超過25個大類的視頻,如教育、美食、游戲、旅游、娛樂等。每個視頻都有作者提供的標題和用戶的評論。用戶可以在視頻和一級評論下進行進一步的討論,這接近于現實世界面對面的多模態聊天場景。

Data Construction

該論文收集了2021年在抖音上發布的視頻,以及標題、評論和回復。為了保護隱私,沒有抓取任何用戶信息。由于視頻基數大,視頻質量良莠不齊,大部分視頻只有一級評論,無法構成對話語料庫。由于視頻高贊、評論高贊表示用戶評分高,因此在爬取數據時通過點贊數過濾低質量的視頻和評論。

數據清理時,用正則表達式過濾掉句子中無用的內容,例如:“@某人”、重復的詞語、以及一些不道德的言論等;此外,評論中帶有的表情符號,通常可以表明用戶的情緒,因此,從對話中提取它們,并作為附加信息。

Data Statistics

該論文共爬取153340個視頻,最終獲取38703個視頻和367670個對話來構建TikTalk數據集。將訓練集、驗證集和測試集按照35703、1000和2000進行劃分,詳細統計數據見表2。圖片可以看出,視頻平均長度為34.03s,提供了豐富的視頻和音頻信息;每段對話的平均輪數為2.25,由于對話的文本上下文較短,回復更有可能來自視頻或外部知識。

Data Analysis

TikTalk數據集有如下幾個特征:

  • 高度自發和自由 ,對話是由用戶觀看視頻后發起,沒有任何的預先的意圖及指導,類似于現實世界中的日常閑聊。
  • 多種模式 ,對話上下文包括相關的圖像、音頻和文本,提供了更多樣化的信息來源,同時也對聊天場景進行了更多的限制,提高了回答的可信度標準。
  • 開放領域的 ,由于社交平臺是開放域的,討論話題也十分豐富。

觀察數據發現,對話回復中經常包含與上下文信息相關的詞語,例如:圖1(a)中的“it”為視頻中的“海鷗”,圖1(c)中討論了音頻描述的故事,圖1(b)中的回復中為上下文觀點,并分析了視頻外的其他節目,與個人經驗及常識相關。因此,該論文分析了數據及中數據與各種信息相關的響應占比,包括視頻中的視覺內容和音頻內容、文本內容及隱形的外部知識。采用眾包的方式進行數據標注,并選擇另外其他三個具有代表性的對話數據集(每個數據集隨機選取300個樣本)進行對比。

從回復中提取名詞和代詞,要求標注人員判斷這些詞語或完整的回復是否是指:(1)視頻上下文;(2)音頻上下文;(3)文本上下文;(4)隱藏外部知識;(5)其他。并且,回復可以涉及多種模式的信息。

四種數據的比較如圖2(a)所示。TikTalk數據除去文本上下文和外部知識后,信息源占比最高,表示視頻中的圖像和音頻可以提供更多的信息。來自外部知識的回復比例最高(約33%,說明),說明多模態上下文更豐富時,會引入更多與當前對話相關的新信息。圖片進一步探究IGC和TikTalk之間的差異,研究當對話輪數數增加時,IGC和TikTalk對不同上下文的依賴性,如圖2(b)和(c)所示。IGC數據集中圖像與對話的比例顯著下降,而TikTalk數據集中沒有這種趨勢。可能是因為IGC的每個對話中只使用一個圖像,隨著時間的推移,可用的信息越來越少。

Experiments

采用三個自動指標(相關性、排序、多樣性),從多個角度評估模型在TikTalk上的性能,

  • 相關性 :針對模型生成的回復,與5個金標準計算BLEU-2、BLEU-4 、Meteor、Rouge-L和CIDEr。
  • 排序 :每段對話構建一個100個樣本的候選集,其中包括5個金標準和95個隨機選擇的錯誤回復。在推理階段,模型根據生成每個回復的對數似然分數降序對候選集進行排序。計算Recall@K和Mean Rank。
  • 多樣性 :計算回復的Dist-1和Dist-2指標。

從不同的任務和設置中評估一些最先進的對話模型,包括:Livebot、DialoGPT、Maria、Maria-Audio、Maria-C3KG等。為了適應TikTalk的特點,在現有的基于圖像的對話模型中引入音頻和外部知識作為輸入,并分別對模型的性能進行評估。

實驗結果如表3所示,可以看出TikTalk與以前的任務和數據集有很大不同,需要更強大的多模態對話模型。圖片從測試集和上述基線模型生成結果中選擇了一些數據示例,對比結果如圖3所示。由于視頻場景和用戶個性的多樣性,TikTalk數據集需要復雜的理解和推理能力。雖然部分基線偶爾可以產生一些合理的響應,但它們遠遠不能滿足現實世界多模式對話的期望。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24689
  • 自然語言
    +關注

    關注

    1

    文章

    287

    瀏覽量

    13346
收藏 人收藏

    評論

    相關推薦

    lABCIWQmultyWindows模態窗口2010

    lABCIWQmultyWindows模態窗口2010。
    發表于 05-17 17:47 ?0次下載

    文化場景下的模態情感識別

    學習的特征,并通過多模態融合方法結合不同的模態。比較不同單模態特征和模態特征融合的情感識別性能.我們在CHEAVD
    發表于 12-18 14:47 ?0次下載

    關于模態機器學習綜述論文

    因此,當研究問題或數據包括多個這樣的模態時,其特征在于模態。 本文主要關注但不僅僅關注三種形式:自然語言既可以是書面的,也可以是口頭的;
    的頭像 發表于 01-21 13:38 ?8808次閱讀

    2021 OPPO開發者大會:終端對話式智能助手

    2021 OPPO開發者大會:終端對話式智能助手 2021 OPPO開發者大會上介紹了終端、模態
    的頭像 發表于 10-27 11:38 ?1312次閱讀
    2021 OPPO開發者大會:<b class='flag-5'>多</b>終端<b class='flag-5'>對話</b>式智能助手

    DocumentAI的模型、任務和基準數據

    隨著最近幾年模態大火的,越來越多的任務都被推陳出新為模態版本。譬如,傳統對話任務,推出了考慮視覺信息的
    的頭像 發表于 08-22 09:55 ?1836次閱讀

    一個真實閑聊模態數據TikTalk

    隨著大量預訓練語言模型在文本對話任務中的出色表現,以及模態的發展,在對話中引入模態信息已經引
    的頭像 發表于 02-09 09:31 ?1835次閱讀

    基于Alpaca派生的對話數據

    ChatAlpaca數據包含10,000個對話組,共計95,558條對話語句。每個對話組的第一輪對話
    發表于 04-14 14:54 ?3996次閱讀

    模態GPT:國內發布一款可以在線使用的模態聊天機器人!

    基于開源模態模型 OpenFlamingo,作者使用公開數據創建了各種視覺指令數據,包括視覺問答、圖像字幕、視覺推理、文本 OCR 和視
    的頭像 發表于 05-12 09:55 ?1192次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態</b>GPT:國內發布一款可以在線使用的<b class='flag-5'>多</b><b class='flag-5'>模態</b>聊天機器人!

    模態上下文指令調優數據MIMIC-IT

    然而,一個理想的 AI 對話助手應該能夠解決涉及多種模態的任務。這需要獲得一個多樣化和高質量的模式指令跟隨數據。比如,LLaVAInst
    的頭像 發表于 06-12 16:36 ?735次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態</b>上下文指令調優<b class='flag-5'>數據</b><b class='flag-5'>集</b>MIMIC-IT

    VisCPM:邁向多語言模態大模型時代

    可以大致分為兩類: 1. 在圖生文(image-to-text generation)方面,以 GPT-4 為代表的模態大模型,可以面向圖像進行開放域對話和深度推理; 2. 在文生圖
    的頭像 發表于 07-10 10:05 ?709次閱讀
    VisCPM:邁向多語言<b class='flag-5'>多</b><b class='flag-5'>模態</b>大模型時代

    全球首個面向網聯智能車的通信與模態感知數據發布

    7月2日,2023中國智能車大會暨國家智能車發展論壇在廣州南沙盛大開幕。會上重磅發布全球首個面向網聯智能車的包含車和多路端的通信與模態感知數據
    的頭像 發表于 07-13 15:20 ?766次閱讀

    更強更通用:智源「悟道3.0」Emu模態大模型開源,在模態序列中「補全一切」

    熱度。Flamingo 具備強大的模態上下文少樣本學習能力。 Flamingo 走的技術路線是將大語言模型與一個預訓練視覺編碼器結合,并插入可學習的層來捕捉跨模態依賴,其采用圖文對、圖文交錯文檔、視頻文本對組成的
    的頭像 發表于 07-16 20:45 ?716次閱讀
    更強更通用:智源「悟道3.0」Emu<b class='flag-5'>多</b><b class='flag-5'>模態</b>大模型開源,在<b class='flag-5'>多</b><b class='flag-5'>模態</b>序列中「補全一切」

    人工智能領域模態的概念和應用場景

    隨著人工智能技術的不斷發展,模態成為了一個備受關注的研究方向。模態技術旨在將不同類型的數據和信息進行融合,以實現更加準確、高效的人工智能
    的頭像 發表于 12-15 14:28 ?9789次閱讀

    從Google模態大模型看后續大模型應該具備哪些能力

    前段時間Google推出Gemini模態大模型,展示了不凡的對話能力和模態能力,其表現究竟如何呢?
    的頭像 發表于 12-28 11:19 ?1258次閱讀
    從Google<b class='flag-5'>多</b><b class='flag-5'>模態</b>大模型看后續大模型應該具備哪些能力

    利用OpenVINO部署Qwen2模態模型

    模態大模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,
    的頭像 發表于 10-18 09:39 ?412次閱讀
    主站蜘蛛池模板: 伊人久久99热这里只有精品| 国内精品伊人久久久久| jiizzyou欧美喷液| 3D漫画H精品啪啪无码| 野花影院手机在线观看| 亚洲一区电影在线观看| 亚洲国产在线99视频| 亚洲AV无码专区国产精品麻豆| 特级淫片大乳女子高清视频| 色欲色香天天天综合| 日韩娇小性hd| 世界第一黄暴漫画家| 无码爽死成人777在线观看网站| 色四房播播| 午夜家庭影院| 亚洲国产精品无码2019| 亚洲精品美女久久777777| 亚洲免费高清视频| 一边亲着一面膜下奶韩剧免费 | 精品无人区麻豆乱码1区2| 国精产品一区一区三区有限公司| 国产自啪偷啪视频在线| 簧片在线免费观看| 久久全国免费久久青青小草| 玖玖爱这里只有精品视频| 老师系列高H文| 浓毛BWBWBWBWBW日本| 青青草在现线免费观看| 色欲蜜臀AV免费视频| 翁公与小莹在客厅激情| 亚洲va久久久久| 最近免费中文MV在线字幕| 97色伦久久视频在观看| xiao776唯美清纯| 国产超碰AV人人做人人爽| 国产色婷亚洲99精品AV在| 教室眠催白丝美女校花| 麻豆国产人妻欲求不满| 日韩欧美中文字幕在线二视频| 香蕉鱼视频观看在线视频下载| 亚洲欧洲精品A片久久99|