色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何去解決文本到圖像生成的跨模態對比損失問題?

LiveVideoStack ? 來源:LiveVideoStack ? 作者:Google AI Blog ? 2021-06-15 10:07 ? 次閱讀

Google提出了一個跨模態對比學習框架來訓練用于文本到圖像合成的 GAN 模型,用于研究解決生成的跨模態對比損失問題。

從文本到圖像的自動生成,如何訓練模型僅通過一段文本描述輸入就能生成具體的圖像,是一項非常具有挑戰性的任務。

與其它指導圖像創建的輸入類型相比,描述性句子是一種更直觀、更靈活的視覺概念表達方式。強大的自動文本到圖像的生成系統可以成為快速、有效的內容生產、制作工具,用于更多具有創造性的應用當中。

在CVPR 2021中,Google提出了一個跨模態對比生成對抗網絡(XMC-GAN),訓練用于文本到圖像合成的 GAN 模型,通過模態間與模態內的對比學習使圖像和文本之間的互信息最大化,解決文本到圖像生成的跨模態對比損失問題。

poYBAGDIDJ-AfrniAADMgxcEq1k626.jpg

XMC-GAN 文本到圖像合成模型中的模態間和模態內對比學習

XMC-GAN 被成功應用于三個具有挑戰性的數據集:一個是MS-COCO 圖像描述集合,另外兩個是用Localized Narratives注釋的數據集,一個是包括MS-COCO 圖像(稱為LN-COCO) ,另一個描述開放圖像數據 (LN-OpenImages)。結果顯示 XMC-GAN生成圖像所描繪的場景相比于使用其它技術生成的圖像質量更高,在每個方面都達到了最先進的水平。

pYYBAGDIDI-AdQkNAAB3Ifj0XNA593.jpg

MS-COCO對圖像質量和文本對齊的人工評估

此外,XMC-GAN還在 LN-OpenImages 上進行了一系列訓練和評估,這相比于 MS-COCO 更具有挑戰性,由于數據集更大,圖像涵蓋主題范圍更加廣泛且復雜。

對于人類評估和定量指標,XMC-GAN 在多個數據集模型中相較之前有顯著的改進。可以生成與輸入描述非常匹配的高質量圖像,包括更長,更詳細的敘述,同時端到端模型的復雜度也相對較為簡單,這代表了從自然語言描述生成圖像的創造性應用的重大進步。

責任編輯:lq6

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1085

    瀏覽量

    40486
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1939

    瀏覽量

    73561

原文標題:XMC-GAN:從文本到圖像的跨模態對比學習

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    淺析OpenVINO 2024.5的新功能

    ,事實上在安全、監控或醫療保健等某些領域至關重要。它代表了從處理文本到處理不同輸入和生成不同形式輸出的重大演變。例如,多模態模型可以接收長視頻,并以圖像或音頻片段的形式輸出關鍵信息。
    的頭像 發表于 11-25 17:12 ?238次閱讀

    高通與智譜推動多模態生成式AI體驗的終端側部署

    此前,驍龍峰會首日,智譜與高通技術公司宣布合作將GLM-4V端側視覺大模型,面向驍龍8至尊版進行深度適配和推理優化,支持豐富的多模態交互方式,進一步推動多模態生成式AI在終端側的部署和推廣,賦能更加情境化、個性化的終端側智能體驗
    的頭像 發表于 11-08 09:55 ?188次閱讀

    生成式AI工具作用

    生成式AI工具是指那些能夠自動生成文本圖像、音頻、視頻等多種類型數據的人工智能技術。在此,petacloud.ai小編為您整理生成式AI工具作用。
    的頭像 發表于 10-28 11:19 ?248次閱讀

    如何使用 Llama 3 進行文本生成

    使用LLaMA 3(Large Language Model Family of AI Alignment)進行文本生成,可以通過以下幾種方式實現,取決于你是否愿意在本地運行模型或者使用現成的API
    的頭像 發表于 10-27 14:21 ?424次閱讀

    AIGC與傳統內容生成的區別

    AIGC : 主要面向非結構化數據的生成,如自然語言文本圖像、音頻、視頻等。 這類數據規模更大,內在結構更復雜,對處理技術提出了更高要求。 傳統內容生成 : 主要處理結構化數據,如
    的頭像 發表于 10-25 15:13 ?439次閱讀

    利用OpenVINO部署Qwen2多模態模型

    模態大模型的核心思想是將不同媒體數據(如文本圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,多模態
    的頭像 發表于 10-18 09:39 ?449次閱讀

    Meta發布多模態LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項重要技術突破,成功推出了多模態LLAMA 3.2人工智能模型。這一創新模型不僅能夠深度解析文本信息,還實現了對圖像內容的精準理解,標志著Meta在AI多
    的頭像 發表于 09-27 11:44 ?413次閱讀

    鴻蒙ArkTS聲明式開發:平臺支持列表【半模態轉場】模態轉場設置

    通過bindSheet屬性為組件綁定半模態頁面,在組件插入時可通過設置自定義或默認的內置高度確定半模態大小。
    的頭像 發表于 06-12 21:09 ?1081次閱讀
    鴻蒙ArkTS聲明式開發:<b class='flag-5'>跨</b>平臺支持列表【半<b class='flag-5'>模態</b>轉場】<b class='flag-5'>模態</b>轉場設置

    阿里云通義大模型助力“小愛同學”強化多模態AI生成能力

    小米的人工智能助手“小愛同學”近期與阿里云通義大模型達成戰略合作,共同提升其多模態AI生成能力,特別是在圖片生成與理解方面。這次合作不僅將強化“小愛同學”的功能,還將在小米的多個產品線,包括小米汽車和手機等設備上得到實際應用。
    的頭像 發表于 05-13 09:19 ?834次閱讀

    李未可科技正式推出WAKE-AI多模態AI大模型

    文本生成、語言理解、圖像識別及視頻生成等多模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互,同時多
    發表于 04-18 17:01 ?613次閱讀
    李未可科技正式推出WAKE-AI多<b class='flag-5'>模態</b>AI大模型

    深度學習生成對抗網絡(GAN)全解析

    GANs真正的能力來源于它們遵循的對抗訓練模式。生成器的權重是基于判別器的損失所學習的。因此,生成器被它生成
    發表于 03-29 14:42 ?4600次閱讀
    深度學習<b class='flag-5'>生成</b>對抗網絡(GAN)全解析

    NVIDIA Edify多模態架構升級,引領視覺生成式AI新紀元

    NVIDIA近日宣布,其用于視覺生成式AI的多模態架構Edify迎來重大更新,為開發者和視覺內容提供商帶來前所未有的新功能。其中,3D資產生成功能的引入,極大地提升了AI圖像
    的頭像 發表于 03-27 10:22 ?471次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他文本
    的頭像 發表于 02-19 16:03 ?951次閱讀
    Stability AI試圖通過新的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>人工智能模型保持領先地位

    韓國Kakao宣布開發多模態大語言模型“蜜蜂”

    韓國互聯網巨頭Kakao最近宣布開發了一種名為“蜜蜂”(Honeybee)的多模態大型語言模型。這種創新模型能夠同時理解和處理圖像文本數據,為更豐富的交互和查詢響應提供了可能性。
    的頭像 發表于 01-19 16:11 ?706次閱讀

    什么是多模態?多模態的難題是什么?

    模態大模型,通常大于100M~1B參數。具有較強的通用性,比如對圖片中任意物體進行分割,或者生成任意內容的圖片或聲音。極大降低了場景的定制成本。
    的頭像 發表于 01-17 10:03 ?4667次閱讀
    什么是多<b class='flag-5'>模態</b>?多<b class='flag-5'>模態</b>的難題是什么?
    主站蜘蛛池模板: 国产精品美女久久久久浪潮AV | 热热久久超碰精品中文字幕 | 俄罗斯老妇女BBXX| 老妇xxxxbbbb| 中文字幕精品视频在线| 久久无码人妻AV精品一区 | 天美传媒在线观看完整高清| 处初女处夜情视频在线播放| 暖暖 免费 高清 日本 在线| 中国女人逼| 恋夜直播午夜秀场最新| 中文字幕亚洲无线码高清不卡| 久久伊人青青| 16女下面流水不遮图免费观看| 久久精品一本到99热| 伊人国产在线播放| 麻豆精品国产剧情观看| 99久久免费看国产精品| 青青草国产精品久久| 成人性生交大片免费看4| 日本无码色哟哟婷婷最新网站| 大胸女晃奶动态图| 天天看学生视频| 国产真实夫妇交换视频| 国产精品永久免费视频| 亚洲精品久久一区二区三区四区| 国产午夜精品一区二区理论影院| 亚洲福利精品电影在线观看| 国产中文字幕乱码免费| 影音先锋男人资源813.| 免费毛片在线播放| xxxxxx日本处大片免费看| 日韩高清特级特黄毛片| 国产精品三级在线观看| 一本色道久久综合亚洲AV蜜桃| 老熟风间由美AV在线一区二区| 99视频在线观看免费视频| 色戒在线完整观看在线播放版| 国产囗交10p| 中文字幕欧美一区| 日本不卡不码高清免费|