色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進技術推向千行百業

NVIDIA英偉達 ? 來源:未知 ? 2023-09-19 11:10 ? 次閱讀

案例介紹

火山引擎通過與 NVIDIA 團隊合作開發了 BMF(Babit Media Framework,多媒體處理框架),提供了豐富的 GPU 即用模塊,低門檻的擴展方式,多語言接口以及各類主流框架 SDK 的簡單接入,方便用戶快速打造高效的全 GPU 視頻處理流水線,有效解決開發效率低,鏈路缺乏整體優化的問題,使得 GPU 能夠充分發揮其強大的并行計算能力,應用于各類視頻 AI 場景。

視頻成為企業數字化增長新動力

在當今人們的生活中,視頻化場景已經滲透到了方方面面。QuestMobile 數據顯示,截止到 2023 年 5 月,中國移動視頻行業整體用戶規模達到 10.76 億,月人均時長達到 64.2 小時[1]。在艾瑞研究院報告的數據中也顯示,目前中國用戶量排名前 100 的 APP 中,有 69% 搭載了視頻類功能,65% 搭載了點播功能,51% 有直播類功能,32% 有實時音視頻類功能[2]。視頻應用正在從內容、娛樂行業拓展至泛互聯網和大量傳統行業。

2016 年抖音上線,同年全民直播和短視頻時代正式開啟。2018 年,業界已經廣泛地使用 AI 進行內容理解,視頻增強。2019 年則是云游戲的元年,這一年,低延遲成為業務關注焦點。進入 2021 年,市面上已經有大量的基于 AI 的視頻增強,特效貼紙,AI 視頻編輯的產品出現。如今,以 Stable Diffusion 和大語言模型(LLM) 掀起的生成式 AI 浪潮,正席卷整個行業進入另一個全新時代。GPU 不斷增強的計算能力和視頻圖像處理能力,正好和業界的發展完全契合。與圖文內容相比,企業自建視頻應用對技術積累和資金成本要求較高。為此,火山引擎與 NVIDIA 團隊合作,開源了 BMF(Babit Media Framework)多媒體處理框架。該框架是視頻化部署的“底座”,可為企業提供從視頻生產到消費的全鏈路場景支持,并能協助幫助開發者低成本構建視頻應用。

從 GPU 加速圖像處理,

到 GPU 上部署生成式 AI 業務

NVIDIA 自 1999 年發明 GPU 驅動了 PC 游戲市場的增長,并重新定義了現代計算機圖形,開啟了現代 AI 時代。2012 年,NVIDIA 在 Kepler 架構上添加了硬件視頻編解碼器,能更好地支持視頻串流和直播,也就是現在云游戲和游戲直播的原型。到了 2016 年,以卷積神經網絡為代表的深度學習技術為整個圖像處理和計算機視覺領域帶來革命,NVIDIA 也順勢推出了用于模型推理的 TensorRT,加速深度學習圖像處理。2019 年,為了配合深度學習的發展,NVIDIA 發布了 nvJPEG,使得 GPU 可以進行圖片編解碼。2022 年,NVIDIA 和字節跳動聯合開源了 CV-CUDA,把加速進一步推進到前后處理。

wKgaomULIY6ALtoTAACciOLcXDc870.jpg

圖 1. GPU 加速圖像處理發展歷程

但是從圖像處理到視頻內容生成,并非一蹴而就。

理想情況下,我們以 ControlNet 為例,它可以配合 Stable Diffusion 進行更精細的文生圖。如果單純向 Stable Diffusion 提供 cute dog 作為 prompt,Stable Diffusion 會生成形態各異的小狗。但是如果用戶想要某一個特定姿勢的小狗圖片,就需要用更加精細的方式控制生成過程。ControlNet 就可以做到這一點。以下圖為例,使用 Canny edge detector 生成輸入圖片的輪廓圖,檢測出的輪廓會和 prompt 一起被輸入 ControlNet 和 Stable Diffusion,即可生成姿勢樣貌相同,但其他細節不同的可愛小狗了。實際上,在其他場景下我們也可以將 Canny edge detector 替換成其他的傳統圖像處理或者 AI 算法,比如使用 pose detector 提取人體姿勢。類似的技術還可用于文生圖、圖生圖、image inpainting 等。

wKgaomUO1eOAWPhdAAFy4JCafos095.png

圖 2. ControlNet + Stable Diffusion

部署這樣一個業務具體涉及到哪些模塊和環節呢?首先,需要圖片和視頻的編解碼,模型的推理(ControlNet/Stable Diffusion),還有前后處理(Canny edge detector)。GPU 有編解碼器,可以運行 TensorRT 和 CV-CUDA,能夠將這些模塊一一加速。理想情況下,開發者應當充分利用 GPU 各種的硬件單元,減少 GPU 和 CPU 之間的拷貝,讓視頻和圖片存留在 GPU;如果涉及跨界點通信,如將處理前后的視頻在網絡和 GPU 之間傳輸,還需要結合 GPU Direct RDMA,簡化通信鏈路,大幅降低延遲、提升吞吐。并且開發過程遵循阿姆達爾定律(Amdahl's law),將盡可能多的環節加速,整體的性能才能最優。

但實際上,火山引擎視頻團隊遇到了不同模塊之間通信不暢,整體性能不高等諸多問題。本質上是因為視頻處理變得越來越復雜,環節越來越多。2000 年 FFmpeg 剛出現的時候,需要面對的編解碼需求是非常簡單的,單機、個人用戶、簡單處理、容錯要求低、用戶耐心強。但是用戶對于視頻處理的要求已經今非昔比,算法和應用的復雜度越來越高,用戶體驗要求也越來越高。以前用戶在電腦前長時間等待編解碼完成的耐心,已經被短視頻的秒級延遲,甚至 VR/AR、云游戲這樣的毫秒級延遲所取代。視頻處理涉及的技術棧也越來越多,包括編解碼、圖像處理、深度學習甚至圖像渲染。

NVIDIA 加速火山引擎為視頻云

提供更理想的處理框架:BMF

面對這些挑戰,NVIDIA 和火山引擎緊密合作開發了 BMF,旨在幫助企業和開發者將各類視頻的原子能力與方案做到優勢互補、協同工作和快速落地。多媒體處理框架 BMF 的整體架構分為應用層、框架層、模塊層和異構層,共 4 個部分:

  1. 應用層:即頂層,為用戶提供多語言的 API,包括 Python、Go、C++,方便用戶根據不同的項目需求進行開發集成。

  2. 框架層:即中間層,包括框架對 graph / pipeline 的調度、跨數據類型跨設備的數據流轉 ackend、以及常用的跨設備 reformat、color space conversion、tensor 算子等 SDK。

  3. 模塊層:包含了具備各種原子能力的模塊,提供多種語言的模塊開發機制,用戶可根據自身需要將算法/處理實現為 Python、Go、C++ 語言的任意一種。

  4. 異構層:負責提供高效的視頻處理算力,包括火山引擎自研的視頻編解碼芯片 ASIC

wKgaomULIY6AN0b4AAG4wQdQyPo493.jpg

圖 3. BMF 架構圖(綠色高亮表示支持 GPU 加速)

火山引擎通過與 NVIDIA 團隊深入合作,針對 GPU 相關的框架層能力、處理能力進行了深度優化,從框架層和模塊層對 BMF 都進行了深入改造,針對各種場景進行了開發和測試,并且貢獻了多種應用層示例。BMF 提供了豐富的 GPU 即用模塊,低門檻的擴展方式,多語言接口以及各類主流框架 SDK 的簡單接入,方便用戶快速打造高效的全 GPU 視頻處理流水線,有效解決前文所述的開發效率低,鏈路缺乏整體優化的問題。這一系列的工作,使得 GPU 能夠充分發揮其強大的并行計算能力,應用于各類視頻 AI 場景。

比如在大型活動直播、電商直播間等場景中,通過“極致超清”技術,能夠有效提升畫質體驗;針對不同損傷情況的經典影片,通過“AI 修復”技術,能夠對損傷后的影片進行全面的畫質提升;在 VR/AR 等復雜圖像場景中,通過“ VR 360° 全景圖像技術”幫助圖像實現更加高清的效果。

火山引擎總裁譚待表示:在營銷、空間、商業和知識的交互體驗都在發生變化的視頻化時代,視頻云技術因其從視頻生產,處理、傳輸至消費的全鏈路技術能力被賦予了重要使命。隨著 AIGC、XR 等技術的興起,新技術與視頻云的融合將帶來更多創新和價值。

字節跳動視頻架構負責人、火山引擎視頻云架構技術總監王悅表示:“BMF 框架是基于抖音多年實踐打磨出來的,火山引擎又攜手 NVIDIA 針對 GPU 相關能力進行了深度優化,使其能夠發揮更強大的并行計算能力。“

目前,BMF 已經全面開源,包含 BMF 框架層整體開源、9 個開箱即用案例、20+ API 調用范例,旨在幫助開發者低成本地構建視頻應用。

歡迎訪問BMF Githubhttps://github.com/BabitMF/bmf)頁面,了解更多信息

數據來源:

[1] 資料來源于 QuestMobile 研究院《2023 內容視頻化與商業化洞察報告》:https://www.questmobile.com.cn/research/report/1678658723797635073 。[2] 資料來源于艾瑞咨詢《2022 年中國視頻云服務行業研究報告》:https://report.iresearch.cn/report/202207/4038.shtml。 GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,關注更多會議及活動信息。

wKgaomULIY-AfE8NAAFtccdApf0231.jpg


原文標題:NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進技術推向千行百業

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3791

    瀏覽量

    91313

原文標題:NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進技術推向千行百業

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    廣和通CES 2025發布Fibocom AI Stack,賦能千行百業端側應用

    千行百業的智能化轉型提供強有力的支持。 Fibocom AI Stack集成了高性能模組、AI工具鏈、高性能推理引擎、海量模型以及全方位的支持與服務,構成了一套完整的端側AI解決方案。該方案致力于幫助智能設備快速實現AI能力的商
    的頭像 發表于 01-08 15:18 ?164次閱讀

    開源技術推動教育數字化高質量發展

    開源技術日益成為數字經濟發展的重要支柱,正加速從社區走進行業變革中,給千行百業的數字化與智能化發展帶來了巨大的想象空間。
    的頭像 發表于 12-17 14:05 ?215次閱讀

    開源技術推動交通基礎設施迭代升級

    開源技術日益成為數字經濟發展的重要支柱,正加速從社區走進行業變革中,給千行百業的數字化與智能化發展帶來了巨大的想象空間。
    的頭像 發表于 12-16 15:00 ?277次閱讀

    開源技術助力電力行業創新發展

    開源技術日益成為數字經濟發展的重要支柱,正加速從社區走進行業變革中,給千行百業的數字化與智能化發展帶來了巨大的想象空間。
    的頭像 發表于 12-13 15:29 ?268次閱讀

    開源技術推動醫療行業創新發展

    開源技術日益成為數字經濟發展的重要支柱,正加速從社區走進行業變革中,給千行百業的數字化與智能化發展帶來了巨大的想象空間。
    的頭像 發表于 12-12 11:28 ?261次閱讀

    開源技術助力智慧文旅信息化建設

    開源技術日益成為數字經濟發展的重要支柱,正加速從社區走進行業變革中,給千行百業的數字化與智能化發展帶來了巨大的想象空間。
    的頭像 發表于 12-11 11:50 ?246次閱讀

    開源如何改變千行百業

    或許你此前并不了解開源,但從銀行的自助智能終端到購物時導購遞給你的POS機、從遍布各地的高速公路到習以為常的新能源汽車充電樁……開源的力量一直悄悄煥新著大眾的日常生活。
    的頭像 發表于 12-10 15:05 ?254次閱讀

    倒計時1天 | 第三屆OpenHarmony技術大會——明天,上海見!

    技術引領筑生態,萬物智聯創未來 OpenHarmony 開源生態 繁榮于各方共建,又賦能于千行百業 開創了萬物智聯的新紀元,開源盛事,亦是
    發表于 10-11 23:29

    第三屆OpenHarmony技術大會開啟 上海見

    技術引領筑生態,萬物智聯創未來 OpenHarmony 開源生態 繁榮于各方共建,又賦能于千行百業 開創了萬物智聯的新紀元,開源盛事,亦是
    的頭像 發表于 10-11 10:08 ?151次閱讀
    第三屆OpenHarmony<b class='flag-5'>技術</b>大會開啟 上海見

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標志著
    的頭像 發表于 09-25 14:11 ?316次閱讀

    千行百業用AI大模型,為什么火山引擎是聚處?

    筑一座AI“良港”,匯萬智能潮涌
    的頭像 發表于 09-06 10:58 ?2378次閱讀
    <b class='flag-5'>千行</b><b class='flag-5'>百業</b>用AI大模型,為什么<b class='flag-5'>火山</b><b class='flag-5'>引擎</b>是聚處?

    AI時代創新潮涌,從探路到引路,螢石云引領千行百業創新

    步入AI新時代,AI、云計算、大數據等技術迅速迭代,并日益融入經濟社會發展各領域全過程,數字經濟成為推動千行百業轉型升級的重要驅動力量。今年的政府工作報告提出,深入推進數字經濟創新發展。積極推進數字
    的頭像 發表于 07-01 15:17 ?432次閱讀
    AI時代創新潮涌,從探路到引路,螢石云引領<b class='flag-5'>千行</b><b class='flag-5'>百業</b>創新

    5G+北斗高精度定位終端技術,賦能千行百業應用

    5G+北斗高精度定位終端技術的融合,正以前所未有的精準度和實時性,為千行百業帶來革命性的變革。從智慧城市的精細化管理,到智能交通的實時調度,再到精準農業的播種與收割,這一技術正不斷拓寬
    的頭像 發表于 06-18 14:42 ?512次閱讀
    5G+北斗高精度定位終端<b class='flag-5'>技術</b>,賦能<b class='flag-5'>千行</b><b class='flag-5'>百業</b>應用

    攜手打造開放AI生態,英特爾助力千行百業數智化變革

    還分享了在互聯網、教育、制造及醫療等垂直領域的諸多應用落地,深度展示其攜手生態伙伴推動千行百業數智化變革的進程。 構建高效解決方案,釋放企業AI潛力 2023年被業界視為生成式AI的元年,隨著大模型和生成式AI的高速發展,企業正迎來AI發展轉折點。預
    的頭像 發表于 04-19 16:23 ?485次閱讀
    攜手打造開放AI生態,英特爾<b class='flag-5'>助力</b><b class='flag-5'>千行</b><b class='flag-5'>百業</b>數智化變革

    云+大模型的2024格局

    云廠商要如何經營好AI時代的“火鍋店”,助力千行百業智能化?
    的頭像 發表于 02-27 09:52 ?2260次閱讀
    云+大模型的2024格局
    主站蜘蛛池模板: 久热在线这里只有精品7| 国产欧美亚洲综合第一页| 国产国拍精品AV在线观看| 蜜臀亚洲AV永久无码精品老司机| 学校女性奴sm训练调教| 丁香美女社区| 涩涩999| 草莓西瓜樱桃香蕉直播视频| 欧美亚洲精品午夜福利AV| 97人人碰免费视频公开| 美女漏bb| jizz非洲| 色欲AV人妻精品麻豆AV| 福利社的阿姨| 窝窝午夜色视频国产精品东北| 国产99在线视频| 午夜福利自怕| 狠狠啪在线香蕉| 影音先锋 av天堂| 两性色午夜视频免费国产| 97在线视频免费| 起碰免费公开97在线视频| 成人性生交大片免费看4| 天天看高清影视在线18| 国产伦精品一区二区三区| 亚洲精品无码专区在线播放| 久草青青在线| 99久久亚洲精品影院| 日本美女阴道| 国产精品人妻无码99999| 亚洲乱亚洲乱妇13p| 玖玖爱这里只有精品视频| 99re久久热在线播放快| 人人草影院| 国产亚洲精品99一区二区| 在线成 人av影院| 青草久久伊人| 国产一区日韩二区欧美三区| 中国少妇内射XXXX狠干| 日本高清免费看| 好好的曰com久久|