獨家獲悉,谷歌高級科學(xué)家、卡內(nèi)基梅隆大學(xué)(CMU)計算機學(xué)院兼職教授蔣路,已經(jīng)加入TikTok。
蔣路是谷歌 VideoPoet 項目負(fù)責(zé)人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類似 OpenAI 剛剛發(fā)布的 Sora。
近期,昆侖萬維創(chuàng)始人周亞輝在朋友圈表示,有個論文的作者加入字節(jié)北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。
資料顯示,蔣路先后在西安交通大學(xué)、布魯塞爾自由大學(xué)、卡內(nèi)基梅隆大學(xué)學(xué)習(xí)計算機,并先后進入微軟亞洲研究院、谷歌研究院、雅虎研究院實習(xí)。
2017 年,蔣路畢業(yè)后加入谷歌。他是谷歌云 AI 的創(chuàng)始成員,也是李佳博士和李飛飛博士首次聘請的研究員。此后,蔣路進入谷歌研究院工作。
蔣路的研究曾被應(yīng)用到谷歌多個產(chǎn)品,如 YouTube、云服務(wù)、云 AutoML、廣告、Waymo 和翻譯服務(wù),影響了全球數(shù)十億用戶的日常生活。
蔣路的工作在自然語言處理(ACL)和計算機視覺(CVPR)的頂級會議上被提名為最佳論文。他是研究社區(qū)的活躍成員,擔(dān)任美國國家種子基金(NSF SBIR)的 AI 評審專家,并定期擔(dān)任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會議的領(lǐng)域主席。
蔣路的研究興趣主要在多媒體交叉領(lǐng)域,他專注于生成式 AI 和視頻創(chuàng)作。2019 年起,他就開始嘗試將 Transformer 用在圖像、視頻生成研究上。
與 Sora 采用的 Diffusion + Transformer 架構(gòu)不同,蔣路負(fù)責(zé)的 VideoPoet 視頻生成模型采用了單 Transformer 架構(gòu),可以將任何自回歸語言模型或大型語言模型轉(zhuǎn)換為高質(zhì)量的視頻生成器,支持生成方形或縱向視頻,以針對短格式內(nèi)容定制生成視頻,并支持視頻輸入生成音頻。
VideoPoet 采用了名為 Tokenizer 的數(shù)據(jù)處理技術(shù),可以將視頻和音頻片段編碼為離散標(biāo)記序列(discrete tokens),這些標(biāo)記也可以被轉(zhuǎn)換回原始表示。其中,視頻和圖像數(shù)據(jù)使用名為 MAGVIT V2 的技術(shù),音頻數(shù)據(jù)使用 SoundStream 的技術(shù)。
VideoPoet 通過使用多個 Tokenizer 訓(xùn)練一個自回歸語言模型,以學(xué)習(xí)跨視頻、圖像、音頻和文本模態(tài)。一旦模型根據(jù)某些上下文生成了標(biāo)記,這些標(biāo)記就可以通過分詞器解碼器轉(zhuǎn)換回可查看的表示。
3 周前,蔣路本人在職場社交平臺宣布了自己在谷歌的 Last Day,并特別表示對在谷歌所做的視頻生成項目(VideoPoet,MAGVIT,WALT等)感到自豪。
蔣路表示自己將繼續(xù)留在灣區(qū),開始視頻生成領(lǐng)域的新旅程?,F(xiàn)在來看,新的旅程就是 TikTok。
值得一提的是,字節(jié)跳動已經(jīng)在大模型領(lǐng)域全面布局,模型層推出了自研的「云雀大模型」以及類 ChatGPT 對話機器人產(chǎn)品豆包。2023 年底,字節(jié)跳動成立新的 AI 應(yīng)用部門 Flow,并在海外推出了 Coze 等多款產(chǎn)品。抖音集團 CEO 張楠也于近期卸任,專注于 AI 工具剪映的發(fā)展。
字節(jié)跳動近期辟謠了推出中文版 Sora,并表示:“還無法完善產(chǎn)品落地,距離國外模型有很大差距?!钡硪环矫?,字節(jié)跳動正在大力招攬人才。
大模型戰(zhàn)場,字節(jié)跳動將會如何攪局?
審核編輯:劉清
-
機器人
+關(guān)注
關(guān)注
211文章
28380瀏覽量
206918 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1698瀏覽量
45977 -
OpenAI
+關(guān)注
關(guān)注
9文章
1079瀏覽量
6482 -
TikTok
+關(guān)注
關(guān)注
2文章
214瀏覽量
7235
原文標(biāo)題:獨家:TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論