2022年,是中國人追逐群星的里程碑之年。
今年10月31日,中國天宮空間站的第二個科學實驗模塊——夢天實驗艙,搭載長征五號B遙四運載火箭發射升空。隨著之后天實驗艙成功與之前發射的天和核心艙完成精準對接,中國空間站歷史性地完成了“合體”。至此,中國空間站距離建成僅剩一步之遙。
從天舟四號到天舟五號,從問天艙到夢天艙,從神舟十四號到神舟十五號,取得一系列航天成果的2022,同時也是中國載人航天工程立項實施30周年。三十年奮進勃發,讓中國人史無前例地接近星辰,接近宇宙中的無限可能。
而在科技賽場的另一條關鍵跑道上,2022同樣至關重要。近日,新華社與百度文心一格聯合推出了一支AIGC視頻——《AI描繪天宮盛宴》。這支視頻畫面全部由AI自動生成,用充滿中國韻味的筆觸,回顧了中國載人航天的三十年輝煌歷程。眾多網友感嘆,AI生成內容竟然在極短時間內就達成了這種效果,實在難以想象。
2022年,被業界稱為AIGC元年。伴隨著AI作畫大規模商業化落地,這一能力開始為全球用戶所接受。AIGC的飽含巨大商業價值的下一站,就是AI生成內容。而在AIGC的“宇宙探索”中,中國人同樣不落人后。以百度文心大模型為代表的中國力量,正在帶領全球AI產業接近AIGC的無限可能。
2022年,文心大模型在AI生成內容這條賽道上不停探索,給出了一系列讓人眼前一亮的成績。在其背后,既可以看到大模型在AI作畫領域的技術趨于完備,又可以看到中文、中國文化背景下的AIGC全面發展。面向AIGC的群星,文心大模型已經成為中國AI產業的一座“空間站”。探索AIGC更多可能,文心大模型的成績單
在全球經濟普遍遇冷的2022,AI技術卻是一片繁榮。從AI作畫到AI對話,各種AI技術創新在全球范圍內火爆出圈。而所有AI能力中最讓人看好其商業前景的,則是AIGC的下一站——AI生成內容。
我們處在一個被短視頻顛覆和重構的時代。短視頻平臺已經在全球范圍內形成了用戶最多、影響力大的媒介形式。AI與視頻的結合,正變成新的巨型風口。在2022年,百度文心大模型先后帶來了一系列視頻生成作品,其完善的效果與創意性地表達,贏得了業界與公眾的一致認可。
在百度2022萬象大會期間,數字人度曉曉作詞作曲演唱的MV《啟航星》正式上線。這也成為成為首支全AIGC生成的音樂MV。《啟航星》MV視頻依托百度推出的AI藝術和創意輔助平臺——文心一格,根據歌詞自動生成畫面。其不僅探索了數字人、AI生成內容等技術的邊界,更為MV制作、AI與音樂產業結合展現出了清晰的路徑。
10月20日,《人民日報》發布AI根據二十大報告中部分詞語描繪的未來中國圖景視頻,該視頻由百度飛槳、文心一格提供技術支持。根據內容描述,文心大模型準確描繪出了未來中國的發展圖卷。筆觸老練自然,完全沒有傳統意義上認為AIGC內容會有的生澀感與不和諧。
等到《AI描繪天宮盛宴》到來,我們可以看到文心大模型生成的視頻內容更加具有整體性風格,畫面調動也更有邏輯性,并且內容能夠與中國傳統文化,比如《西游記》中蟠桃盛宴,進行有機且巧妙的結合。
在這一哥哥AI生成內容背后,我們可以看到文心大模型走出了兩條路:技術之路,與文化之路。
AI生成內容的技術難點,正被一個個打破
“最先進的 AI 動畫生成技術在中國。”
這句話,是今年8月文心ERNIE-ViLG 2.0模型通過百度API服務的方式進行開放公測后,一位外國開發者留在評論區的。幾個月之后,這樣的肯定依舊令我們振奮。數年前,絕大部分人可能會覺得中國難以在AI生成內容中實現領先,但現在這一切已經做到了。
究其根本,在于文心大模型持續面向AIGC的技術挑戰發起一波波沖鋒。今年在文心大模型支持的多部破圈視頻里,我們可以看到其中的技術力表現持續升級。簡單感、不流暢、缺乏創意風格等AI生成內容的傳統問題,正在一個個被文心打破。
在這背后,是文心大模型ERNIE-ViLG 2.0跨模態圖文生成能力的幫助和支持。基于ERNIE-ViLG 2.0,可以實現從文本內容到視頻內容中,轉化的可控性與細節描述能力不斷提升。而這源于秉承著百度在文心大模型當中探索的知識增強方向,為ERNIE-ViLG 2.0找到了核心的升級方向。ERNIE-ViLG 2.0采用基于知識增強算法的混合降噪專家建模,是全球首個將知識增強與AIGC相互結合的大模型。其最終表現,在權威評測集 MS-COCO 和人工盲評上均超越了 Stable Diffusion、DALL-E 2等主流模型,在AI生成內容等方面,取得全球業界的最佳效果,在語義可控性、圖像清晰度等方面均展現出了顯著優勢。
從《AI描繪天宮盛宴》中,我們可以看到畫面可控性、復雜構圖和細節刻畫能力都達到了新的水平高度。AI生成內容不再是生成一幀幀圖片合成視頻,而是基于統一風格,完整、連續地展現出了視頻全貌。這就是知識增強路徑為AIGC帶來的不同之處。
當時間來到2023,中國AI行業、AI開發者,以及廣大視頻創作者,將得到全球領先的AI生成內容能力作為發展引擎——這就是文心大模型,這座“空間站”的戰略意義。
更懂中國,更懂未來
另一方面,我們可以在《AI描繪天宮盛宴》看到一種我們非常熟悉的審美風格,其神韻非常類似1961年上海美術電影制片廠制作的《大鬧天宮》。那既是中國動畫史的開端,也是深刻國民DNA的文化記憶。
用這種審美意蘊展現中國航天三十年的故事,是非常容易獲得國人共鳴,產生審美與文化認同的。這一點其實非常重要,AIGC的最終價值在于文化傳播。試想一下,如果AI生成的內容不懂一個國家的語言、文化、典故以及審美意味,那么最終做出來的內容是否可能實現高效率、有認同的傳播?
從這個角度看,中國的AI大模型發展與AIGC能力建設就顯得更加富有不可替代性。我們不能等到AI生成內容大規模落地時,一味照搬符合他國文化與英語語言習慣的內容給中國觀眾看。而文心對中文數據、中文知識的學習,以及對中國文化、中國審美的理解,則適當地填補了這個空白。從文心一格對中文的理解能力,以及最終生成內容中展現的中國意境,就可以看到目前適合中國環境的AIGC。我們不需要在基礎能力和技術上進行漫長的模仿與追趕,而是可以站在更高點,直視AIGC最前沿、最令人激動的可能性。
2022年,是中國人追逐群星之年,也是中國人追逐AIGC之夢的一年。伴隨著更多AI生成內容火爆出全,更多AIGC的行業化方案落地,更多平臺化能力開放,文心一格正在打開科技與文化融合創新的想象空間,文心大模型正在成為AIGC發展的新引擎。
在文心這座“空間站”,我們已能看到智能世界的浩瀚星空。
審核編輯黃昊宇
-
AI
+關注
關注
87文章
30763瀏覽量
268907 -
AIGC
+關注
關注
1文章
361瀏覽量
1540
發布評論請先 登錄
相關推薦
評論