6月,在北京大學理科2號樓一間辦公室內見到了北京大學信息科學技術學院教授馬思偉,并相約這次郵件采訪。作為國產編解碼器AVS視頻組的組長,馬思偉暢談了編碼器的格局,AVS的機會以及學習編解碼的經驗及方法。
LiveVideoStack:馬思偉您好,請簡要介紹下自己,以及目前主要的工作方向,對哪些技術或領域感興趣?
馬思偉:大家好,我是馬思偉,主要從事視頻編碼方面的研究,按照視頻編碼標準的定義區分,主要從事兩大類編碼技術的研究:一類是視頻編碼標準范疇內的技術,需要在標準規范中給以嚴格定義描述的技術,如預測、變換等一些核心技術模塊。另一類是標準之外,面向編碼器優化實現的前后處理相關技術,如去噪聲、質量增強等視頻處理技術。
LiveVideoStack:許多開發者都有體會,做音視頻的“坑”比較多,入門不易做好更難。對于有意愿進入這一領域的初學者,您有哪些經驗可以分享的?
馬思偉:入門不易,貴在堅持。由淺入深,循序漸進。比如最開始從簡單了解視頻應用層面的一些技術點入手,可以讀科普性質的文章、博文等先了解個大概,然后根據應用需求學習密切相關的一個或幾個模塊,可以讀些專題文章,再后才是逐步更全面的學習,或者某一模塊的深入鉆研,具體學到什么程度可以按需分配精力來學,不要眉毛胡子一把抓,不分主次,不要囫圇吞棗,貪多爵不爛,于事無宜。
LiveVideoStack:什么樣的編解碼器是一個好的編解碼器?視頻質量、碼率、算法復雜度、對數據丟失或錯誤的魯棒性等。當下對于編解碼器的研發,業界主要的研究方向是什么?其難點是什么?
馬思偉:好無止境,沒有最好,只有更好,但翻過來只要能在一定時期滿足一定應用需求的不妨都稱為好的編解碼器。諸如質量、碼率、復雜度、容錯等等這些因素,好的編解碼器是要尋求在這些約束之下能夠滿足應用需求的最佳折中,是動態變化不斷提升的,同時這也是編解碼器研發的難點。
LiveVideoStack:大家已經開始研究H.266、AV1以及國產的AVS2/AVS3,他們有哪些特點?各自的優勢應用場景是什么?
馬思偉:標準一般是在設計上盡量覆蓋需求比較相近的多個應用場景,但實際上不同應用場景之間總還是存在一些特定的差異,對技術的選擇也有很大的影響,這時標準一般通過設置不同的檔次來為某一類應用場景提供特定的工具支持。像目前這些視頻編碼標準,都還是比較通用的,廣播、通訊等各行業都可以在其基礎上開發出好的編解碼器進行應用,當然實際應用情況也是多種因素影響,比如還有專利授權政策問題對應用有著很大的影響,不是由單單技術這一項因素所決定的。
LiveVideoStack:因為有Google、Netflix等巨頭的支持,AV1備受關注。國內一些大視頻平臺也在和AOM談判考慮加入。目前看,H.264的應用還處于統治地位,HEVC因為專利風險,正在面臨來自AV1的挑戰,再加上國產的AVS系列。您如何看待未來Codec戰爭以及市場格局的走勢?
馬思偉:很多實際案例已經告知我們多元化是好事兒,有利于技術競爭,產業發展,希望未來格局是多些國內的創新領導者。
LiveVideoStack:能否介紹下AVS系列的技術演進狀態,編碼效率、算法復雜度、延遲,生態的成熟度,包括硬件方案的成熟度,尤其是移動設備的硬件方案,商業編解碼器/解碼器方案等。
馬思偉:AVS從2002年至今制定了一系列的視頻編碼標準,即我們常說的AVS1、AVS+、AVS2,每一個標準制定實際上都是一個大工程,對于每項技術都要進行詳細全面的評估,目前AVS+、AVS2在廣電行業的成功應用已經充分證明AVS標準技術是成熟的,更多的商業方案及應用有待于市場的進一步培育而協同發展。
LiveVideoStack:比如騰訊推出的TPG圖片格式采用了AVS2作為引擎,AVS在工業界的已經有哪些應用落地?未來AVS的主要應用場景是什么?
馬思偉:騰訊推出TPG是AVS歷史上具有里程碑意義的事件之一,是騰訊音視頻實驗室團隊勇于創新的體現。目前AVS2 4K超高清廣播、IPTV點播等應用也已落地或正在落地,和TPG一樣,未來有多少勇于創新者,AVS就會有多少應用場景。
LiveVideoStack:對于應屆生或從其他研發領域轉行學習編解碼、多媒體開發的技術人,有哪些建議?
馬思偉:視頻領域是個海洋,可以游泳、沖浪,也可以潛水、遠航,根據自身的基礎、特長和興趣選擇合適的領域涉足,編碼優化、去噪聲、視覺特效等很多問題都是跨領域的,涉及計算機、電子、通信,甚至藝術、生理、心理學等,無論本專業還是外專業都需要再學習,相信來者有益。
LiveVideoStack:能否推薦一些系統學習編解碼、多媒體開發的圖書、資料?
馬思偉:快速了解某一標準可以看標準文本、關于標準的專著,如畢厚杰老師的《新一代視頻編碼標準——H.264/AVC》,萬帥、楊付正老師的《新一代高效視頻編碼H.265HEVC原理、標準與實現》,Mathias Wien的《High Efficiency Video Coding: Coding Tools and Specification》,Vivienne Sze等主編的《High Efficiency Video Coding(HEVC) Algorithms and Architectures》 ;深入學習編碼理論和技術,可以學習經典的教材,如Yunqing Shi和 Huifang Sun老師的《Image and Video Compression for Multimedia Engineering, Fundamentals, Algorithms and Standards》,Yao Wang, J?rn Ostermann和Ya-Qin Zhang的《Video Processing and Communications》,我也合作出版過一本《數字視頻編碼技術原理》供學習參考;再進一步若關注于某一項技術的研究,則需要對相關論文進行梳理,深入閱讀。
LiveVideoStack:5G商用,4K逐漸流行。 您如何看他們給多媒體生態帶來的機會?對于Codec有哪些機會和挑戰?
馬思偉:由于傳輸能力的升級,4K會逐漸流行,可以進一步提升感受質量,但實際上4K之后依然存在更高的帶寬需求,比如還有8K,而且8K對于VR都還是低的,還有更高到12K甚至20K,所以對Codec來講依然存在更高效壓縮的需求,好的codec一定是大有市場的,當然如何繼續提升編碼效率本身已經成為一個挑戰了。
-
編碼器
+關注
關注
45文章
3650瀏覽量
134756 -
5G商用
+關注
關注
0文章
109瀏覽量
14043
原文標題:馬思偉:視頻領域是個海洋,可以游泳、沖浪、潛水和遠航
文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論