——他希望AR終端能成為人的再一次延伸,實現真正的空間共享和實時互動,讓人們超時空 “共在”。
采訪對象|唐榮興
文、編輯|李美涵
從03年左右開發PocketPC上軟件電話SIPPhone算起,到現在AR眼鏡上的AR協作軟件,剛好二十年。
20年前,通訊曾是一種稀缺的資源。彼時,手機上網剛剛成為現實,資費也并不親民,更早前的摩托羅拉手機曾是“萬元戶”們的身份象征。許多年輕人沒聽說過的概念“NGN”(Next Generation Network,下一代網絡)一度成為當時的熱詞——人們想象能有一個統一的網絡平臺,來整合當時已有的市內固定電話和移動電話,同時增加多媒體數據服務。
20年后,從FaceTime到視頻會議,音視頻通訊協作成為一種理所當然,與人們的日常生活融為一體。今天,手機作為傳統電話的功能早已“屈居一隅”,人們花費更多的時間在短視頻、帶貨直播等內容娛樂之中。在唐榮興的理解中,這些也是通訊協作的一種形式,畢竟在商業MCN還未成形的時候,促使初代網紅走向網絡的其實就是溝通與分享的需求。
回望這20年,他將自己在音視頻通訊協作領域的所見所聞總結為“變”與“不變”。變的是協作形式、技術和終端產品,不變的就是人性對溝通的需要與追求。
和眾多的技術創業者一樣,唐榮興對自己的技術身份感到自豪。即使COO的工作需要他接手管理和運營的事務,在他身上也始終有著技術者的烙印——理性、追求極致、沒有架子。在采訪中,唐榮興又展現出感性的一面——多年的工作和創業經歷,使得他對通訊協作領域沉淀了深厚的情感,對行業和技術的遷變如數家珍。
他為團隊的AR遠程協作平臺取名HiLeia,靈感源于星球大戰中的萊婭公主。就像電影中所描繪的那樣,萊婭公主通過R2-D2發出自己的全息影像,向盧克天行者和歐比旺求救。他希望AR終端能成為人的再一次延伸,實現真正的空間共享和實時互動,讓人們超時空 “共在”。
溝通是人們內心深處的渴望
LiveVideoStack:唐老師好,回顧您過往的工作經歷,您任職過清華同方、英華達、盛大創新院等多家公司,也有著豐富的創業經驗,您是如何對音視頻通訊協作產生興趣并逐漸專注到這一領域中的?
唐榮興:我的工作經歷有些豐富和有趣、幸運,開始做音視頻通訊協作相關的內容是從03年左右起。通訊協作領域的老兵可能會知道,那時的SIP協議(Session initialization Protocol,會話初始協議)、VOIP(Voiceover Internet Protocol,基于IP的語音傳輸)、NGN(Next Generation Network,下一代網絡)等技術概念,那時候的各種協議都還比較復雜。當時做了一個PocketPC上的軟件電話,目的也是為了融合固定、移動IP網絡和公共電話網絡,實現的功能是在掌上電腦上與其他的電腦或是手機進行通訊。從某個方面看,這個產品在當時還是蠻超前的。
到了08年,開始鉆研FeaturePhone(也就是常說的功能機),為了能夠在上面用文字、語音還有視頻形式提供更高質量的通話。在后來的12年左右,進行了第二次創業,也就是現在的亮風臺公司。
經歷在變化,但圍繞通訊的工作一直在延續。在與各行各業的接觸中,我發現通訊還是很重要的,許多傳統的制造業在數字化轉型期需要智能化、便捷化的通訊方式,能自然高效獲取遠程“專家”的協助,打破距離對于數據價值挖掘的限制。變化的是新技術新手段,但需求是不變的。我們開始思考AR如何滿足這些需求,在17年左右的時候,我們實現了AR眼鏡與手機和電腦終端的協作。
能夠見證通訊行業從較早期的狀態成長到今天,我感覺很幸運。
LiveVideoStack:剛才聊到了通訊行業的變遷,其實這20年也是移動互聯網逐漸普及的時間,您所感受到的大趨勢的變化是怎樣的?
唐榮興:首先是網絡技術的發展,從08年3G網絡開始普及,到之后4G網絡高速發展。沒有底層技術的發展,就不會支撐起現在的短視頻、直播這些應用。然后是音視頻技術上的變化,記得剛開始創業的時,我和小伙伴還是研究的H.263、H.264。到今年編解碼標準已經迭代到H.266甚至在展望H.267。
在這個大的趨勢之下,多媒體通訊從模擬語音到數字語音,從短信到了微信的時代,越來越豐富。實時溝通也從最早的RTC(實時音視頻)到RTE(實時互動),再到馬化騰所提出的全真互聯網,強調對真實世界全面感知、連接和交互。
其實回過頭看,你會發現我們的努力只是微小浪花,大家共同努力的融匯形成了技術發展的大趨勢和大潮流,這個是很有意義的。
LiveVideoStack:您經歷了音視頻通訊協作從無到有的一個過程,有沒有那么一個時刻,讓您覺得從事通訊協作是件非常有意義的事情,可不可以和我們分享一下。
唐榮興:今天有個詞叫“科技普惠”,產品最終還是要面向消費者的,能夠切實的幫助用戶是件很開心的事情。我們最初在FeaturePhone上做音視頻通話的時候,還覺得有些驚訝:用戶怎么這么多。居然還有非洲用戶!現在更多的人知道有家成功的手機公司叫傳音(編者注:主要從事手機業務,銷售網絡涵蓋非洲、中東等新興市場),他們將手機銷售到國外。但在當時,觸達到非洲用戶是件很新奇的事情,尤其是發現很多發展相對落后的地區用戶量還是非常大的。
從我的感覺上看,這些地區的人對溝通和協調有很高的需求。這些用戶可能是出國工作的中國人,他們要和家鄉的親人和朋友聯系。他們可能為省錢或方便就用一個簡單的功能機,也不想支付昂貴的國際通話資費。然而,通過節省流量和資費的音視頻通訊軟件他們可以用更低的價格實現同遠方親人溝通的愿望,哪怕遠在非洲。
雖然我們做的音視頻通訊沒有成為QQ或者微信那個量級的產品,但是曾經使用過它的人,實現了便利的交流,緩解了自己獨在異鄉的孤獨,這件事情讓我更深層次地體會到通訊的價值。所以我為什么在做AR產品時,還是如此重視通訊功能,和那時看到的用戶需求密不可分。
LiveVideoStack:用戶其實是職業成就感的重要來源?
唐榮興:嗯,是的。尤其產品前期會進行許多的投入,研發的小伙伴們可能會熬夜通宵。之后能看到產品被消費者廣泛接受,尤其是頻繁地進行使用,是挺有成就感的。
十多年前,我們做的音視頻通訊曾經有豐富廣泛的用戶群,希望我們產品在未來能讓我再次享受與超越那種喜悅的心情。
劃時代的商業產品 引領技術發展
LiveVideoStack:您提到過一個觀點,說新技術的實現都是“從技術到商業,再從商業反推技術的發展”,這個感悟看起來與您看到的行業變遷有關,您可以具體的談一談這個觀點嗎,是哪項技術或者哪些技術讓您有了這一體會?
唐榮興:就像曾經的Palm、黑莓、摩托羅拉還有諾基亞等等,它們曾經輝煌過,又逐漸地淡出市場。后來有了iPhone、有了三星、華為等手機。我們可以說這是商業時代的變化,但也可以說是技術的發展,新的技術取代舊的。
技術的普及有一個曲線。新的技術剛出來時可能只有少部分人能享受科技帶來的紅利,隨著時間的推移,后來絕大多數人都能享受到,但這種狀態不會維持很久,又會迎來下一波技術迭代曲線。例如,隨著智能手機的成熟,手機制造研發的成本大幅下降,我們會說,那是不是能把它做得更輕更薄?而新材料或者新工藝又會再次提高之前的成本。
我們的AR眼鏡也是如此,必須要做到光學顯示器件、電池存儲、通訊模塊及其他元器件的微型化。如果想成為一個商業產品,AR眼鏡必須變成一個更輕薄的形態讓用戶去佩戴。
總而言之,技術與商業是相互促進生長、進化的雙螺旋。
LiveVideoStack:商業推動技術的部分呢?
唐榮興:主要是為了在商業上獲取成功而進行的技術迭代。為了能獲得更多用戶的使用,必須匹配更多的場景和更好的用戶體驗。用戶群的擴大對于科技企業來說,就是薄利多銷的實現。企業在產品上賺的錢,會給技術研發團隊爭取到更多的資金投入,可能會組建更優秀的技術團隊。
商業通過推動技術降低自己的成本,從而獲利更多,這是發展的一個正向的循環,這個趨勢其實隨處可見。比如4G時代更豐富的應用、更廣泛的用戶群體、更大的商業價值,計算效能增加、海量數據出現,機器學習、深度學習等技術得到蓬勃發展,由于計算效率的提升、計算成本的降低,更多企業投入計算單元去訓練、去學習,不斷優化這些人工智能技術并慢慢應用到更多的業務場景中。
總體上說,用戶需求一直在追求“多快好省”的路上。
LiveVideoStack:一個標桿性的商業商品,比如說iPhone,它其實是對整個領域的技術都有一個非常大的推動作用。
唐榮興:iPhone獲得的極大成功,它是拉動了整個電子產業鏈條的,我們現在喜歡稱這種企業叫“鏈主”企業。而且它的能量也不止在電子產業,包括內容的生產,比如激發了很多新的APP上線,包括很多的游戲也在這個范圍內,從多年前《憤怒的小鳥》到今天的《原神》。
本質上還是科技帶動產品帶動商業化,甚至去推動經濟的發展。我發現,其實今天的科技和商業又在一個分水嶺這樣的時刻,我們也見證了元宇宙和ChatGPT的爆火。但人們依然在期待能引領這個時代的偉大產品出現,包括AIGC來說,對內容生產確實帶來一些質變,但可能還要有兩三年才能帶來一個巨變。
希望能涌現更多劃時代的產品,新的“iPhone”、“Office”、“微信”等等,甚至更超級的應用出現。
通訊協作的下個十年
LiveVideoStack:從03年開發軟件電話算起,您在通訊協作領域已經深耕20年了,作為這個領域的資深從業者您認為通訊協作的下個階段會走向何處?
唐榮興:我特別認同行業內的一些聲音。我能看到國內外的技術者都在致力于描繪未來通訊的一個藍圖。就我的想法,我會認為下一個階段會是空間互聯、實時互動,如果再補充的話就是虛實融合與共生(簡稱虛實融生)。
未來的互動首先應當是立體的交互。在3D的場景下,會有空間的賦能。未來的會議形式應該是,我們在線上選擇一個共同的虛擬會議室,我們可以進行真實的、面對面的交流。如果我們不方便露臉,也可以選擇一個自己形象的數字人,來代表我們講話。
互動是實時的,與情景與空間關聯實時變化,這個趨勢其實已經形成了,比如B站的彈幕,就是文字和視頻內容的一個融合,彈幕其實是數字的信息。至于虛實共生,就是指物理世界和數字世界的結合, 未來我們進行會議的時候,我們講的內容,會有實時的字幕出現在人物旁邊。我只要用語音講,AI就會不斷地把我的語音轉化為文字,也可能會有AIGC把我的想法畫成一幅畫實時地展示在空間內。
LiveVideoStack:在這個空間共享和實時互動的大趨勢下,音視頻技術能需要扮演什么角色?
唐榮興:三維的數據以及4K、8K的高清要求會使得音視頻內容數據量繼續劇增。數據的壓縮和傳輸方面的優化,仍然是音視頻繼續進化的方向。
首先是AI輔助下使用更好的智能壓縮技術,編解碼器的技術也會繼續迭代到H.266甚至更多。音視頻壓縮領域的專家,要突破以前的算法尋找更好的優化方式。
另外就是機器學習、深度學習等人工智能技術的應用,尤其是對場景的深度理解。以數字人、數字化身通訊為例,不需要傳輸全部的語音、表情、姿態等數據,只需檢測眼睛、嘴唇等位姿變化,傳輸少量數據,本地計算自動完成內容、數據的完整生成,所以未來的算法甚至需要包含對具體場景的智能理解、壓縮,增加對物理空間的計算與傳輸。
最終來看,音視頻會被更多人工智能算法以及融合技術賦能。
LiveVideoStack:但也還是在做編解碼和網絡傳輸方面的改進?
唐榮興:是的。我還記得2000年左右的時候,我們在工程中做優化“錙銖必究”,BYTE 到 BIT,乘除轉位移……,不斷去優化代碼。可以看到,工程化要解決的問題是有很強的連貫性的,以網絡傳輸為例,直到今天我們還需要解決弱網環境、網絡堵塞、抖動丟包等這些老生常談的問題。
但讓我比較興奮的是,每一次的技術突破,都不是孤立的,例如4G網絡、對AI結合的需要等等,這些都會推動技術者繼續在現有算法的基礎上繼續優化。不管是工程化的優化,還是在算法方面尋求一些突破,我覺得都是工藝上、技術上的改進,而技術的精進是無止境的。
LiveVideoStack:具體到我們目前的產品上,在實踐又是怎樣回應您剛才提到的種種挑戰的?
唐榮興:我們目前的產品,AR遠程協作平臺HiLeia。Leia是星球大戰電影中的角色,這部電影的全息影像很好地描繪了通訊協作的未來,我們希望類似產品能成為下一代終端的重要應用,像現在的手機上的超級應用一樣融入人們的日常生活之中。
但目前我們更多的應用場景是在工廠、學校與展館中,很多工廠的網絡都不夠好,那我們怎么去做自適應就是一個問題。例如我們怎樣在網內分配資源,如何優化阻塞、擁塞的算法……這些還屬于有成熟的范例,我們會根據不同環境的要求去做優化。也有一些意想不到的小情況,比如說要開始支持4K,渲染出現了問題,因為4K計算、傳輸是新需求,那我們就要去解決bug與優化體驗;還會遇到一些新的產品場景,是之前不支持的,那如何進行擴展和兼容也是需要考慮的。
目前AR協作已經支持多人互動,有關動點標注、實時標注的傳輸方式也和以往有很多區別。我比較欣賞的一個解決方案是構建一個新的AR通道。
LiveVideoStack:AR通道是一個專屬的傳輸協議嗎?會在多久的未來中變成現實?
唐榮興:是的。通常在通訊中會有信令通道、媒體通道,現在我們嘗試建立新的AR通道,通過傳輸協議去同步,在傳輸中實現順暢的壓縮和解壓縮。
其實大家很多的想法都在慢慢的達成一致。現在,相關AR通訊的新標準已經出現了,比如HSTP。大家都知道HTTP超文本傳輸協議,而改動的“S”代表著space(空間)。這個協議已經通過了IEEE的標準,成為了一個開源的協議。在未來的三五年中,應該能見證國內外很多AR、VR產品跟進和支持這個標準。
一切為了用戶
LiveVideoStack:剛才談到了行業的變遷、技術的更迭,有變化就有不變,您覺得“不變”的是什么?
唐榮興:剛才說過商業和技術間相互推動產生的變化,最終新的產品線誕生,推動新的“iPhone”出現。我覺得蘋果的產品有個非常突出的優點,它永遠以用戶為中心帶給他們更好的體驗。
回到通訊協作領域來談論這點,我們覺得通訊對于人們始終有很高的價值,人們在追求自然的交流方式。比如說,我們今天在采訪中談得很愉快,我們也許想把交談的場景變成真實的。“真實”不是我們今天看到的“平面”的視頻會議,而是真正的讓人感受到我們在面對面的和朋友聊天。這種還原成真實聊天場景的功能,就提供了一個更好的通訊體驗。
LiveVideoStack:用戶的溝通需求是不變的,但AR眼鏡作為比較前沿的通訊協作產品,在推廣普及的過程中,用戶教育會是一個難題嗎?
唐榮興:(笑)用戶教育我們已經進行了十余年了。
剛才我們講到整個通訊行業的變化,從模擬到數字,從文本到語音到視頻經過了一個相對漫長的過程。而AR協作其實還處于比較新的階段,我也曾經在12年到14年的時候,滿臉真誠地像個布道者一樣去向別人介紹我們的產品和技術。
隨著AR漸漸進入人們的視野,用戶教育的難度在降低。像今年,特別感謝蘋果發布了MR頭顯,讓更多人意識到未來的下一代終端,未來AI會更好地融合到通訊協作的技術和產品中。蘋果在推出MR頭顯之前至少投入了七年以上、十年左右的開發,把它從一個技術變成了一個商品。
所以產品的教育不是一個公司、幾個團隊的努力,而是整個產業鏈的協同發力,一起去教育這個市場。無論是蘋果、微軟、Meta,還是我們這樣的中小企業,都對行業的發展有益處,去推動整個生態的變革。這也不只為了用戶教育,最本質的還是不斷地去優化自己的技術產品,讓人們更好、更容易地去用它。
LiveVideoStack:AR通訊協作服務用戶的目標是什么?
唐榮興:我們現在更多地在做To B業務,AR通訊協作是一個更好的生產力工具。因為它做到了所見即所得,戴上AR眼鏡,遠方的專家就如同在這個設備前。AR眼鏡讓人在工廠中進行遠程合作,將實景和虛擬的實時標注、數字內容結合起來,這就是我們剛才強調的在共享空間當中的互動。
有了空間的共享,就相當于請了一個專家來到了傳統的工程中。我們的目的是讓小白變專家,一個頂多人,讓人的價值,以及對數據和知識的使用最大化。過渡到大眾場景下,我們希望實現通訊場景的空間互聯、空間共享、實時互動以及虛實融合,遠程通訊“真實”,更智能便捷。在AR這個領域,我并不知道我們未來究竟能做到多遠,但是一定會有更多的小伙伴去用它。未來,我希望我們能找到更多新的產品場景,讓更多人選擇這種全新的通訊協作方式,并提高他們在工作中的生產效率、帶來生活體驗的再變革。
共在,媒介的下一次延伸
LiveVideoStack:“產業元宇宙”是個很新穎的概念,在構建行業+AR產品方案時,您有沒有遇到讓您印象深刻的應用場景?
唐榮興:剛才我們所說的遠程協作,主要集中在傳統的制造業,實現專家的遠程指導。在疫情期間,這種大型機械的遠程協作需求更明顯了:出差成本變得很高,海外專家到現場的指導變得非常繁瑣,遠程的指導就沉淀成了一個基礎的需求,這是近幾年我看到的日常變化。
我印象很深的案例,也是在疫情期間看到的:一個線上的虛擬演奏會。在這場演奏會中,藝術家來自全球各地,他們的鋼琴、小提琴等樂器演奏也是分散各處,通過通訊技術的合成,最后呈現的所有的聲音和畫面的演奏效果都是無縫同步、完整合一,呈現的表演效果真的讓我覺得無比震撼。
無論是哪個行業、哪個場景,其實統一的價值都是“共在",這個詞指的大家存在于一個空間中并同時在線,這是我認為在未來最有價值的事情。
“在線”曾經是件很重要的事情,之前我們使用QQ的時候,好友上線會有“嘀嘀”的提示聲,后來就不會再提示別人的在線狀態,而是默認在線。但是我想,未來的在線互聯會獲得新的定義,會有更豐富的時空內涵,人們可以在同一個時刻在同一個空間中,讓在線互聯的體驗如此的真實立體與零距離,這就是“共在”。這是AR協作真正能賦能于人的東西,打破時空的界限,把人的能力增強。
LiveVideoStack:在落地的時候,會有哪些技術困難。有一些行業其實對于這種共在的要求其實是非常高的,比如遠程醫療等?
唐榮興:同時在線有兩方面的要求,首先是要保證盡量低的延遲,其次是足夠的畫面清晰度。如果畫質不夠好,是沒辦法讓用戶感覺到專家就在自己身邊的,所謂的“沉浸式”,其實是在制造一種“視覺欺騙”,對畫面逼真度的要求是很高的。
為什么在5G時代,才會有人關注到遠程教育、甚至遠程醫療?只有在網絡的條件成熟的時候,才可能將延時控制在毫秒級,必須要無限的壓縮延遲,才會保證遠程醫療手術的安全。所以這些并不是我們現在主要考慮的場景,我們會在工廠、學校、公共應急、文旅體驗等方面,努力提供更加優質的服務。
當時機成熟的時候,我覺得HiLeia會發揮出更大的價值。
LiveVideoStack:咱們今天聊了很多,虛擬現實和增強現實的共有趨勢,比如說空間共享、實時互動等等。回到區別上來看,您覺得AR與VR比較,它的獨特優勢在哪里?
唐榮興:以前我們常說,VR是“白日夢”,AR是“活見鬼”。過去的二十年,互聯網已經創造了一個非常大的數字世界,現在我們考慮的是如何將數字世界與真實世界鏈接起來,這是AR能做到的事情。
現在我們看到,AIGC強大的內容生產能力,能快速創造我們需要的信息內容。如果這些內容可以更好地出現在現實中,我們就能更方便地獲取指導,讓虛擬的部分成為生產工具,使得數字世界和物理世界和諧的共在共生。以上是我覺得AR和VR的最大區別。
但是我想說,VR和AR沒有高下,只是用戶在不同場景的需求有區別。可能一些場景里我們會用VR,去獲得更好的沉浸式體驗;另一些需要和物理世界交互的場景,我們要用到AR,更好地提高生產力。十年以后大家可能不會糾結于兩者的區別,就像有的人會在Switch上玩任天堂的游戲,另一些人喜歡在電視上玩,其實形式沒有那么重要。
AR和VR的未來應該會更多元化,終端也應該是百花齊放的。
LiveVideoStack:今天很開心跟唐老師進行采訪交流,最后請唐老師來劇透一下,您在我們深圳站大會上的獨家內容吧。
唐榮興:我會花時間整理,更好地去分享我在音視頻通訊協作和AR通訊協作的思考與實踐。
我對通訊行業有情感和熱愛,相信隨著技術的發展,通訊與協作會帶給世界更多的價值,更多的溫暖與美好:不只能提升生產力,也能提升人們的幸福指數。我非常喜歡Alan Kay的一句話,“預測未來的最好方法就是創造未來”,這就是我們研發產品的意義所在。
前段時間也看了互聯網預言大師KK(凱文.凱利)的《5000天后的世界》,可以大致看出十年內XR終端會流行,新的計算平臺與超級應用會再次出現。
希望能通過這次分享來“拋磚”,和現場的朋友們一起交流探討,通訊協作產品未來的走向。
2023年11月24日-25日,亮風臺唐榮興將在LiveVideoStack舉辦的深圳站大會現場與大家分享《AR通訊協作的思考與實踐》,敬請期待!
-
Ar
+關注
關注
24文章
5095瀏覽量
169469 -
軟件
+關注
關注
69文章
4921瀏覽量
87401 -
AR眼鏡
+關注
關注
4文章
528瀏覽量
23143 -
亮風臺
+關注
關注
0文章
26瀏覽量
1947
發布評論請先 登錄
相關推薦
評論