RTC本質(zhì)上是一個(gè)時(shí)延、流暢、質(zhì)量、成本等幾個(gè)點(diǎn)的平衡,我們不能在某些單點(diǎn)上用力過猛,導(dǎo)致最終的效果大打折扣。拍樂云CEO 趙加雨在LiveVideoStackCon 2020北京站的演講中拋出關(guān)于RTC的六個(gè)問題,同時(shí)站在辯論的正反方與大家拆解如何能夠讓RTC產(chǎn)品給用戶帶來更好的體驗(yàn)。
大家好,我是來自拍樂云的趙加雨。首先做個(gè)簡單的自我介紹,我2003年加入WebEx,在WebEx工作了14年,前面幾年是在國內(nèi)工作,后面幾年在美國。在美國工作幾年之后,發(fā)覺中國的環(huán)境也不錯(cuò),于是在2017年回國加入了網(wǎng)易,任網(wǎng)易云信CTO,直到去年創(chuàng)立了拍樂云。大家可以看到,雖然我現(xiàn)在的頭銜是CEO,但我過去的經(jīng)歷一直都是在做技術(shù),現(xiàn)在在公司里和小伙伴們也會(huì)經(jīng)常討論技術(shù),對(duì)技術(shù)也一直保留著很多熱情。
本次分享是和我一直以來的工作經(jīng)歷和背景有關(guān)的視頻會(huì)議,即RTC(Real time communication)相關(guān)的一個(gè)主題。今天這個(gè)題目還是挺特殊的,不知道大家有沒有人喜歡看奇葩說,其實(shí)奇葩說里很多時(shí)候都是觀點(diǎn)的碰撞,沒有絕對(duì)的對(duì)或是錯(cuò),但是通過辯論這樣的方法,大家會(huì)得出自己的一個(gè)結(jié)論和輸出,我覺得還是非常有意思的,今天演講的題目也是借鑒了奇葩說。
RTC中涉及的點(diǎn)很多,如果很仔細(xì)地分享要花很多時(shí)間。那我今天想拋出6個(gè)問題來為大家拆解,我既當(dāng)正方的辯手,也擔(dān)當(dāng)反方的辯手。通過拆解這6個(gè)問題,和大家做一個(gè)簡單的分享。
最近幾年,因?yàn)榍Рゴ髴?zhàn),包括線上業(yè)務(wù)的火熱,很多公司開始進(jìn)入RTC領(lǐng)域,這些公司對(duì)RTC技術(shù)有著各種各樣的認(rèn)知。采用的技術(shù)方案也有一些不同,在這里我列出了6個(gè)問題來和大家一起探討。
第一個(gè)問題是關(guān)于網(wǎng)絡(luò)節(jié)點(diǎn)問題。正方是200個(gè)節(jié)點(diǎn),反方是10幾個(gè)節(jié)點(diǎn)。大家認(rèn)為哪種方法能夠提供更好的服務(wù)呢?這是非常符合常識(shí)的一個(gè)認(rèn)知,大家會(huì)覺得200個(gè)節(jié)點(diǎn)應(yīng)該能夠提供更好的服務(wù)。
實(shí)際來看,現(xiàn)在最火的視頻會(huì)議公司就是Zoom了。當(dāng)然在Zoom之前其實(shí)還有WebEx,即使現(xiàn)在它的市場占有率已經(jīng)被Zoom超越,但WebEx現(xiàn)在每個(gè)月視頻會(huì)議的分鐘數(shù)仍有百億分鐘。所以說WebEx和Zoom都是服務(wù)于全球的視頻會(huì)議公司,差不多覆蓋200多個(gè)國家和地區(qū),大家可以看到他們的數(shù)據(jù)中心,在網(wǎng)上有公開數(shù)據(jù)可以查到。WebEx在全球有12個(gè)數(shù)據(jù)中心,Zoom在全球是18個(gè)數(shù)據(jù)中心。這個(gè)有點(diǎn)反常識(shí)對(duì)吧。那按照道理,200多個(gè)節(jié)點(diǎn)應(yīng)該能夠提供更好的一個(gè)服務(wù),那為什么WebEx和Zoom他們都只有十幾個(gè)數(shù)據(jù)中心呢,這是怎么回事?是WebEx和Zoom他們沒有錢嗎?那肯定不是。Zoom現(xiàn)在是市值1500億美金的公司了,WebEx現(xiàn)在屬于思科,思科也是市值1600億美金的公司。那這個(gè)問題就一定不是由于成本的原因。
因?yàn)檫@兩家視頻會(huì)議的領(lǐng)導(dǎo)者,他們自己在提供視頻會(huì)議這個(gè)服務(wù)的過程當(dāng)中,這是他們總結(jié)出來的最高效的方案。通過十幾個(gè)數(shù)據(jù)中心和網(wǎng)絡(luò)層的基建,可以給用戶提供非常好的全球網(wǎng)絡(luò)覆蓋。這是這兩家視頻會(huì)議的領(lǐng)導(dǎo)者,做出來的技術(shù)上的最優(yōu)選擇。
那為什么會(huì)有一些廠商會(huì)說他們有200多個(gè)節(jié)點(diǎn),甚至有的會(huì)說自己有300多個(gè)節(jié)點(diǎn),那為什么他們會(huì)選擇部署這么多的節(jié)點(diǎn)呢?可能的一個(gè)原因就是大家的技術(shù)方案、技術(shù)選型是不一樣的。
很多RTC廠商的網(wǎng)絡(luò)分發(fā)參考了CDN技術(shù),CDN的做法是通過小城市的邊緣機(jī)房來做客戶的接入,再通過向中心機(jī)房的匯聚來實(shí)現(xiàn)跨網(wǎng)的問題。我們知道CDN服務(wù)于文件下載、視頻點(diǎn)播和直播這樣的應(yīng)用,這些都是時(shí)延不那么敏感的,分發(fā)路徑上經(jīng)過了多個(gè)節(jié)點(diǎn)所帶來的時(shí)延損耗并不會(huì)影響用戶體驗(yàn),CDN技術(shù)是一種低成本的用于大規(guī)模數(shù)據(jù)分發(fā)的技術(shù)方案。這樣的分發(fā)方式對(duì)于RTC未必是最優(yōu)選擇。
要構(gòu)建一張全球音視頻分發(fā)大網(wǎng),問題的關(guān)鍵其實(shí)不在于多少個(gè)節(jié)點(diǎn),多并不等于好,關(guān)鍵在于是否解決了音視頻全球分發(fā)的這些問題:各國出口帶寬受限問題、防火墻問題,各個(gè)運(yùn)營商互聯(lián)互通問題,網(wǎng)絡(luò)路由變化導(dǎo)致的Jitter問題,鏈路的靈活調(diào)度,等等。
2
時(shí)延越低越好嗎?
第二個(gè)問題,時(shí)延越低就越好嗎?那這個(gè)問題的答案似乎也是顯而易見的,我們在做RTC的應(yīng)用時(shí)肯定是希望時(shí)延越低越好的。但是這其中存在著一個(gè)誤區(qū),如果我們單純強(qiáng)調(diào)時(shí)延,其實(shí)可能會(huì)導(dǎo)致技術(shù)方案變形。我們在做RTC的應(yīng)用時(shí)知道,如果時(shí)延超過400毫秒,用戶在通話的過程中就會(huì)有感知。因此要保證時(shí)延低于400毫秒,最好是在200毫秒以內(nèi),這樣整體效果會(huì)比較好。但是如果說150毫秒跟120毫秒有沒有太多區(qū)別?從用戶體驗(yàn)角度來說可能并沒有太大的區(qū)別。
凡事皆有正反面,在音視頻應(yīng)用里為了保證流暢度,往往需要通過數(shù)據(jù)包緩沖區(qū)來抵抗丟包提升流暢,如果一味的追求低時(shí)延,而壓縮數(shù)據(jù)包緩沖區(qū)大小,很可能會(huì)導(dǎo)致更容易出現(xiàn)卡頓。因此,追求低時(shí)延是合理的,但是不應(yīng)該通過犧牲流暢來過分追求低時(shí)延。當(dāng)然,有些場景確實(shí)需要更低的時(shí)延才能保證用戶體驗(yàn),譬如線上合唱,此時(shí)追求極致的低時(shí)延是合理的。
3
數(shù)據(jù)白板 VS 視頻白板
第三個(gè)點(diǎn),大家在做白板的過程中,我們實(shí)現(xiàn)白板有兩種方式,一種是數(shù)據(jù)白板,一種是視頻白板。大家如果有用過視頻會(huì)議軟件的話,多數(shù)視頻會(huì)議軟件是用視頻白板的方式在做。當(dāng)然視頻白板和數(shù)據(jù)白板這兩種做法其實(shí)各有優(yōu)劣,從技術(shù)角度來說,視頻白板和共享是類似的技術(shù),通過一個(gè)方案來解決了共享和白板的問題,這樣技術(shù)的包袱會(huì)更輕,維護(hù)的成本也會(huì)更低一些。但是我們假設(shè)在某些對(duì)于白板有強(qiáng)需求的這些場景,包括教育這個(gè)場景,可能視頻白板的體驗(yàn)就沒辦法做到非常好。其實(shí)很多時(shí)候數(shù)據(jù)白板可能是一個(gè)更好的解決方法,數(shù)據(jù)白板帶來的好處也是顯而易見的。白板本質(zhì)上其實(shí)是一個(gè)多人的軌跡同步,它是多人的消息的同步,再加上客戶端的繪制。如果通過數(shù)據(jù)白板的方式來做的話,可以實(shí)現(xiàn)更少的數(shù)據(jù)量,占用的帶寬也會(huì)更少,這樣的話就可以保證自己更不容易卡頓,另外也可以把更多的帶寬留給音視頻。因?yàn)槲覀冊谧霭装宓臅r(shí)候,同時(shí)可能也會(huì)有音視頻的通訊。
另外,數(shù)據(jù)白板的呈現(xiàn)會(huì)非常高清。因?yàn)槭鞘噶繑?shù)據(jù),所以說不管是很小的一個(gè)窗口,還是很大的窗口,即使縮放到很大,白板的清晰度還是非常好。所以在具體的實(shí)現(xiàn)過程當(dāng)中,從用戶體驗(yàn)的角度我們認(rèn)為數(shù)據(jù)白板可能是一個(gè)更好的實(shí)現(xiàn)方式。
4
1080P比720P體驗(yàn)更好嗎?
第四個(gè)問題,1080P可以提供比720P更好的體驗(yàn)嗎?這個(gè)聽上去似乎也是顯而易見的,1080P分辨率更高,當(dāng)然比720P體驗(yàn)更好了。但是在RTC場景下,答案可能并沒有那么顯而易見。
首先要解釋一下,視頻分辨率并不等于清晰度,視頻清晰度取決于分辨率、碼率、幀率等,三者對(duì)清晰度的影響大致可以參考公式Bits/(Pixel*Frame),簡單點(diǎn)說,相同碼率下,分辨率越高清晰度越低,分辨率越低清晰度越高。當(dāng)然實(shí)際情況稍微復(fù)雜一點(diǎn),在碼率一定的情況下,分辨率在一定范圍內(nèi)取值都將是清晰的;同樣地,在分辨率一定的情況下,碼率在一定范圍內(nèi)取值都將是清晰的。因此,如果碼率不夠,1080P的清晰度很可能比720P更差。
其次,對(duì)于目前的移動(dòng)互聯(lián)網(wǎng)應(yīng)用來說,手機(jī)端的屏幕尺寸有限,多數(shù)情況下360P就夠了,一般來說720P足夠了,完全不需要1080P。
我們在做視頻會(huì)議應(yīng)用時(shí),有一個(gè)原則叫夠用就好,當(dāng)手機(jī)只需要720P的視頻時(shí),如果我們發(fā)送1080P的視頻,需要的碼率更大,此時(shí)并不能帶來更高清的體驗(yàn),反而會(huì)帶來副作用,因?yàn)楦叩拇a率會(huì)更容易出現(xiàn)卡頓,也更加消耗手機(jī)CPU。同理,如果180P就可以滿足需要,我們就應(yīng)該發(fā)送180P的視頻,而不是720P的視頻。
我們借鑒視頻會(huì)議經(jīng)驗(yàn)支持了視頻大小流,客戶端可以按需選擇大流或者小流,在同一個(gè)會(huì)議里,也支持部分人選擇大流部分人選擇小流,保證最優(yōu)的視頻體驗(yàn)。
5
AVC VS SVC
第五點(diǎn)是AVC vs SVC。我們現(xiàn)在主流使用的視頻標(biāo)準(zhǔn)其實(shí)還是H264。在H264里面分為兩種,一種就是AVC,另外一個(gè)是SVC。大家知道SVC是分層編碼,它可以提供時(shí)域、空域、質(zhì)量域的分層,聽起來是非常好的編碼手段,因?yàn)橥ㄟ^分層,如果帶寬很好或者端的設(shè)備很好,可以首先接收base layer,接收到base layer之后,可以再接收上面的一些增強(qiáng)的layer。而通過增強(qiáng)的layer就可以實(shí)現(xiàn)更高清的畫質(zhì)或者更高的幀率。這樣對(duì)于視頻的分發(fā)來說,你的手段就會(huì)更多。如果接收端的帶寬受限或者接收端的設(shè)備本身性能很差,那這個(gè)時(shí)候可能只要選擇接受base layer就可以了,這樣可以保證一個(gè)比較流暢的視頻體驗(yàn)。從技術(shù)角度來說,SVC好像是比AVC更先進(jìn)的技術(shù),但是實(shí)際上我們在選擇的過程當(dāng)中,這里沒有標(biāo)準(zhǔn)的答案,只是我們在選擇時(shí)需要慎重。
比如選擇AVC,就要知道AVC的優(yōu)缺點(diǎn);選擇SVC,就要知道SVC的優(yōu)缺點(diǎn)。SVC從技術(shù)角度來說更先進(jìn),可以幫助我們實(shí)現(xiàn)更好的視頻的分發(fā)。但是SVC帶來的一個(gè)副作用就是在編碼的時(shí)候占用的資源會(huì)更多,可能會(huì)更耗電或者某些設(shè)備支撐起來可能CPU消耗會(huì)更高。所以這兩個(gè)選擇沒有對(duì)錯(cuò),可能要在對(duì)應(yīng)的場景根據(jù)需要去選擇。
6
H265 VS H264
第六個(gè)點(diǎn)跟技術(shù)不那么相關(guān)了,只是和大家做一個(gè)簡單的分享。我們知道最近H266也已經(jīng)定稿了,關(guān)于H265,從視頻標(biāo)準(zhǔn)角度來說領(lǐng)先了H264一代,是更好的視頻標(biāo)準(zhǔn)。但是實(shí)際上現(xiàn)在H265涉及專利問題。H265現(xiàn)在已知的就有三個(gè)專利池,而且還有一些專利的擁有者,他們是不在這三個(gè)專利池里面的。所以采用H265會(huì)面臨專利問題。如果你們的業(yè)務(wù)在發(fā)展壯大的過程中,將來真的能夠做大或者做到國際化的話,可能就會(huì)面臨專利的風(fēng)險(xiǎn)。如果你做的很好,做到像Zoom一樣的全球化大公司,那就更不應(yīng)該采用H265,因?yàn)檫@里面有很多專利的坑。
H266在試圖解決這些問題,它在定標(biāo)準(zhǔn)和選擇工具的時(shí)候,也都跟對(duì)應(yīng)的專利擁有者做了溝通,試圖解決這樣的問題。所以我們也期待H266能夠把專利問題解決好,因?yàn)镠264畢竟是在2003年就已經(jīng)定稿的標(biāo)準(zhǔn),經(jīng)過這么多年的發(fā)展,其實(shí)H264在很多方面,比如更大的分辨率、視頻的壓縮方面已經(jīng)需要被改進(jìn)了,希望新一代的視頻標(biāo)準(zhǔn),譬如H266、AV1等,能在提供更好視頻壓縮的情況下也能解決好專利問題。
RTC是時(shí)延、流暢、質(zhì)量、成本等的平衡
因?yàn)镽TC的應(yīng)用涉及到的點(diǎn)會(huì)比較多,我們剛才通過6個(gè)點(diǎn)的分享,大家可以看到RTC本質(zhì)上是一個(gè)時(shí)延、流暢、質(zhì)量、成本幾個(gè)點(diǎn)的平衡,沒有一個(gè)銀彈能夠解決所有的問題。RTC應(yīng)用本質(zhì)上就是在一個(gè)受限的環(huán)境下,去平衡各種選擇并盡量呈現(xiàn)最好的音視頻體驗(yàn)給到用戶。
在所有這些受限的資源里面,我們既想保證時(shí)延,又想給用戶非常流暢的體驗(yàn),同時(shí)也希望能夠盡量讓客戶看到更好的視頻、音頻質(zhì)量,最終還要需要兼顧成本,否則這樣的商業(yè)模型也不成立。所以我們需要在這些關(guān)鍵點(diǎn)里做平衡,同時(shí)在這些受限的資源里面,我們希望找到最低的時(shí)延,最流暢的音視頻和最高的畫質(zhì),以及最低的成本,這里其實(shí)就是在做各個(gè)維度的選擇。我們在做RTC應(yīng)用的時(shí)候,不應(yīng)該一味地追求一些點(diǎn),不應(yīng)該在某些單點(diǎn)上用力過猛,導(dǎo)致最終的效果會(huì)打很多折扣。
-
RTC
+關(guān)注
關(guān)注
2文章
538瀏覽量
66468 -
WebRTC
+關(guān)注
關(guān)注
0文章
57瀏覽量
11240
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論