如何搭建一種架構(gòu),能夠高效地處理各種多媒體數(shù)據(jù),并且專門(mén)針對(duì)音頻、視頻進(jìn)行優(yōu)化?
產(chǎn)品定義與芯片選型――搭建基于網(wǎng)絡(luò)的多媒體平臺(tái),但排除ASIC、X86和通用DSP編程方式。
網(wǎng)絡(luò)向我們提供日益豐富的內(nèi)容(包括:文本、圖像、視頻和音頻),這些內(nèi)容的表現(xiàn)形式多種多樣,僅視頻和音頻就有幾十種格式。傳統(tǒng)的ASIC芯片最大缺點(diǎn)是缺乏靈活性和通用性,例如DVD解碼芯片通常只支持MPEG-2,MPGE-4和MP3標(biāo)準(zhǔn),如果要處理更多的格式還需要設(shè)計(jì)新的芯片,因此ASIC類的芯片不適合網(wǎng)絡(luò)功能的消費(fèi)類電子產(chǎn)品應(yīng)用。X86架構(gòu)是針對(duì)數(shù)據(jù)處理而設(shè)計(jì),可以高效的處理32位或64位整型數(shù)字流,但視頻數(shù)據(jù)流的變長(zhǎng)數(shù)據(jù)(不是32位或64位對(duì)齊的整型數(shù)據(jù))處理和位運(yùn)算量很大,由此,X86架構(gòu)不能高效地處理各種媒體應(yīng)用,而且成本也不適合消費(fèi)電子產(chǎn)品。
像ADI的Blackfin處理器和TI的DaVinci技術(shù)(采用ARM+通用DSP架構(gòu))都采用可編程DSP SoC芯片,因?yàn)橥ㄓ肈SP的體系結(jié)構(gòu)加入長(zhǎng)指令,針對(duì)乘法累加等運(yùn)算優(yōu)化,其效率比X86提高很多。通用DSP架構(gòu)針對(duì)所有數(shù)字信號(hào)處理,強(qiáng)調(diào)通用性,應(yīng)用范圍包括醫(yī)療、勘測(cè)和音/視頻。但這種架構(gòu)并沒(méi)有專門(mén)針對(duì)音頻、視頻進(jìn)行優(yōu)化,這導(dǎo)致用于音視頻處理的DSP主頻通常很高,價(jià)格也較貴。那么,是否有一種架構(gòu),能夠處理所有數(shù)字多媒體數(shù)據(jù),并且專門(mén)針對(duì)視頻和音頻進(jìn)行優(yōu)化?專注于通信(Communication)與消費(fèi)(Consumer)融合的北京希圖視鼎科技有限公司(C2 Microsytems)向我們介紹了一種低成本、高性能的可編程平臺(tái)CC1100,它可滿足“網(wǎng)絡(luò)化娛樂(lè)”的要求。該平臺(tái)從形態(tài)上講是DSP類型的可編程SoC,它是一個(gè)完整的編解碼器,完全軟件可編程性使它適合處理一切音、視頻數(shù)據(jù)。目前C2自己開(kāi)發(fā)了基于CC1100平臺(tái)的MPEG-2、MPEG-4、H.264、Real Media、Flash和AAC、MP3、AC-3等的編解碼算法。
結(jié)構(gòu)特點(diǎn):1個(gè)CPU作主控,3個(gè)DSP分別為三類關(guān)鍵運(yùn)算優(yōu)化
CC1100平臺(tái)采用C2公司自主設(shè)計(jì)的1個(gè)CPU+3個(gè)DSP架構(gòu),其中CPU是精簡(jiǎn)指令集計(jì)算機(jī)(RSIC)CPU,3個(gè)DSP分別針對(duì)三類計(jì)算進(jìn)行優(yōu)化。這三類計(jì)算分別是:1,運(yùn)動(dòng)估計(jì),這是視頻處理中最耗費(fèi)時(shí)間的一類計(jì)算,塊匹配和運(yùn)動(dòng)向量搜索都有專有的指令做運(yùn)算加速;2,熵編碼,這也是圖像處理中使用頻率很高的計(jì)算;3,向量處理,圖像是二維數(shù)據(jù),對(duì)于8×8的圖像塊,一行像素或者一列像素都視作一個(gè)向量進(jìn)行處理,向量之間的運(yùn)算在圖像處理中也非常常用,另外,這部分也可以兼作音頻數(shù)據(jù)的處理。除了CPU本身固化的加減乘除等指令外,C2公司將上述三類運(yùn)算量最大的計(jì)算抽出來(lái)固化為指令庫(kù),通過(guò)CPU調(diào)用這些指令庫(kù)中的指令,可大大提高運(yùn)算效率。
需要特別指出的是,在音頻數(shù)據(jù)處理方面一般采用24位整數(shù)DSP處理(例如Blackfin),而CC1100平臺(tái)集成了256位的向量處理器,支持浮點(diǎn)處理,可以支持7.1聲道解碼和添加復(fù)雜的音效處理。該平臺(tái)架構(gòu)對(duì)視頻流碼率并不敏感:已驗(yàn)證過(guò)15Mbps MPEG-2碼流和8Mbps MPEG-4碼流。CC1100單芯片支持網(wǎng)絡(luò)接口和USB,SATA等存儲(chǔ)接口,適用于公共場(chǎng)所網(wǎng)絡(luò)監(jiān)控設(shè)備、流媒體電視、時(shí)移電視、硬盤(pán)媒體播放機(jī)、IPTV等數(shù)字家庭娛樂(lè)設(shè)備以及個(gè)人娛樂(lè)(例如PMP)和汽車娛樂(lè)。關(guān)于CC1100是否能應(yīng)用到手機(jī)上,C2公司總裁兼執(zhí)行官劉錦湘指出,雖然手機(jī)也可以處理多媒體的需求,但手機(jī)和數(shù)字家庭娛樂(lè)設(shè)備對(duì)芯片的規(guī)格要求還是有差異的,比如手機(jī)芯片多集成基帶處理器,功耗要求更低。手機(jī)應(yīng)用不是CC1100的設(shè)計(jì)目標(biāo)市場(chǎng)。C2的下一代平臺(tái)CC1200將采用90nm設(shè)計(jì),能夠支持所有視頻格式的高清解碼,并且能夠支持WinCE和Linux雙系統(tǒng),可以應(yīng)用在更廣泛的行業(yè)市場(chǎng)。CC1100芯片目前采用0.15mm工藝設(shè)計(jì),在臺(tái)積電(TSMC)制造流片。
經(jīng)驗(yàn)借鑒:找準(zhǔn)軟件和硬件實(shí)現(xiàn)的結(jié)合點(diǎn)
CC1100平臺(tái)最大的特點(diǎn)是實(shí)現(xiàn)了一種全新的處理架構(gòu),很好地平衡了硬件加速和軟件可編程的靈活性。芯片運(yùn)行在350MHz,視頻編解碼的性能可以超過(guò)700MHz的通用DSP SoC。軟件可編程性的優(yōu)點(diǎn)是使產(chǎn)品保持高度的靈活性、可重用和新產(chǎn)品面世時(shí)間短。硬件實(shí)現(xiàn)的優(yōu)點(diǎn)是高性能、低功耗和小尺寸,其中的關(guān)鍵在于采用何種層次的實(shí)現(xiàn),從而達(dá)到性能和靈活度的最佳結(jié)合。C2公司市場(chǎng)經(jīng)理劉明璋分析了下一代平臺(tái)的發(fā)展方向:除了降低功耗之外,CC1200平臺(tái)一個(gè)主要的改進(jìn)是增加一顆ARM CPU,以支持Window CE操作系統(tǒng),這樣原有CPU的處理負(fù)擔(dān)可以減輕很多;另外,CC1200采用90nm工藝制造,而且適于處理高清1080p分辨率的視頻應(yīng)用。
附文:C2 Micro的DSP SoC核心架構(gòu),多處理器設(shè)計(jì),能夠并行運(yùn)行Linux應(yīng)用程序和音、視頻處理算法。其中:ME Engine是一個(gè)可編程子處理器,其體系架構(gòu)可以高效率地執(zhí)行視頻壓縮運(yùn)算中的塊搜索和運(yùn)動(dòng)補(bǔ)償算法;Entropy Engine也是完全可編程的變長(zhǎng)位運(yùn)算處理器,其架構(gòu)可以高效地解析處理MPEG-2, MPEG-4, H.264, VC-1和JPEG等位串碼流數(shù)據(jù)中的語(yǔ)法元素,它還可以高效地運(yùn)行CABAC/CAVLC等熵編碼的壓縮和解壓縮算法;Vector子處理器支持專為音、視頻處理而優(yōu)化SIMD指令集,它內(nèi)置64個(gè)256位的超寬向量寄存器,支持整點(diǎn)和浮點(diǎn)運(yùn)算;RISC主處理器是一個(gè)超級(jí)標(biāo)量處理器,支持硬件雙線程技術(shù),一個(gè)指令周期最多運(yùn)行4條指令,可以運(yùn)行Linux操作系統(tǒng);片內(nèi)集成指令和數(shù)據(jù)cache;HUBS/DMA控制器可以在子處理器和DDR內(nèi)存之間建立高速數(shù)據(jù)交換的直接通道,不需要主處理器的干預(yù)和占用其它系統(tǒng)資源。
審核編輯黃宇
-
dsp
+關(guān)注
關(guān)注
554文章
8058瀏覽量
349648 -
mcu
+關(guān)注
關(guān)注
146文章
17267瀏覽量
352022 -
cpu
+關(guān)注
關(guān)注
68文章
10892瀏覽量
212478
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論