機器學習的研究正進行的如火如荼,各種新方法層出不窮。盡管這樣,還有一個問題擺在面前,研究這些算法對于現實有什么用。特別是當討論起機器學習在手機和其他設備上的應用時,經常會被問到到:「機器學習有什么殺手級應用?」
機器學習工程師 Pete Warden 思考了很多種答案,包括從語音交互到全新的使用傳感器數據的方法等,但他認為實際上短期內最激動人性的一個方向是壓縮算法。盡管壓縮算法在研究領域基本上是人盡皆知的一個方向,還是有很多人還是會對這個看法感到驚訝。在本篇博文中,Pete Warden 分享了他的關于為什么壓縮算法如此有前景的看法。雷鋒網(公眾號:雷鋒網)AI 科技評論編譯如下。
當我讀到一篇名為「神經自適應內容感知的互聯網視頻分發」(Neural Adaptive Content-aware Internet Video Delivery)的論文的時候,我意識到了這個領域的重要性。這篇文章在總結里說到,通過神經網絡,在保證帶寬相同的情況下,該方法能夠將質量體驗指標提高 43%。或者在在保證相同的觀看質量下,減少 17% 的帶寬使用。實際上還有很多類似研究方向的論文,比如生成式壓縮(https://arxiv.org/pdf/1703.01467.pdf)和自適應圖像壓縮(https://arxiv.org/pdf/1705.05823.pdf ) ,但為什么沒有聽說到更多的關于壓縮算法的機器學習實際應用呢?
目前還沒有足夠的計算能力
所有這些基于機器學習的壓縮方法都需要相對較大的神經網絡,并且所需的計算量與像素數量成正比。這意味著高分辨率圖像或者高幀率視頻需要更多的計算能力,可能遠遠超過當前移動電話或類似設備能夠提供計算量。目前大多數CPU能夠處理每秒幾百億次的算術運算,而在高清視頻上運行機器學習壓縮算法很容易就需要十倍以上的計算量。
好消息是現在有了一些新的硬件解決方案,比如 Edge TPU 等,在未來可能能夠提供更多可用的計算資源。我希望我們能夠將這些資源應用于各種壓縮問題,從視頻和圖像以及到音頻。
自然語言是最終極的壓縮
我認為機器學習非常適合于壓縮算法的另一個原因是,我們最近在自然語言處理中得到了很多有趣的結果。如果你仔細琢磨圖片的話,其實是可以將圖像描述看作是圖片的一種終極壓縮方法。我一直以來都希望創建一個項目,一個能夠以每秒一幀的速度給照相機拍下的圖片配上描述文字,之后將這些描述文字寫入到日志文件中。通過這個就能夠得到一個非常簡單的故事,講述著相機隨著時間的推移看到了什么。我認為這就可以看作一個能夠敘事的傳感器。
我將這種東西叫做壓縮的原因是,我們其實可以使用一個生成神經網絡來根據字幕生成圖片。這個生成出的圖片并不一定要與輸入圖片完全一樣,只要它們具有同樣的意思就可以了,這就可以看作是一個解壓縮算法。如果想要輸出的結果與輸入盡可能相似的壓縮算法,可以參考圖像風格化的算法,將圖片壓縮為每個場景的輪廓線。這些算法與傳統壓縮算法的共同之處在于,它們找到了輸入中對于我們人類最重要的信息,而忽略了其他的細枝末節。
不僅僅是圖像
語言世界也有類似的趨勢。語音識別技術正在迅速改進,合成語音的能力也在迅速提高。識別過程可以看作是將音頻壓縮為自然語言文本的過程,而合成則正好反過來。而人之間的對話可以通過將音頻翻譯為文字表示而的到極大的壓縮。我現在還很難想象是否需要走那么遠,但是似乎有可能通過我們對與語言特征的新理解來實現更好的壓縮質量以及更低的帶寬。
我甚至看到了將機器學習壓縮算法應用到文本本身的可能。Andrej Karpathy 的 Char-RNN(https://github.com/karpathy/char-rnn)展示了神經網絡可以很好的模擬給定樣本的風格,這種學習風格的本質與壓縮問題是很相似的。如果考慮一下典型的 HTML 頁面有多少冗余,機器學習壓縮算法其實有很好的機會去改進 gzip。但這只是我的一個猜想,畢竟我沒有機器學習文本壓縮的經驗。
壓縮算法已經是一個有市場的項目
在我創業生涯中,我曾嘗試向企業銷售產品而最終失敗,從中我學到了一件事情,就是如果企業已經有大量的資金分配在你所銷售的產品類別上,那么進行銷售會更加容易。企業對于某種產品有預算意味著公司已經做出了是否要在該項解決方案上花錢的決定,現在的唯一問題是要購買哪種解決方案。這就是為什么我認為機器學習可以在這個領域取得巨大進展的原因之一,因為制造商已經擁有專門用于視頻和音頻的壓縮工程師,以及對應的資金和芯片制造產業。如果我們能夠證明將機器學習添加到現有的解決方案中可以提高某些指標,如質量速度或者功耗,這些方法就能夠很快被采用。
帶寬成本需要平攤到用戶和運營商身上,而質量和續航是產品的一大賣點,因此采用機器學習進行壓縮相比于其他應用方向有更直接的動機。現有的研究表明,機器學習算法進行壓縮非常的高效,而且我樂觀的認為還有很多方法等著被發現,所以我希望壓縮算法會成為機器學習的一個重要應用。
-
機器學習
+關注
關注
66文章
8423瀏覽量
132752 -
自然語言
+關注
關注
1文章
288瀏覽量
13359
原文標題:「壓縮」會是機器學習的下一個殺手級應用嗎?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論