成立于2012年的云知聲,是一家專注于物聯網人工智能的公司。2014年,云知聲提出“云端芯”一體化戰略,今年5月發布了首款面向物聯網的AI系列芯片“UniOne”,并宣布開源全棧語音交互方案。
在11月4日甲子引力大會上,云知聲創始人兼CEO黃偉做了主題為《 AI芯片在物聯網產業升級中的應用價值》的演講,講述了云知聲如何一步步看到AI一體化、端到端打通的大趨勢。
在這篇演講中,黃偉主要分享了以下3個方面的內容:
1.互聯網從 PC 到Mobile再到AIoT時代的演變過程。
2.AIoT 落地的典型挑戰及云端芯戰略。
3.云知聲 AIoT 產業化歷程及成果。
黃偉認為,新一代人機交互革命引領的萬物智能時代已經到來。
關注甲子光年,在后臺聊天窗口回復“黃偉”,獲得《AI芯片在物聯網產業升級中的應用價》報告PPT完整版。11月4日甲子引力大會的其他主講嘉賓稿件和PPT將在本號陸續發布,敬請期待。
AI芯片在物聯網產業升級中的應用價值
主講人:云知聲創始人兼CEO黃偉
前面牛奎光總講了未來10年投資什么硬科技。過去很長一段時間我們投什么?共享經濟。今天除了留下一批單車還留下什么?中興事件時,我發了一個朋友圈:靠送外賣永遠贏得不了競爭。
接下來,對于中國經濟內生的變革,包括我們如何贏得未來的競爭,科技格外之重要。
無論是媒體還是資本方,都跟我講過一句話,你應該專注,應該只做一點。為什么要做那么多?我很難跟他們解釋,但是我認為,對的事情就應該堅持。
今天我看到AI一體化、端到端打通,跟我自己的切身體會非常一致。接下來我就講講在產業界真正的實踐。
我今天主要介紹云知聲通過AI芯片在物聯網產業應用的價值。這一張PPT就一句話,既是緒章也是結論:新一代人機交互革命引領的萬物智能時代已經到來。
這張圖相信大家在很多場合看到過,過去我們從PC時代進入Mobile時代,今天我們已經進入AIoT時代。
我第一次用鼠標是大二,第一次上網是1998年,那時我們開始進入PC時代。但那時我們是通過打開一個IE,在IE里面用輸入法輸入網址,獲得人和信息世界的交互。鼠標和鍵盤使我們能方便地在IE框里輸入信息。
2004年畢業后,我的第一份工作是在摩托羅拉做手機。當年我們做手機時,三星應該算是三線品牌,基本上是第三流的,蘋果只是一個小公司。但是今天我們看到,2010年開始進入移動互聯網時代,那年全球智能手機出貨量達到千萬級別,小米成立。
我自己會把2010年作為世界移動互聯網的起點。變化來得非常快。我們今天看到地球上不光誕生了阿里、騰訊這樣幾千億美元市值的公司,也誕生了像蘋果這樣市值接近一萬億美元的公司。
回過頭看,為什么Mobile相比PC獲得那么大增長?以前在PC時代,我們到網吧才打游戲,進入移動互聯網時代,我們可以坐在馬桶上打游戲。我們可以看到,設備數量的增加,以及場景的遷移、多樣化,產生了巨大的化學變化。
想象一下,進入AIoT時代后,我們身邊任何一個設備,可能一個麥克風、一個燈泡、一個音箱,所有事物都是聯網的、智能的。這會給整個社會帶來什么改變?很多時候,這些底層技術改變的不止是某一個產品的品類,它們改變的是我們的生活方式,是我們的社會組織形態。以五年、十年為單位計算的話,這些才是真正的重大變革。
越來越多的設備連接到云端,聯網的目的是什么呢?顯然不是為了給供應商貢獻更多流量,給中國移動多付點錢。我們希望聯網后,通過各種不同的終端,在不同場景里獲得更多場景化的服務。聯網后,這種服務需要交互,需要AI化。同樣的,所有的AI能力,不管是做的還OK,還是說離應用有差距,都需要在場景里面落地,從而往前演進。
所以,物聯網需要AI化,AI要在互聯網落地,是一個雙向而行的過程。我們會看到這個過程越來越近。我曾經在美國Nuance工作過,這個公司以前有三大業務,手機、汽車和醫療。今天,面對互聯網巨頭的夾擊,手機和汽車業務受到的沖擊非常大,醫療卻守得非常穩。
創業初期我也想過,我們能不能通過AI給醫院賦能?這個想法產生是在2012、2013年,當時醫院沒有完全信息化,很多醫院沒有聯網,沒有聯網時不需要AI。而且當時我們這些技術公司,能提供的AI能力也并沒有那么好。比方說,我們當時做語音識別,那時中國一流的語音識別準確率不過90%左右,說一百個字有10個是錯的,考慮大量專業術語恐怕還不止。這個時候你想去賦能,其實根本就不是賦能了,不僅沒有給醫生提供幫助,反而給醫院添亂。很多時候,我們選擇什么樣的場景、使用什么能力,取決于時機和當時的能力水平。
2012年,我們成立時給公司取名云知聲,英文名叫Unisound。云是云彩的云,知是知道的知,聲是聲音的聲。我們為什么叫云知聲?我們希望利用云端的技術能力,通過感知和認知的技術,感知聲音世界,這是我們當時就叫云知聲的原因。2012年,中國并沒有真正意義的云計算,那個時候我們能夠提供的只是網盤,也就是云存儲。但我們相信未來很多服務、很多算法、很多算力都在云端。
為什么選擇從聲音切入呢?因為語音和語言是整個人工智能皇冠上的明珠。今年4月份,我在美國參加活動時看見,在中國跟美國的創業圈,人工智能都非常熱,但是重點略有不同。在美國的人工智能創業圈,無論估值還是關注度,重點更多在語音語言類,或者自動駕駛這些團隊,而我們國內比較關注安防,這是不同的場景。但從美國的機構和媒體關注的方向上,我們會看到,語音和語言確實是未來非常重要的方向。因為考慮到成本,很多AloT設備沒有屏幕,可能連攝像頭也沒有。
而且人之所以成為人,是因為在過去幾十萬年的進化過程中,我們創造了語言。每個動物都有眼睛,包括蒼蠅,但它們為什么沒有進化成智慧生物?是因為人有語言。通過語言,我們能夠把很多人高效地組織在一起。通過語言,知識可以傳遞、繼承,這是非常非常重要的一點。第二點,今天語音和語言技術有很多局限性,但相比較來說,這塊還是相對成熟的。比方說,今天的語音識別,不僅可以做近場識別,也可以做遠場識別,甚至能識別出是你是男是女,是什么年齡階段,在這個房間的哪個位置。基于這些,我們認為從語音切入AIoT需求,是一個比較合理的點。
其實今天所有的AI團隊在談到落地時,都面臨巨大的挑戰。2012年我們剛創業時,面臨的挑戰是什么呢?
首先是今天的主題,to B。今天,我看到大家很多人在談論to B。但在2012年,說云知聲做to B時,很多投資機構會覺得你不夠性感。你為什么做to B呢?不止一個投資人跟我說,老黃你要做APP的話就投你。但是我做APP干嗎呢?通過這些機構媒體的反饋,你們可以想象到,AI當時的落地非常不順利。大家的認知還沒到,那個時候大家對to B的關注,完全不像今天大會上這樣。
其次是AI技術的成熟度。2016年通過阿爾法狗,大家才知道深度學習。我們在2012年就開始做深度學習了。但是從2012年到2016年,包括到2018年,很多技術依然不夠成熟,不夠完善。
甚至還有一個問題,技術難道就是用戶想要的嗎?前面浩哥說一定要全棧,一定要端到端打通,什么叫全棧,什么叫端到端打通,不同人的理解不同。可能有人說,你把語音識別做到99.5%就好了,但是有用嗎?沒有用。不同時間段,大家對一個問題的理解不一樣。我們也面臨這個問題。我們怎樣把我們的能力很好地跟客戶需求結合在一起呢?
我先講一下,如果大家真正去開發一個技術,真正希望這個技術能夠創造價值,會面臨哪些問題。
第一是終端的碎片化。什么叫IoT? Internet of things,甚至Internet of everything。從PC到Mobile都是高度標準化的設備,PC基本上都是英特爾芯片,Windows的操作系統。Mobile基本上要么蘋果,要么安卓。但是AIoT設備非常多元化,有音箱,有冰箱,有空調,各種各樣。這些設備的碎片化,會給你帶來巨大的挑戰。怎樣用一個產品,用一個方案滿足不同場景中的不同客戶?即便在同一個產品形態里,大客戶和小客戶也會對你提出不同的需求。
第二是分散的供應商。那些讓我專注做一件事的朋友,出發點是好的,但他們沒有意識到,時代已經變了。PC時代,公司做一個網站就可以了,一個網站搞定所有事情。那個時候很多人通過幫公司做網站賺到了第一桶金。到Mobile時代,做一個網站肯定不夠了,你至少還要做APP,做各種應用市場的分發、推廣和宣傳。Mobile時代,我們每個公司工作的復雜度已經超過PC時代。而在AloT時代,設備變得更加碎片化、場景化,供應商也非常分散。分散的供應商加重了終端廠商的時間、財力成本。你如何用更短的時間、更低的成本,給客戶提供更多方案,決定你能不能在市場上生存。今天我們的目標肯定是希望更快更好,但現實中的結果往往更分散、更慢。
第三是不可控的產品體驗。我們今天已經進入AIoT時代,但很多產品經理依然在用互聯網時代的思維做產品。他沒有意識到,今天場景的碎片化,已經給我們帶來很多挑戰。很多產品經理依然希望把一個東西打散,找N家供應商,絲毫不顧忌供應商是黑盒子。比如說做一個云交互的設備,里面有很多環節,包括語音降噪,理解,合成,知識圖譜等,有的產品經理會把這個過程拆成七八個鏈條,每個鏈條找三個供應商過來,相當于十幾個陌生人在一個房間里做一件事情,你不知道我在干嗎,我也不知道你在干嗎。
第四是TTM(產品上市周期)無法保證。因為鏈條很長,供應商很多,產品的復雜度大大超過從前,我們要反復去調,去測試,就會造成TTM非常長,團隊的開發成本很高,你的客戶使用成本也很高。這會影響客戶對這件事情的決策。我們一直在講要搞定決策人,如果這個事你跟對方老大說兩個禮拜我給你搞定,老大可能就馬上拍板了,跟他說這事我要半年、9個月,這事就黃掉了。能不能用更快的時間滿足需要很重要。
第五是如何在不同產品間快速復制。比較下to B和to C,to C可以快速拷貝,to B就是去做。但我的理解是什么呢?我理解to B有兩種做法。一種是項目to B,一個客戶給我提需求,搞一個團隊,充分理解用戶需求,搞到6-9個月,搬到另一個客戶那完全不成立。還有一種是產品to B。我們認為這是兩種不同的思維,對團隊的要求完全不一樣。用產品to B意味著需要用一個相對標準化的產品。它的技術能力和技術方案,能適應大多數用戶比較共性的需求。這是比較難的,但一旦你做到了,你就可以快速在不同產品間復制。如果你做不到,注定是項目公司。你靠400人做1億收入,明年靠900人做到2億收入。因為人越多,內耗肯定越多,效率會下降。
我前面講的,是自己真正體會到的,用to B的方式、用AI在場景中落地,面臨的五個最典型的挑戰。
2014年初,我們第一次對外提出我們的產品云端芯。我們相信,未來大多數計算能力、技術能力和服務能力,都發生在云端。端是什么?端就代表著各種不同品類的產品,包括智能音箱,包括有屏幕的,也包括沒屏幕的。但是所有的端都需要終端感知能力,都需要芯片。
在2014年初,我們就認識到,即便在不同場景中,云端芯都是必須要具備的能力。2016年,華為開始提出華為人工智能戰略——云端芯,和我們在兩年之前提出的一字不差。今天我們可以看到,幾乎所有公司,無論是BAT大公司,還是創業公司,大家基本上都在遵循這個原則:如果想滿足用戶需要,我們的方案、技術和產品,一定要云端芯一體化。
今天如果提供一個純粹的SDK,毫無疑問根本不能滿足用戶需要。以智能音箱為例,它是非常典型的、最小功能集的物聯網交互。首先,它具有感知能力,能知道你在說什么。其次,它還具有表達能力,通過語音合成、圖象或其他形象化方式,將內容和信息傳遞給客戶。除此之外,它背后還有思考能力,能通過云深入理解用戶的意圖,通過帳號體系,把一個用戶在不同場景里的使用習慣混在一起,并通過用戶最接受的方式,把用戶所需要的內容和信息反饋回去。這是三個簡單的能力。
我們有沒有可能在產品to B思維的模式下,從不同場景、不同客戶的需求中,從個性中找出共性?
你對著車說話,對著音響說話,對著手機說話,模式也許不一樣,但里面總歸有比較趨同的東西。能不能把共性的東西放進芯片,把相對個性化、需要定制開發的東西放在云端,這是我們幾年前開始思考的問題。
這個圖是我們2014年提出云端芯之后一步一步做的。
2012年我們有一個開放平臺,我們通過SDK的方式給客戶提供服務,2012年他們也在用我們的SDK。其實我們希望以云平臺為基礎,找出具有典型意義的場景,我們在這個場景里做一系列的終端產品,再將終端產品通過平臺連接在一起。先定義典型場景,在典型場景里滿足典型用戶的需求,將這些個性變成共性。共性的東西我們再通過芯片,大規模、低成本、高效率地實現萬物互聯。這是我們對云端芯一體化、如何在行業中落地的思考和行動路徑。
這是我們一步步做的一些事情。
我們在2014年初提出了云端芯一體化,同時拿出了一個芯片模組的原型,然后開始跟大的廠商對接,2016年開始量產,到今天我們這個芯片模組出貨量超過一百萬片。這是一個很典型的案例,我怎么樣去落地,它不是消費品,是工業產品,有更高的工藝要求。
我們在2016年開始量產,其實我們依然面臨很多問題。第一是邊緣算力要求。很多人問為什么你們自己做芯片?其實一開始我們不想做芯片,這玩意誰都知道很累,很燒錢,還可能失敗,我在做的時候,很多人投反對票,做芯片這件事情沒人給我提供任何融資幫助。大家都覺得這事做不成,也沒必要做,但在那個時間點,沒有任何一家芯片公司愿意跟你合作,為什么?因為這是一個新的市場。2014年,我們開始做芯片模組的時候,誰會相信今天格力美的空調會帶有語音功能呢?我自己做的話,我賣給格力、美的的芯片模組就會非常貴。我只能用在格力、美的非常高端的產品中。所以你必須開發出更高算力的芯片,而且有更低的成本,更好的性能,才能在產品里獲得更高出貨量。我們沒有辦法,只有一個選擇——自己做芯片。
2015年8月,我們自己組建了新團隊。好在2015年、2016年,芯片還不像今年被炒得這么火熱。2015年我在招團隊的時候,一個有15年芯片設計經驗的工程師來面試,我問了他的薪水,感覺很辛酸。我說,這個行業工資怎么這么低,還不到我們一個普通安卓開發工程師的水平。今天你看這個行業的待遇翻了四倍五倍。2015年8月,我們組建了第一批芯片團隊,2016年開始啟動。期間我們花了差不多一個多季度的時間來做芯片的定位。
過了兩年,到今年1月15號,芯片正式出來。6月份芯片正式量產,9月份開了發布會。到今天我們已經導入接近十家伙伴,包括像格力、美的這種很大的合作伙伴。
今天很多人開始意識到芯片的重要性,開始找人找團隊,用四倍五倍的薪水挖人做芯片的時候,我們的芯片已經出來了,而且不是做demo的芯片,是真正可以量產的芯片。這個芯片是面向AIoT的AI芯片,剛才好未來楊總討論是往上走還是往下走,我的觀點是這兩點并不矛盾。
往上走是上九天攬月,往下走是下五洋捉鱉。未來一切東西都是在云端,區別是巨頭可能有很多服務,很多技能,而創業公司可以在場景里有獨特的技能,但是這個技能一定是在云端的。相比巨頭,我們的優勢是什么呢?我們對場景的理解更加深入,在場景里能夠端到端整合的能力更強,我們有芯片,我們可以在場景里提供更好的服務,這就是我們對整個云+芯的理解。
我們的芯片用很低的成本,將計算能力提升了差不多50倍以上,帶寬利用效率提升了20倍以上,所有指標都比以前有很大提高。基于這個芯片,我們的成本是賣給客戶模組的幾分之一。即使我明年的售價只是之前的幾分之一,毛利率依然會大幅提高,這就是芯片給行業帶來的巨大變革。
我們很自豪的一點是什么呢?行業里很多人還沒意識到時,我們意識到了,而且做了。通過對行業的深刻理解,通過平時養成的深度思考能力,一個團隊的CEO必須具備看到未來的能力。看到未來后,接下來你要做什么呢?只有一件事情,就是堅持。當你知道未來在哪里時,選擇已然不多。做芯片我們想得很清楚,只能這么做,如果不這么做的話,今天搜狗也做語音,BAT也做語音,我做到99.5%,他們做到99.2%,又如何呢,他們分分鐘把我干掉。我只有比巨頭對行業的理解更深入,比巨頭拿出更完整的解決方案,才有可能在未來生存和發展。
這個芯片的價值大家應該很清楚了,它降低了客戶對這個行業、對這個產品的基礎調研成本。9月份我們的芯片剛出來,現在導入的客戶就接近十家。這放在過去不可想象。因為我們使用一個高度標準化的產品,降低了客戶的調研成本,降低了決策周期,縮短了產品投向市場的周期。而且我們用更低的成本、更好的性能,減少了人力資源的投入,客戶不需要投入很多人。今天把這些高度標準化在一個芯片里面,客戶拿芯片做就可以了,而且原代碼都開源。
我們的芯片能應用在不同的場景中,包括智能音箱、家電。智能音箱和家電的控制技術指標要求完全不一樣。比方說,用戶在家聊天時,音箱可能響了,把大家逗笑了,但格力、美的不允許空調被誤喚醒了,把客戶凍感冒了。我不知道現在BAT哪家音箱耐得住85度高溫,耐得住85%的濕度,耐得住高壓靜電,但是在家電行業必須滿足。
回顧一下我們云端芯的產業化落地過程。公司到今天為止六年,每個階段很清晰,但是你要說2012年規劃好了公司,我不知道,我只知道大概的方向。過去六年唯一做的是每年離那個目標更近一步。我們回頭看的話,可以分為三個階段:第一個階段做了技術團隊最擅長的事情,我們2012年做了深度學習;在沒有云計算的時候,我們把AI作為云服務能力開放出來;上完天了,我們要落地,接著我們用云端芯去落地。
我們相信未來真正的云交互不應該再拿著麥克風,不應該拿著一個手機,我一直覺得回到家通過手機開燈是很愚蠢的行為,能不能一邊脫鞋子一邊說把臥室燈打開,主臥空調升到26度,干嘛拿手機。那個時候,我就認為真正的云交互應該給用戶便捷,這種便捷應該擺脫距離控制。
因為我們相信,所以我們就堅持。在所有人還沒有反應過來的時候,我們開始做芯片模組,我相信這是未來。因為AIoT既有PC、Mobile,又有智能音箱這種新的品類,它依然有巨大的存量市場,空調每年有一億多臺的出貨量。我們相信,即使是這些存量設備的改革升級,市場也是很大的。包括今天新能源很火,我們發明汽車了嗎?沒有,汽車還是四個輪子,上面兩排沙發,把發動機換成一個電池組而已,難道這不是信息化、智能化嗎?很多時候,我們看行業不要看表面,要看更本質的東西。
在家居行業,截止到今年,我們的芯片出貨量(家電和兒童機器人)超過300萬片。在汽車領域,我們在后裝市場的激活用戶,接近1800萬臺車。兩個月前,我們跟吉利成立了合資公司,我們的芯片會用在吉利的每臺車上。同一個月,上汽量產使用了我們賣給格力的芯片模組。大家能想到嗎,我這個芯片模組以前是給格力用的,怎么能用在汽車里面?這就是在場景里通過個性找共性。我不可能量產完之后,針對上汽專門做一個芯片模組。
我們就是拿著標準化的產品,在不同場景里切換。包括醫療,我相信AI+醫療是非常性感的業務,但很少有公司現在能在這個領域真正賺到錢。云知聲通過醫療語音產品,極大地提升了醫生的工作效率,如果大家有興趣去協和醫院,你會看到從門診大廳到住院部,他們在全系列地使用我們的產品。今天,使用我們產品的醫院大約有500家。也包括教育,我們也提供兒童的口語評測,每天日調用量達2.7億次。家里有孩子的,也許你們的孩子每天都在使用我們的服務,只是你不知道而已。
-
物聯網
+關注
關注
2909文章
44736瀏覽量
374436 -
AI芯片
+關注
關注
17文章
1890瀏覽量
35096
原文標題:云知聲CEO黃偉:做物聯網,我為什么要自己造AI芯片(附視頻) | 甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論