BAT ,中國互聯網公司三巨頭,在中國互聯網發展的20多年的時代下,不斷壯大,引領了中國信息產業,走到了世界的前列。
如今,人工智能正以前所未有的速度掀起新一輪科技的浪潮,繼7月份國務院印發《新一代人工智能發展規劃》,將人工智能發展上升為國家戰略,11月15日,《新一代人工智能發展規劃》暨重大科技項目在京啟動,會上公布了首批共四家國家人工智能開放創新平臺名單,有一家公司和BAT比肩齊名,名列其中,它就是科大訊飛。
國家人工智能開放創新平臺
依托百度公司建設自動駕駛國家新一代人工智能開放創新平臺,
依托阿里云公司建設城市大腦國家新一代人工智能開放創新平臺,
依托騰訊公司建設醫療影像國家新一代人工智能開放創新平臺,
依托科大訊飛公司建設智能語音國家新一代人工智能開放創新平臺。
為了抓住歷史機遇,搶占人工智能的制高點,實現第四次工業革命的彎道超車,戰斗即將正式打響了。而在這場戰斗中,BAT+科大訊飛將是開路先鋒!
1、顛覆來臨,無人汽車真的來了!
11月16日,一年一度的百度世界大會正式召開!不同以往的是,這次不再是預想概念,而是直接上貨!
李彥宏的一句“如果無人駕駛的罰單已經來了,無人駕駛汽車的量產還會遠嗎?”全場沸騰!
今年夏天, 李彥宏乘無人車上了五環,沒想到華麗麗地違反了試車規定,收到了一張來自“交警叔叔”的罰單。
百度表示已經和金龍客車簽定了戰略合作。無人小車將在2018年正式量產!沒有方向盤,自動駕駛的無人車真的要來了,比我們想象的快多了。
今年4月19日,百度就正式發布了“Apollo(阿波羅)計劃”!該計劃全面開放,向汽車行業以及自動駕駛領域的合作伙伴提供一個完整、安全的平臺,幫助他們結合車輛和硬件系統,快速打造出一套屬于自己的完整的自動駕駛系統。截止目前,有6000多個開發者在投票支持Apollo項目;有1700多家合作伙伴使用了Apollo的開源代碼;還有100多個合作伙伴申請開放數據。
2、阿里的城市大腦,讓人為之癲狂!
阿里云ET城市大腦是目前全球最大規模的人工智能公共系統,可以對整個城市進行全局實時分析。目前ET城市大腦已經在杭州、蘇州等地落地。
它將交通、能源、供水等基礎設施全部數據化,將散落在城市各個角落的數據進行匯聚,再通過超強地分析、超大規模地計算,實現對整個城市的全局實時分析,讓城市智能地運行起來!
杭州城市大腦接管了杭州128個信號燈路口,試點區域通行時間減少15.3%,高架道路出行時間節省4.6分鐘。在主城區,城市大腦日均事件報警500次以上,準確率達92%;在蕭山,120救護車到達現場時間縮短一半。
今后,城市大腦將讓數據來幫城市做思考、做決策!
通過AI技術,癌癥的早期篩查變得更加精準!8月初,騰訊發布了一款AI醫學影像產品——騰訊覓影。
騰訊覓影是首款AI食管癌篩查系統,準確率超過90%;在肺結節方面,覓影可以檢測出3毫米及以上的微小結節,檢測準確率超過95%。未來騰訊覓影將與醫學院和醫療結構合作助力更多病種檢測。可以有效輔助醫生發現癌變征兆,將病魔遏制在搖籃里。
承擔著建設智能語音開放平臺的科大訊飛,又有何能耐可以比肩BAT,擔負起國家人工智能發展戰略的重任呢?
語音識別龍頭——科大訊飛
1、科大訊飛的起點
上世紀90年代, 國內語音分為“南北二王”,“南”指的是中國科技大學的王仁華教授;“北”則是清華大學的王作英教授。劉慶峰正是在這個時期被選中加入了王仁華教授的人機語音通信實驗室,并牽頭做一個語音合成系統,該系統不但保證了音質,還具備了優良的語音自然度,合成的語句近乎“人聲”,成為1998年國家“863計劃”成果比賽中最為轟動的科研成果。同年,IBM發布了語音系統,首次靠說話就能讓電腦完成指令,被評為當年科技界十件大事之一。
面對國內空白的語音市場,IBM、微軟、英特爾、摩托羅拉等紛紛搶占布局,在中國成立研究院。在這樣的背景下,劉慶峰產生了創業的想法。
在獲得導師首肯后,一邊攻讀博士學位的劉慶峰一邊拉攏一批中科大校友開始創業。1999年6月,安徽硅谷天音信息科技有限公司成立,半年后,改名科大訊飛。
創業之初,劉慶峰對于科大訊飛的定位是開發面向大眾消費市場的產品。很快,一款名叫“暢言2000”的電腦軟件問世,這是一款針對 PC 的軟件,通過語音既可以有指令的操作,又可以有文本輸入,第一次把手寫輸入的隨意性和語音輸入的快速性無縫整合在一起。
對于這款產品,劉慶峰信心十足,兩三年內將帶給科大訊飛10億甚至100億的營收。但是,暢言2000最終反而讓這家初創僅一年的企業面臨破產危機,最困難時,劉慶峰自己借錢給大家發工資。
在總結暢言2000失敗的時侯,科大訊飛悟出幾點:一是盜版猖獗,科大訊飛正版軟件剛一面世,盜版已經鋪天蓋地;二是因為大部分用戶是老年人,操作電腦的能力很差,時常因為電腦本身的硬件問題呼叫售后服務,這推高了科大訊飛的運營成本;三是因為團隊都是技術出身,缺乏建渠道做市場推廣的營銷經驗;四是PC 已經比較好地解決了人機交互的問題,對語音的需求沒那么迫切。
但是,團隊堅定初心,并對未來達成3個共識:1.人工智能產業未來有100億的空間;2.我們能成為這個領域的No.1;3.我喜歡。
科大訊飛要做中國乃至全球語音產業的龍頭,
團隊及時調整戰略,科大訊飛暫時不適合大眾消費市場,只能轉而攻企業級用戶。
2000年以后,中國電信的168電話信息平臺開始鋪向全國,其原本是人工錄音接聽,很難應付海量和動態的信息,而科大訊飛的語音合成技術,正好可以解決這一問題。這是一個價值上億的訂單,對于科大訊飛來說勢必要拿下。
不過,電信看不上當時還是小團隊的科大訊飛,而是具備整個系統集成和企業綜合實力的華為。于是,科大訊飛只能退而求其次,選擇與華為合作,將技術嵌入到華為的系統平臺上。最后,與電信的合作就這樣間接的達成了。
與華為的合作模式的成功令科大訊飛在市場得到認可,中興和聯想在內的50多個企業也很快成為其合作伙伴,也吸引聯想投資和英特爾在內的三家知名企業相繼入股。投資方在資金、資源和經驗上的助推,將科大訊飛推向了產業化的快車道。終于,在經過5年的虧損后,科大訊飛在2004年首次扭虧為盈,次年語音產品實現銷售收入1.5億元,利稅2500萬元,帶動相關產業10億元以上,推動語音產業進入全面爆發階段。
2007年,科大訊飛完成股份制改造,一年后,2008年5月12日在深圳中小板上市,成為中國在校大學生創業的第一家上市公司,也是國內唯一一家語音產業上市企業。
2、語音合成:英語合成做到了超過普通人說話水平
人工智能是以以深度神經網絡為基礎,加上大數據、云計算后臺的運算平臺,和移動互聯網源源不斷地把各種訓練數據收到后臺。科大訊飛是中國第一個把深度神經網絡用到語音識別領域的公司,并且在 2011年, 在全球首次發布了云平臺,宣告語音、手機的聽寫時代正式到來。在2012 年,在圖像識別領域,深度神經網絡開始異軍突起,接著 2014 年機器翻譯取得突破。
今年,科大訊飛即將給大家看到一個又一個行業的令人欣喜的成果,這些是從算法創新,到應用創新和持續數據迭代的一個結果。
在這個結果中,首先是語音合成技術:讓機器能聽會說,給機器裝上一個人工的嘴巴。
今年,在全球的語音合成大賽暴風雪競賽中,科大訊飛再次獲得全球第一名。今年的國際比賽比的是英語合成,而且是英語的故事級合成,也就是要求系統更加深情并茂,難度更大。但是,在今年一堆的國際的頂尖研究機構和產業界全部參加的前提下(因為 IBM 在今年年初就認為人際交互接口會是 2016 年十大技術突破的前 3 名,所以語音合成也是受到了前所未有的關注),科大訊飛再次在英文領域獲得全球第一名,而且不僅是全球第一,更是全世界唯一把英語合成做到了超過普通人說話水平的技術!
在國際比賽中,5 分是播音員的水平,4 分是普通人的說話水平,而科大訊飛是 4.2 分,第二名只有 3.9 分。也就是說,全世界,讓計算機念小說風格、故事風格的語音合成,只有中國人做的超過了普通人的水平。而且,這已經不是第一年,科大訊飛已經連續 11 年蟬聯了全球語音合成大賽的第一名。去年國際組織比的是印度的印地語,照樣是全球第一,是 3.9 分。 今年的中文,科大訊飛已經做到了 4.5 分。 當前的中文、英文、印地語的第一名都是科大訊飛所代表的中國做出來的,這意味著我們中國用戶享受了全球語音合成最高的成果。
3、語音識別:噪音環境下錯誤率為 2.24%
在語音合成的進展上,我們再看一下語音識別。 在去年 12 月 21 號發布會上,科大訊飛是全球第一次,敢于在幾千人的演講現場同步把語音自動轉成文字,而且現場機器跟人的對比結果表明,機器在轉寫準確率上大大超過了專業速記人員。
在訊飛發布之后,今年 5 月份谷歌開始發布了英文轉寫,國內也有一些單位開始跟風。但是 ,即便到今天為止,能夠任意不用做任何訓練,在不用聯網的單機情況下(為應對保密和網絡的各種不同異常環境),能夠做到超過 90% 的準確率的企業,全行業迄今為止只有科大訊飛一家。
伴隨著語音轉寫,訊飛又發布了萬物互聯時代最重要的人機交互的幾個關鍵的特征:可以在 3 到 5 米,5 到 8 米之外,用于語音跟機器人跟智能家居交流,可以多輪對話上下文可以隨時隨地打斷。通過這些特征,訊飛定義了萬物互聯時代的語音交互標準,并且推出了 AIUI 人工智能的人機交互平臺。該平臺當時以叮咚音響為代表,不光可以聽音樂,還可以控制所有家居。
在交互過程中最重要的是遠場識別、噪音環境下的語音識別,以及在多個人同時講話時,語音識別能不能達到使用。
國際上有一個非常著名的語音識別競賽 Chime,就是在噪音口音和多人情況下進行比賽。這個比賽今年是在谷歌舉行的,科大訊飛在所有 3 項指標中都是全球第一名。而且,我們可以看到這個數據指標網站,6 麥克風,這最難的這個麥克風場合下,準確率已經可以做到 97% 以上。 這不是中文,而是英文的在谷歌做的國際比賽結果:在噪音環境下科大訊飛的錯誤率只有 2.24%。
4、機器翻譯:比賽中打破日本、美國壟斷
在機器翻譯領域,2014 年基于深度神經網絡的這些算法上的創新和突破,科大訊飛的機器翻譯取得了突破性的歷史進展。在 2014 年國際口語翻譯大賽( IWSLT)中, 獲得了全球第一,這是具有歷史意義的。因為以前國際翻譯大賽,漢英翻譯項目都是日本研究機構全球第一,英漢翻譯項目都是美國機構全球第一,2014 年 11 月的這次比賽,終結了這個歷史:科大訊飛英漢和漢英都是全球第一名。
在這基礎上,2015 年 2 月,美國國家標準技術研究院組織的機器翻譯大賽中訊飛繼續是全球第一。今年,科大訊飛又面對國家一帶一路的重大戰略,正式推出面向一帶一路的多語種翻譯。 這一切,我覺得都是真正的在踐行科大訊飛創業之初的理念:我們要實現人類乃至人機信息溝通無障礙。在未來,我們要把世界所有主要語種全部放進去。
5、“認知智能”是未來人工智能的必由之路
人工智能有 3 個層次:計算智能(機器人能計算和存儲)、感知智能(機器的視覺、聽覺可以超過人工)和認知智能(未來的核心)。而以語音和語言為入口的認知計算,是人工智能的必由之路。在過去一年之中,科大訊飛在人工智能最核心的可以說是皇冠上的明珠的認知計算領域,又取得了令全球矚目成果,我們在今年參加國際非常知名的 Winogard 的認知智能的測試,這比賽是要用來替代圖靈測試的,因為今天移動互聯網傳輸到后臺的對話數據越來越多,所以圖靈測試已經越來越容易過關,這就是看機器真正的認知結果。
就在不久前,在 11 月 15 號,又一次傳來喜訊,由美國國家標準技術研究院組織的國際非常知名 KBP 認知大賽中,在對于實體的發現,以及關聯信息的關系的比賽項目中,包括了卡內基梅隆,包括 IBM 這些我們非常尊敬的企業和研究機構都參加了,科大訊飛是全世界第一名。
在這些創新的基礎上,訊飛在跟教育部考試中心合作,在事關國家教育未來的考試閱卷中(保證主觀題的評分要達到公平公正性),機器已經在今年上海的四六級考試,在江蘇、湖南等地的高考和研究生考試中對學生的語文和英語作文判分。機器學習了 500 份專家判分的卷子,就可以對其它幾十萬份卷子進行判分,其綜合效能已經超過人工水平。
6、科大訊飛開放平臺數據進展
科大訊飛在去年發布會上把平臺開放給所有創業者以來,我們可以看到一些令人鼓舞的數據進展。
首先,人工智能云平臺上的總用戶數,今天已經達到8.9億,比去年同期增長48%。8.9 億是什么概念?——過去18個月,累計下載人工智能相關應用的獨立終端數。如果一個手機裝了3個跟訊飛人工智能相關的應用,我們只算一個。過去18個月,累計已經有8.9億不同的終端。
那么第二個更重要的數據是,每天有多少人在用?
一個人用一次叫一人次,去年這個時候每天是10億人次的使用量。今天,已經突破30億人次。4月26號習近平***親臨視察科大訊飛的技術成果,當時他非常高興的看到訊飛每天的數據量是15億人次。短短半年已經到了30億人次,并且我們認為很快會突破百億人次。
再有一個是第三方圍繞訊飛的創業團隊,去年有7萬家,現在已經達到21萬家。
這就是人工智能的產業生態,訊飛希望與所有創業者共同成長、共同創造、共同分享人工智能的偉大未來。
ToC還是ToB?
近日,戰略上全線押寶AI的百度高調喊出“智能語音技術全系列永久性免費”的口號,由此引發了人工智能領域最大規模的軒然大波。A股有著人工智能第一股的科大訊飛首當日直接封死跌停板。
盡管科大訊飛對外澄清稱,人工智能的市場很大,足以容納更多企業千帆競發,科大訊飛不需要“保衛”。但市場似乎沒有那么樂觀:科大訊飛的技術壁壘以及規模壁壘究竟有多高,成為當下市場最為關注的問題。
既然被稱為A股人工智能第一股,并且在很多細分領域與國際巨頭比肩,科大訊飛在智能語音領域的技術實力18年的技術積累,應該非一朝一夕能被超越的。數據顯示,目前科大訊飛已經占到了語音識別市場60%以上的市場份額,語音識別技術在多項比賽中多次蟬聯第一,對標的企業是國際上的谷歌、微軟、亞馬遜這些巨頭,技術上或許壓根沒把BAT放在眼里。
為了加強技術壁壘所帶來的規模效應,科大訊飛也看到了ToC端消費市場的巨大前景,在這點上,科大訊飛是有戰略眼光,也有相應的儲備。
早在2010年,科大訊飛就推出了訊飛語音開放平臺。截至2017年11月,開放平臺累計覆蓋終端數已經突破了15億,日均交互次數達到40億,覆蓋的開發者團隊有46萬。
就在百度DuerOS在全國范圍內向開發者投出橄欖枝后,今年10月24日,科大訊飛又舉辦了有史以來規模最大的首次開發者大會,拿出了10.24億元基金扶持開發者。某種程度上,這是科大訊飛維護自身智能語音生態吸引力的“防護”舉措。既是實質性動作,又表明了一個態度——不會任由BAT切割走開發者的市場和人群。
科大訊飛董事長劉慶峰也感嘆,“目前,科大訊飛構建的技術壁壘依然存在,比如智能語音技術可識別22種方言,由于積累時間較長,在這一能力上,BAT暫時還無法企及,但留給訊飛的窗口期只有三到五年。”
在這場圍剿與“反圍剿”的戰斗中,科大訊飛過去的業務集中在教育、醫療、司法等ToB市場里,接下來如何鞏固這些領域的固有優勢,不被BAT粗暴的免費模式所破,既是科大訊飛當下最重要的挑戰,也是對其智能語音技術壁壘最嚴酷的考驗。
智能語音技術確實存在準入門檻。雖說當前科大訊飛的技術領先性依然存在,但互聯網多年來的競爭事實表明,技術的差異性和差距已經越來越小了。更何況,BAT根本不缺錢,完全能請得起大牛的專家,也有足夠多的資金可以砸向市場,甚至還可以購買成熟的技術或公司。
而且,人工智能技術的成熟度依賴于后天的多應用場景的訓練與學習,在拓展C端應用場景方面,科大訊飛還是有不少要補齊的部分,其中有兩點值得說一下:
一是,BAT每一家手里都有強勢的產品,每一個產品和入口都是智能語音的關鍵應用場景,比如百度的搜索和攜程的訂票訂酒店,騰訊的QQ、微信兩大入口及延伸出來的開放服務平臺,還有當二股東后所能控制的滴滴、摩拜、美團點評、京東等外圍援手,阿里的淘寶、天貓、支付寶、優酷、蝦米音樂等產品矩陣。這些都是BAT碗里的,也是科大訊飛動不了的奶酪。
二是,雖然科大訊飛在智能語音技術上要比BAT更成熟,用戶體驗更好,但這要看是個什么玩法,一旦到了開放平臺和生態的場子里,無論是拼錢、拼資源、拼開發者的號召力和控制力,科大訊飛恐怕都占不到便宜。因為BAT這么多年,最大的勢能就在流量生態和資源整合上。過去可能是站長聯盟、APP聯盟,如今到了智能語音的賽道上,其實玩法大同小異,只需要遷移一下就過來了。
這些都是科大訊飛所面臨的挑戰,也是難以逾越的高墻。
那么問題來了,既然麻煩很大,后果很嚴重,面對BAT扔過來的降維攻擊,科大訊飛究竟如何應對呢?到底該怎么破呢?
其實,不論在任何行業,一家企業通過精耕細作,建立起自己的護城河是首當其沖的任務,也是企業立足之本。
與其在本不占優勢的消費級市場里與BAT血拼,參與燒錢大戰,還不如深耕教育、醫療、司法等TO B行業市場,結合行業應用特征做深做透,在細分領域壘砌起高高的圍墻,建立起抵抗巨頭進攻的堡壘。
科大訊飛只要“綁”好政府、教育、司法等部門,提供垂直化的智能語音解決方案,體現出差異化價值,BAT的免費套路就很難適用,不易被攻破。
在上述這些領域,科大訊飛有先入為主的優勢。科大訊飛發布的2017年上半年財報數據顯示,其營收中有29.65%來自于教育類行業產品,公司中有三分之一的技術投入到了教育產品研發領域,教育相關費用同比增長了21.27%。此外司法、醫療、車載等幾個關鍵領域,也是科大訊飛智能語音技術應用的重要賽道。科大訊飛只要守好“大門”,將護城河越挖越深,BAT的戰火就殃及不到這里,讓科大訊飛可以守好產糧區。
BAT的圍剿,對任何一個行業或者企業來說,都是一次危機,既有危,也有機。網宿科技固守陣地不盲從的策略,或許會給科大訊飛提供一個可借鑒的經驗。
劉慶峰在朋友圈說了一段意味深長的話,“人工智能+時代,不僅是屬于科大訊飛的時代,更是屬于人工智能領域萬千開發者和科學家的新時代。這里空間廣闊,完全容納得下千帆競發的產業生態。”
-
人工智能
+關注
關注
1791文章
47244瀏覽量
238365 -
科大訊飛
+關注
關注
19文章
800瀏覽量
61247
原文標題:人工智能創新平臺,它與BAT齊名
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論