商湯科技作為為人工智能技術(shù)的重要一員,商湯科技徐立絲毫不敢懈怠。專注于計(jì)算機(jī)視覺和深度學(xué)習(xí)原創(chuàng)技術(shù),成為國內(nèi)最大的新銳人工智能公司,他表示我們進(jìn)入了軟件的摩爾定律時(shí)代,軟件性能通過人工智能快速增長,用人工智能改造傳統(tǒng)行業(yè)挖掘藍(lán)海市場。
今日人工智能時(shí)代完全變了,第四次工業(yè)革命尚未真正開始,很多人已開講。“全球進(jìn)入了一種未卜先知時(shí)代,這與抗日劇中喊八年抗戰(zhàn)馬上要開始一樣。”徐立說。
作為人工智能公司商湯科技聯(lián)合創(chuàng)始人兼CEO,徐立感受著創(chuàng)業(yè)的苦與樂,以及時(shí)代的喧囂和嘈雜。一方面,商湯科技專注于計(jì)算機(jī)視覺和深度學(xué)習(xí)原創(chuàng)技術(shù),飛速發(fā)展,自主建立了原創(chuàng)深度學(xué)習(xí)平臺Parrots和深度學(xué)習(xí)超算中心,成為國內(nèi)最大的新銳人工智能公司,估值超過20億美金。
另一方面,各路人馬齊齊殺到這一領(lǐng)域。國內(nèi)外巨頭公司無不分出人馬研發(fā)人工智能,競爭日趨激烈。從2015年開始,只要一個(gè)論壇主題詞中出現(xiàn)人工智能幾個(gè)字,場場爆滿。
在這樣環(huán)境中,近三年人臉識別、自然語言處理和機(jī)器深度學(xué)習(xí)等等人工智能型公司紛紛創(chuàng)立。商湯科技是其中一員。2014年創(chuàng)立,經(jīng)過三年發(fā)展,商湯科技將人臉識別、圖像識別、自動駕駛、人機(jī)交互、醫(yī)療圖像、人工智能芯片等多項(xiàng)人工智能核心技術(shù)實(shí)現(xiàn)應(yīng)用落地。
2017年7月,商湯科技宣布完成4.1億美元B輪融資,創(chuàng)下當(dāng)時(shí)全球人工智能企業(yè)單筆融資紀(jì)錄,同時(shí)也成為全球估值最高的人工智能獨(dú)角獸企業(yè)。
但是,商湯科技徐立絲毫不敢懈怠。新一輪融資后,他希望在包括無人駕駛、智慧醫(yī)療、深度學(xué)習(xí)芯片、增強(qiáng)現(xiàn)實(shí)平臺等方面加大研發(fā)投入以及人才引入,開拓更多技術(shù)應(yīng)用場景,深化人工智能商業(yè)生態(tài),以原創(chuàng)技術(shù)賦能更多行業(yè)。
視頻分析大風(fēng)口
移動互聯(lián)網(wǎng)時(shí)代,每個(gè)人手機(jī)都會拍照很多照片,錄制短視頻。商湯科技聯(lián)合創(chuàng)始人之一楊帆注意到一個(gè)現(xiàn)象,這些照片和視頻二次價(jià)值轉(zhuǎn)化很小,其最重要的價(jià)值體現(xiàn)在拍完、分享那一刻,之后大多數(shù)人很少再次翻閱、利用這些照片。但是,它們占據(jù)了大量的手機(jī)存儲空間。“這是很矛盾的。” 楊帆說。
基于這種洞察,商湯科技為手機(jī)廠商提供了一個(gè)智能相冊解決方案,即利用人臉識別聚類技術(shù),按照不同人像進(jìn)行歸類,實(shí)現(xiàn)“一人一相冊”,輕松解決手機(jī)中成百數(shù)千張照片分類管理的難題。該方案還能找到手機(jī)中照片最多的那個(gè)小孩,從大概率來說,“那是用戶自己的小孩,系統(tǒng)會將該照片推薦給手機(jī)用戶做屏保”,其余照片或者可以存儲到云端,或者利用其它技術(shù)處理,實(shí)現(xiàn)照片的二次價(jià)值轉(zhuǎn)化。
這是一個(gè)并不復(fù)雜的實(shí)際應(yīng)用案例。再往下發(fā)展,隨著AI技術(shù)進(jìn)步,楊帆相信可以從照片和視頻中挖掘更價(jià)值。
商湯科技研發(fā)的智能相冊、美顏和濾鏡功能,有些已應(yīng)用到華為和小米手機(jī)上。借助此類方式,商湯科技的技術(shù)已經(jīng)悄無聲息影響到很多人。
11月2日,最新發(fā)布的OPPO旗艦手機(jī)R11s上,應(yīng)用了商湯科技提供的AI智慧美顏技術(shù)和 “面部識別”人臉解鎖功能。
通俗來講,這類應(yīng)用后面的實(shí)現(xiàn)方式與人臉定位、AI特效增強(qiáng)相關(guān),算法的選擇尤其關(guān)鍵。
技術(shù)落地經(jīng)歷了一個(gè)有意思過程。楊帆最早預(yù)設(shè)各類場景,抽象出106點(diǎn)來。最初從5個(gè)點(diǎn),2個(gè)眼睛、1個(gè)鼻子、2個(gè)嘴角,接著衍生出21個(gè)定位點(diǎn)。接下來是38個(gè)點(diǎn),最后是106個(gè)點(diǎn)位。
理論上來說,點(diǎn)位越多越準(zhǔn)確。操作時(shí)要兼顧人工標(biāo)注數(shù)據(jù)成本,一張106點(diǎn)的標(biāo)注圖,成本要5-10元。從標(biāo)注十萬張照片起步,5個(gè)點(diǎn)位全部標(biāo)出來,訓(xùn)練出一個(gè)5點(diǎn)模型,再進(jìn)化,將21點(diǎn)算法等融合到標(biāo)注工具,然后就可做到更快、更低成本標(biāo)注。
最后,商湯倡導(dǎo)的106點(diǎn)標(biāo)注得到非常廣泛的應(yīng)用,積累到百萬級別數(shù)據(jù)時(shí),可以通過類似方法去以較低成本標(biāo)注240個(gè)點(diǎn)。
類似技術(shù)成熟后,為商湯打開了進(jìn)入短視頻和直播業(yè)務(wù)通路。商湯正在進(jìn)入一個(gè)技術(shù)進(jìn)步帶來數(shù)據(jù)積累,進(jìn)而做到產(chǎn)業(yè)化落地的正向循環(huán)。
商湯想解決計(jì)算機(jī)識物之后,真正把視頻理解發(fā)揮到一個(gè)真實(shí)應(yīng)用場景當(dāng)中。現(xiàn)在,視頻分析能力可以認(rèn)出人的身份,周圍的桌子、凳子和沙發(fā),還有顏色。再進(jìn)一步發(fā)展下去還有很大可能性。
比如,搜索引擎公司現(xiàn)在只是基于文本,如果對于整個(gè)視頻理解能做到文本搜索水平,未來可以成為視頻搜索引擎。當(dāng)然這只是商業(yè)上想象的一部分。
按照徐立和團(tuán)隊(duì)設(shè)想,人工智能對當(dāng)前互聯(lián)網(wǎng)主要的商業(yè)領(lǐng)域電商、搜索和游戲都將產(chǎn)生影響,另外,還外對安防、智能駕駛等等領(lǐng)域賦能,未來前景廣闊。
商業(yè)模式摸索前進(jìn)
作為算法領(lǐng)先的公司,商湯科技在商業(yè)模式上經(jīng)歷過一段摸索階段。
商湯科技屬于第一批研究視覺方面的人工智能團(tuán)隊(duì)。2011年,人工指導(dǎo)智能變成數(shù)據(jù)驅(qū)動智能剛開始的時(shí)候,商湯已經(jīng)投入此方向。2011到2013年間,在CVPR、ICCV和ECCV三大全球頂級計(jì)算機(jī)視覺學(xué)術(shù)會議上,有關(guān)深度學(xué)習(xí)的文章共29篇,其中14篇是來自于商湯團(tuán)隊(duì)。團(tuán)隊(duì)里包括18名教授和150多名博士,創(chuàng)立早期三人中必有一個(gè)博士。軟件領(lǐng)域快速發(fā)展,最尖端人才具有決勝性作用。
在技術(shù)平緩發(fā)展的時(shí)候,競爭比拼的是資本和財(cái)力。在技術(shù)快速進(jìn)步領(lǐng)域,創(chuàng)業(yè)型公司有機(jī)會通過技術(shù)迭代形成競爭壁壘。徐立稱,“我們進(jìn)入了軟件的摩爾定律時(shí)代,軟件性能通過人工智能快速增長,你只要領(lǐng)先帶來的時(shí)間窗口可能是一年,甚至更長,領(lǐng)先18個(gè)月就超出一代,是整體一倍性能。”
2015和2016年世界上最頂級視覺會議上,就論文統(tǒng)計(jì)數(shù)量排名而言,微軟、卡耐基梅隆大學(xué)等排在前面,商湯排在所有亞洲公司前面,領(lǐng)先于谷歌很多名次。
這或許是市場中,商湯科技能找到生存之地的秘訣。但是,論文落地變成商業(yè)上的案例,首先要考慮到有效需求,而且有人愿意給需求付費(fèi)。
商湯科技楊帆舉過一個(gè)極端的例子——
廁所里刷臉取廁紙,可以通過設(shè)置規(guī)定,每次一人不能取太多,防止有人把廁所紙拿走,這是一個(gè)真實(shí)需求。但是,如果要落地,前提是管理方想明白,通過人工智能設(shè)備可以省出足夠多紙錢來。
照著真實(shí)需求去查看,首先關(guān)注到安防領(lǐng)域。安防是目前整個(gè)AI落地最快,也是短期規(guī)模最大、最重要的一個(gè)市場。目前已經(jīng)有攝像頭監(jiān)測很多城市,每天產(chǎn)生海量視頻,從這里面挑出需求的視頻片段來,費(fèi)時(shí)費(fèi)力。
商湯在成都給當(dāng)?shù)靥峁┓窗窍到y(tǒng)。他們發(fā)現(xiàn),把一個(gè)場景做好,真正解決問題,需要把多項(xiàng)技術(shù)整合在一起。比如,民警有小偷照片庫,但是,抓小偷要低成本取證,難度很大。“你不能說這個(gè)人當(dāng)了一次小偷,他一輩子都是小偷,我只要街上看見他,就把他抓起來。”
商湯的方案是通過技術(shù)從海量視頻里識別出小偷,同時(shí)輔助以動作檢測。在一些特定場景,比如人群移動緩慢的地方,技術(shù)會預(yù)判出這里發(fā)生偷竊的可能性更高。這時(shí)可以布置一個(gè)大的遠(yuǎn)景攝像頭,覆蓋幾百米范圍,還有可移動攝像頭,對焦點(diǎn)區(qū)域進(jìn)行覆蓋。
類似的案例,需要很多不同的細(xì)小技術(shù)應(yīng)用和組合。如果移植到金融領(lǐng)域做刷臉支付,應(yīng)用到交通領(lǐng)域查處違章等等,不難看出,人臉識別技術(shù)在細(xì)分行業(yè)中的潛力非常大。
有時(shí)工作多得商湯團(tuán)隊(duì)忙不過來。“首先拿需求,定制化產(chǎn)品做完了之后去賣,銷售人員堅(jiān)持一個(gè)售賣原則,賣標(biāo)準(zhǔn)化的東西。你要就簽,不要就走。”徐立9月底與包括騰訊《深網(wǎng)》在內(nèi)媒體交流時(shí)透露。
整個(gè)行業(yè)的商業(yè)模式建立有些點(diǎn)困擾著徐立,“技術(shù)大眾化,我們一直講智能手機(jī)是人工智能+手機(jī),人工智能+手機(jī)還不如一個(gè)手機(jī)價(jià)錢,人工智能的錢找誰收呢?人工智能加了人臉解鎖,加了50元,這個(gè)錢向誰收?這是行業(yè)困惑。”徐立期待著大眾給技術(shù)買單的那一天。
技術(shù)不能向普通消費(fèi)者收錢,走to B路線成為另一個(gè)選擇。在安防領(lǐng)域,商湯所作所為,一直為大華股份研發(fā)中心中央研究院院長殷俊所關(guān)注。殷俊告訴騰訊《深網(wǎng)》,商湯是大華的合作伙伴,雙方一直保持著接觸。
但是,作為算法領(lǐng)先的公司,商湯需要不斷地升級算法,而算法本身精進(jìn)會不會有天花板?對此見仁見智。
現(xiàn)有安防領(lǐng)域客戶按硬件購買和后期維護(hù)付費(fèi),商湯要深入這一產(chǎn)業(yè),賣硬件和服務(wù),必須增加人員,與大華、海康等傳統(tǒng)安防公司比拼全方位的資本、服務(wù),以及生產(chǎn)乃至供應(yīng)鏈管理。
有些軟件算法驅(qū)動型公司,進(jìn)入安防領(lǐng)域,先期通過OEM代工攝像頭方法彌補(bǔ)短板,這一模式在摸索當(dāng)中。
另外,大華股份已經(jīng)雇用了100多人進(jìn)行數(shù)據(jù)標(biāo)注,自主研究人工智能、深度學(xué)習(xí)等技術(shù)進(jìn)行追趕。就上游數(shù)據(jù)而言,傳統(tǒng)公司有著遍布全國的攝像頭和網(wǎng)絡(luò),獲取原始數(shù)據(jù)更便捷,成本更低。
一名要求匿名的英偉達(dá)人工智能芯片銷售人員則向騰訊《深網(wǎng)》表示,安防領(lǐng)域新型算法創(chuàng)業(yè)型顛覆傳統(tǒng)的安防公司可能性極小,經(jīng)過2015火熱競爭之后,他不認(rèn)為新型公司有機(jī)會顛覆大華和海康,且勝負(fù)已分,本人已經(jīng)將工作重點(diǎn)轉(zhuǎn)向智能駕駛研發(fā)。
實(shí)際上,商湯創(chuàng)立前一段時(shí)間都是不停拿需求,然后做產(chǎn)品,發(fā)現(xiàn)滿足不了市場需求,再迭代。“到2015年9月份,真正在金融場景大規(guī)模試點(diǎn),跟一些銀行、P2P公司簽下千萬級別的合同。”徐立說。接下來,商湯仍然將繼續(xù)拓展安防領(lǐng)域業(yè)務(wù)。
技術(shù)底層扎根做平臺
12月7日,商湯科技宣布與日本本田汽車簽訂長期合作協(xié)議,共同深耕自動駕駛技術(shù),雙方將基于本田的車輛控制技術(shù)系統(tǒng),融合商湯科技的視覺算法和開發(fā)平臺,共同打造適合乘用車場景的L4級自動駕駛方案。此外,本田未來還將與商湯科技在機(jī)器人方面展開合作。
運(yùn)用商湯科技技術(shù),汽車行駛視覺技術(shù)而非高精地圖,能夠覆蓋更廣場景的區(qū)域。即便車輛行駛至無高精度地圖覆蓋的區(qū)域,車輛自動駕駛功能依然可以使用。
以上是商湯涉及的諸多業(yè)務(wù)領(lǐng)域之一。經(jīng)過不斷拓展,商湯科技目前有400多家國內(nèi)外合作伙伴,“做商業(yè)化以來,每個(gè)工作日簽約一個(gè)商業(yè)客戶。”徐立表示。
商湯科技發(fā)現(xiàn)國內(nèi)很多領(lǐng)域有待提升。人力成本過高,中國人口紅利下降,未來機(jī)器代替人工是一個(gè)必然趨勢。而且,國內(nèi)生產(chǎn)效率低下,工業(yè)自動化程度與發(fā)達(dá)國家比起來,效率低很多。最終,利潤空間縮小。很多領(lǐng)域已經(jīng)是紅海一片,如果用人工智能去改造傳統(tǒng)行業(yè),就出現(xiàn)一個(gè)新契機(jī),進(jìn)入藍(lán)海。
徐立喜歡將商湯科技比作賣人工智能的樂高玩具,“針對特定場景,我們搭建一個(gè)樂高的車,賣給行業(yè)甲方,甲方根據(jù)這個(gè)車,直接用,或者改造一下都可以。某種意義上,商湯賣底層人工智能模塊,賦能一些行業(yè)。”
目前,像高通、英偉達(dá)、本田這樣的跨國大公司,京東、華為、小米、OPPO、vivo等處于潮流中的國內(nèi)明星公司,都買了商湯“搭建的車”。
“我們做的事情,就是搭底層平臺。通常最底層平臺,很多人不愿意花大力氣做,比如中國計(jì)算機(jī)干了這么多年,一直沒有自己操作系統(tǒng)。”徐立說。
鑒于當(dāng)前商業(yè)環(huán)境,商湯確立了1+1+X發(fā)展模型。先是技術(shù)上形成產(chǎn)業(yè)核心競爭力,+1是跟產(chǎn)業(yè)結(jié)合, +X是賦能。最終實(shí)現(xiàn)+合作伙伴,形成共生共贏生態(tài)。
2017年,商湯花大力氣招了350個(gè)人左右的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),慢慢減少對外包數(shù)據(jù)標(biāo)注依賴。“一數(shù)據(jù)標(biāo)注是一門技術(shù);二,一些數(shù)據(jù)有安全性要求,脫敏的數(shù)據(jù)做訓(xùn)練使用,安全更可控。”徐立說。
數(shù)據(jù)關(guān)系到競爭速度,速度關(guān)系著創(chuàng)業(yè)型公司生死。就深度學(xué)習(xí)而言,數(shù)據(jù)很重要。數(shù)據(jù)量每增加一個(gè)數(shù)量級,結(jié)束是幾何級增長。十億照片,增長到100個(gè)億,不管對小公司,還是大公司,都是一個(gè)比較難邁過門檻。
徐立希望商湯利用技術(shù)領(lǐng)先時(shí)間窗口,將護(hù)城河挖得更寬更深。這也意味著商湯的前途既可能是星辰大海,也難免各種險(xiǎn)灘暗礁。
評論
查看更多