在人類歷史的車輪中,始終充斥著以「科技」為名的碾壓和推動力。
遠(yuǎn)至1萬年前的新石器時代,為適應(yīng)農(nóng)業(yè)及其他手工業(yè)需求的遠(yuǎn)古人對石質(zhì)工具進(jìn)行打磨加工;近及18世紀(jì)60代開始席卷全球的工業(yè)革命,新能源動力機(jī)器的發(fā)明推動生產(chǎn)力飛躍式發(fā)展和生產(chǎn)關(guān)系大變革,這一點早已被一次又一次地論證過。
幾年前,AlphaGo團(tuán)滅人類圍棋手,將人工智能推向臺前。所有人都在問一個問題,AI究竟是什么。
在我看來言,AI不僅是新一輪生產(chǎn)資料大發(fā)現(xiàn)的過程,更是新一輪生產(chǎn)力釋放和補(bǔ)充。因為在AI時代,數(shù)據(jù)成為新時代的石油工業(yè),規(guī)模甚至?xí)螅厥猓哂袘?zhàn)略性。
而對于一家企業(yè)來說,未來如何創(chuàng)造收入,隨之而來機(jī)會又要多大,這一切都要從更大的畫面上去考慮,而不是從過去的財務(wù)結(jié)果上去找預(yù)期。
有句話說得好,一個公司的命運,既要看自身的努力,更要看歷史的進(jìn)程。
從這個角度上來說,依托于數(shù)字內(nèi)容管理業(yè)務(wù)的開普云,無疑卡住了一個不錯的位置,也讓它有了更大的想象空間。
01 AI時代的“敲門磚”
數(shù)字內(nèi)容管理業(yè)務(wù),是開普云在AI時代的“敲門磚”。
什么是數(shù)字內(nèi)容管理業(yè)務(wù)?簡單來說,是依托于互聯(lián)網(wǎng)內(nèi)容服務(wù)云平臺及統(tǒng)一信息資源庫等相關(guān)產(chǎn)品,幫助政府完成互聯(lián)網(wǎng)數(shù)據(jù)中臺建設(shè)。
以開普云的一體化政務(wù)業(yè)務(wù)為例,過去政府有很多數(shù)據(jù),包括不同政府部門的數(shù)據(jù),也包括文本、圖片、音頻、視頻等多種結(jié)構(gòu)的數(shù)據(jù)。
隨著政務(wù)信息化改革的深入,政府需要一個更強(qiáng)大的數(shù)據(jù)平臺,幫助他們打通各部門的業(yè)務(wù)系統(tǒng),實現(xiàn)不同部門數(shù)據(jù)的統(tǒng)一采集,不同結(jié)構(gòu)數(shù)據(jù)的統(tǒng)一存儲,最終實現(xiàn)后端不同場景下數(shù)據(jù)的統(tǒng)一調(diào)度。
開普云的數(shù)字內(nèi)容管理業(yè)務(wù)的應(yīng)用場景主要有三個:智慧門戶、一體化政務(wù)以及融媒體。從目前來看,公司在三個場景中均有不俗的表現(xiàn)。
在智慧門戶領(lǐng)域,開普云的客戶覆蓋了全國20%左右的省級政府,國務(wù)院組成部門和直屬機(jī)構(gòu)。在政府服務(wù)平臺方面,公司也承擔(dān)了多個政務(wù)服務(wù)平臺的項目建設(shè)。
回過頭看,內(nèi)容管理業(yè)務(wù)對開普云的AI業(yè)務(wù)影響巨大。
一方面,AI技術(shù)的落地應(yīng)用往往會優(yōu)先爆發(fā)在數(shù)據(jù)化程度較高的領(lǐng)域,比如醫(yī)療的數(shù)據(jù)比較少一些,AI滲透的難度會大一些。
原因在于,現(xiàn)在普遍的監(jiān)督算法必須依賴標(biāo)記數(shù)據(jù)。無監(jiān)督算法對數(shù)據(jù)標(biāo)記的要求會小一些,但是技術(shù)還不是很成熟,主要是做聚類和分析。
當(dāng)開普云在不同場景下完成數(shù)據(jù)平臺建設(shè),客戶對AI的需求也逐漸爆發(fā)。
另一方面,通過數(shù)據(jù)平臺產(chǎn)品,開普云能切入不同的場景,而場景則是海量數(shù)據(jù)的入口。
當(dāng)這些數(shù)據(jù)通過AI技術(shù)成為結(jié)構(gòu)化、可利用、可輸出的生產(chǎn)要素,便為開普云積累了一筆最大的財富。這也讓它們有了更大的想象空間。
02 開普云開辟AI新戰(zhàn)場
縱觀過去,每一次技術(shù)革命,都帶來全新的商業(yè)機(jī)會。互聯(lián)網(wǎng)本質(zhì)上解決了效率和鏈接的問題,進(jìn)而出現(xiàn)外賣、社交、打車等新業(yè)態(tài)。
而人工智能的價值主要在于兩點,生產(chǎn)工具的延伸和人工勞動力的替代。前者的例子是淘寶天貓的智能推薦,提高人們獲取商品的效率,而后者的典型則是海底撈的機(jī)器人。
對于人工智能企業(yè)來說,核心并不在技術(shù),而在于場景的選擇。以開普云為例,由于積累的數(shù)據(jù)大多為政府稿件和圖片,因此他們選擇政府內(nèi)容安全的場景切入。
從過去來看,人工智能的應(yīng)用要經(jīng)歷從感知、認(rèn)知到?jīng)Q策的三階段。感知智能只能實現(xiàn)對語音、圖像和人臉的識別,而認(rèn)知智能可以更好地理解語言的含義,實現(xiàn)和人類的交互,以及各種洞察和決策分析。
開普云也正在經(jīng)歷這個過程。
早期,開普云的大數(shù)據(jù)服務(wù)主要以政府網(wǎng)站的內(nèi)容安全為主。其中很重要的一個工作是,敏感詞的識別。
在當(dāng)下信息爆炸時代,每天都在誕生新詞、新的敏感用語。基于對語義的正確理解,快速找到新詞和敏感用語,減少新詞、敏感用語漏報,是內(nèi)容安全監(jiān)測的重要工作。
在提高內(nèi)容安全監(jiān)測的效率上,開普云做了兩件事。
技術(shù)方面,開普云通過平衡語料庫自動構(gòu)建技術(shù),極大地降低了人工標(biāo)注的成本,可以在較短的時間內(nèi)覆蓋較大規(guī)模的文本素材。目前,基于無監(jiān)督方式為主訓(xùn)練的NGram計算,已基本接近人工標(biāo)注的精度,依存關(guān)系計算結(jié)果的可信度達(dá)到80%以上。
在深度學(xué)習(xí)的模型下,數(shù)據(jù)規(guī)模很大程度上會影響機(jī)器學(xué)習(xí)算法的精度。目前,公司平衡語料庫覆蓋了各行各業(yè)出版圖書、電子報紙、主流媒體新聞資訊,達(dá)千億字規(guī)模的文本素材,數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過國內(nèi)其他中文語料庫。
大數(shù)據(jù)服務(wù)具有規(guī)模效應(yīng)。即客戶越多,你收到數(shù)據(jù)反饋越多,大數(shù)據(jù)產(chǎn)品精準(zhǔn)度就越高,繼而被更多客戶選擇,最終形成馬太效應(yīng)。
在政務(wù)大數(shù)據(jù)監(jiān)測領(lǐng)域,這一趨勢已經(jīng)極為明顯。截至目前,開普云大數(shù)據(jù)服務(wù)的客戶覆蓋了65%的省政府以及40%的地級政府,在細(xì)分領(lǐng)域占據(jù)絕對優(yōu)勢。
作為大數(shù)據(jù)監(jiān)測領(lǐng)域頭部平臺,隨著客戶需求的復(fù)雜化,開普云的大數(shù)據(jù)服務(wù)也有計劃從感知領(lǐng)域向更深度的認(rèn)知領(lǐng)域延伸,即從敏感詞識別過渡至輿情監(jiān)測。
眾所周知,在識別領(lǐng)域,文本的識別處理難度最高。原因是文字、語言涉及語義理解,主觀色彩更重,因此更為復(fù)雜。
開普云的做法是,通過人工智能深度學(xué)習(xí)的方式,強(qiáng)化文字識別的準(zhǔn)確性。
技術(shù)能力的提升,進(jìn)一步拓展了開普云的應(yīng)用場景。比如,當(dāng)用戶搜索內(nèi)容時,開普云通過人工智能技術(shù),極大加強(qiáng)搜索結(jié)果的準(zhǔn)確性。
此外,大數(shù)據(jù)服務(wù)可以從網(wǎng)站內(nèi)容的監(jiān)控擴(kuò)大至全網(wǎng)的輿情監(jiān)控,比如當(dāng)一個政策發(fā)布后,網(wǎng)上的正面評論有多少,負(fù)面評論有多少,評論中出現(xiàn)最多的關(guān)鍵詞又有哪些。
基于這些反饋數(shù)據(jù),可以為政府的決策提供參考,從而幫助其建立健全的輿情收集和回應(yīng)機(jī)制。
這也代表了人工智能的一個重要發(fā)展趨勢,即隨著數(shù)據(jù)量的增長和業(yè)務(wù)場景復(fù)雜度的提升,AI應(yīng)用勢必要從智能識別走向更高階的智能輔助決策。
03 AI再進(jìn)化,大數(shù)據(jù)服務(wù)從智能識別到智能決策
這種趨勢的鋒芒正在開普云身上閃現(xiàn)。
國家知識產(chǎn)權(quán)局項目正是其從智能識別到智能決策的重要體現(xiàn)。
要知道,國家知識產(chǎn)權(quán)局是文獻(xiàn)內(nèi)容很多的政府部門。原因是按規(guī)定在專利申請過程中,申請人需要提交一系列的申請文件,如請求書、說明書、摘要和權(quán)利要求書等,再由專利審查員去看申請的內(nèi)容是否滿足要求。
但隨著專利申報數(shù)量的增加,國家知識產(chǎn)權(quán)局每年能收到幾百萬篇申請,如何更高效地完成篩選工作變成一個棘手的問題。開普云大數(shù)據(jù)服務(wù)的價值就凸顯出來了。
而開普云提供的解決方案是,搜集歷史上所有專利申報成功的稿件,通過人工智能識別網(wǎng)絡(luò)的算法把關(guān)鍵特征進(jìn)行提取,再將新的文獻(xiàn)與關(guān)鍵特征進(jìn)行匹配,最終得出一份創(chuàng)新性比例的參考數(shù)據(jù)。憑借這個算法,使得客戶的審查效率大大提高。
事實上,這種類似于智能決策的業(yè)務(wù),在各個細(xì)分領(lǐng)域的應(yīng)用日益頻繁。比如在醫(yī)學(xué)影像領(lǐng)域,利用人工智能系統(tǒng)輔助閱片。
而隨著人工智能從感知走向認(rèn)知,要解決的業(yè)務(wù)問題從單個業(yè)務(wù)場景、單點問題,向業(yè)務(wù)全流程演進(jìn),行業(yè)know-how的復(fù)雜度和壁壘變得更高,給技術(shù)驅(qū)動的人工智能服務(wù)商帶來更大的商業(yè)機(jī)會。
一方面,深入場景服務(wù)需要極強(qiáng)的業(yè)務(wù)理解做支撐,行業(yè)準(zhǔn)入門檻大大提高。另一方面,人工智能與行業(yè)深度融合后重塑業(yè)務(wù)流程和產(chǎn)業(yè)鏈,形成巨大的商業(yè)機(jī)會,比如基于計算機(jī)視覺的智能貨柜,相比傳統(tǒng)機(jī)械式無人售貨機(jī)成本下降50%以上。
在AI時代全面到來前,找到落地場景的開普云,無疑已經(jīng)占據(jù)了競爭優(yōu)勢的制高點。
責(zé)任編輯:Ct
評論
查看更多