數據世界是四維的:通過感知獲得一維數據,來觀測真實世界;第二維,通過人工智能對感知數據進行特征提取,真實地反映世界;第三維,隨著空間數據的融合,構建空間矩陣,構建與真實場景業務有匹配的數據場景化;第四維,則是全面計算的過程,通過時空數據的維度來構建時空矩陣,充分描述和表達真實世界。
峰會邀請到了業內極具代表性的14位業內知名專家,世界頂尖人工智能科學家、芯片創業大牛、產業巨頭首席技術高管、明星投資人齊聚,為行業資深從業者們分享前瞻的技術研究與商業模式方法論。
在大會上午場,大華股份研發中心副總裁、先進技術研究院院長殷俊以《AI構建數字世界的基礎》為主題發表精彩演講。
在殷俊看來,數據世界是四維的:通過感知獲得一維數據,來觀測真實世界;第二維,通過人工智能對感知數據進行特征提取,真實地反映世界;第三維,隨著空間數據的融合,構建空間矩陣,構建與真實場景業務有匹配的數據場景化;第四維,則是全面計算的過程,通過時空數據的維度來構建時空矩陣,充分描述和表達真實世界。
他表示,在二維世界里面,人臉、語音識別或者很多檢測識別真正構筑了二維特征數據的空間,數據的準確率是最高要求。因為只有構建精準的二維數據世界,才能準確表達世界上的萬世萬物。對行人的特征描述,則是典型的應用三維數據來形成更精準的定位。四維空間內,系統可以加入時域的分析,做更多預測、決策和評估的工作。
算力方面,殷俊認為,數據在不斷升遷,算力增加是必然的,往后更需要大算力芯片。而大算力的芯片除了感知之外,還可以在邊緣側提取特征和空間分析;到了中心側,能夠完成二維、三維、四維數據的分析。
同時他也強調,盡管隨著數據遷移,數據大幅度濃縮,從單點來看要求下降,但四維數據要求的路數和要獲得的感知數據更多,網絡成本反而增加。到越高維,網絡代價越高。所以,需要根據業務綜合部署,考量網絡和計算的分布,看到底如何形成最佳的計算網絡。
以下是殷俊的大會現場演講內容,雷鋒網做了不改變原意的整理及編輯:
大家好,非常榮幸今天能夠代表大華為大家分享我們對AI的認識以及對AI的定位。
首先我提一個觀點:AI是構建數字世界的基礎,那什么是數字世界,以及為什么數據會成為數字世界的必要條件?
首先我們來看一下AI做了什么事情。
其實我們正在構筑一個數字世界,用數字化世界描述真實世界。實際上數字世界和真實世界有很大差異,真實世界中物質由很多元素構成,數據世界數據是唯一的元素,只有數據才能構建我們的數字世界。
我們的數據世界如何構建?在大華看來,我們構建了四維的數字世界。首先,我們通過感知獲得一維感知數據,來觀測真實世界發生了什么事情。
第二維,通過人工智能對感知數據進行特征提取,真實地反映真實世界到底是什么東西,比如是一個人、一個人臉、一輛車。
在第三維世界,隨著空間數據的融合,我們構建空間矩陣,構建與真實場景業務有匹配的數據場景化。
第四維,我們認為是一個全面計算的過程,通過時空數據的維度來構建時空矩陣,充分描述和表達真實世界到底發生什么事情、出現什么行為、出現什么事件。
這個過程中,我們用感知和物聯網技術構建一維數據,用人工智能構建第二維、第三維、第四維數據,而且不同維度都會進行數據檢索。隨著數據維度增多,數據的價值也會快速提升。以往我們看一個小時的數據,一維世界可能會消耗多達幾個G的存儲空間,到四維數據可以通過簡單描述告訴觀察者這段時間發生什么事情、觀測對象是什么,所以數據是高度濃縮的。這個過程中,我們消耗了大量計算能力。每一維數據升遷需要耗費很大計算力,這是AI真正幫助我們構建的數字世界。
我們認為在二維世界里面,人臉、語音識別或者很多檢測識別真正構筑了二維特征數據的空間。在這里,我們認為數據的準確率是最高要求,因為只有構建精準的二維數據世界,才能準確表達世界上的萬世萬物。我們大華在前幾年一直把每項指標做到最高的精度,以交通為例,在車輛抓拍、車輛識別、車型車系方面提升精度,在出口都會大幅度運用優秀的特征,對車輛有完整的描述。
同時,我們會把真實商用化的算法做評測,確立所有的算法在業內的領先性。同時,我們在人臉識別方面,去年也持續在提升,今年在NIST全球綜合排名第五。同時,現實生活中有很多跨年齡的問題,我們可以做到國內第一。在整個評測過程中,我們是全球算法速度第二快的的公司,這也意味著這一套算法我們直接可以商用,這個是我們覺得在整個人臉進度中最重要的環節。
我們還在目標檢測、跟蹤、識別、場景分析方面在構建二維、三維的數據能力。我們年初在market-1501測試集上準確率達到了96.7%的水平,這種性能提升真正幫助我們刻畫真實的數字世界。
所有人工智能都圍繞業務場景,正在加速業務場景的擴展,人工智能不僅僅是人臉和車輛等物體,而是能真實的表現真實世界,包括我們和零售做商品識別、貨架空置率識別,來提升對商品的認知。
在能源方面,大華有幾百種檢測手段,原來一個人爬山涉水去觀測每條線的輸油管道、燃氣線的安全事故,現在我們可以通過智能手段來快速檢測,實時預警。
還有動物的檢測,比如在養豬上的應用,來做豬的計數,確定豬有沒有丟失等等。
機場是比較封閉的,我們識別飛機下降到入位、移位以及停靠過程中廊橋的狀態,安全車輛與飛機匹配的狀態,通過自動化解決航站人工的痛點。
在社區里面,高空拋物是痛苦的事情,我們會做這個識別,精準識別誰家把東西拋出來,提升安全。
人工智能不只是處理圖像問題,還要處理很多感知數據的問題。舉個例子,這是普通的煙感,傳統煙感的誤報率會很高,比如受到水氣、蚊蟲的影響,還會受到煙和PM2.5的影響,都會影響它的準確率。我們通過人工智能的手段去分析它采集到的數據。真正落地之后,我們發現可以把誤報降低90%以上,實現精準的報警。
我們把人工智能利用在編解碼上,像H265、H266,我們通過AI賦能,可以把碼流壓低80%,用20%的帶寬(200多kb帶寬)可以傳輸原先需要4M編碼的性能。H266的研究中,我們發現同樣可以降低70%以上的碼流,這都是人工智能帶來的數字化改造。我們認為未來有更多的利用場景需要我們擴展,而且我們也在積極拓展各個行業的應用。
人工智能離不開訓練中心,實際上我們的工程師團隊也是希望我們的訓練中心能夠實現各個行業的愿望,他們把人工智能平臺取名于巨靈,源于阿拉丁神燈的燈神,希望可以達成我們的各種愿望。我們在想如何加速產業化落地,過往三年,大華建成了三地三中心的算力平臺,算力提升了20倍,每天在線任務數提升了40倍以上,滿足我們對行業場景的覆蓋和定制化,滿足場景需求。
在這里我們會想一個問題,是不是算力越大,不斷增加計算的算力可以幫助我們增加很多。我們認為算力增加是必然的,更重要的是中心除了算力訓練和算法之外還有很多東西要做,比如現在有這么多芯片,算力芯片層出不窮,我們要做芯片適配,有很多應用程序,需要做應用場景的適配,這將需要很大的人力物力和時間解決這個問題,所以我們在人工智能平臺里面把芯片面向業務的集成部署作為我們的一部分。同時我們想這樣夠不夠?其實對于工程化是不夠的,因為作為產業化和商業化的公司,我們希望提供給客戶的每個算法都是可靠、高質量的,能夠達到高性能要求的。所以,在我們的人工智能平臺里面加入了自動化測試模塊,每一個發布的算法經過這個平臺發布之后,都經過自動化測試導出結果,能夠快速告訴你這個算法版本的性能和質量是否滿足要求,從而提供給最終用戶高質量的性能產品。
那么如何在三維空間空間進行應用呢?我們在二維空間做過交通業務,比如布一個電子相機分析紅綠燈的狀態,通過流量分析流量狀態,通過結構化數據分析路面的車和物。但是我們發現每部分都是斷層,都是單層看問題,所以我們構建了空間的路網,構建了整個道路的全要素,這時候就可以做更多,因為可以從路網分析道路堵塞情況、跨區域紅綠燈情況,因此可以做全路面擁堵測試定位、全路面信號燈配適,自學對路網進行調整,以此達到最優的通行效果。這是在三維空間進行人工智能分析給我們帶來的最大的優勢。
關于人和人臉的識別,早期簡單的特征識別是不夠的,因為我們發現有時候人不會對著你走,有時候側著走,有時候背著走,那怎么辦?在第二代描述人的特征向量的時候,我們用了特征融合,人臉、人體融合的一體化特征模型。但是這樣還不夠,因為我們會碰到很多奇怪的問題,比如一個人今天走路,明天騎著電動車,今天是從可見光上面走過,到晚上可能是紅外光拍到的熱力成像,那怎么辦?我們做第三代人員特征描述的時候,引入靜態特征和動態特征融合的模型,通過人臉、人體、行走姿態、步態和標準行為動作的分析,構建人的描述的特征,這也是通過三維數據的描述來形成更精準的定位,能夠描述清楚這個人是誰。
到四維空間更有意思,剛才講三維空間交通做了很多事情,到四維空間我們有很多時間參數,我們可以看到過往一年、一個月、一周、每天的交通態勢。結合我們時域的分析,我們可以看到時間維度上各個因素對交通的影響,比如刮風下雨、節假日,比如今天是“雙11”或者今天有什么活動,對道路可能有影響,交通因素中對我們最大的影響是我們可以做預測和決策。在軌道交通方面,我們可以對紅綠燈進行優化,可以對路面基于活動的情況、基于每天的狀態做道路面的優化,還可以對未來城市道路優化產生價值,可以指導城市道路如何優化,比如哪條十字路口非常擁堵,是不是要建高架,這是通過大數據分析可以得到的一些參考性建議。所以,到第四維數據的時候可以做更多預測、決策和評估的工作。
同時,我們認為數據在不斷升遷,計算力是非常之大的,因為到后面需要大量計算來滿足計算的要求和數據分析的要求。幸運的是,我們現在很多芯片出來了,有很多大算力的芯片,除了感知之外我們還可以提取特征。在邊緣側,既能提特征,又能做空間分析。到了中心側,我們可以做二維、三維、四維數據的分析,這時候我們可以做更多事情,因為我們有了更大的算力。
實際上我們還是得從業務出發,在大量業務上要分析清楚到底用二維數據還是三維數據來做業務閉環,所以要考慮網絡部署。隨著數據維度遷移,數據是大幅度濃縮的,從單點來看對網絡的要求下降,但是到四維數據,要求的路數和要獲得的感知數據更多,所以網絡成本反過來是增加的。維度越高,網絡代價越高。所以,我們會根據業務來綜合部署,考量網絡和計算的分布,看到底如何形成最佳的計算網。我們認為未來每個系統都是一張全網計算的能力。
要建設這樣一張網就夠了嗎?從我們的時間來講,還是不夠。為什么?因為我們的用戶持續會發生系統升級、系統擴容、系統變更,這時候要求更多的是在網絡建設的時候要彈性適配、有靈活性,要適配未來業務需求的動力。我們在擴容的時候,我們增加產品是線性擴容,對當前的全網計算有了新的挑戰和要求。
在人工智能行業有很多優秀的合作伙伴,對大華來說,我們希望以開放的心態和各位合作伙伴一起應用我們的業務場景,我們提供人工智能提供大華的優質算法,希望跟合作伙伴互補,同時在智能端、算法倉庫也希望在算法上和行業合作伙伴互補,形成行業的應用場景的競爭力,真正實現構筑數據世界的真實性的能力。
剛剛介紹很多能力方面的優勢,但實際上最終是由業務牽引整個數字世界,數字世界的價值閉環來自業務牽引。在交通、高鐵、機場等各個方面,要能幫助交通便利的出行;在秩序方面做很多違章類的檢測,本身是要提升城市管理運營的效率;環境方面我們做了煤氣、水電的檢測。雖然做到數字化解決這些問題,但是回到本質問題,還是要解決客戶的問題,解決為生態建設服務的能力,最終數據要形成一個價值閉環。所以我們一直強調,業務驅動通過數字化建設、數字世界搭建回歸到真實世界,通過數字世界改造幫助真實世界提升整體的運營效率。
在制造業、物流和零售有同樣的問題,在制造業通過智能化改造面向中國制造2025、工業4.0升級,通過自動化報表的產生提升工廠和工人運營效率。物流方面,通過人車場貨的匹配提供包裹的可追溯,物流車輛可以快速匹配。零售方面通過管理在線、消費在線、商品在線、服務在線提升商場運營效率,提升客戶滿意度和貨、場的匹配能力,這都是通過業務實踐用數字世界服務真實世界。
責任編輯:ct
評論
查看更多