· 是否真的會帶來下一場技術變革,將會帶來什么機會?
· 深度神經網絡是實現AI的終極方式嗎?
帶著這一系列問題,下面這篇文章進行了探討,AI世代進行摘編整理,希望讀者有所收獲。
一、前言
· AI 到底是什么?為什么會被人們再次廣泛的提及?
·AI 真的會帶來下一場變革嗎?如果是,那么機會在哪里?
·深度神經網絡是實現 AI 的終極方式嗎?
·AI 將會以什么樣的形式出現?
·如何在這樣一個國家、這樣一家公司里深度的參與其中?
二、AI / AGI 是一種世界知識的組織形式
·技術壁壘創造商業價值
·從務虛到務實的轉變
·AI 是下一代搜索引擎的核心
·機會 = 技術更迭/升級 & 場景創新
·關聯是商業價值,在大數據中找關聯,人工智能是手段
三、融合 + 開放會成為技術壁壘
·自定制
·整合需要實力和想象力
·探索與跟隨
·開放的準則
四、打造護城河的第一步:自動化構建觀
·集成交付流程與技術架構設計
·目前,只能將 AI 當成工具
·未來,最好不要讓 AI 形成閉環
·檢索與回憶
五、打造護城河的第二步:合理規劃輸入輸出
六、打造護城河的第三步:重新思考平臺門檻及黏性
·門檻、黏性與開放的能力
·打造 AI 平臺
·pepper
七、打造護城河的第四步:萬物互聯與標準化傳感器
八、打造護城河的第五步:協同設計與合作
·AI 提高人類的整體協作效率
·企業用戶實現業務目標的主要障礙
·數據量大
·在共有大數據上協同工作
·連貫性計算模式
九、打造護城河的第六步:打造可視化服務
·可視化的重要性
·慎重設計視覺交互模式
十、小結
人工智能 被再次熱烈討論的引爆點似乎是自動駕駛汽車,這是筆者的切身感受。各大主流汽車廠商相繼給出各自相關產品投入使用的時間點,甚至很多對汽車行業不甚了解的互聯網公司也積極參與其中。
自動駕駛以及高級輔助駕駛技術 是多個科研方向的融合點,存在不止一條的技術路徑。這一次,人們想通過深度學習的手段,讓車具有人工智能。這種端到端的理想狀態看似讓問題變得簡單,但是由于科學家尚且不能夠完全掌握黑箱內部的具體情況,更無法得知黑箱與人腦到底有哪些異同,造成這件事情不可控。
此時,筆者感到問題重重。治學要嚴謹,落地更要有正確的 方法論 和 產品觀 。但從根本上講,也許對于 AI ,有幾個問題需要重新思考:
AI 到底是什么?為什么會被人們再次廣泛的提及?
AI 真的會帶來下一場變革嗎?如果是,那么機會在哪里?
深度神經網絡是實現 AI 的終極方式嗎?
AI 將會以什么樣的形式出現?
如何在這樣一個國家、這樣一家公司里深度的參與其中?
觀點
·AI / AGI 是一種世界知識的組織形式
技術壁壘創造商業價值
關于 人工智能 最著名的描述是——圖靈測試:
一個人在不接觸對方的情況下,通過一些特殊的方式和對方進行一系列的問答。如果在相當長的時間內,他無法根據這些問題判斷對方是人還是計算機,那么就可以認為這個計算機是智能的。
人工智能可以應用到很多領域,比如 AI + 芯片、 AI + 共享經濟、 AI + 光學投影 、 AI + 知識型數據 + 語音技術 /+ 情感計算等等。
從務虛到務實的轉變
比起上面那些抽象的概念,更重要的是 如何有效的參與其中,創造真正的商業價值。比如,研發自動駕駛汽車這件事,筆者從起初關注怎么做,到思考為什么做,現在的想法卻是,“我并不需要一個可以自己跑的車,我需要的是在此過程中,逐漸打造起自己的護城河,繼而創造商業價值”。
筆者認為,在這個領域里,盡管切入的時間點有先有后,但并不存在永遠的跟隨者 或者 彎道超車這件事。在一個可以看見頂的市場里,做跟隨者比做探索者輕松(比如通信解決方案行業的華為和愛立信) ;但在一個未知領域,做跟隨者的意義卻不大,每個人、每家公司都應該有他自己的 AI 觀,尋找那些快速開合的窗口,打造自己的核心壁壘是關鍵。
AI 是下一代搜索引擎的核心
提到搜索引擎就不得不提谷歌和百度。
百度的無人車其實早已上路,實現方式與人工智能相去甚遠。但在去年十二月成立了自動駕駛事業部,今年九月更是成立了 L3 事業部,兩者互為掎角之勢,打算將 AI 全面的應用到自動駕駛汽車以及 ADAS 產品上。百度之所以投入如此巨大,也許是因為 AI 可以說是下一代搜索引擎的核心,后面會詳細闡述這個觀點。
百度無人車
機會 = 技術更迭/升級 & 場景創新
機會出現在兩種情況下,一種是技術的自然更迭與升級,一種是使用場景的創新。比如 pc 互聯網時代的搜索引擎,比如移動互聯網時代的 smart phone 。
一次搜索算法的升級奠定了谷歌十幾二十年的霸主地位;一次以觸控為交互方式的場景創新與上下游整合讓蘋果攫取了smart phone 市場的絕大部分利潤,更是給長三角等地區帶來了眾多產業紅利。
關聯是商業價值 ,在大數據中找關聯,人工智能是手段
移動互聯網加速了大數據時代的到來,模擬信號似乎一下子從人們的生活中消失,越來越多的活動使用數字方式表達。數據量劇增;速度、種類和不確定性也在增長;大部分的數據(比如圖像、視頻、自然語言和符號)都是非格式化的。
如果有一種計算模型可以處理和理解它們,在這些雜亂無章的數據中找到彼此之間的聯系,企業/創業者就可以在這個計算模型的基礎上,提高生產效率,提升企業運作模式,甚至做感知、預測、推理或者思考方面的場景創新;也許機會就來自這里。
直觀上講,可以擁有并且提供這種計算模型的公司要有一定的數據量以及一套設計完善的開放平臺解決方案。下面,筆者將要就此進行詳細論述。
數據量重要但不是瓶頸,瓶頸是融合/整合的能力。百度和阿里巴巴做了同樣的一件事,百度的 ADAS 和自動駕駛汽車、阿里云車機單位時間內會產生幾 T 的數據,包括語音、操作等各方面的用戶行為統計,此數據上報到云端,將會成為理解用戶、訓練網絡最重要的數據渠道。
現在考慮這樣一個問題:在人工智能領域,小公司相比大公司有哪些優劣點?筆者認為,就構建 AI 平臺,制定標準規范而言,小公司沒有任何優勢,但是一旦平臺搭建完畢,基于此平臺的場景創新,小公司就有優勢了,因為,就算公司分大小,但是創意并無大小之分。
這里,筆者是以數據量的大小來區分公司大小的。大公司擁有更多的用戶數據,但是數據量越大,邊際效益越減小。因此,創業公司只需要獲取到夠用的數據資源就可以了,至于數據規模的差異并不會帶來實質性的差距,筆者正是基于此點認為數據量不是最關鍵的,關鍵是創意以及計算資源。
· 融合 + 開放會成為技術壁壘
自定制
假如有這樣一種架構,企業/創業者可以自由選擇他們的輸入組合,比如傳感器數據、圖像、視頻、自然語言等等,經過某個或某幾個計算模型的處理,輸出了標準格式的知識。企業/創業者因此無需再考慮如何理解未知信號的內在結構和聯系,直接就可進入應用場景方面的創新。這種融合 + 開放的能力自然就會成為技術壁壘。
打造多源融合能力,重要且難。具體有多難,之前筆者在自動駕駛的文章中詳細的介紹了一種多源傳感器數據融合的方法,由此可見一斑。
整合需要實力和想象力
從更高的層次看,還有一個關鍵詞是整合,整合需要想象力和實力:
蘋果公司利用電容式觸摸屏、LCD、Camera、陀螺儀等各類傳感器,打造了一個以觸摸為主要交互方式的使用場景。這些硬件沒有一個是它自己生產的,但是它的工程師卻可以深入的與各個硬件廠商溝通和指導。筆者第一次拿到 iPhone4 的時候,內心是震撼的,感覺它是個藝術品,顛覆了我以往對手機的認識,滑動起來如此的自然、舒服。(那時整個部門只有部門經理有一部,他非常大方的把手機留給我說,“你很有極客范兒,那么現在你幫我破解這個手機,把log抓出來,我要知道它為什么好”,然后連根數據線都沒給我就轉身走了。當然,現在這成了一個笑話)那時,我意識到,好的產品就是即使你使用同一家供應商,同樣的硬件、模組,都達不到它的效果。這種整合實力,不但震撼用戶,更讓競爭對手連模仿都不知如何入手。這背后就是筆者提到的想象力和實力。
創造與模仿
在 AI 時代,無論是探索者還是追隨者 創造與模仿 都將變得更加艱難,尤其是追隨者:現在,尚且可以拆解競品硬件、可以分析對手釋出的軟件接口、甚至可以使用高速攝像機反向推斷算法,將來,面對的是一個黑盒,輸入的是不知從何而來的數據,輸出的是經過了上億次非線性運算的數據,追隨者 將不得不徹底忘記逆向工程(我指的是一系列的技術/非技術的手段)。
開放的準則
筆者在設計 SDK/API 的工作中總結并堅守一個準則:對外提供的是 N 個1,要做到克制,控制好接口粒度,讓用戶自己創造 1+1 》 2 的效果。這很考驗研發人員的設計能力和眼光,更可以彰顯一個平臺的開放能力。
融合與開放看似左右手互搏,實則互為表里。要成為這樣的人:既有整合、融合的架構觀,又有開放、克制的遠見。
筆者認為 :好產品 = 核心技術 + 集成交付解決方案 ,這兩個方面會形成一道競爭對手無法輕易模仿、跨越的“護城河”。下面,筆者將要詳細分析如何做到這兩點。
· 打造護城河的第一步:自動化構建觀
集成交付流程與技術架構設計
如何深度參與其中,實現個人價值?除了上面提到的架構觀等方面,還應該有真誠溝通,發現需求的能力。這是筆者從早期工作中總結到的。當問出:“我能為你做些什么”的時候,總是可以發現真實的需求。集成交付流程與技術架構本就該基于真實需求合理設計。
舉個例子,比如對外提供計算模塊時,有些人把能想到的功能,統統實現并封裝成接口提供給用戶,至于用戶如何在繁雜的技術文檔中找到自己需要的功能以及后續的技術支持問題卻并未考慮,甚至有些功能要靠用戶在實際使用中慢慢體會,看似為用戶做了一切,實則增添了不必要的麻煩。這就是我在上面說到的克制這個詞的一種解釋。
筆者是通過與客戶溝通,找到需求點,重新設計交付流程及軟件架構解決這個問題的。在與用戶的溝通中,筆者發現:①客戶需要高度定制的服務;②客戶會因為交付軟件包的大小舍棄現有方案轉而選擇競品(早期,受限于智能機存儲能力,軟件大小是必須要考慮的問題。)。
于是,筆者將整體交付模式設計成:用戶只需要在一個頁面上做選擇(一些用戶會選擇功能A、功能B,而另一些用戶會選擇功能B、功能C等等),當用戶完成自定制后,自動構建工具會在后臺抓取相應模塊代碼,動態封裝軟件包,交付給用戶。如此交付的軟件,不同需求的用戶得到高度自定制的包。整個流程全自動化,無人為參與,保證了產品質量。
在我所設想的 AI 解決方案中,對外集成交付 AI 計算能力這一場景上,也有類似的設計:那時,自動構建工具抓取的就是相應的計算模型,創業者基于此就可以通過筆者上面提到的那個簡潔的自定制界面接入不同的計算模型,這更具挑戰!
筆者認為,在 AI 時代,高度自動化是應該被最先考慮的事情。以往要達到這個目的,要在設計第一個接口,寫第一行代碼的時候,充分的考慮各種沖突與耦合問題。在 AI 時代,這些問題或被放大或發生變化,甚至過去那些在系統研發中積累的經驗變得不再奏效:如何處理計算模型間的融合?如何處理邊界問題?這些都是工業界和學術界需要解決的問題。
目前,只能將 AI 當成工具;
未來,最好不要讓 AI 形成閉環
近鄉情怯,是一種很有意思的心理活動。隨著人工智能被一次次的提起,隨著技術手段的推陳出新,人工智能的輪廓似乎越來越清晰,筆者有時候在想,一旦有一天它突破了存儲限制,學會了在網絡間移動,那就太可怕了。正如概述中所說的,深度神經網絡讓這件事變得更加不可控。
如果人工智能是目的,如今深度學習就是手段,是一種上面提到的計算模型。這個實現手段其實尚未定型,甚至可以說,在 2017 年它會劇烈變化,這個變化趨勢,在第二章會仔細探討。
所以,筆者想要這樣一種人工智能,它既是威力巨大的工具,又是知識的組織形式,它讓看似無關的信號間自動關聯,它顛覆了以往的數據存儲形式,它是我在之前文章中提到的那個互聯網大腦,2017 年這個大腦,不管它是深度神經網絡還是樹還是什么,都將迎來劇烈的變化。如果順利的話,也許它會形成記憶,創造出新的知識,如果有一天它進化成世界知識的組織形式,它就是下一代搜索引擎的核心,AGI 便不是夢想。
檢索與回憶
那么,再大膽假設下。聯想 大腦在處理不同任務時,總是不同的區域活躍 這一特性。這種世界知識組織體系應該是由無數個小模型組成的,小模型內部通過權值共享等軟件技術或者硬件技術高度連接,模型間弱連接,整體形成一個復雜的拓撲結構。此時,筆者上面所描述的自動構建工具就會進化成一個高性能的區塊檢索工具,一個搜索引擎。快速抓取計算模型,動態隔離、封裝給用戶。就好像是一個人在回憶自己已掌握的一項技能一樣。
· 打造護城河的第二步:合理規劃輸入輸出
一個系統的輸入輸出直接影響到它的易用性以及后續的可擴展性等重要屬性,這個問題需要具體問題具體分析。
· 打造護城河的第三步:重新思考平臺門檻及黏性
門檻、粘性與開放能力
筆者從 08 年開始從事軟件研發,經歷了幾個平臺,一個切身體驗是,越是開發門檻低的平臺,越能吸引更多的開發者,開發者多了,平臺自然繁榮,這是一個互惠互利的模式。看似簡單其實要做到它需要制定詳細的技術路線,和一整套的解決方案。
比如,谷歌的 Android 平臺。當年智能機興起,筆者迅速從 Qt 轉到 Android ,連編程語言都從 C++ 切換到了Java,期間卻并沒有經歷過多的痛苦,這個平臺讓 App 開發從少數人的游戲變成一群人的狂歡。如今 Android 已經渡過了它的快速成長期,筆者在離開這個平臺的時候卻有很多不舍,比如語言、工具用的熟;測試機容易獲得;系統代碼開源,這些年的共同成長,離開就是自廢武功等等。如果不是經過仔細思考,認為 AI 時代,操作系統太重的話,真是無法輕易離開。
—— 這些都是在打造 AI 平臺 時值得思考和借鑒的問題。
Pepper
Pepper機器人
今年八月份,阿里巴巴聯合軟銀富士康成立了一個機器人公司,同時阿里云也組建了自己的 NLP 團隊。他們快速的將 yunos 移植到這個叫 Pepper 的機器人上。同時,將機器人的各種能力封裝成 SDK 提供給開發者,各種能力間的處理對開發者透明,這也是一種融合 + 開放的形式。
這個 120cm 的機器人更容易走進日常生活,似乎會比自動駕駛更快的產生商業價值。
如果把這個機器人當作是阿里巴巴人工智能戰略的一個組成部分,這個具有豐富傳感器的硬件一旦擁有 OTA 的能力,便會自成一個 AI 生態環境,看似占盡先機。
但是筆者也有另外的看法:
首先,這種技術架構是不具備快速移植性的;
其次,在 AI 時代是輕 OS 的時代,OS 再也無法形成技術壁壘。
單一的硬件框定了應用范圍,限制創新只是時間的問題。
基于大硬件平臺或特定硬件平臺對外提供 SDK,需要考慮 開放 安全 合理 效率 調度 體驗連貫性 一致性 等眾多問題,與重新開發 os 的難度相當。
阿里設想了一個機器人生態體系,并為此設計了一整套的解決方案,開發者都在此硬件上做創新。筆者認為,不應為了創造生態而主動造一個特定形式的生態,生態應該是自動形成,自行進化的。
筆者想要這樣一種 AI 環境,創業者利用它開放的數據融合能力,廣闊創新,看似沒有生態環境,但卻是真實的技術壁壘。這樣帶來了另外一個好處是,技術路徑相當清晰,可以有自己的節奏。筆者認為,技術壁壘與技術路徑是相當重要的。
· 打造護城河的第四步:萬物互聯與標準化傳感器,打造感知型大腦
在設計 AI 平臺解決方案的時候,應該時刻牢記 AI + ,因為 AI 無法自己形成一個行業,它需要各個行業的數據教育,一旦這個平臺打造完畢,AI 也就進化為各個行業的技術壁壘,就看這個壁壘為這個行業創造多少增值了。
AI + 智能家居、金融和醫療這幾個行業最接近日常生活,各類傳感器的數據質量直接影響 AI 平臺。提前規劃各類傳感器數據融合以及規范傳感器數據標準還有通信標準是很有必要的。
感知型大腦是人工智能必將經歷的階段。數據融合后再抽象出更高的概念,這顆大腦也就具備了認知的能力,下一階段就是認知型大腦。
打造護城河的第五步:協同設計與合作 & 打造可視化服務
人工智能可以提高人類的整體協作效率 ,增強人類認知能力:
“像鐵路與無線通信技術一樣,人工智能將會徹底的顛覆人們現有的行為習慣,提高人類的整體協作效率。目前還沒有哪項科學技術可以像人工智能那樣影響巨大,即便是號稱可以上億倍的提升計算速度的量子計算。因為,人工智能提升的是可觸達能力 ,改變的是萬物之間的連接方式,而這是無法簡單量化的。”
企業部門之間在共有數據上協同工作的效率是影響業務目標的主要因素
數據量大
筆者在負責設計 某產品用戶行為數據分析系統 的技術架構時,將客戶端的可擴展性、魯棒性及可靠性作為主要關注點。這套系統在產品早期,運行的非常高效精準,但是隨著用戶量以及上報數據種類增多,筆者發現后臺人員要消耗相當的時間進行數據清洗工作。
早前,百度的無人車跑一天的數據,需要百度數據中心的幾百臺服務器一周的時間才能處理完畢。
這就是大數據時代將要面臨的一項挑戰。
在共有大數據上協同工作
更棘手的是,對于 AI 開放平臺上的開發者和企業用戶,他們的數據工作人員在工作時相互獨立、使用不同的編程語言、沒有共同的關注點,還要把時間浪費在數據收集與清洗上。所以如何在共有數據上高效協作,將會成為開發者/企業完成業務目標的主要障礙。
連貫性計算
作為一個技術人,協同設計曾經是筆者癡迷的一個方向。騰訊是一家非常開放的公司,它允許員工將工作帶回家中完成,那么思考這樣一種使用場景:
1.筆者不相信網絡傳輸的安全性(盡管企業云盤等做的已經非常便捷) —— 網絡隔離
2.也不想手動的將需要做的內容一個個的考入U盤 —— 物理隔離
3.甚至家中的電腦筆者都不想讓它時刻聯網 —— 安全保證
4.筆者想要一個安全高效的全自動化工具 —— 高自動化
5.可以在極短時間內為當前工作做快照 —— 高時間敏感度
這樣即使家中電腦無網絡連接,屏幕上也會顯示正在做的工作,光標正停留在之前正在寫的那行代碼/文檔/圖形上,真正的無縫切換。最終筆者基于 一切皆數據 的思想,完成了這個軟件的開發。這件事情發生在幾年之前,那時筆者輕狂的認為個人理想主義與商業利益無法共存,最終這個軟件只在自己和幾個小伙伴間使用,它成倍的提升了時間利用率。當然,從贏得小伙伴的贊同中,筆者也實現了個人價值。
在 AI 平臺設計上 協同合作 問題應該予以充分的考慮,凡是關系時間利用率的問題都不該忽視。
再發散思考下這個無縫切換問題。隨著 AI 平臺上的開發者變多,我們的計算能力就會覆蓋相當比例的消費者,如果消費者從室內走到室外,從一個場景移動到另一個場景,這背后就有一個體驗一致性問題 —— 不同的創業者引用了我們的不同計算模型,模型間應該有一種可以貫穿時間和空間的計算模式,使得消費者間,消費者與計算模型間,多個計算模型之間做到無縫切換,是否可以把這種計算模式稱為:連貫性計算?或者浸入式計算?
提到連貫性計算與場景切換—— 分布式計算也就呼之欲出了,是否有一種新瓶裝舊酒的感覺?
· 打造護城河的第六步:打造可視化服務
慎重設計視覺交互模式
人是一種視覺動物,期待萬事萬物的反饋。把 AI 當成工具,就該為它打造合理的反饋與容錯機制。
感知因果 五個感官之間相互影響,聽到的看到的會影響觸覺。感覺一個事件產生另一個事件的連續事件之間的最長的時間間隔是140ms。這個時間間隔是感知因果的最長時限。如果你的產品對用戶的一個動作的反應時延超出了140ms那么用戶就會從一種無意識的高效的狀態中出來,轉而思考這個反應是不是自己動作造成的。如果在搜索框使用過程中,用戶敲打字符經過140多ms才顯示出來,用戶就會覺得這些字不是他輸入的,他的注意力會從文字的意義轉移到字符輸入的這個動作上,從而導致速度下降,打字這個本來可以自動處理的動作變成了主動意識的處理,增加了用戶出錯的幾率。
上面這段話摘自筆者攻關智能機產品觸控體驗問題的項目總結報告,筆者通過研究認知心理學中大腦常量等屬性制定了:從優化LCD顯示效果來提高觸控體驗 這一技術路徑,最終完成項目公關。核心思想是:攻關某個特定問題,如果最直接的路徑會受限于當前技術能力,用取巧的方法也是可以的。
評論
查看更多