2010年,一個特殊的年份,也許注定是人類從工業革命時代悄然邁入智能革命時代的轉折點。這個新時代的初期表象是人們對人工智能技術摻雜著疑惑、追求(甚至是盲目追求)、驚訝、躁動、追概念,甚至也有些許的追星現象。這個時代將會孕育著新科學的產生和發展(學習科學(人工智能、機器學習、生物學習)、數據科學、數據驅動的數學、數據驅動的信息科學、數據驅動的統計學等),并且隨著科學的發展逐步回歸理性和系統性,但也會發展得更快、更穩,產生更深遠廣泛的影響。能否跟上智能革命(不僅是人工智能)的前進步伐將關系到一個國家和企業的生存能力。雖然目前還處于智能革命的前夜,但是人工智能、機器學習、生物學習和智能材料的合力將加速智能革命的到來。
人工智能和機器學習的再定位
人工智能、機器學習等技術和概念的內涵不是一成不變的,它隨著歷史的發展而演化。
機器學習未必就是人工智能
也許把機器學習當作人工智能是個“美麗”的時代錯誤。人工智能強調的是“人工”創造的“智能”,機器學習是“機器”自主從數據中找出“知識”。當數據少、應用相對簡單、人能推導以及控制時,“人工”的特性比較明顯,人們會認為機器學習是人工智能的一部分。這種智能“人工”的創造特性從1950年代到本世紀初尤其明顯。沒有數據,機器很難學習到充分的知識,人的知識便在智能的實現中起到關鍵和主導作用。因而許多情況下機器學習是實現人工智能的重要輔助工具。 在當初人們認為機器智能永遠附屬于人類和人工智能,不會超越或挑戰人類智能時,機器學習無疑是人工智能的一部分。
然而隨著數據量、數據復雜度和應用復雜度指數式增長,機器學習有望獨立于人工智能。各種應用和各種數據有其自我特征和規律,機器學習科學的建立將有助于更加科學地實現機器學習,也幫助(以人工神經網絡技術為主的)機器學習和人工智能跳出“15年魔幻周期”。雖然其中也有人工參與和應用這種科學和技術,但并不能因此就把另外一個機器學習“世界”歸為人工智能。就像物理世界有其規律,當人類社會發現物理定律,了解物理世界,進而利用物理定律改變世界,我們并不能因此說物理世界是人工創造的。
尤其在最終實現無監督學習和機器學習能力能自我進化的情況下,人工賦予的智能可能在整個機器學習世界中顯得幾乎微不足道。 隨著時間的推移,人工智能和機器學習的區別就會越來越明顯,二者又相互促進。機器學習的發展很大程度上來自數據科學和相關應用的驅動,直接的表現又好像是人工智能的發展和成就,人工智能和數據科學的發展也使機器學習變得更科學有效。 從長遠來說,人類也許要為一個可控的“人工智能”和最終充滿不確定性的“機器學習”時代的到來提前做好準備。
智能依賴于數據、算法和運算能力(速度、空間)的動態關系人工智能離不開高效的計算環境、大數據和好的學習算法,這些條件從2010年開始同時得到滿足。即使面對簡單的應用,目前大部分實現還是基于復雜的計算能力和大量的數據。這種實現其實是不可持續的。也許不久的將來,面對較為復雜的應用,許多實現也不必依賴于超算環境和大數據。數據是不可或缺的,但數據太多也會產生過擬合,算法是解決學習問題的關鍵,高效的算法使得人工智能和機器學習對大數據和超算環境的依賴度有所下降。數據、算法和運算能力(運算速度、空間)在人工智能的實現中保持一個動態的三角關系。目前許多應用、實現和產業資金都高度集中于數據和運算能力,使得這個三角關系顯得相對不平衡,存在不穩定因素和系統風險。一旦智能算法有進展,也許會在某些人工智能細分領域造成塌方效應。
深度學習和人工神經網絡
深度學習的意思其實不是不變的,它的本意是動態發展的。最初的深度學習基本意思是聚焦于區別于誤差反向傳遞算法(Backpropogation)那種打包式的黑箱(black-box)學習方法,使用多層網絡的“庖丁解牛”的“深層次”的白箱(white-box)學習(比如用卷積神經網絡和自編碼)組成多層結構。再后來發展到幾個主要神經網絡學習的組合也歸納為深度學習。可以說早期的深度學習是人工神經網絡技術體系下的一個特例。現在出現一種趨勢:深度學習已不再局限于神經網絡范疇,多種學習算法的組合即是深度學習。
這樣反而有讓深度學習失去聚焦點的可能,不禁讓人有疑問:5年后還有沒有深度學習的必。早期當數據少、應用簡單時,人們通常只用單一學習方法或加一個預處理。在現實應用中,多種機器學習算法的組合本是機器學習解決現實問題的基本思路和策略。
深度學習和“類腦”學習機制
深度學習是不是“類腦”學習機制?從網絡結構的敏感性、人工的干預、并行和硬件的實現、實時性、對大數據的要求、對精度的追求以及在學習機制中出現的“雞”和“蛋”議題看,答案應該都是否定的。 另一方面,可以從理論上證明在許多方面,深度學習和生物學習機制其實是矛盾的,比如深度學習依賴于神經元和鏈接的精確耗時調整,而這使得深度學習不利于多任務同步、記憶遷移和進化。 然而這不能否定深度學習是個好的人工智能技術。(智能)機器和人運行的是兩個(智能)函數和,兩者不必一樣,即使兩者在某些應用中的智力收斂到一點。
生物學習和生物智能潛能的探索
人工智能和生物智能
歷史有時是驚人的巧合,當人們驚嘆于人工智能和機器智能的巨大潛力、為人工智能和機器智能許多超越人類能力所震撼時,人類對生物學習機制的探索也在加速進行。 總體而言,研究和探索機器智能和生物智能在歷史巧合中同步進行,二者又互相支持,這在過去的近70年間,甚至幾年前還只是一個夢想,如今機器智能和生物智能的關聯性竟然如此緊密。 一方面對生物學習機制的了解有助于機器學習和人工智能的發展(比如最典型的是日本人Fukushima根據貓的視覺系統提出的Neocognition網絡結構及其特例卷積神經網絡),機器學習和人工智能的發展也有助于對生物學習機制的了解。
同時根據超限學習機理論,也許有類似的學習算法存在于生命體智能和非生命體智能,只是生命體智能和非生命體智能二者的組成材料不同而已。智能不一定受限于其載體(材料)。
生物學習系統和自然界的相似性
根據超限學習機理論,學習(包括生物學習和機器學習)可以不依靠調整神經元來實現。(生物的或人工的)神經元與具體的訓練數據無關。這一學習理論后來在2013年和2015年分別在老鼠和猴子的大腦中被發現。這一發現徹底顛覆了傳統生物學習對于神經元調整可能是學習關鍵的認知。 隨機神經元和隨機連接可能是實現不依靠調整隱藏神經元來學習這一學習機制的兩種特殊方式。神經元也可以從它們的祖先那里遺傳或從其它系統遷移繼承而來。 整體來說,整個活躍的大腦都是結構化的、有序的,但它們在某一特定的層或者大腦神經元薄片上或許是隨機的、非結構化的。令人感到驚奇的是,大腦作為宇宙中最復雜的物體之一,竟然和整體結構化但是局部滿是隨機布朗運動的物理世界如此相似,二者之間竟然有如此強的相似性!生物學習正是因為其全局的結構化構造與局部的隨機性的共存才能如此地完美。
智能革命的前夜
人工智能真空填補期
機器學習和人工智能目前基本還是處于發展初期,只能通過大數據和超高效運算環境帶來的產業機會,實現以前由于數據匱乏和運算資源有限而不能實現的應用,基本屬于快速的“真空填補期”。新產品新創意層出不窮。這就有點像餓極了的狼(產業界)突然面前有成群結隊的羔羊(數據)出現一樣,幾乎是逮到羔羊便是機遇。
黎明前的黑暗
同時從歷史發展看,機器學習和人工智能又處于黎明前的黑暗期,雖然表面看上去華麗多彩,背后卻是大量資源的消耗和“血拼”,暗示著這種研發的局限性和不可持續性。現有流行的人工智能方法在許多看似簡單的應用上也要用上幾十塊GPU(幾萬到幾十萬核)訓練幾天甚至幾十天,許多公司和學校能承擔這種高昂的資源成本。25年前,面對誤差反向傳遞算法(Backpropogation)普天下調參,15年前,面對支持向量機(SVM)普天下調參,基本都是10年一個“波瀾壯闊”的調參周期,最近幾年面對深度學習普天下又開始了新的調參周期。
人工智能大爆發
每次“痛苦”經歷也許預示著新的技術呼之欲出。綜觀過去60多年的歷史,機器學習和人工智能本身就遵循一個螺旋式上升的發展過程,在2020前后可能新的一波機器學習技術要興起,突出表現為:
●機器學習從云端走向各類本地智能終端、傳感器、設備,云端機器學習和本地機器自主學習有機融合;
●機器學習算法本身不再只依賴于GPU的支撐,但GPU等卻可以實現眾多智能系統在云端的同步協同,GPU等在人工智能和機器學習中繼續扮演重要的角色;
●基于神經形態,FPGA和光技術的芯片開始在普適學習、普適智能中顯現魅力;
●機器學習也許不需要特別“深度”,理論上講5~8層神經網絡具有普適學習能力;
●無監督學習理論和應用可能有突破性發展;
●機器學習不必依賴于大數據,小樣本學習技術的吸引力不可小覷,但數據始終是個重要的資源。
智能革命
一萬年前新石器革命預示著農業時代的到來,250年前的瓦特改良蒸汽機推進了工業革命,6年前(2010年)蘋果公司創辦人Steve Jobs(史蒂夫·喬布斯)推出的iPhone4則撬動了“智能革命”,人類和其它非生命體從此邁向漫長的合二為一的“智能社會”。 iPhone 4之所以掀開了“智能革命”時代,原因之一是人類還在探索如何實現普適智能和如何實現智能傳感器時,它已經首先把人類變成了超級智能傳感器,從此人類、機器、虛擬世界、實體世界通過網絡無縫銜接,促進了大數據的產生和對大數據分析的需求,大數據的產生和分析需求進而推動了人工智能和機器學習的爆發。
智能革命的10大影響
如果說農業革命起源于人類有意識的栽種,工業革命起源于人類了解自然規律進而制造和運用機器取代人力,智能革命也許起源于人類探索和使用非生命體智能。人類學會了栽種催生了農業革命,制造和運用機器取代人力催生了工業革命,創造和使用智能則迎來了智能革命。
1)數據驅動的科學和工程學(數學、信號處理等)
以前經典的物理學、數學、統計學、信號處理、天文學等大都建基于對事物本身的了解、相互關系和邏輯推理。有許多事物的本質也許未知,但可能它們的表象已經或以后可能反映在不同的數據中,通過數據分析事物的本質和規律也會變得越來越重要。由此需要數據驅動的相關科學和工程學支撐。
2)人工智能和機器學習的分化
人工智能強調更多的是根據人的經驗規則衍生的智能,機器學習應該更注重于機器本身找尋數據背后的規律和模型。 隨著人工智能和機器學習的飛速發展,機器(廣義的講包括包括各種傳感器/感知器)也會自我學習、復制、推理、決策、有感情和認知,人類的經驗規則在機器智能中的重要性,長期看(10年,50年……)有下行的可能。因而隨著人工智能和機器學習的發展,深度學習這種依賴于大量人力和人類先驗知識(調參等)技術的人工智能性質會逐步強于它的機器學習性質。
3)智能從云端走向世界
早期的人工智能由于缺少算法和智能芯片技術的支持,大部分人工智能實現只能依賴于超算環境、大數據在云端實現。 隨著高效算法的出現和智能芯片技術的提高,低功耗微智能芯片將成為可能,智能正在從云端走向世界的各個角落、各個事物,智能成為可能。智能實現將不再是“富人”的專屬。
4)智能材料
蛋白質和碳水化合物將不再是智能的唯一載體。 其它的智能材料也逐步呈現和被挖掘,這些智能材料有的已經出現,以后也許還會有新的智能材料陸續被發現。
5)機器智能和進化論(機器的進化、人的減少、人的工作時間縮短)
人工智能和達爾文的進化論有沒有關聯?也許許多人認為二者沒有本質聯系、沒有太多的關聯。 在機器學習邁向無監督學習、自主學習,在機器智能將來形成自主智能時,機器智能本身也可以適應達爾文的進化論,具有進化能力,逐步適應環境、適者生存。 也許將來人類也會由于適應機器智能帶來的互補和競爭呈現人口減少的趨勢,畢竟許多人類活動會逐步由機器取代。
6)智能物聯網和新經濟模式
相對于農業革命和工業革命,智能革命的影響也許更加深遠。歷史上每一次重大技術革命都會推動新經濟模式的誕生。現在的經濟模式大都需要人的參與,是以人為核心的經濟模式。以后也許會迎來智能物聯網推動的智能物社會經濟模式。比如一個新的電商模式也許是:機器人助理根據主人的口味訂某類牛扒,食品倉庫中的機器人在收到訂單后就會把預約的牛扒送到運貨車上,自動駕駛運貨車就會把牛扒送到客戶家,客戶家的家庭保姆機器人會把預訂的牛扒取下送到廚房,廚房機器人會根據主人的愛好烹飪好牛扒,主人的保姆機器人也就可以給主人呈上美味的牛扒。再過20年,許多人類工作也許會被機器取代。 因此,從長遠說,能否在人工智能技術上占有先機和領先優勢也許會決定一個國家和企業的生存能力。
7)銜接機器學習和生物學習(催生新醫療方案、新藥等)
機器學習和生物學習看似不相關。隨著人類對生物學習機制的了解深入和機器學習的發展,二者在某種程度上存在相關性和收斂性。這種相關性和收斂性也會幫助人類發明新醫療方案、研制新藥等。
8) 智能拐點
根據達爾文進化論,人類個體的智能也許到達歷史的峰值附近,還有部分增加的空間。另一方面,機器智能只是剛剛被啟動,機器智能的爆發期還沒有到來,將來也許非生命體智能的總指數會超過生命體智能。 善用機器智能,無疑會使加富于人類在機器智能的輔助下變得更加富于智慧。
9)智慧星際旅行、時光倒轉
隨著技術的發展,智能可以存在于非生命體載體,最后首先實現星際旅行的也許是“智能”(進而是“智慧”)而不是人。最終也許是“智能”而不是人穿越時光隧道,甚至時光倒轉。
10) 倫理、“智控”
人類的“智慧”就是這么矛盾:當機器學習還是以有監督為主,機器的智能多少比較容易“受控”。人類在追求無監督學習。 當機器真能全面走向無監督學習,人類就很難指望機器會自動學習對人類有用的東西,照著人類的夢想前進,機器就極有可能自我學出對人類有害的東西和行為。 雖然機器智能可以幫助人類,但是機器智能和人類智能的交融也可能產生負面的結果,甚至引起倫理、道德問題。 “智控”已經是個嚴肅的事情,同時倫理問題也不再遙遠。
編輯:黃飛
?
評論
查看更多