資料介紹
摘要: 談論機器人消滅人類,甚至談到機器人的‘意識’仍然是遙不可及的事。然而,來自人工智能的一項更為嚴重的威脅正在逼近,并可能產生嚴重的影響。
當人們問我是干什么的,我常常對回答的深度感到困惑。說“人工智能”我很滿意,但太寬泛,而說“圖像處理”可能又太具體。然而,一聽到接下的來的毫不相干的問題我總是氣不打一處來。
“人工智能要主宰世界嗎?”
做為一位研究機器智能的人來說,這個問題的確讓我失望。我不能責怪這些懷疑者——人們大都認為人工智能是某種未知而神秘的東西,密謀著最終要殺光我們所有人,因為它能預測下一場我們想看的電影是香腸派對,此前我們看了一整夜的埃文·戈登伯格的片子。
許多人沒想到的是,不管我們認為自己多么奇特,我們的選擇和基本智能都遵循著普遍的模式,對于這種模式計算機只要看多了就很容易識別出來。
這就使得 預測你所喜歡的音樂, 或建議我們在方便時所用的正確手機應用 等方面對于機器來說是小菜一碟。我并不是說所有的 預測工作都具有同樣的性質和難度,但指望該研究領域之外的人理解它是有難度。
理解我們目前的人工智能技術所擅長之處的關鍵是知道計算機在兩種基本環境中學習得特別好——i)受控環境,和ii)監督之下。
我們看到谷歌的人工圍棋機器最近擊敗了最佳人類棋手。戰勝國際象棋的事早在我們還是孩童時就實現了。最近所看到的 許多有關擊敗人類的論文都提到Doom。其實在游戲中,你知道可能的結局、戰斗環境和你能采取的行動,這使得建模問題容易得多。一旦我們能對游戲所處的世界進行建模,從模擬中學習則是下一部分——我們在硬件上實現了飛躍,大規模學習能力讓 AlphaGo 能 在最近實現突破。 (其理論一直存在)。
游戲是一種在受監督、 受控環境下的最佳實例。在這種環境中,你能估計每次所采取行動所得到的懲罰,因此能有效地從錯誤中進行學習。督控環境的另一個例子是我們正在談論的電影預測。由于有記錄大批用戶和電影的表存在,加上用戶選擇模式,我們就有了預測下一部電影所需要的東西。
在督控環境中,我們知道要獲取哪種信息,因此能用同樣的方式處理類似的信息位。我們創建對象組,這有助于我們最終在需要做出預測時確定實現的算法。這是類似人類的智能人一般性學習的非常窄的子集。
人類在與環境作用中不僅發育了邏輯還有直觀,而且基本上是在沒有監督的情況下實現的。象識別物體和理解物理原理的過程每一秒都在發生,總體來說,我們通過與它交互而學到更多有關的新信息。而在這方面,現在的計算機做得一塌糊涂。
圖像分類程序(Image Classifier)示意圖 (image courtesy: wildML.com)
今天,如果你想要機器能在照片中認出你的車,你得告訴它要看什么(你的照片)以及你的車像什么。只要你提供大量有關你車的圖像, 那么它肯定能認出它。亦即監督中的學習, 監督是說你指出你的車在圖像中的樣子,然后它就懂得要找什么。今天計算機科學家正努力理解有沒有監督或很少監督下的學習——無監督學習。我們最終要讓機器自己能明白什么是物體什么是場景而不用我們去明示。
不用監督或很少監督的學習是個難點,人工智能研究大多集中在處理這個問題。我們的機器智能越來越高,但大數是在監控的環境中。我們首先需要懂得如何讓機器人在無監控下學習, 從而讓系統有接近人類的智能。
所以說,談論機器人消滅人類,甚至談到機器人的‘意識’仍然是遙不可及的事。然而,來自人工智能的一項更為嚴重的威脅正在逼近,并可能產生嚴重的影響。
就在本次會議剛剛開始時,我從前的顧問就第一次提到某種讓我質疑人工智能應用的事。
在早期人工智能技術中, 我們能輕易地理解算法為什么要那樣做。例如,我們想制造一臺能僅通過測量人的身高和體重而告訴他是否超重的機器。為此,我們只要計算該人的身體質量指數(BMI)就行了,如果他過了某和臨界值就說他超重了。
這是非常原始的人工智能代理。實際上它只做邏輯判斷。
早期名為決策樹的算法通過檢查具體特征而將數據切分。 [Image courtesy : Wikipedia]
于今所使用的機器顯然沒那么簡單。它們采用復雜的海量輸入(如高清圖像) 并且需要對其內容進行細微的預測。象臨界值或決策樹在這里不起作用。系統越來越多地使用一套被統稱為 深度學習的算法, 這種計算密集技術能象人一樣運用大量數據識別和學習具體模式。
一種典型的深度學習技術包含數個神經元(圈),它們象人腦一樣互相連接,傳遞信息。 [Image courtesy neuralnetworksanddeeplearning.com]
這些系統雖然因需要大量數據進行學習而學得慢,但對于它們的工作干得非常出色。
但會有陷阱——一旦它們得出結論,盡然結論正確,但我們大多無法準確得知它是如何得出的。
這聽起來并不值得大驚小怪。在機器學習系統中,我們有兩類數據——特征和標注。特征是系統所觀察到的變量,而標注是我們要預測的量。例如在前面肥胖探測器的例子中,特征是一個人的體重和身高,而標注是超重或健康。對于從圖片上探測癌細胞來說,特征是幾個器官的圖像,而標注是上述圖像是否有癌細胞。
這些是癌細胞算法必須完成的工作。[Image Courtesy: CNN]
機器學習算法解決問題的辦法通常是對每個特征賦上“加權值”,求它們的和并最終基于該和的值做出決定。例如,如果叫你預測蘋果是否變質,你可能會去聞蘋果的氣味、看它的顏色,最后去摸它,心理上對每種特征賦上加權值。
如果蘋果真的腐爛,只看顏色就夠了
計算機遵循著類似的高級意識,只不過那些“權值”是通過使用不同的優化技術通過計算獲得的。但在深度學習中, 我們并不能確定我們想看哪種特征,更別提賦值了。那我們怎辦?我們讓計算機自己學習最佳特征,然后以最佳方式將其進行組合來做出預測,在某種程度上類似人腦的工作方式。
這種思想產生了令人震驚的結果,特別是在計算機視覺(即研究讓計算機理解視覺數據),高性能GPU的出現和新穎的結構讓學習圖像一級的概念輕而易舉。但要說明一點——我們所說的這些特征,亦即這些算法所學到的特征 不太直觀,與我們傳統技術很不一樣。
這些是計算機尋找圖像的實例——從視覺上看它們似乎是在探測形狀,但對于非視覺數據來說,情況就不那么直接[Image Courtesy?—?Yann LeCun’s ICML 2013 tutorial]
一般人并不把它當回事——那時在技術上也不是大不了的問題,用人工智能所做的工作都很具體,如在圖像中識別人和物體, 跟蹤人臉以及生成地址抽樣。于是我們有了一個很妙的主意來表達算法所學的內容 (事實上, 這個演示是這方面最近發展情況,相當酷)。但當我們開始針對有預測風險的任務運用深度學習時,每次預測都必須站得住腳。
比喻說你是家銀行,你有所有客戶的交易和信用的歷史記錄。你用復雜的深度學習算法弄清貸款不還者。既然你有龐大的用戶行為模式的數據庫,你的算法可能讓你準確地寫成這項工作,但有種情況除外:一旦你真的懷疑一位未來欠款人,你弄不清到底是什么導致懷疑,從而讓這種預測判斷更加困難。
大多深度學習系統并沒有良好的技術理解其決策能力,這是目前活躍的研究領域。對于某些特定任務的深度網絡,尤其是計算機視覺,我們在理解這些系統上有所進步——相當程度地確定促使算法那樣做的位點。但總的來看,需要做的工作還不少。
機器學習系統有個嚴重的障礙——需要手動輸入來讓它們正確地區分信號與噪音。或者從技術術語說, 過度擬合。這個技術行話的意思是說,當一個模型必須適合于某個集合的數據時,要對更新的未知數據做出預測,它會在學習中 過于順從它已經收集到的數據。結果在現實世界中應用時不會有良好的表現。
這意味著模型一般會開始搜索存用于算法訓練的數據而并不存在于現實世界的模式。有多種方式理解過度擬合,現實生活中存在一些過度擬合的事例,簡單一例是在你當地夏天時你把手提箱塞滿了夏天穿的衣服,而在阿姆斯特丹是11度,在那里你會瑟瑟發抖。
這就是過度擬合的樣子,最后一條曲線發出噪音。 [Image courtesy?—?StackExchange]
就過度擬合說些題外話是為了強調機器學習系統責任的重要性。如果我們無法理解并弄清這些算法在學什么,我們就無法說出它們是不是過度擬合。這種不良影響的事例還有,比如機器根據瀏覽歷史中預測可疑行為,由于它所看到的大多用戶都是——比方說——來自美國的十九歲的人,于是它的側重不在來自美國的十九歲的用戶,盡管他們搜索歷史大多有 PewDiePie 視頻。
當深度學習越來越多地應用于艱深的推導工作時,這種影響會呈指數增加。例如,我們看到許多研究進入到醫學圖像預測,這種應用需要承擔更大責任。另外,一旦這種預測規模大到無法進行人工檢驗時,我們需要系統讓我們理解并調整這些算法所考慮的內容。
這種威脅正在來臨,但也成了研究對象,投入的時間越多,更好的解決方案就更有可能出現。但我們必須認識到模型責任的重要性,尤其是當我們開發讓生活變得更為輕松的新系統時。我們用一個例子來結束談話——
如果一個人撞了車,我們會讓他擔責并理解事故為什么發生,可能是酒駕或在給人發短信。
但如果自動駕駛車撞上另一輛并讓一位乘客致死,誰會擔責呢,原因如何?你如何確保下次不會發生呢?
這種事故最近已經發生了好幾起 , 隨著更多的系統使用人工智能,會出現更多失誤。要進行糾正,我們需要知道錯在哪——這是人工智能今天所面臨的主要挑戰。
本文譯者為:kundogma
原文來自:bullshit
(mbbeetchina)
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 2023年人工智能產業概況及應用趨勢分析 6次下載
- 什么是人工智能 人工智能應用領域 0次下載
- 基于ESP32-CAM的人工智能機器人設計資料 3次下載
- 面向兒童的人工智能和機器學習
- 一文了解人工智能的概念元素資料下載
- 智能系統的定義與識別:人造智能與人工智能資料下載
- IC Design是否會被人工智能取代?資料下載
- 嵌入式系統與人工智能資料下載
- 人工智能的倫理智能體應用及相關研究 7次下載
- 北京科技大學的人工智能視頻教程免費下載 19次下載
- 人工智能的現狀是怎么樣的未來應該如何發展 12次下載
- 人工智能與產業發展的融合復習題資料免費下載 15次下載
- 人工智能行業發展狀況如何?人工智能行業研究報告詳細資料免費下載 15次下載
- 電子書 中美人工智能行業生態比較 243次下載
- 機器人編程C語言與人工智能 0次下載
- 生成式人工智能和感知式人工智能的區別 1159次閱讀
- aigc是什么意思和人工智能有什么區別 9181次閱讀
- 12個好用的人工智能工具和框架 8738次閱讀
- 什么是人工智能?人工智能的分類和應用介紹 1w次閱讀
- 機器學習是如何工作的? 人工智能與機器學習實例 1963次閱讀
- 關于人工智能的機器學習一些知識 898次閱讀
- 人工智能與機器學習的區別 4112次閱讀
- 人工智能帶給實際的作用 1.3w次閱讀
- 工業機器人和人工智能的區別詳細概述 8074次閱讀
- 5個頂級的人工智能開源工具 6100次閱讀
- 人工智能相關的人與技術都在這里_人工智能的相關技術 4754次閱讀
- 人工智能需要哪些知識_人工智能需要學什么_如何自學人工智能 4.4w次閱讀
- 學人工智能10本必看書_人工智能入門書籍推薦 7w次閱讀
- 從AI小白直接晉級為具備一年經驗的人工智能工程師的方法 7761次閱讀
- Facebook人工智能母體技術解析 1389次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1491次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 4次下載 | 免費
- 8基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537793次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多