12月27日,蘋果公司終于不再遮遮掩掩,發布了自己的首份人工智能研究報告。業內人士稱,這對蘋果將來推廣自己的人工智能應用大有裨益。蘋果本月初曾表示,將發布自己的人工智能研究報告。不到一個月的時間,蘋果就兌現了承諾。近日,蘋果發布了第一份關于人工智能的學術論文。
于于22日發布其首篇關于機器學習的研究論文,詳細描述了如何通過電腦合成圖像訓練算法的識別能力。論文中解釋道,與現實生活中直接抓取的圖像相比,電腦合成圖像已經包含標記和注釋。在訓練計算機人工神經網絡算法時,省去了大量人力,程序員無需再一一告訴計算機,圖中顯示的每一樣東西是什么。不過,電腦合成圖像相比真實世界缺乏真實感也是顯而易見的,論文中為此專門提出了一種叫做“模擬+無監督學習”的方法。蘋果還改進了現有的生成對抗網絡模型,使生成的圖片變得更加逼真。蘋果高調發聲進軍人工智能領域,繼而迅速公布研究成果,足以見得它興趣濃厚,雄心勃勃。
這篇報告的第一作者是蘋果研究員阿希什·什里瓦斯特瓦(Ashish Shrivastava),擁有馬里蘭大學帕克分校計算機視覺博士學位。有業內人士稱,對于蘋果而言,此次公開其首份人工智能研究報告也是一大進步。多年來,蘋果對其在人工智能領域的研究一直守口如瓶,這遭到了人工智能研究社區的批評。同時,這也影響了蘋果招募人工智能人才。
那么蘋果進軍人工智能領域的過程到底經歷了什么?
外界一直認為蘋果在人工智能領域比較低調,其技術也落后于Google、微軟等公司。
其實蘋果有著寫滿兩頁紙的機器學習應用,部分已經投入使用,其他的還在討論中。而這些應用的背后則是這6年來蘋果已悄無聲息收購了15家人工智能公司,包括:語音識別、自然語言處理、圖像識別、人臉識別、動作捕捉、機器學習等方向的創新型技術公司。
有個有趣的現象是,蘋果每收購一個AI公司后,均不會對外公布收購目的和發展計劃,而且會立即關閉被收購公司的產品和服務。
語音、語義識別
Siri語音助手
Siri無疑是蘋果最為重要的語音產品,2010年以2億美金的價格購入無疑是一筆非常劃算的買賣,之后蘋果在語音識別和NLP方向的收購舉措均基于Siri而展開。
Novauris語音識別
2014年4月,蘋果收購的Novauris是一家自動化語音識別技術公司,Novauris是由Nuance旗下的Dragon Systems創始人創辦,而Nuance曾是Siri的基礎語音技術提供商。他們的核心產品是基于服務器的可擴展語音識別系統NovaSystem,特點是能夠同時處理多個語音訪問請求。雖然蘋果拒絕透露如何使用Novauris團隊,但從Siri和Nuance的合作關系來看,蘋果此項收購意在擺脫對Nuance的依賴,利用Novauris團隊開發自己的語音技術。
VocalIQ人機對話
一直以來,Siri只能識別最基本的指令,無法做出匹配度較高的回答,這導致它成為一款娛樂屬性的娛樂產品。2015年10月,蘋果通過收購VocalIQ予以解決此項問題。VocalIQ能夠利用深度學習來理解語言的環境,從而使得人機對話變得更加自然。開發者在Siri中嵌入VocalIQ的人工智能技術后,利用這個平臺來儲存和學習用戶的交流信息,實現準確識別用戶的指令并提供更加智能的對話。
機器學習
蘋果曾提到他們利用AI技術試水一些微功能:如識別陌生來電;檢測用戶的運動狀態;手機解鎖后列出最可能使用的應用;自動顯示附近標記的酒店;日程表安排;興趣新聞推薦等等。這些看似簡單的功能其實全部被置人到機器學習系統中,為此蘋果通過收購多家以興趣推薦和習慣預測為研究方向的機器學習公司,用于提高自身的數據挖掘實力。
Turi機器學習平臺
2016年8月,蘋果斥資2億美元收購機器學習公司Turi。目前Turi已推出了GraphLabCreate、Turi機器學習平臺、TuriDistributed和TuriPredictive Services等產品,這些產品主要用于開發推薦引擎、情緒分析、欺詐探測等解決方案。
Cue數據挖掘
2013年10月,蘋果以4000萬美金收購被稱為“云數據的搜索引擎”的Cue,Cue可以從用戶郵件、聯系人、臉書、推特、LinkedIn、Reddit、Dropbox、印象筆記、Tumblr中收集數據,通過處理所有數據并通過機器學習算法找出用戶需要的信息,從而進行整理:如提供日歷提醒、通知與某人約會、會面餐館推薦等。據悉,Cue將會整合到Siri中。
Matcha視頻推薦
2013年8月,蘋果約以1000—1500萬美金(雙方未對外公布明確交易價格)收購Matcha,其產品可從Netflix、iTunes、Hulu以及Amazon Prime等流媒體網站上抓取內容,根據興趣焦點推薦合適的信息給用戶。蘋果收購Matcha主要就是為了獲得視頻推薦算法。下線之前,Matcha的iOS應用在App Store娛樂類別軟件暢銷榜前15名,用戶增長率非???。
Semetric音樂數據挖掘
2015年1月,蘋果以5000萬美金收購Semetric公司,該公司在2008年推出了Musicmetric服務,主要業務是提供與音樂下載和流播放有關的數據分析服務,利用機器學習幫助客戶分析社交媒體中音樂愛好者喜歡哪些歌手和歌曲,從而給出相關音樂推薦。完成收購后,蘋果將其整合在iTunes音樂中。除音樂外,Semetric在游戲、電視、電影和圖書方面的數據分析服務也有著一定的積累,這將有助于增強蘋果對旗下各類數字產品的數據挖掘。
Spotsetter地圖社交個性化推薦
Spotsetter是基于Google地圖的社交搜索引擎,于2014年6月被蘋果收購,其通過分析用戶的社交圈數據,為用戶提供個性化的地點(如旅游地點和餐館)推薦服務,致力于解決所謂的“where to go”問題。蘋果的收購目的不外乎其推薦算法與蘋果Maps整合的前景。
WiFiSlam機器學習與模式識別
2013年3月,蘋果以2000萬美元收購室內導航服務商WiFiSlam,該公司的優勢在于機器學習和模式識別技術,可對設備上各種傳感器收集的數據進行相關性繪圖,并且與WiFi三角定位的數據相結合,用于繪制準確的室內地圖,蘋果將其算法應用在地圖中。
Topsy 社交數據挖掘
2013年,蘋果以2億美金收購Topsy,該公司的產品能夠幫助用戶從Twitter以及其他社交媒體數據中提取關鍵信息,包括關鍵字追蹤器以及判斷社交媒體中用戶對某個話題的反應態度。
計算機視覺
蘋果官方提到,他們的人臉識別和視頻檢測技術已經開始應用在相機等產品當中,與此同時,消息人稱蘋果為研發VR/AR產品收購了多家專注于計算機視覺的公司。
Perceptio圖像識別
2015年10月,蘋果收購圖像識別公司Perceptio,該公司的產品是開發智能手機端的人工智能圖像分類系統,該系統的最大優勢是無需大量外部數據進行分類。這符合蘋果的隱私保護策略,對用戶數據的利用最小化,并將盡可能多的技術放在手機端,而非云端。
Metaio計算機視覺
2015年5月蘋果收購Metaio,Metaio專注于計算機視覺和增強現實的技術公司,其在計算機視覺尤其是人臉識別方向有著十幾年的研發經驗。
Polar Rose人臉識別
2011年12月,蘋果以2900萬美元收購瑞典人臉識別廠商Polar Rose。Polar Rose曾推出多個產品,包括針對網絡服務的面部識別技術FaceCloud,以及為手機添加功能性的FaceLib。其臉部識別軟件,通過臉部識別Polar Rose可以為用戶自動圈出照片中的人臉。
Emollient 人臉識別
2016年1月Emollient被蘋果收入囊中,其可以通過臉部識別技術分析人類的表情,從而判斷人的情緒。醫生也可以用他們公司的技術了解病人的表情是否痛苦,也可將這項技術應用在監視器,查看是否有“表情可疑”的人正在商品前面徘徊等等。
Flyby Media 計算機視覺
今年年初,蘋果悄悄買下Flyby Media,Flyby Media擁有尖端的計算機視覺技術,此外其慣性傳感、同時定位和導航空間感知技術也深受蘋果喜愛。Flyby media曾與谷歌合作,利用計算機視覺技術幫助谷歌開發Project Tango。Flyby Media可幫助系統看到和繪制其周圍環境地圖,對于無人駕駛汽車和增強現實技術來說都必不可少。
人工智能這么火,蘋果怎么可能錯過這個機會,勢必會在人工智能領域占領一席之地!
評論
查看更多