如今,AI算法幾乎成了蘋果許多應用的基礎,從處理照片以便讓照片看起來更明亮、更清晰,到為智能助手Siri提供動力,甚至可能驅動“蘋果汽車”。
像其他所有大型科技公司一樣,蘋果也迫切需要人工智能(AI)程序員加盟。如今,AI算法幾乎成了蘋果許多應用的基礎,從處理照片以便讓照片看起來更明亮、更清晰,到為智能助手Siri提供動力,甚至可能驅動“蘋果汽車”。
因此,早在2016年,蘋果就聘請了卡內基梅隆大學教授魯斯蘭薩拉克胡迪諾夫(Ruslan Salakhutdinov)領導其AI部門,并出人意料地推出了一個研究博客,發表該公司自己的一些研究成果。對于這家向來喜歡守口如瓶的科技巨頭來說,這是個出人意料的舉動。
蘋果之所以愿意將其部分研究成果公之于眾,是因為AI領域的支柱仍然是學術領域,而發表新研究的能力是博士生們進入科技界的主要考慮因素。Facebook首席科學家雅恩勒昆(Yann LeCun)在2016年接受采訪時表示:“你不能這樣對招募的人才說:‘來為我們工作,但你不能告訴人們你在做什么’,因為這樣說意味著你基本上毀了他們的職業生涯。”
如今,四年時間過去了,蘋果仍然在其研究博客上發表文章,讓人們對該公司的研究人員正在從事的工作有了些最新的見解。目前還不能保證這項研究會成為蘋果的真正產品,但這項研究顯示了蘋果正在投資的那些想法。這些論文中的許多都集中在支持Siri上,通常它被認為不如Google Assistant和亞馬遜Alexa。
蘋果公司的研究人員正試圖讓Siri更好地理解問題背后的意圖,甚至試圖在人們說出命令時解碼他們的情緒。一篇論文還談到了“聲學活動識別”,也就是傾聽特定的噪音。在論文附帶的一段視頻中,智能音箱HomePod聽到廚房周圍發出的噪音后竟然問道:“那是什么聲音?”一位研究人員回答說“微波爐”。
Siri的其他改進與虛擬助手的多語言使用有關,蘋果公司制作了自己的數據集,以衡量虛擬助手用26種不同語言回答問題的能力。還有一項研究是關于讓Siri“被喚醒”來傾聽用戶的命令這一簡單任務。
雖然這項具體的研究是新的,但對于那些關注蘋果AI努力的人來說,這是一個老生常談的故事。2017年,一名AI界專業人士發送了蘋果在業內最大會議之一的閉門活動中演示的幻燈片,幻燈片顯示,蘋果的研究團隊正在研究健康、Siri、圖像處理甚至自動駕駛汽車的AI系統。
今天,許多相同的主題都可以在蘋果網站上找到。而且Siri仍然遠遠落后于谷歌助手和Alexa,也許比三年前還要落后。
在蘋果準備用HomePod Mini擴大其HomePod智能音箱系列之際,對語音助手和智能音箱的投資有重要意義。谷歌和亞馬遜憑借各自的智能音箱設備積累了巨大的市場份額,很明顯,蘋果正在迎頭趕上。
以下是關于蘋果AI研究團隊正在進行的工作的更多細節:
讓Siri變得更智能化
蘋果公司今年夏天發表了相當多關于語音助理的論文。一個目標是更好地理解用戶意圖,或者弄清楚一個人想要Siri做什么。蘋果研究人員描述了一種方法,它不僅考慮了一個人說了什么,還考慮了上下文背景,包括用戶的位置、瀏覽歷史、是否在開車,以及之前的其他Siri請求。
另一種方法則試圖通過分析一個人的聲音來推斷他的情緒。還有一款應用引入了新的數據集,使Siri能夠更可靠地回答不同語言的問題。這項研究集中在26種語言上,目的是更好地衡量語音助理跨多種語言工作的能力。
胰島素-血糖預測
今年8月,蘋果發表了一篇論文,研究人員試圖通過將AI算法與更傳統的胰島素預測模型相結合,來解決尋找正確胰島素劑量的反復試驗問題。研究小組強調,他們還沒有解決這個問題,但引入了一種新的思維方式來預測血糖。然而,更大的圖景是蘋果對健康研究的興趣,以及有證據表明該公司正在考慮如何讓其產品為那些患有糖尿病的用戶服務。
AI支持的輔助工具
在10月份的一篇論文中,蘋果研究人員描述了一種名為Rescribe的新工具,它使錄制視頻的音頻描述變得更容易。就像論文中詳細描述的那樣,“Inline”音頻描述本質上是視頻的畫外音,以幫助那些看不到媒體視頻的人加強理解。
Rescribe的目標是讓一個人更有效地錄制這些音頻描述,而不需要一個由音頻工程師、配音演員和制片人組成的團隊。蘋果對這個工具的使用可能會很廣泛,從將其添加到自己的視頻編輯軟件中,到使用它來使其原創電影和電視節目更容易獲得。
責任編輯:YYX
-
蘋果
+關注
關注
61文章
24395瀏覽量
198559 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238259 -
Siri
+關注
關注
4文章
206瀏覽量
37023
發布評論請先 登錄
相關推薦
評論