電子發燒友網報道(文/李彎彎)近日消息,據知情人士透露,蘋果始終在增加構建人工智能所需計算的預算,并且已經擴大到每天數百萬美元。該公司的一個目標是開放一些功能,允許iPhone用戶使用簡單的語音命令來自動執行涉及多個步驟的任務。
舉例來說,這項技術可以讓用戶命令Siri語音助手用他們最近拍攝的五張照片創建GIF動圖,并將其發送給朋友。如今,iPhone用戶必須手動完成這個過程。
蘋果很早就組建AI團隊
相比于微軟、谷歌等全球知名科技公司而言,蘋果在人工智能技術上的發展看上去更慢些,包括近年來很火的生成式AI。不過據外媒報道,蘋果正在加大投資力度,現在每天在人工智能上投資數百萬美元,并且多個團隊正在同時開發多種人工智能模型。
其中開發對話式人工智能的團隊被稱為基礎模型(Foundational Models),該團隊有幾位曾在谷歌工作多年的工程師組成,目前擁有16名成員。事實上,早在四年前,蘋果人工智能主管約翰·詹南德里亞(John Giannandrea)就授權組建團隊,開發基于大語言模型(LLM)的對話式人工智能。約翰·詹南德里亞在2018年加入蘋果,并主持Siri的升級。
除此之外,蘋果還有另外至少兩個團隊在推進AI的研究。一個是視覺智能(Visual Intelligence)團隊,該團隊致力于開發能夠生成圖像、視頻或3D場景的軟件;另一個團隊正在研究多模式人工智能,這種模型可以識別和生成圖像、視頻或文本。該團隊的領導者之一是喬恩·什倫斯(Jon Shlens),他于2021年底加入蘋果,之前在谷歌人工智能團隊(DeepMind)工作。
同時,蘋果還在加大對AI大模型研發人員的招聘力度。有報道稱,蘋果已經從Meta挖角了不少大模型相關研究人員,并還在全球積極招聘大語言模型方面的工程師。蘋果官網顯示,關于大語言模型相關的招聘廣告就超過了600個,主要集中于優化AI軟件的多媒體功能,包括生成圖像或視頻內容、視覺動作與交互等。
據了解,目前蘋果的基礎模型團隊已經開發出幾個先進的模型,并正在內部測試。其中最先進的語言模型,被稱為Ajax GPT,該模型已經接受超過2000億個參數的訓練,據稱其功能表現比OpenAI此前發布的GPT-3.5版本ChatGPT更強。
不同于谷歌、微軟等大模型應用到企業等層面,蘋果致力于在移動端使用生成式AI。不過大語言模型參數量大,需要更多存儲空間和計算能力,將其在iPhone等移動設備上運行存在難度。然而這卻并不是不可能,業界已經有企業通過量化等各種技術,來縮小模型規模,以便其能夠在終端設備上使用。
從蘋果最近的招聘信息,可以看到蘋果也有這方面的研究,比如,它要求應聘者能夠將最先進的基礎模型帶入我們口袋里的iPhone。有知情人士透露,蘋果基于大語言模型的聊天機器人,最終可能會與使用蘋果AppleCare的用戶互動,另一種用途則是加強Siri,使其能夠更輕松地執行復雜任務。
通過大語言模型優化Siri
近一年多時間,全球消費電子市場持續低迷,蘋果業績也受到影響,根據其2023財年第三財季財報,蘋果營收818億美元,同比下降1.4%,凈利潤199億美元,同比增長2.3%。這是蘋果營收連續第三個季度下滑,其主力產品iPhone、iPad、Mac都出現一定下滑。
雖然蘋果將會在本周發布最新的產品iPhone15,不過就目前的形勢來看,業界對其的預測也并不好,知名分析師郭明錤認為,iPhone 15系列的需求將低于今年的iPhone 14系列。
在這樣的背景下,蘋果似乎對人工智能大模型寄予厚望。近日,庫克稱,蘋果多年來一直在研究生成式人工智能和其他模型,未來幾個月,蘋果將進一步增加用于生成式AI的研發支出。
行業人士認為,對于蘋果而言,Siri是其新研發的GPT系統能夠最快落地的地方,也是能夠最快改善用戶體驗的地方。將Apple GPT與Siri結合升級,很可能是效率和用戶交互體驗上的一個突破,這將是蘋果在大模型競爭中的最大優勢。
Siri是蘋果公司在iPhone、iPad、iPod Touch、HomePod、Apple Watch、Apple TV、AppleCarPlay等產品上應用的一個語音助手,利用Siri用戶可以通過手機查找信息、撥打電話、發送信息、獲取路線、播放音樂、查找蘋果設備等。
Siri可以支持自然語言輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調,提供對話式的應答。
過去這些年里,蘋果一直在積極優化Siri。然而不少用戶對Siri目前的效果并不滿意,甚至有網友稱其為“人工智障”。消息稱,蘋果內部正在積極提高Siri的智力,預估將會在iOS 18系統中和大家見面。蘋果正在積極擴展Siri的技能,可以基于用戶的自然語音命令,自動執行各種復雜的多步驟任務。就如文章開頭提到的,Siri可以根據一條語音命令,連續拍攝 5 張照片,然后自動轉換成為 GIF 動圖,并發送給指定的好友。
不過網友對蘋果的這個優化各有看法,有人認為,將大模型集成到Siri里面,可能是一個錯誤方向,他表示,更希望得到一個有強大語音識別功能的AI助手,而不是一個對他口述內容進行智能解釋的東西。
也有網友認為,加入新模型的Siri的可用性將大大提高,蘋果將調整參數以確保人工智能驅動的Siri不會再那么啰嗦。或許再次升級Siri,它就不會只是傻傻地甩出一個網頁鏈接,而是真正地對用戶需求做出解答。
小結
相對于谷歌、微軟等全球知名科技公司來說,蘋果在人工智能技術的結果展示上,看上去較為緩慢,不過深究下可以發現,其組建團隊開始研究方面其實并不晚。當前全球消費電子市場持續低迷,蘋果業績連續多季度受到影響,而將生成式AI與其原有的技術,比如說Siri等結合,蘋果可能會帶來更大的創新進展,這無論是對于蘋果還是AI的創新應用都有意義。
-
蘋果
+關注
關注
61文章
24395瀏覽量
198554 -
Siri
+關注
關注
4文章
206瀏覽量
37022 -
生成式AI
+關注
關注
0文章
502瀏覽量
471
發布評論請先 登錄
相關推薦
評論