我們決定忽略顯而易見的事情。我們知道,大型語言模型將繼續占據主導地位。監管機構將變得更加大膽。人工智能的問題——從偏見到版權再到末日論——將影響研究人員、監管機構和公眾的議程,不僅在 2024 年,而且在未來幾年。
相反,我們挑選了一些更具體的趨勢。以下是 2024 年需要注意的事項。
1. 定制聊天機器人
你會得到一個聊天機器人!你會得到一個聊天機器人!到2024年,在生成式人工智能方面投入巨資的科技公司將面臨壓力,需要證明他們可以從他們的產品中賺錢。為此,人工智能巨頭谷歌(Google)和OpenAI正在大舉押注:兩家公司都在開發用戶友好的平臺,允許人們定制強大的語言模型,并制作自己的迷你聊天機器人來滿足他們的特定需求,而無需編碼技能。兩家公司都推出了基于網絡的工具,允許任何人成為生成式人工智能應用程序開發人員。
到 2024 年,生成式 AI 實際上可能對普通的非技術人員有用,我們將看到更多的人修補一百萬個小 AI 模型。最先進的 AI 模型,如 GPT-4 和 Gemini,是多模態的,這意味著它們不僅可以處理文本,還可以處理圖像甚至視頻。這項新功能可以解鎖一大堆新應用程序。例如,房地產經紀人可以上傳以前房源中的文本,只需單擊一個按鈕即可微調強大的模型以生成類似的文本,上傳新房源的視頻和照片,只需讓定制的 AI 生成房產描述。
但是,當然,這個計劃的成功取決于這些模型是否可靠地工作。語言模型經常會編造一些東西,而生成模型則充滿了偏見。它們也很容易被黑客入侵,特別是如果它們被允許瀏覽網頁??萍脊具€沒有解決這些問題。當新奇感消失時,他們將不得不為客戶提供處理這些問題的方法。
2. 生成式人工智能的第二波浪潮將是視頻
令人驚訝的是,夢幻般的事物變得如此迅速。2022 年,第一批生成逼真圖像的生成模型成為主流,并很快變得司空見慣。OpenAI 的 DALL-E、Stability AI 的 Stable Diffusion 和 Adobe 的 Firefly 等工具充斥著互聯網上令人瞠目結舌的圖片,從巴黎世家的教皇到獲獎藝術,應有盡有。但這并不全是好玩的:對于每一個揮舞著絨球的哈巴狗來說,還有另一件仿冒的幻想藝術或性別歧視的性別刻板印象。新的領域是文本到視頻。期望它把所有關于文本到圖像的好的、壞的或丑陋的東西都放大。
一年前,我們第一次看到了生成模型在訓練將多個靜止圖像拼接成幾秒鐘長的剪輯時可以做什么。結果是扭曲和生澀的。但技術已經迅速改進。
Runway是一家制作生成視頻模型的初創公司(以及共同創建Stable Diffusion的公司),每隔幾個月就會發布其工具的新版本。它的最新型號稱為Gen-2,仍然生成只有幾秒鐘長的視頻,但質量是驚人的。 最好的剪輯離皮克斯可能推出的并不遙遠。
Runway 設立了一年一度的 AI 電影節,展示使用一系列 AI 工具制作的實驗電影。今年的電影節有60,000美元的獎金,10部最佳電影將在紐約和洛杉磯放映。 頂級工作室注意到這一點也就不足為奇了。包括派拉蒙和迪士尼在內的電影巨頭現在正在探索在其制作流程中使用生成式人工智能。該技術被用于對演員的表演進行口型同步,以配音多個外語配音。它正在重塑特效的可能性。2023 年,《印第安納瓊斯與命運轉盤》由一位衰老的深度偽造哈里森福特主演。這僅僅是個開始。
在大銀幕之外,用于營銷或培訓目的的深度偽造技術也在起飛。例如,總部位于英國的 Synthesia 開發的工具可以將演員的一次性表演變成源源不斷的深度偽造化身,只需按一下按鈕即可背誦您給他們的任何劇本。據該公司稱,其技術現在被 44% 的財富 100 強公司使用。
用這么少的東西做這么多事情的能力給演員帶來了嚴重的問題。對工作室使用和濫用人工智能的擔憂是去年SAG-AFTRA罷工的核心。但這項技術的真正影響才剛剛顯現出來。“電影制作的工藝正在發生根本性的變化,”獨立電影制片人、專門從事創意技術咨詢公司Bell & Whistle的聯合創始人Souki Mehdaoui說。
3. AIGC的選舉虛假信息將無處不在
如果最近的選舉有什么可取之處,那么人工智能生成的選舉虛假信息和深度偽造將是一個巨大的問題,因為 2024 年將有創紀錄的人數參加投票。我們已經看到政客們將這些工具武器化。在阿根廷,兩名總統候選人創建了人工智能生成的對手圖像和視頻來攻擊他們。在斯洛伐克,一位自由派親歐洲政黨領導人威脅要提高啤酒價格,并拿兒童色情制品開玩笑,在該國選舉期間像野火一樣傳播開來。在美國,唐納德·特朗普(Donald Trump)為一個使用人工智能生成帶有種族主義和性別歧視比喻的迷因(memes)的團體歡呼。
雖然很難說這些例子對選舉結果有多大影響,但它們的擴散是一個令人擔憂的趨勢。在網上識別什么是真實的將變得比以往任何時候都更難。在已經激化和兩極分化的政治氣候中,這可能會產生嚴重后果。
就在幾年前,創建深度偽造需要先進的技術技能,但生成式人工智能使它變得非常容易和容易獲得,而且輸出看起來越來越逼真。即使是信譽良好的來源也可能被人工智能生成的內容所愚弄。例如,用戶提交的人工智能生成的圖像,旨在描繪以色列-加沙危機,已經充斥著像Adobe這樣的庫存圖像市場。
對于那些與此類內容擴散作斗爭的人來說,來年將是關鍵的一年。跟蹤和緩解其內容的技術仍處于開發的早期階段。水印,例如 Google DeepMind 的 SynthID,仍然大多是自愿的,并非完全萬無一失。眾所周知,社交媒體平臺在刪除錯誤信息方面進展緩慢。準備好進行大規模的實時實驗,以破壞人工智能生成的假新聞。
4. 多任務機器人
受到生成式人工智能當前繁榮背后的一些核心技術的啟發,機器人專家開始構建更多可以執行更廣泛任務的通用機器人。在過去的幾年里,人工智能已經從使用多個小模型(每個模型被訓練來執行不同的任務——識別圖像、繪制圖像、為它們添加標題)轉向單個、單一的單體模型,這些模型經過訓練可以完成所有這些事情,甚至更多。通過向 OpenAI 的 GPT-3 展示一些額外的示例(稱為微調),研究人員可以訓練它解決編碼問題、編寫電影腳本、通過高中生物學考試等。多模態模型,如 GPT-4 和 Google DeepMind 的 Gemini,可以解決視覺任務和語言任務。同樣的方法也適用于機器人,因此沒有必要訓練一個機器人翻轉煎餅,另一個機器人打開門:一個放之四海而皆準的模型可以讓機器人能夠同時處理多項任務。2023 年出現了該領域的幾個工作實例。今年6月,DeepMind發布了Robocat(去年Gato的更新),它通過反復試驗生成自己的數據,以學習如何控制許多不同的機器人手臂(而不是更典型的一個特定手臂)。今年10月,該公司與33個大學實驗室合作,推出了另一個通用機器人模型RT-X,以及一個大型的新通用訓練數據集。其他頂級研究團隊,如加州大學伯克利分校的RAIL(機器人人工智能和學習),正在研究類似的技術。
問題是缺乏數據。生成式 AI 利用互聯網大小的文本和圖像數據集。相比之下,機器人很少有好的數據來源來幫助它們學習如何完成我們希望它們完成的許多工業或家庭任務。
紐約大學的勒雷爾·平托(Lerrel Pinto)領導了一個團隊來解決這個問題。他和他的同事們正在開發技術,讓機器人通過反復試驗來學習,并隨時提出自己的訓練數據。在一個更加低調的項目中,平托招募了志愿者,使用安裝在垃圾撿拾器上的iPhone攝像頭從他們家中收集視頻數據。在過去的幾年里,大公司也開始發布用于訓練機器人的大型數據集,例如 Meta 的 Ego4D。
這種方法已經在無人駕駛汽車中顯示出前景。Wayve、Waabi 和 Ghost 等初創公司正在引領新一波自動駕駛 AI,它使用單個大型模型來控制車輛,而不是多個小型模型來控制特定的駕駛任務。這讓小公司趕上了 Cruise 和 Waymo 等巨頭。Wayve現在正在倫敦狹窄繁忙的街道上測試其無人駕駛汽車。世界各地的機器人都將獲得類似的推動力。
審核編輯:劉清
-
人工智能
+關注
關注
1791文章
47206瀏覽量
238279 -
GPT
+關注
關注
0文章
354瀏覽量
15345 -
聊天機器人
+關注
關注
0文章
339瀏覽量
12306 -
OpenAI
+關注
關注
9文章
1082瀏覽量
6483 -
AIGC
+關注
關注
1文章
361瀏覽量
1539
原文標題:MIT科技評論:2024 年 AI 的四大熱門趨勢
文章出處:【微信號:軟件質量報道,微信公眾號:軟件質量報道】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論