中文字幕家政妇,在线免费观看h,在线观看网站

在全球所有 AI 模型中，OpenAI 的 GPT-3 最能引發公眾的遐想。

雖然它可以僅憑很少的文本來輸出詩歌、短篇小說和歌曲，并且成功地讓人們相信這是人類的創作。但是，它在同人類對話時還是顯得非常“幼稚”。可盡管如此，技術人員依然認為，創造了 GPT-3 的技術可能是通往更高級 AI 的必經之路。

GPT-3 使用大量文本數據進行了訓練，那么，假如同時使用文本和圖像數據進行訓練，會發生什么呢？

艾倫人工智能研究所（AI2）在這個問題上取得了進展，技術人員開發了一種新的視覺語言模型，可以根據給定的文本生成對應圖像。

不同于 GAN 所生成的超現實主義作品，AI2 生成的這些圖像看起來非常怪異，但它的確可能是一個實現通用人工智能的新路徑。

AI“做題家”

GPT-3 在分類上屬于 “Transformer” 模型，隨著 Google BERT 的成功，該模型開始流行。而在 BERT 之前，語言模型可用性不佳。

它們雖然具備一定的預測能力，但并不足以生成符合語法和常識的長句子。BERT 通過引入一種稱為 “masking（遮罩）” 的新技術，使模型這方面的能力得到了大幅加強。

模型會被要求完成類似下面的填空題：

這位女士去___鍛煉。

他們買了一個___面包做三明治。

這個想法初衷是，如果強迫模型進行數百萬次的這類練習，它是否可能學會如何將單詞組合成句子以及如何將句子組合成段落。測試結果表明，模型確實獲得了更好地生成和解釋文本的能力（Google 正在使用 BERT 幫助在其搜索引擎中提供更多相關的搜索結果）。

在證明遮罩行之有效之后，技術人員試圖通過將文本中的單詞隱藏，將其應用于視覺語言模型，例如：

一只站立在樹木旁的___。(來源：MIT TR)

通過數百萬次的訓練，它不僅可以發現單詞之間的組合模式，還可以發現單詞與圖像中元素之間的關聯。

這樣的結果就是模型擁有了將文字描述與視覺圖像相關聯的能力，就像人類的嬰兒可以在他們所學的單詞同所見事物之間建立聯系一樣。

舉個例子，當模型讀取到下面的圖片，便可以給出一個較為貼切標題，如 “打曲棍球的女人”。或者它們可以回答諸如“球是什么顏色？” 之類的問題，因為模型可以將單詞 “球” 與圖像中的圓形物體關聯。

圖 | 女子曲棍球比賽 (來源：MIT TR)

一圖勝千言

技術人員想知道這些模型是否真的像嬰兒一樣 “學會” 了認識這個世界。

孩子不僅可以在看到圖像時聯想到單詞，還可以在看到單詞時在頭腦中浮現出對應的圖像，哪怕這個圖像是真實和想象的混合體。

技術人員嘗試讓模型做同樣的事情：根據文本生成圖像。然后模型吐出了無意義的像素圖案。

得到這樣的結果是有原因的，將文本轉換為圖像的任務相比其他要困難得多。AI2 的計算機視覺團隊負責人 Ani Kembhavi 說，文本并未指定圖像中包含的所有內容。因此，模型需要 “聯想” 許多現實世界的常識來填充細節。

例如，假設 AI 被要求繪制“在道路上行走的長頸鹿”，它需要推斷出這條道路更可能是灰色而不是粉色，并且更可能毗鄰草地而不是海洋——盡管這些信息都不明確。

因此 Kembhavi 和他的同事 Jaemin Cho、Jiasen Lu 和 Hannaneh Hajishirzi 決定看看他們是否可以通過調整遮罩的方式，來教授 AI 所有這些隱式視覺知識。他們訓練模型不是為了從對應圖片中預測被遮蓋的單詞，而是為了讓它能從文本中 “腦補” 圖片中的缺失部分。

雖然模型最終生成的圖像并不完全真實，但這不是重點。重要的是這預示著模型已經包含了正確的高級視覺概念，即 AI 一定程度上具備了兒童的根據文本畫圖的能力。

圖 | AI2 模型根據文本生成的圖像示例 (來源：MIT TR)

視覺語言模型獲得此類圖像生成的能力代表了 AI 研究的重要一步，這表明該模型實際上具有一定程度的抽象能力，而這是理解世界的基本技能。

未來，這項技術很可能對機器人領域產生極大影響。機器人可以使用語言進行交流，當它們對視覺信息的理解越好，就越能夠執行復雜的任務。

Hajishirzi 說，從短期來看，這種可視化還可以幫助技術人員更好地理解 AI 模型的學習過程。之后，AI2 團隊計劃展開更多實驗，以提高圖像生成的質量，并拓寬模型的視覺和語言。

文章出處：【微信公眾號：DeepTech深科技】歡迎添加關注！文章轉載請注明出處。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31097

瀏覽量
269434
人工智能

人工智能

+關注

關注
1792

文章
47409

瀏覽量
238924

原文標題：這些令人不安的照片，表明AI越來越聰明了！它正在學習根據文字生成圖片

文章出處：【微信號：deeptechchina，微信公眾號：deeptechchina】歡迎添加關注！文章轉載請注明出處。

AI時代算力的重要性及現狀:平衡發展與優化配置的挑戰

瓦時的電力。訓練一次擁有1746億參數的GPT-3模型，所需的算力更是高達3640PFlops，耗資466萬美元。

發表于 11-04 11:45 ?459次閱讀

Llama 3 與 GPT-4 比較

隨著人工智能技術的飛速發展，我們見證了一代又一代的AI模型不斷突破界限，為各行各業帶來革命性的變化。在這場技術競賽中，Llama 3和GPT-4作為兩個備受矚目的模型，它們代表了當前AI

發表于 10-27 14:17 ?386次閱讀

英偉達預測機器人領域或迎“GPT-3時刻”

未來2-3年內，機器人基礎模型的研究將迎來重大突破，這一時刻被形象地比喻為機器人領域的“GPT-3時刻”。

發表于 09-20 17:05 ?812次閱讀

Jim Fan展望:機器人領域即將迎來GPT-3式突破

英偉達科學家9月19日，科技媒體The Decoder發布了一則引人關注的報道，英偉達高級科學家Jim Fan在近期預測，機器人技術將在未來兩到三年內迎來類似GPT-3在語言處理領域的革命性突破，他稱之為機器人領域的“GPT-3時刻”。

發表于 09-19 15:13 ?601次閱讀

【算能RADXA微服務器試用體驗】+ GPT語音與視覺交互：4，文字轉語音

tts_venv source tts_venv/bin/activate pip3 install https://github.com/radxa-edge/TPU-Edge-AI/releases

發表于 07-15 23:18

耐能推出最新的邊緣AI服務器及內置耐能AI芯片的PC設備

- 耐能的邊緣 AI 服務器 KNEO 330 為中小企業帶來 30-40% 的成本節省，同兼顧隱私和安全性。- 耐能的邊緣 GPT AI

發表于 06-05 10:21 ?650次閱讀

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

電子發燒友網報道（文/李彎彎）當地時間5月13日，OpenAI舉行春季發布會，宣布將推出桌面版ChatGPT，并發布全新旗艦AI模型GPT

發表于 05-15 00:15 ?7855次閱讀

AI的盡頭真是儲能？

能源，社會需要更多的光伏與儲能。 ? 日消耗50萬度電，美國普通家庭用電的1.7萬倍 ? AI的發展日新月異，從文字到圖片再到視頻，其進步速度令人矚目。但這些發展的背后都有著代價，而發

發表于 04-15 09:28 ?3453次閱讀

為什么GPU適用于AI？AI服務器產業鏈格局分析

GPT模型對比BERT模型、T5模型的參數量有明顯提升。GPT-3是目前最大的知名語言模型之一，包含了1750億（175B）個參數。在GPT-3發布之前，最大的語言模型是微軟的Turi

發表于 04-09 10:38 ?937次閱讀

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

2024年第一季度才剛過半，AI領域就大動作不斷，大家卯著勁的出新品，可謂卷出天際。 ? 3月4日，Anthropic發布了最新的Claude 3系列模型，用Anthropic的話說，Claude

發表于 03-06 22:22 ?683次閱讀

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

據悉，“朗讀”功能支持37種語言，且能夠自主識別文本類型并對應相應的發音。值得關注的是，該功能對GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態交互”（multimodal capabilities）的方向

發表于 03-05 15:48 ?958次閱讀

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

近日，AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型，該系列模型在多模態和語言能力等關鍵領域展現出卓越性能，成功擊敗了此前被廣泛認為是全球最強AI模型的GPT

發表于 03-05 09:49 ?701次閱讀

MB91530_590 EVB板添加字庫，能顯示圖片但是沒有文字顯示是為什么？

我的 MB91530_590EVB板在應用例程中添加字庫能顯示圖片但是沒有文字顯示。我是在開發板的例程中修改的。我是按照文檔一步一步做的，為什么顯示不出文字，有知道原因的請盡快回

發表于 02-22 08:19

Rambus HBM3內存控制器IP速率達到9.6 Gbps

在人工智能大模型浪潮的推動下，AI訓練數據集正極速擴增。以ChatGPT為例，去年11月發布的GPT-3，使用1750億個參數構建，今年3月發

發表于 01-23 11:19 ?1014次閱讀

OpenAI GPT商店與ChatGPT Team服務今日上線助力行業創新

近日，備受關注的人工智能（AI）研究機構——OpenAI，宣布其醞釀已久的“Let’s GPT“商店正式上線，并面向公眾開放注冊。 OpenAI表示，近兩個月以來，全球范圍內的用戶已經成功打造出超過

發表于 01-11 11:32 ?695次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

GPT-3引發公眾的遐想能根據文字產生圖片的AI!

評論

AI時代算力的重要性及現狀:平衡發展與優化配置的挑戰

Llama 3 與 GPT-4 比較

英偉達預測機器人領域或迎“GPT-3時刻”

Jim Fan展望:機器人領域即將迎來GPT-3式突破

【算能RADXA微服務器試用體驗】+ GPT語音與視覺交互：4，文字轉語音

耐能推出最新的邊緣AI服務器及內置耐能AI芯片的PC設備

OpenAI全新GPT-4o能力炸場！速度快/成本低，能讀懂人類情緒

AI的盡頭真是儲能？

為什么GPU適用于AI？AI服務器產業鏈格局分析

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

MB91530_590 EVB板添加字庫，能顯示圖片但是沒有文字顯示是為什么？

Rambus HBM3內存控制器IP速率達到9.6 Gbps

OpenAI GPT商店與ChatGPT Team服務今日上線助力行業創新

搜索歷史

GPT-3引發公眾的遐想 能根據文字產生圖片的AI!

評論

GPT-3引發公眾的遐想能根據文字產生圖片的AI!