色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認(rèn)識(shí)你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

圖像捕獲是AI中最難的問題之一

長期以來，AI的目標(biāo)就是準(zhǔn)確地描述圖像，而不僅僅是像笨拙的機(jī)器人。谷歌在2016年表示，其人工智能可以為人類提供幾乎與人類一樣的字幕圖像，準(zhǔn)確度達(dá)到94%。現(xiàn)在，微軟表示，它走得更遠(yuǎn)：它的研究人員建立了一個(gè)AI系統(tǒng)，甚至比人類更準(zhǔn)確-以至于現(xiàn)在坐上了榜首的nocaps圖像字幕標(biāo)桿。微軟聲稱其自2015年以來一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個(gè)顯著的里程碑，但微軟不僅僅是將這項(xiàng)技術(shù)保留在自己手中。現(xiàn)在，它作為Azure認(rèn)知服務(wù)的一部分提供了新的字幕模型，因此任何開發(fā)人員都可以將其引入他們的應(yīng)用程序中。今天，它也可以在Seeing AI中使用，Seeing AI是面向盲人和視障用戶的Microsoft應(yīng)用程序，可以描述周圍的世界。今年下半年，字幕模型還將改善您在PowerPoint中針對Web，Windows和Mac的演示文稿。它還會(huì)在桌面平臺(tái)的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時(shí)說：“圖像捕獲是AI中最難的問題之一。它不僅代表理解場景中的對象，還包括它們之間的交互方式，以及如何描述它們。”精細(xì)的字幕技術(shù)可以為每個(gè)用戶提供幫助：它使在搜索引擎中查找所需圖像變得更加容易;對于視障用戶，它可以使瀏覽網(wǎng)絡(luò)和軟件變得更加出色。

看到公司吹捧他們的AI研究創(chuàng)新并不少見，但是將這些發(fā)現(xiàn)迅速部署到運(yùn)輸產(chǎn)品中卻很少見。Azure AI認(rèn)知服務(wù)的CTO Huang Xuedong出于對用戶的潛在好處，推動(dòng)將其迅速集成到Azure中。他的團(tuán)隊(duì)使用標(biāo)記有特定關(guān)鍵字的圖像對模型進(jìn)行了訓(xùn)練，這有助于使它成為大多數(shù)AI框架所沒有的視覺語言。通常，這些類型的模型是使用圖像和完整標(biāo)題訓(xùn)練的，這使得模型更難于學(xué)習(xí)特定對象的交互方式。

“視覺詞匯預(yù)訓(xùn)練本質(zhì)上是訓(xùn)練系統(tǒng)所需的教育;我們正在嘗試教育這種運(yùn)動(dòng)記憶，”黃在博客文章中說。這就是這種新模型在nocaps基準(zhǔn)測試中的優(yōu)勢，該基準(zhǔn)測試側(cè)重于確定AI可以如何為字幕創(chuàng)建字幕，這些字幕從未見過。

但是，盡管要打破基準(zhǔn)很重要，但微軟新模型的真正考驗(yàn)將是它在現(xiàn)實(shí)世界中的功能。據(jù)博伊德說，Seeing AI開發(fā)人員Saqib Shaik也在自己的盲人手中推動(dòng)了Microsoft的更大可訪問性，他說這是對他們先前產(chǎn)品的巨大改進(jìn)。既然微軟已經(jīng)設(shè)定了一個(gè)新的里程碑，那么有趣的是，看看來自Google和其他研究人員的競爭模型也將如何競爭。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6643

瀏覽量
104845
機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
212

文章
28910

瀏覽量
209657
AI

AI

+關(guān)注

關(guān)注
87

文章
32439

瀏覽量
271629

圖像采集卡：現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

直接影響到圖像的質(zhì)量和處理效率。本文將系統(tǒng)探討圖像采集卡的定義、工作原理、應(yīng)用領(lǐng)域以及未來發(fā)展趨勢。一、圖像采集卡的定義圖像采集卡，通常被稱

發(fā)表于 02-20 10:42 ?117次閱讀

<b class='flag-5'>圖像</b>采集卡：現(xiàn)代<b class='flag-5'>圖像</b>處理技術(shù)的關(guān)鍵組件

攝像頭捕獲 2D 圖像，深度傳感器拉長距離

的，但單獨(dú)的攝像頭只能捕獲2D圖像。為了發(fā)揮作用，還需要使他們獲得深度信息。例如:自動(dòng)感應(yīng)水龍頭需要識(shí)別與手的距離、機(jī)器人和自動(dòng)駕駛汽車需要檢測到與物體的距離以避免碰

發(fā)表于 12-08 01:01 ?440次閱讀

攝像頭<b class='flag-5'>捕獲</b> 2D <b class='flag-5'>圖像</b>，深度傳感器拉長距離

高通AI Hub：輕松實(shí)現(xiàn)Android圖像分類

高通AI Hub為開發(fā)者提供了一個(gè)強(qiáng)大的平臺(tái)，以優(yōu)化、驗(yàn)證和部署在Android設(shè)備上的機(jī)器學(xué)習(xí)模型。這篇文章將介紹如何使用高通AI Hub進(jìn)行圖像分類的程式碼開發(fā)，并提供

發(fā)表于 11-26 01:03 ?486次閱讀

高通<b class='flag-5'>AI</b> Hub：輕松實(shí)現(xiàn)Android<b class='flag-5'>圖像</b>分類

如何在STM32f4系列開發(fā)板上部署STM32Cube.AI，

已下載STM32Cube.AI擴(kuò)展包，但是無法使用，感覺像是沒有部署AI模型，我是想要通過攝像頭拍照，上傳圖像后，經(jīng)過開發(fā)板處理器進(jìn)行AI模型處理識(shí)別過后，告訴我識(shí)別結(jié)果，顯示在TFL

發(fā)表于 11-18 09:39

AI圖像識(shí)別攝像機(jī)

隨著科技的迅猛發(fā)展，人工智能（AI）在各個(gè)領(lǐng)域的應(yīng)用越來越廣泛，其中圖像識(shí)別技術(shù)尤為引人注目。AI圖像識(shí)別攝像機(jī)作為這一技術(shù)的重要應(yīng)用

發(fā)表于 11-08 10:38 ?497次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識(shí)別攝像機(jī)

AI大模型的訓(xùn)練數(shù)據(jù)來源分析

AI大模型的訓(xùn)練數(shù)據(jù)來源廣泛且多元化，這些數(shù)據(jù)源對于構(gòu)建和優(yōu)化AI模型至關(guān)重要。以下是對AI大模型訓(xùn)練數(shù)據(jù)來源的分析：一、公開數(shù)據(jù)集公開數(shù)據(jù)集是

發(fā)表于 10-23 15:32 ?2289次閱讀

AI大模型在圖像識(shí)別中的優(yōu)勢

AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢，這些優(yōu)勢主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像識(shí)別中優(yōu)勢的介紹：

發(fā)表于 10-23 15:01 ?1583次閱讀

《DNK210使用指南 -CanMV版 V1.0》第二十六章攝像頭圖像捕獲實(shí)驗(yàn)

第二十六章攝像頭圖像捕獲實(shí)驗(yàn) 本章將介紹CanMV下攝像頭的使用，能通過攝像頭實(shí)時(shí)地采集攝像頭捕獲到的圖像數(shù)據(jù)，從而進(jìn)行進(jìn)一步的處理。通過

發(fā)表于 10-23 10:05

圖像采集卡：增強(qiáng)視覺數(shù)據(jù)采集

。什么是圖像采集卡？圖像采集卡，是一種專門用于捕獲和處理來自不同來源的視頻信號或圖像的硬件組件。它們充當(dāng)成像設(shè)備（例如相機(jī)或視頻源）與計(jì)算機(jī)

發(fā)表于 09-24 11:06 ?439次閱讀

Freepik攜手Magnific AI推出AI圖像生成器

近日，設(shè)計(jì)資源巨頭Freepik攜手Magnific AI，共同推出了革命性的AI圖像生成器——Freepik Mystic，這一里程碑式的發(fā)布標(biāo)志著

發(fā)表于 08-30 16:23 ?1282次閱讀

是德DSOX4032A示波器波形捕獲率

在電子工程領(lǐng)域，示波器是不可或缺的工具之一。而其中，是德DSOX4032A示波器以其卓越的性能和精準(zhǔn)的測量能力備受青睞。今天，我們就來深入了解一下是德DSOX4032A示波器的波形捕獲率。一

發(fā)表于 08-30 15:38 ?376次閱讀

OpenAI發(fā)布圖像檢測分類器，可區(qū)分AI生成圖像與實(shí)拍照片

據(jù)OpenAI介紹，初步測試結(jié)果表明，該分類器在辨別非AI生成圖像與DALL·E 3生成圖像時(shí)，成功率高達(dá)近98%，僅有不到0.5%的非AI圖像

發(fā)表于 05-09 09:57 ?584次閱讀

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測試，基于Stable Diffusion

UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測試，以計(jì)算機(jī)視覺工作負(fù)載評估AI推理性能。新推出的圖像生成測試將提供統(tǒng)一、精確且易于理解的工作負(fù)載，用以保證各支持硬件間

發(fā)表于 03-25 16:16 ?1065次閱讀

AI女友比AI男友更受歡迎？前者是后者的700%+

生成式 AI 催生了各種新的應(yīng)用類別，但其中最大的影響之一是重新激活了 AI 約會(huì)和陪伴……

發(fā)表于 03-18 09:07 ?595次閱讀

求一種油冷扁線電機(jī)開發(fā)多物理域設(shè)計(jì)高效解決方案

散熱冷卻是電機(jī)設(shè)計(jì)過程中最難處理的問題之一。只有提升電機(jī)的散熱效果，才能實(shí)現(xiàn)更高的功率密度和轉(zhuǎn)矩密度。

發(fā)表于 03-13 10:36 ?673次閱讀

精選推薦
更多

文章

資料

帖子

中國工程院：人形機(jī)器人技術(shù)與產(chǎn)業(yè)發(fā)展研究，我國傳感器等核心技術(shù)處于什么水平？

傳感器專家網(wǎng)
13小時(shí)前

274 閱讀

Thingy:91#具有LTE-M、NB-IoT、GNSS連接和各種環(huán)境傳感器的Nordic原型構(gòu)建平臺(tái)

eeDesigner
14小時(shí)前

381 閱讀

解鎖車載充電器（OBC）設(shè)計(jì)密碼：工程師必備 PDF 手冊免費(fèi)下載！

eeDesigner
14小時(shí)前

311 閱讀

MDC91128S數(shù)據(jù)手冊#128 通道、20 位電流輸入 ADC

eeDesigner
14小時(shí)前

184 閱讀

北京迅為RK3568開發(fā)板OpenHarmony系統(tǒng)南向驅(qū)動(dòng)開發(fā)內(nèi)核HDF驅(qū)動(dòng)框架架構(gòu)

北京迅為電子
17小時(shí)前

261 閱讀

以太網(wǎng)控制器驅(qū)動(dòng)免費(fèi)下載

yezi888
19.6 MB

免費(fèi)

245下載

ADI經(jīng)典模數(shù)轉(zhuǎn)換器應(yīng)用筆記

guozhixi
11976KB

5積分

77下載

AM335x和amic110該?處理器技術(shù)參考手冊

jfzhangjin
12.0 MB

1積分

17下載

openharmony第三方組件適配移植的音頻可視化器教程案例

姚小熊27
3.17 MB

免費(fèi)

1下載

Bona文件信息查看器

馬祥
4.60 MB

免費(fèi)

0下載

LT3763做恒流驅(qū)動(dòng)電路時(shí)沒有電流輸出

jf_46444766
1天前

368 閱讀

這個(gè)電路是用來控制正負(fù)12v的切換的，mcu高電平cp為正12v，低電平cp為負(fù)12v，幫忙看看電路有什么問題。

jf_06242780
1天前

365 閱讀

【米爾-全志T536開發(fā)板試用體驗(yàn)】燒寫系統(tǒng)與外設(shè)測試

jinyi7016
1天前

459 閱讀

HarmonyOS NEXT 原生應(yīng)用/元服務(wù)-ArkTS代碼調(diào)試反向調(diào)試

李洋水蛟龍
1天前

330 閱讀

迅為RK3588開發(fā)板實(shí)時(shí)系統(tǒng)編譯-Preemption系統(tǒng)/ Xenomai系統(tǒng)編譯-實(shí)時(shí)系統(tǒng)測試-Preemption測試

jf_23361246
1天前

409 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

圖像捕獲是AI中最難的問題之一

評論

圖像采集卡：現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

攝像頭捕獲 2D 圖像，深度傳感器拉長距離

高通AI Hub：輕松實(shí)現(xiàn)Android圖像分類

如何在STM32f4系列開發(fā)板上部署STM32Cube.AI，

AI圖像識(shí)別攝像機(jī)

AI大模型的訓(xùn)練數(shù)據(jù)來源分析

AI大模型在圖像識(shí)別中的優(yōu)勢

《DNK210使用指南 -CanMV版 V1.0》第二十六章攝像頭圖像捕獲實(shí)驗(yàn)

圖像采集卡：增強(qiáng)視覺數(shù)據(jù)采集

Freepik攜手Magnific AI推出AI圖像生成器

是德DSOX4032A示波器波形捕獲率

OpenAI發(fā)布圖像檢測分類器，可區(qū)分AI生成圖像與實(shí)拍照片

UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測試，基于Stable Diffusion

AI女友比AI男友更受歡迎？前者是后者的700%+

求一種油冷扁線電機(jī)開發(fā)多物理域設(shè)計(jì)高效解決方案