微軟開發了一種新的AI圖像字幕算法

微軟開發了一種新的圖像字幕算法，在某些有限的測試中，其準確率超過了人類。該人工智能系統已被用于更新該公司為視障人士提供的助理應用程序 “Seeing AI”，并將很快被納入Word、Outlook和PowerPoint等其他微軟產品中。在那里，它將被用于為圖像創建alt文本等任務，這一功能對于提高無障礙性尤為重要。

這些應用包括微軟自己的Seeing AI，該公司于2017年首次發布。Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。它可以識別家庭物品，閱讀和掃描文本，描述場景，甚至識別朋友。它還可以用來描述其他應用中的圖像，包括電子郵件客戶端、社交媒體應用和WhatsApp等消息應用。

微軟沒有披露Seeing AI的用戶數量，但Azure AI的企業副總裁Eric Boyd告訴The Verge，該軟件是 “為盲人或低視力人士提供的領先應用之一”。Seeing AI已經連續三年被盲人和低視力iOS用戶社區AppleVis評選為最佳應用或最佳輔助應用。

微軟新的圖像字幕算法將顯著提高Seeing AI的性能，因為它不僅能識別物體，還能更精確地描述它們之間的關系。因此，該算法可以在看一張圖片時，不僅能說出圖片中包含哪些物品和物體（如 “一個人、一把椅子、一個手風琴”），還能說出它們之間的互動關系（如 “一個人坐在椅子上，正在拉手風琴”）。微軟表示，該算法是其之前自2015年開始使用的圖像字幕系統的兩倍。

該算法在9月份發表的一篇預印論文中進行了描述，在一個被稱為 “nocaps ”的圖像字幕基準測試上取得了有史以來最高的分數。這是一個業界領先的圖像字幕評分板，不過它有自己的限制條件。nocaps基準測試由超過166，000個人類生成的字幕組成，描述了從Open Images Dataset中提取的約15，100張圖片。這些圖片涵蓋了一系列場景，從運動到假日抓拍，再到美食攝影等等。
責任編輯：YYX

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6591

瀏覽量
104027
AI

AI

+關注

關注
87

文章
30757

瀏覽量
268902

AI圖像識別攝像機

？AI圖像識別攝像機是一種集成了先進算法和深度學習模型的智能監控設備。這些攝像機不僅能夠捕捉視頻畫面，還能實時分析和處理所拍攝的內容，從而實現對特定對象、場景或行

發表于 11-08 10:38 ?230次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識別攝像機

愛普生開發了一種烤箱控制的晶體振蕩器，其功耗比傳統OCXOs1低56%

愛普生開發了一種烤箱控制的晶體振蕩器，其功耗比傳統OCXOs1低56%-該振蕩器小巧且節能，是下一代通信基礎設施中參考信號源應用的理想選擇-精工愛普生公司（TSE:6724，“愛普生”）開發了

發表于 10-29 11:28 ?178次閱讀

BitEnergy AI公司開發出一種新AI處理方法

BitEnergy AI公司，一家專注于人工智能（AI）推理技術的企業，其工程師團隊創新性地開發了一種名為線性復雜度乘法（L-Mul）的

發表于 10-22 15:15 ?388次閱讀

圖像識別算法的提升有哪些

方法。數據增強數據增強是提高圖像識別算法性能的一種有效方法。通過對訓練數據進行變換和擴展，可以增加數據的多樣性，提高模型的泛化能力。常見的數據增強方法包括： 2.1 旋轉、縮放、平移和翻轉通過對

發表于 07-16 11:12 ?641次閱讀

圖像識別算法的優缺點有哪些

圖像識別算法是一種利用計算機視覺技術對圖像進行分析和理解的方法，它在許多領域都有廣泛的應用，如自動駕駛、醫療診斷、安全監控等。然而，圖像識別

發表于 07-16 11:09 ?1551次閱讀

Whatsapp正在開發一種新的生成人工智能功能

據悉，Whatsapp正在開發一種新的生成人工智能功能，該功能應允許用戶制作自己的個性化頭像，用于任何想象中的場景。WABetaInfo在新的Android版WhatsApp測試版2.24.14.7

發表于 07-14 17:50 ?991次閱讀

rup是一種什么模型

RUP（Rational Unified Process，統一建模語言）是一種軟件開發過程模型，它是一種迭代和增量的軟件開發方法。RUP是由

發表于 07-09 10:13 ?1245次閱讀

日本九州大學開發了名為QDyeFinder的人工智能(AI)工具

在探索大腦這一宇宙中最復雜結構的征途中，科學家們不斷突破技術的邊界，以更精細、更高效的方式揭示其奧秘。近期，日本九州大學的研究團隊在《自然·通訊》雜志上發表了一項革命性的研究成果，他們開發了一

發表于 07-03 14:43 ?479次閱讀

基于一種AI輔助可穿戴微流控比色傳感器系統

存在的挑戰限制了這項技術的實際應用。據麥姆斯咨詢報道，為了克服這些挑戰，來自中國石油大學（華東）的研究人員開發了一種人工智能（AI）輔助的可穿戴微流控比色傳感器系統（AI-WMCS）

發表于 06-29 10:57 ?1.1w次閱讀

微軟網頁版PPT新增語音識別及字幕生成功能

據報道，微軟計劃于今年六月份推出網頁版PowerPoint全新語音識別功能。此項功能將能夠監控PowerPoint視頻中的聲音，進而自動生成字幕。

發表于 05-16 14:36 ?416次閱讀

微軟在天氣預報領域突破，新AI模型精準預測未來30天

微軟在天氣預報領域取得顯著成果。其Start團隊成功研發了一種全新AI模型，能夠更精準地預測未來30天的天氣狀況。

發表于 05-10 11:23 ?808次閱讀

微軟開發新AI語言模型MAI-1，挑戰行業巨頭

據最新消息，微軟正積極開發一款新型AI語言模型MAI-1，以提升在快速發展的AI市場中的競爭力。

發表于 05-08 10:27 ?451次閱讀

博世與微軟合作開發生成式AI產品

全球知名科技公司博世與微軟聯合宣布，雙方已建立合作關系，共同致力于開發先進的生成式AI產品。這一合作的核心目標在于通過利用生成式AI技術來進

發表于 03-05 11:17 ?893次閱讀

利用AI實現自動圖像標注不是夢

一次次的將圖像添加標簽進行分類，如此機械式的操作是否令你心煩？為不多不少的圖像分類標注工作不得不增加一個崗位？你是否因圖像標注需求和數據安全

發表于 01-04 08:29 ?1303次閱讀

FPGA圖像處理-CLAHE算法介紹(一)

在介紹CLAHE算法之前必須要先提一下直方圖均衡化，直方圖均衡化算法是一種常見的圖像增強算法，可

發表于 01-02 13:32 ?1726次閱讀

精選推薦
更多

文章

資料

帖子

算力荒緩解，自主化智算還有必要嗎？

腦極體
4小時前

221 閱讀

芯對話|賦能通信變革，創享無限互聯

芯佰微電子
5小時前

138 閱讀

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

803 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
2天前

740 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
3天前

963 閱讀

電路設計技術與技巧_周玉坤

黃靈智
19.4 MB

免費

0下載

基于openharmony適配移植的可滑動視圖堆棧教程

姚小熊27
0.12 MB

免費

1下載

RenderHelp可編程渲染管線實現

凌流浪
5.03 MB

2積分

1下載

iKnowledge博客系統

莫聯雪
0.07 MB

2積分

1下載

一種重量測量儀器-高端稱重系統顯示模塊

李明
0.14 MB

2積分

1下載

飛凌嵌入式-ELFBOARD 硬件知識分享-ELF 2電源電路講解

jf_02372380
15小時前

215 閱讀

CSU-IDE是否支持函數指針

七月小子
1天前

182 閱讀

【正點原子STM32H7R3開發套件試用體驗】開箱、簡介、上電、工程測試

jf_07365693
1天前

147 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

327 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
2天前

503 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

微軟開發了一種新的AI圖像字幕算法

評論

AI圖像識別攝像機

愛普生開發了一種烤箱控制的晶體振蕩器，其功耗比傳統OCXOs1低56%

BitEnergy AI公司開發出一種新AI處理方法

圖像識別算法的提升有哪些

圖像識別算法的優缺點有哪些

Whatsapp正在開發一種新的生成人工智能功能

rup是一種什么模型

日本九州大學開發了名為QDyeFinder的人工智能(AI)工具

基于一種AI輔助可穿戴微流控比色傳感器系統

微軟網頁版PPT新增語音識別及字幕生成功能

微軟在天氣預報領域突破，新AI模型精準預測未來30天

微軟開發新AI語言模型MAI-1，挑戰行業巨頭

博世與微軟合作開發生成式AI產品

利用AI實現自動圖像標注不是夢

FPGA圖像處理-CLAHE算法介紹(一)