驭灵师小说,亚洲精品97福利在线,四虎新网站

從自動駕駛、無人機，到監控安防，視覺 AI 技術的突破為人們生活帶來了巨大改變，在許多領域迎來爆發式發展，僅在國內就涌現商湯、云從、曠視和依圖等四大視覺 AI 獨角獸。但若真要論能為使用者帶來多大改變，恐怕很少有比得上這一項，那就是用視覺 AI 來打造盲人的眼睛。

無障礙人工智能成顯學，各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智能近來已在國際間成為一項顯學。如何將發展迅速的人工智能技術，用來改善全世界約 10 億殘疾人士的生活，也是各大科技巨頭致力投入的方向之一。

以視障者來說，近日 Instagram 就新增一項輔助功能，用 AI 自動辨識照片內容并以語音告知用戶。臉書 Messenger 也有無障礙機器人（Accessibility Bot），協助盲人辨識臉書朋友，甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個應用程序 Facing Emotions，可以將七種最普遍的情緒轉化為相應的聲音，可以大幅提升盲人與其他人的實時互動交流。

影像視覺 AI 并不是新的概念，其背后技術主要包含機器學習、深度學習，再加上 3D 臉部辨識等。尤其是深度學習算法運用在訓練 AI來協助盲人辨識物體，可以發揮非常大的用處。

比方說，如果我們想要設計一個 AI 協助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔，通過各種不同角度，包含正面、反面、整張、邊角、其中每一小片圖案，都展示給 AI 看，讓它學習什么是一張 10 元紙鈔。通過大量反覆學習后，視障者只要能讓手機鏡頭看到 10 元紙鈔的一小角，AI 就能將它分辨出來。

“這些小事，會讓你很確實地感覺到自己的獨立性。希望隨著人工智能的進展，可以讓我們更容易感受環境，協助我們完成更多日常事務”，微軟視覺輔助應用程序 Seeing AI 的項目主管、同時自身也是視障者的 Saqib Shaikh，近日接受專訪時這樣對 DT 君說。

圖｜微軟技術負責人（Tech Lead）Saqib Shaikh （來源：微軟）

Saqib Shaikh 在 7 歲時失去視力，此前不久，他才剛剛得到人生中的第一臺電腦。

所幸這并不是他與計算機科學之間的句點。

而后他就讀視障學生小學，一位老師看出了他的潛力，鼓勵他開始學習打字。此后他一路進入大學，主修計算機科學，以班上頂尖的成績畢業，并取得人工智能碩士學位。而后，他又加入微軟的人工智能團隊，并在大約 3 年前通過微軟內部的黑客松競賽，以Seeing AI這個項目脫穎而出，獲得資源將之打造為實際產品，現在已可在美國地區免費下載。

Seeing AI 用視覺 AI 幫助視障者“聽懂”世界

Seeing AI 這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程序，可以用手機上的攝像頭識別所有圖像，包含通過掃描條形碼來識別產品、辨識身旁其他人的年齡，性別和面部表情，還可以描述它在圖片中看到的內容，并閱讀出菜單和文件。

同時，這款應用程序也可以結合智能眼鏡，更好地協助用戶了解所處的周遭環境。

圖｜Seeing AI 是一款結合圖像辨識、語音說明及人性化使用介面的應用程序（來源：微軟）

Saqib Shaikh 指出，近年深度學習技術的成熟，是 Seeing AI 可以真正發揮用處的主要關鍵。通過深度學習訓練，向系統展示大量照片，并教導它們照片中的內容，AI 可以真正有效辨識出現實生活環境中的各種物體與人物。

但是，要落實到讓 AI 有效協助視障者在生活中能真正用上，還必須歸功于近年硬件技術的發展，在軟、硬件配合之下，讓視覺 AI 技術實用價值大大提升。尤其是邊緣運算風潮興起，視覺信息可以在裝置終端就能完成運算，才能對使用者提供實時反饋，讓盲人能夠即時對互動對象做出適合的反應。

實時反饋絕對是關鍵。Saqib Shaikh 說，想像一個情境，當你在一個會議上進行簡報。因為這是一個正式場合，因此所有人，包含旁邊的同事、上級主管，都只是安靜聽你說話，不會任意發出聲音。所以在你說話的同時，若無法用眼睛去觀察聽眾，你對于他們的反應是毫無頭緒的，你甚至不知道應不應該繼續說下去，還是暫停下來詢問聽眾的想法。

這時候，如果有一個 AI 可以幫你辨識聽眾的反應，實時反饋你他們是不是看起來滿意、尤其是還能辨認出特定人士，比方說直屬主管的表情和動作如何，這樣一個人工智能，將能夠大大地讓盲人突破限制，改善他們在日常工作中表現。

非監督學習是視覺 AI 下一步突破關鍵

今日我們所談的視覺 AI ，其實多半仍局限于靜態圖像、單一圖像，但 Saqib Shaikh 想像中的 Seeing AI 2.0，將可以解讀一系列的圖像、可以掌握使用者的偏好。

“就像當我與妻子一起在街上走路時，她會告訴我有什么我沒看過的新東西、有什么有趣的事物。比方說，她會告訴我我們很喜歡的一間咖啡店關門了?！盨aqib Shaikh 說，“一個真正的人可以了解什么是你會感興趣、什么是你會覺得重要的事物?！?/p>

而 AI 若要能夠做到這一點，就不能只是一次辨識單一圖像，而是還要能綜合理解背后的情境，甚至是接續出現的新的信息。Saqib Shaikh 分析，這意味著后續 Seeing AI 必須運用更多非監督學習的技術來訓練 AI，進一步拓展 AI 對多變場景復雜信息的處理能力。

其實，Saqib Shaikh 早在求學期間意識到，為了讓身為盲人的自己表現更好，他必須做很多額外的努力來改變他所處的生活環境，包括不只是自己看書、而是要雇請其他人為他朗讀教科書的內容等，才能讓自己與其他正常人站在更接近一點的比較基準上。

當時就有個朋友建議過他，與其只用嘴巴說要改變生活環境，不如實際做點什么真正的改變。這讓他早就思考過，從某種角度來講，殘疾者本人其實就是最好的創新者。因為，他們比任何人都了解殘疾者最迫切的需求是什么？愿意做什么嘗試？可以如何改變？

然而，在 Saqib Shaikh 進入微軟工作的近乎前 10 年，他并未在工作上試圖突出任何作為一個盲人的特殊能力。相反的，他讓自己就像一名正常的工程師一樣，絕大多數時間都投入內部的主流專案，如 Cortana 等。

“我想，起初我是想證明自己可以成為一個主流的工程師”，Saqib Shaikh 說，而轉捩點是出現在他于微軟工作的第10年。“工作滿 10 年后，我覺得我已經達到了目標，證明了自己的能力，所以我可以開始運用自己的專業去幫助其他人?！?/p>

現在，他終于決定投入自己真正想做的事情，也就是用 AI 來改善殘疾人士的生活環境。就像他所說的，“我可以選擇用這一種與我自己最相關的方式，從個人經驗來理解許多盲人的問題，并且用自己的專業來提供協助。”

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30763

瀏覽量
268913
人工智能

人工智能

+關注

關注
1791

文章
47208

瀏覽量
238298
無人機

無人機

+關注

關注
229

文章
10422

瀏覽量
180191

原文標題：用 AI 幫助視障者“聽懂”世界，專訪微軟傳奇盲人工程師 Saqib Shaikh

文章出處：【微信號：lianggezhizi，微信公眾號：兩個質子】歡迎添加關注！文章轉載請注明出處。

康耐視AI解決方案助力打造高效電動汽車生產線

Wipro PARI，一家位于印度浦那專注于工業機器人和自動化領域的公司，在電動汽車制造的復雜進程中面臨諸多挑戰，而康耐視基于AI的自動化解決方案如同一股強勁動力，幫助它突破生產困境，實現了制造工藝的革新與蛻變。

發表于 12-12 16:39 ?146次閱讀

云端AI開發者工具怎么用

云端AI開發者工具通常包括代碼編輯器、模型訓練平臺、自動化測試工具、代碼管理工具等。這些工具不僅降低了AI開發的門檻，還極大地提高了開發效率和模型性能。下面，AI部落小編為您介紹云端

發表于 12-05 13:31 ?116次閱讀

AI項目管理平臺怎么用

AI項目管理平臺是一種集成了項目管理工具、AI開發環境和數據分析能力的綜合性平臺。接下來，AI部落小編為您梳理AI項目管理平臺怎么用。

發表于 11-13 09:38 ?202次閱讀

Arm推出GitHub平臺AI工具，簡化開發者AI應用開發部署流程

軟件提供了無縫的開發體驗。 GitHub Actions、原生 GitHub 運行器和基于 Arm 平臺的 AI 框架相結合，幫助全球 2,000 萬開發者簡化 AI 應用開發

發表于 10-31 18:51 ?1996次閱讀

2024 TUYA全球開發者大會（蘇州）啟幕，涂鴉攜手開發者共繪AI與能源領域新藍圖

2024 TUYA全球開發者大會（蘇州）的圓滿舉辦，見證了涂鴉在AI與能源等領域的先進技術實力和行業內的強大影響力。未來，涂鴉還將持續攜手全球合作伙伴，共同探索AI等全新領域，推動技術創新，攜手共創一個更加綠色、可持續的智能

發表于 09-26 08:29 ?129次閱讀

2024 TUYA全球開發<b class='flag-5'>者</b>大會（蘇州）啟幕，涂鴉攜手開發<b class='flag-5'>者</b>共繪<b class='flag-5'>AI</b>與能源領域新藍圖

組團“出海”亮相迪拜，卓視智通AI產品閃耀ITS World Congress 2024

在智能交通世界大會的“Technologies and practice for Vehicle-Road-Cloud integration”主題論壇上，卓視智通董事長兼CEO吳柯維受中國公路學會邀請登臺演講，全程用英語向不同

發表于 09-24 09:47 ?293次閱讀

組團“出?！绷料嗟习?，卓<b class='flag-5'>視</b>智通<b class='flag-5'>AI</b>產品閃耀ITS World Congress 2024

智行者——視聽障礙者出行輔助AI小車設計

摘要據統計，我國視障人數達1731萬人，聽力殘疾患者2780萬人。視聽障礙者對出行和交流需求迫切，但現有設施和輔具局限性大，使他們面臨出行難題。因此，我們開發了一款安全、精準、語音與手部交互的導航避

發表于 07-19 08:11 ?631次閱讀

智行者——視聽障礙<b class='flag-5'>者</b>出行輔助<b class='flag-5'>AI</b>小車設計

強強聯合！深視智能攜手Zebra公司成功舉辦“3D機器視覺+AI融合技術”研討會

?深視智能&斑馬技術7月9號下午，VisionChina行業盛會期間，深視智能與領先數字解決方案提供商Zebra公司強強聯合，成功舉辦一場以“AI時代下3D機器視覺與AI技術融合創新

發表于 07-16 10:40 ?490次閱讀

強強聯合！深<b class='flag-5'>視</b>智能攜手Zebra公司成功舉辦“3D機器視覺+<b class='flag-5'>AI</b>融合技術”研討會

AMEYA360：2024年世界人工智能大會-除了Ai更有“愛”

在上海2024年7月4日揭幕的2024年世界人工智能大會上，全球科技界的精英們不僅展示了最前沿的人工智能技術，更向世界宣告了 AI 的另一面 —— 它的溫暖與“愛”。這場在上海舉辦的科技盛會，以

發表于 07-08 16:37 ?344次閱讀

2024 TUYA全球開發者大會盛大啟幕，Cube AI大模型重磅首發！

在AI浪潮席卷全球的當下，把握時代脈搏，全面擁抱生成式AI已成為共識。面對AI帶來的無限可能，開發者們紛紛投身其中，積極探尋AI技術的新邊界

發表于 05-31 08:15 ?352次閱讀

2024 TUYA全球開發<b class='flag-5'>者</b>大會盛大啟幕，Cube <b class='flag-5'>AI</b>大模型重磅首發！

NVIDIA與微軟擴展合作，幫助開發者更快構建和部署AI應用

NVIDIA 在 Microsoft Build 開發者大會上展示了與 Microsoft Azure 和 Windows PC 的集成解決方案，簡化了 AI 模型部署并優化了路徑規劃和應用性能。

發表于 05-23 10:14 ?407次閱讀

開發者手機 AI - 目標識別 demo

功能簡介該應用是在Openharmony 4.0系統上開發的一個目標識別的AI應用，旨在從上到下打通Openharmony AI子系統，展示Openharmony系統的AI能力，并為開發者

發表于 04-11 16:14

AI芯片未來會控制這個世界嗎？

AI芯片行業資訊

芯廣場
發布于 :2024年03月27日 18:21:28

谷歌發布全新AI基礎世界模型Genie

谷歌近日宣布推出其最新研發的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數，其獨特之處在于，僅需一張圖片，便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界中逐

發表于 03-04 14:02 ?750次閱讀

高通AI Hub為開發者開啟卓越終端側AI性能

在今年的巴塞羅那世界移動通信大會（MWC）上，高通技術公司再次引領AI技術的創新潮流，發布了其全新的高通AI Hub。這一創新平臺為開發者提供了一個全面的

發表于 02-27 11:15 ?848次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

用 AI 幫助視障者“聽懂”世界

評論