關于人工智能 (AI) 偏見的討論繼續將注意力主要集中在其社會影響上,這是正確的。然而,導致機器學習模型強化社會刻板印象的過程可能會影響在工業環境、醫療保健等領域的人工智能物聯網 (AIoT) 應用中使用這些技術的努力。如果不仔細注意用于構建這些模型的數據,即使公司和個人更加依賴其結果,這些應用程序也無法達到預期。
受用于構建基于 AI 的應用程序的現成可用工具和硬件的鼓舞,幾乎每個細分市場的組織都急于充分利用工業、醫療和消費領域智能傳感器迅速出現所帶來的不斷增長的數據源池設備等。事實上,市場研究人員預測,到 2023 年,全球人工智能市場的復合年增長率 (CAGR) 將達到近 35%。研究人員預測,僅制造業領域的人工智能,到 2025 年的復合年增長率將超過 55%。下面是如何在這些模型中管理人工智能。
人工智能的引人注目的本質
使用 AI 方法快速部署智能應用程序的潛力令人信服。能夠預測工業機械故障的 AIoT 應用程序可以在設備出現故障時提供急需的意外停機緩解措施。加速度計、麥克風和溫度等傳感器無需定期手動檢查機器健康狀況,而是可以將連續數據流提供給預測性維護應用程序,這些應用程序使用機器學習模型構建,這些模型經過訓練可以在即將發生的故障模式發生之前就識別出來。
對于工業電機的預測性維護,開發人員將收集與特定故障模式相關的振動、音頻和溫度測量值的組合,例如電機不平衡、未對準、耦合松動、軸承退化等。然后,他們將使用這些數據集,使用決策樹或神經網絡模型等監督學習算法,根據從電機收集的新傳感器數據預測這些故障模式。
這種方法既是優點也是限制。它允許部署復雜的應用程序來檢測這些狀態,而無需編寫復雜的模式識別軟件。不幸的是,它還允許部署對不受相應訓練數據支持的狀態視而不見的應用程序,并且可能有利于主導訓練數據的狀態。例如,如果訓練數據集對與高頻振動和聲音相關的狀態有很大的權重,則相應的模型預測將對與傳感器測量組合相關的軸承相關故障類型進行加權。理想情況下,
管理人工智能中的偏見
當模型更有可能預測一種結果而不是另一種時,就會出現模型偏差。它可能源于上述那種采樣偏差,或者源于試圖通過刪除在人類觀察者看來是離群值的數據來清理數據。一種更微妙的形式來自人類觀察者固有的認知偏差,他們自然會根據自己對世界的看法和理解來確定什么是相關的,什么是不相關的——所有這些都會微妙地影響機器學習模型的功效。
機器學習研究人員和經驗豐富的開發人員使用各種方法來對抗偏見的影響。隨機森林算法或神經網絡集合等方法使用旨在幫助避免這些限制的集成方法。其他方法側重于訓練方法,使用生成對抗網絡 (GAN) 生成新數據集以增強目標神經網絡的訓練。盡管如此,其他方法仍然關注數據本身,其方法是對表示不佳的狀態的數據進行過采樣以提供平衡的訓練數據。管理人工智能偏見的方法仍然是一個非常活躍的研究課題。
結論
即使沒有這些更先進的方法,AIoT 應用程序開發人員也可以邁出管理模型偏差的第一步,只需提醒自己收集真正代表其應用程序的訓練數據的重要性。盡管開發平臺和監督學習算法軟件工具大大簡化了機器學習模型的部署,但基于機器學習的應用程序開發最關鍵的組成部分是無偏訓練數據。
審核編輯:湯梓紅
-
AI
+關注
關注
87文章
31118瀏覽量
269435 -
人工智能
+關注
關注
1792文章
47415瀏覽量
238926 -
AIoT
+關注
關注
8文章
1413瀏覽量
30758
發布評論請先 登錄
相關推薦
評論