AI不乖了。
今天踢爆了亞馬遜用AI進行招聘,進而引發的可能歧視女性的新聞。
對于一直尋求智能化的亞馬遜而言,僅在倉儲和物流管理上使用AI技術是遠遠不能滿足的,因此這項2014年啟動的AI招聘原本是亞馬遜探尋進一步智能化的實驗,卻偏偏出了簍子。
最初亞馬遜開發團隊的想法是,使用AI進行求職者簡歷的篩選,可以更精確地找到匹配的頂尖人才,減少人力勞動,將招聘這件事變得更智能化。
它們在使用這個實驗性的招聘工具過程中,用AI為求職者打分,分數從一星到五星不等。開發該程序的工程師表示,亞馬遜想要將這一程序打造成引擎,給該程序100份簡歷,程序會列出前五人,其就會聘用列出的人才。
聽上去非??釋Σ粚Γ康?,人算不如AI算。
在這項工具使用不長時間后,亞馬遜發現他們使用AI系統的時候并未對軟件開發人員和其他技術職位求職者進行性別中立的評估。
這里面就存在兩個可能性問題,一是樣本問題,二則是AI系統有極大的BUG。
需要說明的是,亞馬遜對這套系統采用的模型訓練方式是通過觀察過去10年被提交給亞馬遜公司的簡歷中找出固有模式,以此篩選審查求職者。
而問題就出在這里——在過去的10年中,提交給亞馬遜的簡歷大部分來自男性,這就導致了亞馬遜使用的AI系統告訴自己男性求職者更受到青睞。
是亞馬遜歧視女性嗎?還是AI在歧視?
我們認為,這里面有三重因素。
首先,被提交給亞馬遜的應聘樣本多數是男性求職者,這與科技行業長久以來更愿意錄用男性員工有關??峙驴萍夹袠I自身都產生了“誤會”,認為男性更能勝任,而女性則有更多顧慮。
其次,在被提交的樣本中,亞馬遜的系統采用了特別標志,會特別標志出“女性”,這在不經意間已經對樣本有了“性別歧視”。
最后,雖然亞馬遜對AI招聘的程序進行了修正,試圖確保對特定術語保持中立。但事實上,這無法從根本上客觀呈現篩選結果的一視同仁。
換句話說,亞馬遜的這套AI招聘系統出現了“雞生蛋還是蛋生雞的”哲學性困惑。
如果不添加標簽進行篩選,勢必無法達到精準匹配;
然而想要實現無差別對待,就勢必會出現不同領域的歧視??赡苁切詣e、也有可能是學校、甚至可能是個人興趣和生活習慣。
WHATEVER,這個鍋,AI逃不掉。
這不是AI第一次陷入“性別歧視”的風波中。
今年夏天,據報道,弗吉尼亞大學計算機系攻讀人工智能機器學習方向的博士趙潔玉接到了導師文森特?奧都涅茨(Vicente Ordó?ez)給她的一個課題。
這個課題是關于圖形識別的AI,總是將男人認成女人。這在計算機視覺技術發展比較成熟的當下,顯得有些不可思議。有趣的是,AI發生認知錯誤有個共同點:這些被誤認為女人的男人不是站在廚房就是在做家務。
這顯然不是程序的BUG,而是AI算法本身的問題,它自動的將女性和某些特定的元素聯系在一起,比如站在廚房燒飯的就一定是女性,最終形成了關于女性的“刻板成見”,甚至是某種性別歧視。
相似的事情也發生在微軟身上,之前他們在twitter上推出了一個少女聊天機器人Tay,微軟的原意是讓妹子和大家在網上談談心,順便學習一下怎么交流,然而Tay聊著聊著卻學會了罵臟,比如咒罵女權主義者、支持納粹,種族歧視……
技術本身是中立的,但追根溯源的話,AI也是從我們普通人身上“學習”了偏見或者歧視,當我們在訓練人工智能模型的時候,大量的數據標注結果再告訴AI,包含這些元素的可能98%是女性,最終關于性別的偏見不僅在數據庫里普遍存在,而且還會被AI放大。也就是說,技術人員用大量的數據看似訓練出“精準”算法,然而卻缺少對這些數據背后的社會現狀的思考。
不過,這種現象也有可規避的方式。就像人的認識,我們可以在學習以及社會化的過程中,形成一個合理、乃至政治正確的價值觀,同樣對于AI,我們也有“糾錯”的方法。
我們認為:
1、增加對原材料的凈化,盡可能地減少樣本數據庫的偏差,包括擴大樣本的范圍以及多樣性,擴容數據庫。
2、增加樣本的現實影響因子,現實維度是反應社會價值取向、態度和引導方向的基礎。創建更好、更多樣化的數據集用于訓練算法,從樣本數據的層面去縮小算法可能存在的偏差。
3、用技術的方式去彌合算法的偏差,比如開發某種系統來發現存在偏見的決策,并及時采取措施,比如采用貝葉斯(Bayesian)的方法確定某種假設的機率,并摒除可能存在的人類偏見。
4、最為關鍵的一點,解決AI歧視的本質問題,也就是人的改變。只有改變樣本數據在現實社會中的弊端作為,才能從源頭解決算法的歧視問題。而機器,有時候也需要學會思考如何去擺脫人類對它們造成的錯誤影響。
劍橋大學未來研究所教授魯恩?奈如普(Rune Nyrup)曾經說過“沒有事實上的技術中立。對機器來說,中立的就是占統治地位的?!倍?,我們現在的人工智能,還遠遠沒到達到理解真善美、假惡丑的“抽象”地步。
算法的歧視,AI不背鍋。
評論
查看更多