AI 模型卡是一份詳細(xì)說明機(jī)器學(xué)習(xí)( ML )模型如何工作的文檔。模型卡提供了有關(guān) ML 模型元數(shù)據(jù)的詳細(xì)信息,包括它所基于的數(shù)據(jù)集、它所接受培訓(xùn)的性能度量以及深度學(xué)習(xí)培訓(xùn)方法本身。本文將帶您了解 AI 模型卡的當(dāng)前實(shí)踐,以及 NVIDIA 計(jì)劃如何通過模型卡++(增強(qiáng)的下一代 AI 模型卡來提升它們。
在 2019 年的論文 Model Cards for Model Reporting 中,包括 Margaret Mitchell 、 Timnit Gebru 和 Lucy Vasserman 在內(nèi)的一群數(shù)據(jù)科學(xué)家試圖為 AI 模型創(chuàng)建一個(gè)文檔標(biāo)準(zhǔn)。他們的主要?jiǎng)訖C(jī)是通過披露有關(guān)人工智能模型的基本信息,促進(jìn)人工智能模型開發(fā)過程中的透明度和問責(zé)制。
這些信息包括誰(shuí)開發(fā)了模型、預(yù)期用例和范圍外的應(yīng)用程序、預(yù)期用戶、模型如何與不同的人口群體一起執(zhí)行、關(guān)于用于培訓(xùn)和驗(yàn)證模型的數(shù)據(jù)的信息、限制和道德考慮。
在開發(fā)第一個(gè) AI 模型卡之前,很少共享關(guān)于特定 AI 模型的信息,以幫助確定該模型是否適合特定組織的用途。
如果模型的輸出可能對(duì)特定人群產(chǎn)生不利影響,那么這就成了一個(gè)問題。例如, 2019 年由大學(xué)牽頭的研究 Discrimination through Optimization: How Facebook’s Ad Delivery Can Lead to Skewed Outcomes 顯示,盡管使用中性參數(shù)來針對(duì)廣告,但在社交媒體上發(fā)布廣告的算法導(dǎo)致了歧視性廣告發(fā)布。
模型卡的采用有助于開發(fā)人員將其結(jié)果與類似模型的結(jié)果進(jìn)行比較,從而幫助開發(fā)和改進(jìn)模型。模型卡強(qiáng)調(diào)了計(jì)劃部署模型的人員的性能問題。
同時(shí),模型卡還教育了正在起草管理人工智能模型和系統(tǒng)的法規(guī)和立法的決策者。雖然不是必需的,但開發(fā)模型卡是一種最佳實(shí)踐,它鼓勵(lì)開發(fā)人員與最終將受到模型輸出影響的人接觸。
模型卡的重要性
雖然模型卡旨在鼓勵(lì)模型透明度和可信度,但利益相關(guān)者也會(huì)使用它們來提高開發(fā)人員的理解并使決策過程標(biāo)準(zhǔn)化。
模型卡的結(jié)構(gòu)和組織方式為模式。他們簡(jiǎn)明扼要地報(bào)告了不同因素的信息,如人口統(tǒng)計(jì)、環(huán)境條件、定量評(píng)估指標(biāo),以及道德考慮(如有)。
模型卡還可以記錄模型版本、類型、日期、許可證限制、有關(guān)發(fā)布組織的信息以及其他定性信息。示范卡旨在進(jìn)行教育,并允許對(duì)衡量標(biāo)準(zhǔn)和基準(zhǔn)進(jìn)行明智的比較。圖 1 顯示了 NGC Model Card for StyleGAN3 。
圖 1.StyleGAN3 模型卡顯示了有關(guān)其體系結(jié)構(gòu)、培訓(xùn)和數(shù)據(jù)集的信息
模型卡就像開源的資料表。除非你是模型本身的開發(fā)人員,否則如果沒有模型卡,你甚至可能不太了解 AI 模型本身。模型卡提供了對(duì)模型細(xì)節(jié)的最全面理解,以及個(gè)人在應(yīng)用模型時(shí)應(yīng)考慮的因素。
例如,智能手機(jī)可能有一個(gè)面部檢測(cè)系統(tǒng),允許用戶根據(jù)識(shí)別解鎖。如果沒有模型卡,模型開發(fā)人員可能在部署模型之前無(wú)法意識(shí)到模型的行為。這就是 Joy Buolamwini 博士 嘗試使用面部檢測(cè)系統(tǒng) 作為她在麻省理工學(xué)院研究生工作的一部分時(shí)發(fā)生的事情。
AI 模型卡可訪問性
AI 模型卡不應(yīng)該只為開發(fā)者構(gòu)建;公司還應(yīng)該制作模型卡,非技術(shù)人員和技術(shù)專家都可以訪問和閱讀。
模型卡不限于給定的行業(yè)或領(lǐng)域。它們可以用于計(jì)算機(jī)視覺、語(yǔ)音、推薦系統(tǒng)和其他 AI 工作流。除了在高等教育和研究以及高性能計(jì)算空間中有著積極的用途外,模型卡還可以在多個(gè)行業(yè)中使用,包括汽車、醫(yī)療和機(jī)器人應(yīng)用。模型卡可以:
教學(xué)生并幫助他們理解真實(shí)的用例
告知決策者并澄清非模型開發(fā)者的預(yù)期用途
教育那些對(duì)尋求人工智能利益感興趣的人
通過模型卡動(dòng)員人工智能是公司向可信賴人工智能發(fā)展的決定性和透明的一步。
改進(jìn)和增強(qiáng)模型卡
我們進(jìn)行了市場(chǎng)調(diào)查,以了解現(xiàn)有模型卡的改進(jìn)情況。雖然開發(fā)人員樣本中 90% 的受訪者認(rèn)為模型卡很重要, 70% 的人會(huì)按原樣推薦,但仍有改進(jìn)的余地,以推動(dòng)其采用、使用和影響。
根據(jù)我們的研究,現(xiàn)有的模型卡應(yīng)該在兩個(gè)主要方面得到增強(qiáng):可訪問性和內(nèi)容質(zhì)量。模型卡用戶需要模型卡,以便于訪問和理解。
可訪問性
發(fā)現(xiàn)是模型卡可訪問性的一個(gè)需要改進(jìn)的要素。在發(fā)布模型時(shí),人工智能開發(fā)人員應(yīng)該能夠找到模型卡,然后將其與工作一起推廣。研究論文中介紹的模型以及用于商業(yè)用途的模型都是如此。
其次,模型卡需要放在感興趣的個(gè)人可以參考的地方。 NVIDIA 推廣模型卡的方式之一是通過 NGC 目錄。模型和模型卡并排放置在同一存儲(chǔ)庫(kù)中。
內(nèi)容質(zhì)量
找到模型卡后,用戶的下一個(gè)挑戰(zhàn)是理解其中包含的信息。這在選擇前的模型評(píng)估階段尤為關(guān)鍵。不理解模型卡中包含的信息會(huì)導(dǎo)致與不知道信息存在相同的結(jié)果;不管怎樣,模型用戶都無(wú)法做出明智的決策。
為了解決這個(gè)問題, NVIDIA 鼓勵(lì)使用一致的組織結(jié)構(gòu)、簡(jiǎn)單的格式和清晰的語(yǔ)言制作模型卡。還建議添加可篩選和可搜索字段。當(dāng)個(gè)人能夠找到模型卡中包含的信息時(shí),他們更有可能理解軟件。根據(jù)我們的研究,受訪者喜歡并依賴于模型卡中的信息,因?yàn)樗苋菀撰@取和理解。
事實(shí)上,性能和許可信息是受訪者希望在模型卡中看到的兩個(gè)最重要的方面。圖 2 顯示了 StyleGAN3 模型卡如何將單獨(dú)的部分用于性能和許可。
圖 2.StyleGAN3 模型卡包括性能和許可部分
在性能和許可信息之后,受訪者認(rèn)為關(guān)于道德考慮的部分是模型選擇標(biāo)準(zhǔn)中最重要的信息類別。出于道德考慮,受訪者表示,他們希望獲得更多關(guān)于用于培訓(xùn)和驗(yàn)證模型的數(shù)據(jù)集的信息,尤其是關(guān)于不必要偏見的詳細(xì)信息以及關(guān)于安全和安保的信息。
型號(hào)卡++概述
Model Card ++是 NVIDIA 在過去 9 個(gè)月開發(fā)的改進(jìn)型 NGC Catalog Model Card 原型。除了 NGC 目錄中模型卡概述部分給出的典型信息外,模型卡++還包括:
Plus Plus Promise (也稱為++ Promise 或 Triple P ),描述 NVIDIA 軟件開發(fā)方法和我們?cè)谒心P烷_發(fā)中堅(jiān)持的標(biāo)準(zhǔn)
詳細(xì)說明有關(guān)偏差、可解釋性、隱私、安全性和安全性的模型特定信息的小節(jié)
圖 4 顯示了++ Promise ,它將嵌入到每個(gè) ModelCard ++中。
圖 4.模型卡++承諾描述了 NVIDIA 在 AI 模型開發(fā)中證明可信度所采取的步驟
++承諾描述了 NVIDIA 正在采取的步驟,以證明我們的工作在設(shè)計(jì)中的可信度。附卡概述:
采取措施減少不必要的偏見
決策邏輯和示例域
培訓(xùn)數(shù)據(jù)集的來源以及收集的數(shù)據(jù)類型和方式
使用的開發(fā)控制和已知限制
這并不是一份詳盡的清單,但它展示了設(shè)計(jì)意圖和對(duì)標(biāo)準(zhǔn)和保護(hù)的承諾,這些標(biāo)準(zhǔn)和保護(hù)重視個(gè)人、數(shù)據(jù)和 NVIDIA 對(duì) AI 的貢獻(xiàn)。這適用于跨域和用例的每個(gè)模型。
圖 5 顯示了解釋性附卡的示例。每個(gè)模型卡++將包括一個(gè)專門的字段部分和每個(gè)子部分的響應(yīng)。每個(gè)領(lǐng)域的回答部分所示內(nèi)容并不代表真實(shí)世界的模型,而是為了說明基于當(dāng)前理解和最新研究將提供的內(nèi)容。
圖 5.可解釋性附卡示例,模型卡++的四個(gè)子部分之一并入 NGC 模型卡
解釋性附卡提供了 AI 模型的示例域、目標(biāo)用戶、決策邏輯和合規(guī)性審查的信息。 NVIDIA 模型卡旨在使用清晰、一致和簡(jiǎn)潔的語(yǔ)言呈現(xiàn) AI 模型。
NVIDIA 將于年底開始推出 Model Card ++,所有商業(yè)車型將于 2023 年底使用。
我們?nèi)绾沃谱髂P涂?+
模型卡++是下一代 AI 模型卡。它是與工程、產(chǎn)品、研究、產(chǎn)品安全和法律團(tuán)隊(duì)合作的紀(jì)律嚴(yán)明的跨職能方法的結(jié)果。在現(xiàn)有 NGC 模型卡的基礎(chǔ)上,我們審查了其他組織和模板(包括 GitHub )的模型卡,以找出可以一致提供的其他信息。
除了目前提供的信息外,我們還與工程部合作,試驗(yàn)可以持續(xù)提供的信息。我們發(fā)現(xiàn),雖然我們的模型卡有一個(gè)道德考慮部分,但還可以提供更多內(nèi)容,比如我們?yōu)闇p少不必要的偏見而采取的措施。我們還發(fā)現(xiàn),我們可以描述數(shù)據(jù)集的來源和可追溯性、數(shù)據(jù)集存儲(chǔ)和質(zhì)量驗(yàn)證。
我們希望提供更多關(guān)于數(shù)據(jù)集人口構(gòu)成、不同人口群體的績(jī)效指標(biāo)以及我們?yōu)榻鉀Q不必要的偏見而采取的具體緩解措施的詳細(xì)信息。我們還與算法偏差顧問合作開發(fā)了一個(gè)評(píng)估不必要偏差的流程,該流程符合數(shù)據(jù)隱私法,并與我們的最新市場(chǎng)研究相結(jié)合。
在構(gòu)建 Model Card ++時(shí),我們還通過調(diào)查使用我們模型的開發(fā)人員和來自整個(gè)行業(yè)的開發(fā)人員,來證實(shí)我們的市場(chǎng)研究工作。我們驗(yàn)證了所需的信息,并與我們的用戶設(shè)計(jì)經(jīng)驗(yàn)團(tuán)隊(duì)一起將其結(jié)構(gòu)化,以清晰有序的格式呈現(xiàn)出來。我們對(duì)向世界推出 Model Card ++感到興奮,并希望繼續(xù)領(lǐng)導(dǎo)努力,鼓勵(lì)全人類的包容性人工智能。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4985瀏覽量
103023 -
AI
+關(guān)注
關(guān)注
87文章
30829瀏覽量
268983 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8414瀏覽量
132604
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論