亚洲激情欧美激情,亚洲网色,亚洲国产精品久久久天堂

編者按：上個月，李飛飛曾推薦斯坦福學(xué)者發(fā)表在Nature上的一則短文，文章指出現(xiàn)在人工智能使用的數(shù)據(jù)集多存在性別歧視和種族主義：“醫(yī)生”是男性，“護士”是女性，維基百科人物詞條中只有18%是女性，而這些女性的事跡會被頻繁鏈接到男性事跡中。這個問題的解決辦法有兩個，一是規(guī)范數(shù)據(jù)集制作，二是開發(fā)納入約束機制的算法。本文介紹的Quicksilver就是其中的第一種方法。

生成示例：Andrej Karpathy

是的，你沒看錯，作為計算機視覺和深度學(xué)習(xí)領(lǐng)域的頂級專家之一，特斯拉人工智能與自動駕駛視覺總監(jiān)，李飛飛高徒，維基百科沒有收錄Andrej Karpathy本人的詞條。

以下是Quicksilver為它編寫的詞條內(nèi)容（英語直譯）：

Andrej Karpathy是特斯拉研究員1,2，人工智能和深度學(xué)習(xí)領(lǐng)域的專家3,4。

Andrej Karpathy是加利福尼亞州斯坦福大學(xué)的計算機科學(xué)博士生，研究方向是用于語言建模的自然語言處理（NLP）和循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）5。他主要在學(xué)術(shù)界工作，但去年9月，他作為研究科學(xué)家加入了特斯拉的人工智能部門OpenAI6。Karpathy的大部分研究都圍繞圖像識別和圖像理解7。他的Reddit用戶名badmephisto，同樣也是他的YouTube賬號名，來自他致力于解決的問題——魔方7。

事跡

如何實現(xiàn)完美自拍，基于200萬張圖像的研究——2015年10月30日這些是Karpathy在研究中挑選出的頂級自拍圖像，原圖來自網(wǎng)絡(luò)。斯坦福大學(xué)計算機科學(xué)畢業(yè)生Andrej Karpathy使用來自網(wǎng)絡(luò)的200萬張自拍圖像，訓(xùn)練了一個人工神經(jīng)網(wǎng)絡(luò)，用來區(qū)分哪些是好自拍，哪些是差自拍。他的神經(jīng)網(wǎng)絡(luò)包含1.4億個不同的參數(shù)，可以為輸入的數(shù)百萬張圖像輸出結(jié)果。他得出的結(jié)論是：自拍的好壞很大程度上取決于圖像風(fēng)格，而不僅僅是人的外貌。10

特斯拉聘請深度學(xué)習(xí)專家Andrej Karpathy領(lǐng)導(dǎo)Autopilot——2017年6月21日 ……（略）

上任兩年后，特斯拉的Autopilot首席執(zhí)行官辭職——2018年4月26日 ……（略）

引用

A.I. Researchers Leave Elon Musk Lab to Begin Robotics Start-UpNew York Times,2017-11-07

A.I. Researchers Are Making More Than $1 Million, Even at a NonprofitNew York Times,2018-04-19 ……

維基百科的問題

每當我們在Google上搜索著名人物時，維基百科通常是第一個彈出來的頁面?，F(xiàn)如今，從查找作業(yè)資料的學(xué)生，到搜集資料的編輯記者，這個免費的數(shù)字百科全書已經(jīng)成為各個年齡段的首選工具。但近期人們卻發(fā)現(xiàn)，維基百科也出現(xiàn)了令人不安的趨勢。

不少人指出，維基百科正顯示出性別歧視，簡而言之，即很多著名女性人物沒有她們的專屬頁面。以Mirian Adelson為例，她是一名多才多藝的醫(yī)生，一生發(fā)表過上百篇關(guān)于生理成癮和治療的研究論文，她在拉斯維加斯經(jīng)營著一家備受矚目的藥物濫用診所，她也是以色列最大報紙的出版商、著名慈善家。但維基百科并沒有收錄她的詞條（8月4日更新后新增了）。

擁有相同遭遇的還有MIT MechE的部門的新負責(zé)人Evelyn Wang，她致力于為沙漠地區(qū)居民研究生成飲用水的設(shè)備。如果說維基百科在收錄女性詞條上更苛刻，但它其實對看似被“優(yōu)待”的男性也不完全友好。研究人員統(tǒng)計了30000名計算機科學(xué)家，發(fā)現(xiàn)維基百科只收錄了其中的15%。

換言之，面對不斷更新的信息，維基百科在時效性和完備性上仍面對重大挑戰(zhàn)。

事實上，除了以上提及的缺漏現(xiàn)象，維基百科在現(xiàn)有詞條維護上也有些力不從心，以華盛頓大學(xué)校長Ana Mari Cauce為例。自從特朗普政府宣布啟動延遲兒童入境行動（DACA）以來，Cauce多次聲明華盛頓大學(xué)會繼續(xù)向移民學(xué)生提供各項福利，這在美國產(chǎn)生極大影響，但他的詞條內(nèi)容卻遲遲沒有更新。

維基百科是學(xué)界重要的語料來源之一，但它卻展示出非常嚴重的滯后性和偏見，可想而知，我們不能指望用它來構(gòu)建合理模型。

Quicksilver如何運作

從自然語言處理角度看，用模型自動生成維基百科風(fēng)格詞條是可能的。對于這類問題，現(xiàn)在采取的普遍方法是多本文摘要：給定一組包含有關(guān)實體信息的參考文檔，生成實體的摘要。

前人的研究

其實早在十年前，Biadsy等人就已經(jīng)嘗試過生成類似人物介紹，他們提出的算法是對源文本中的相關(guān)句子進行排序和剪切，然后再拼湊成最終文本。這樣做的優(yōu)點是語句十分連貫，因為它們都由人類編寫。但它的局限也很大，就是機器只能組合人類寫過的內(nèi)容，無法自己創(chuàng)作。

近年來，研究人員開始由上述提取式生成轉(zhuǎn)向抽象概括，這種技術(shù)使用神經(jīng)語言模型來動態(tài)生成文本，缺點是模型為了“連貫性”會生成不少無意義內(nèi)容。對此，斯坦福大學(xué)的See等人提出指針生成器網(wǎng)絡(luò)，它可以為抽象模型提供一個信息提取回退的選項，有機結(jié)合了提取式和抽象概括式兩種方法。

為了避免從源文本中引用重復(fù)內(nèi)容，See等人提出的指針生成器網(wǎng)絡(luò)可以通過指向復(fù)制單詞，從固定詞匯表生成單詞，從而糾正提取式摘要的表述

基于上述研究，今年Google AI的Peter Liu團隊在ICLR上展示了一篇論文：Generating WIKIPEDIA by Summarizing Long Sequences。他們先把提取式摘要作為約束輸入文本的第一步，再對輸出文本進行抽樣概括，這樣做形成的文本非常驚艷，它們既保留了人類編寫的流暢性，也出現(xiàn)了大量模型“自創(chuàng)”的表述。

Quicksilver

Quicksilver是美國創(chuàng)業(yè)公司Primer開發(fā)的一款軟件，它沿用了Google AI的基礎(chǔ)架構(gòu)，但目的更加簡單實在，就是開發(fā)一個可用于構(gòu)建和維護維基百科等知識庫的系統(tǒng)，而不是將維基百科作為文本摘要算法的學(xué)術(shù)測試平臺。除了生成連貫文本，Quicksilver還需要能追蹤數(shù)據(jù)來源，以便最終輸出的任何語句都能指示其引用來源。

簡單來看，它的基本思路就是通過交叉引用維基百科詞條和從學(xué)術(shù)搜索引擎（文中稱為語義學(xué)者）中抽取的作者列表，來檢測其中和詞條人物有關(guān)的信息。提取這些信息并進行組合，最后用只包含一個解碼器的抽象概括模塊使輸出文本更連貫。

為了追求時效性，研究人員基于維基數(shù)據(jù)，制作了一個和seq2seq模型相結(jié)合的知識庫。對于了解科學(xué)家的生平事跡，使用維基數(shù)據(jù)的結(jié)構(gòu)數(shù)據(jù)是一個關(guān)鍵突破，它既做到了映射新聞文檔，又可以通過添加遠程監(jiān)督機制，讓知識庫實現(xiàn)自我更新。

以下是Quicksilver的具體流程：

目前，Quicksilver已經(jīng)在3萬份科學(xué)家數(shù)據(jù)中經(jīng)過訓(xùn)練，并生成了40000余份維基百科風(fēng)格的人物簡介，其中有多篇已被維基百科收錄。它也重點關(guān)照了女性詞條缺失的現(xiàn)象，在2小時內(nèi)為70名女科學(xué)家更新了她們的詞條。

小結(jié)

維基百科的受歡迎程度和它對社會造成的影響息息相關(guān)，學(xué)界呼吁一個更具代表性的數(shù)據(jù)集，我們也期望一本剔除了不平等思維的百科全書。Quicksilver讓我們看到了用機器學(xué)習(xí)技術(shù)糾正偏見思維的可能性，這項研究不僅有助于把代表性不足的科學(xué)家群體置于燈光下，它也成了后期ML研究的一個光輝榜樣。

Quicksilver背后的算法不難理解，但它的設(shè)計依然非常復(fù)雜。除了學(xué)術(shù)上的啟示，從工業(yè)角度看，這種技術(shù)在中文維基百科和國內(nèi)其他百科的維護上都有用武之地，值得進行嘗試。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4608

瀏覽量
92845
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47208

瀏覽量
238298
機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8408

瀏覽量
132576

原文標題：告別歧視和偏見，用AI自動生成維基百科詞條

文章出處：【微信號：jqr_AI，微信公眾號：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

嵌入式和人工智能究竟是什么關(guān)系?

、連接主義和深度學(xué)習(xí)等不同的階段。目前，人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域，如自然語言處理、計算機視覺、智能推薦等。嵌入式系統(tǒng)和人工智能在許多方面都

發(fā)表于 11-14 16:39

人工智能是什么?

的階段。阻礙前行的因素很多，要攻克的技術(shù)難點也很多，但這些問題在人工智能領(lǐng)域的專家來看，技術(shù)的積累都只是時間問題，對人工智能技術(shù)做更進一步剖析的話，其實就是“算法”+“海量數(shù)據(jù)”。更通俗一點就是：在

發(fā)表于 09-16 15:40

那個涉嫌性別歧視被開除的谷歌工程師，到底吐槽了些什么？

(inclusion)，我不否認性別歧視(sexism)的存在，并且我反對刻板印象(stereotype)。如果我們想解決群體比例上的差距(指公司工程師中男女比例與人口中的男女比例的差異)，我們需要審視群體分布上的差異

發(fā)表于 08-15 10:36

數(shù)據(jù)對人工智能發(fā)展的重要性

。APP時代，我們常說中國創(chuàng)業(yè)成本達到歷史新低，很不幸，人工智能加大數(shù)據(jù)，創(chuàng)業(yè)成本將會達到歷史新高。第三是數(shù)據(jù)量需要非常多。數(shù)據(jù)收集是一個

發(fā)表于 10-09 15:26

解讀人工智能的未來

而言，我們能夠?qū)崿F(xiàn)的只是一種狹義的人工智能，它需要由人類精心準備數(shù)據(jù)集然后進行人工訓(xùn)練。例如，如果要教會AI識別貓的圖片，你需要有一個龐大的照片數(shù)據(jù)

發(fā)表于 11-14 10:43

人工智能醫(yī)生未來或上線，人工智能醫(yī)療市場規(guī)模持續(xù)增長

一直到后期的診斷、治療和評估。　　不過，就目前的技術(shù)限制，在人工智能輸入的數(shù)據(jù)和其輸出的答案之間，通常存在著無法洞悉的“隱層”，被稱為“黑箱”?！昂谙洹?b class='flag-5'>存在的后果，就是難以判斷

發(fā)表于 02-24 09:29

人工智能：超越炒作

。對于人工智能用例在當前物聯(lián)網(wǎng)環(huán)境中變?yōu)楝F(xiàn)實，必須滿足三個條件：非常大的真實數(shù)據(jù)集具有重要處理能力的硬件架構(gòu)和環(huán)境開發(fā)新的強大算法和人工神經(jīng)網(wǎng)絡(luò)（ANN）以充分利用上述內(nèi)容很明顯，后兩

發(fā)表于 05-29 10:46

基于人工智能的傳感器數(shù)據(jù)協(xié)同作用

各種來源的大量數(shù)據(jù)，識別各種模式、提供交互式理解和進行智能預(yù)測。這種創(chuàng)新發(fā)展的一個例子就是將人工智能應(yīng)用于由傳感器生成的數(shù)據(jù)，尤其是通過智能

發(fā)表于 07-25 06:20

只要6秒 AI人工智能只要聽聲音就能描繪你的長相

　　你相信嗎?AI人工智慧最近已經(jīng)進化到，只要花6秒的時間，聽到你的聲音除可以分辨出你的性別、年紀與種族外，甚至可以描繪出你的長相?！　∵@款由麻省理工學(xué)院(MIT)所打造出來的AI，研究人員用一個由

發(fā)表于 07-29 15:49

MIT創(chuàng)造了一種減少AI偏差的方法 AI性別歧視有救

在社交媒體的應(yīng)用場景中，人工智能算法模型的偏差導(dǎo)致搜索結(jié)果或用戶體驗不佳常常出現(xiàn)，甚至可以說是無法規(guī)避，如人們熟知的大數(shù)據(jù)殺熟等。可以預(yù)見，當AI應(yīng)用到醫(yī)療保健、自動駕駛汽車、刑事司法或刑事處理等

發(fā)表于 11-19 10:52 ?1437次閱讀

那些潛藏在高大上的學(xué)術(shù)會議背后的種族與性別歧視

假休息日時，Twitter 上卻迎來了人工智能界的“扛把子”Anima Anandkumar 的連篇炮轟。她在其最新的推文中指出 Yann LeCun 存在性別歧視，Moshe

發(fā)表于 12-27 10:00 ?3516次閱讀

IBM打造百萬人臉數(shù)據(jù) 意圖減少AI偏見與歧視問題

科技中立，但人制造出來的 AI 卻可能帶有偏見或歧視。AI 偏見情況像是性別歧視、種族歧視，例如面部偵測算法在識別白人時的準確率比識別黑人高許多，男性跟女性類別也存在類似問題，讓軟件識

發(fā)表于 02-13 08:47 ?523次閱讀

人工智能也存在種族歧視嗎

有望借助大家的聲音反抗現(xiàn)有種族格局，大大改變?nèi)蚨鄶?shù)老齡化人口使用技術(shù)的方式。

發(fā)表于 09-10 16:31 ?1401次閱讀

人工智能存在性別歧視？

谷歌人工智能工具用于標記圖像中的內(nèi)容，將不再給人們貼性別標簽。

發(fā)表于 02-25 16:35 ?1220次閱讀

蘋果宣布REJI項目,旨在解決種族主義

1月14日上午消息，蘋果公司今天宣布“REJI”項目，旨在解決種族主義，幫助消除有色人種面臨的不公正待遇。

發(fā)表于 01-14 11:52 ?2390次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

人工智能使用的數(shù)據(jù)集多存在性別歧視和種族主義

評論

嵌入式和人工智能究竟是什么關(guān)系?

人工智能是什么?

那個涉嫌性別歧視被開除的谷歌工程師，到底吐槽了些什么？

數(shù)據(jù)對人工智能發(fā)展的重要性

解讀人工智能的未來

人工智能醫(yī)生未來或上線，人工智能醫(yī)療市場規(guī)模持續(xù)增長

人工智能：超越炒作

基于人工智能的傳感器數(shù)據(jù)協(xié)同作用

只要6秒 AI人工智能只要聽聲音就能描繪你的長相

MIT創(chuàng)造了一種減少AI偏差的方法 AI性別歧視有救

那些潛藏在高大上的學(xué)術(shù)會議背后的種族與性別歧視

IBM打造百萬人臉數(shù)據(jù) 意圖減少AI偏見與歧視問題

人工智能也存在種族歧視嗎

人工智能存在性別歧視？

蘋果宣布REJI項目,旨在解決種族主義