繼谷歌、蘋果、亞馬遜、Facebook等科技巨頭紛紛被曝出人工收集用戶語音數據后,微軟也承認了類似做法。根據一份泄密文件,微軟承包商的酬勞很低,每小時要處理大約200條數據,而且他們在Cortana錄音中聽到過很私人的敏感信息。
近段時間,包括谷歌、蘋果、亞馬遜、Facebook等在內的科技巨頭紛紛被曝出人工收集用戶語音數據。
而最近,微軟承認員工和供應商會收聽Skype和Cortana的語音數據和錄音,來改善微軟產品和服務的語音識別、翻譯、意圖理解等功能。
那么,這些科技巨頭雇傭的人工到底做了什么呢?根據一份泄密文件,這些人做的是一些辛苦耗時的重復性工作。
“我為微軟所做的大部分工作都集中在注釋和轉錄Cortana命令,”一位微軟承包商表示。
關于對這類數據進行分類的使用說明書有幾百頁,承包商要從令人眼花繚亂的選項中對數據進行分類,以及他們需要遵循的標點符號樣式指南。
承包商表示,他們每小時要處理大約200條數據,而且他們在Cortana錄音中聽到過很私人的敏感信息。文件顯示,對于某些工作,承包商需要每小時完成至少200項任務。
任務繁重,報酬很低
這項工作的報酬并不高。每小時只有12-15美元不等。其中要求特別關注觸發命令“Hey,Cortana”,注意區分記錄不同的語言和口音的發音,包括德語、中文、日語和澳大利亞語,加拿大語和美式英語等。 另外,微軟要求將很多發音類似的單詞轉錄為“Cortana”,比如用戶的發音是“Cortona”或“Cortina”,也要能夠激活Cortana。微軟認為,用戶的本意就是如此。此外,有些任務需要明確地將與聯系人或其他個人信息相關的專有名詞大寫。” 微軟發言人在一封電子郵件聲明中表示,“我們一直在尋求提高透明度,幫助客戶做出更明智的選擇。我們披露的信息表明,我們使用Cortana和Skype Translator的客戶內容是為了改進這些產品,我們邀請了第三方專家協助這一過程,并采取措施抹去這些信息,以保護人們的隱私。“ 在媒體曝出微軟對Skype翻譯功能和Cortana中的用戶語音進行審核后,微軟更新了其產品隱私政策頁面,明確說明了可能會有人收聽所收集的音頻信息。 其實這些人的主要工作是對用戶的語音數據其進行分類。微軟要求承包商將每份錄音按照“領域”或“主題”來劃分。這些包括“日歷”、“報警”、“捕獲”。其他領域包括游戲,電子郵件、通信、反饋、媒體控制和“訂購食品”。還有一個“通用”域,可以放入多個域的通用命令,并向其中添加文檔。 每個域都有幾個不同的“意圖”。比如說“警報”域,包括設置警報、關閉警報、查找警報,更改警報、設置/查找計時器等。 微軟的承包商會分析這些Cortana命令,然后確定適當的域/意圖。還有一些音頻中涉及“雙重意圖”,即用戶要求Cortana一次完成兩項任務,對于這些信息,承包商也必須注意。 谷歌、蘋果都這么干過,被曝光后已暫停
此前不久,蘋果和谷歌的語音助手Siri和Google Assistant都被曝出以人工收集并審核用戶語音數據的事件。兩家公司在事件曝光后均承認了這一點,并很快宣布暫停人工審核。
今年7月中旬,谷歌宣布Google Assistant錄音審核政策在歐盟國家范圍內暫停至少三個月,德國的一家隱私監管機構于8月1日啟動了對谷歌的調查。 谷歌的一位發言人表示,“在機密音頻數據泄露事件曝光后,我們立即暫停了語音助手的人工審核,開始調查。我們目前與德國的隱私保護機構保持著接觸,正在對語音的審核方式進行評估,幫助用戶理解我們對數據的使用方式。” 谷歌一位產品經理David Monsees表示,谷歌人工審核的語音錄音只占全部錄音的0.2%。 8月2日,蘋果宣布停止由承包商人工審核用戶的語音錄音,并表示將更新軟件,用戶可以選擇拒絕人工審核選項。 根據蘋果的Siri和聽寫服務條款,用戶錄制和聽寫的內容可能會被發送至蘋果,包括名字、合約和與用戶之間的關系等信息,還包括用戶家中支持家庭套件服務的設備、手機上還安裝了哪些app等,都在可能被發送的內容之列。蘋果對此未予置評。 目前,用戶無法通過Siri獲取或刪除自己的錄音;我們可以選擇停止使用Siri或刪除Apple帳戶。然而,蘋果的條款表明,如果Siri和dictation都被禁用,蘋果將刪除用戶數據和最近的錄音。任何與原始用戶無關的東西——包括音頻文件、transcripts、用戶在提出請求時的位置和性能統計數據——都可用于蘋果改進Siri和dictation。
要在Apple設備上禁用iOS 11+中的Siri,需要這樣做:
1.設置> Siri & Search 2.關閉“Listen for 'Hey Siri'”和“Press Side Button for Siri”(按側鍵喚醒Siri) 3.確認“Turn Off Siri”(關閉Siri)
然后,用戶還可以禁止從dictation中錄制:
1.單擊設置>General(常規)>Keyboard(鍵盤) 2.關閉“Enable Dictation”(啟用聽寫)并確認 科技進步和用戶隱私真的是矛盾嗎? 當把Siri、Alexa、Cortana等語音助理放在顯微鏡下時,語音助理隱私恐慌故事就出現了。它們代表了一種尚未被充分理解的新的AI技術。例如,公眾仍然普遍認為,無論是否說出了喚醒詞,這些語音助理使用的麥克風總是在聽。這種認知是錯誤的。 現如今,人們對于科技巨頭普遍焦慮和不信任,像谷歌、蘋果、Facebook、微軟、亞馬遜這樣的巨頭都要用我們的對話來訓練、改進自家的技術,那我們還能相信科技公司會負責任地管理我們的數據嗎?
-
微軟
+關注
關注
4文章
6596瀏覽量
104054 -
Facebook
+關注
關注
3文章
1429瀏覽量
54741 -
語音識別
+關注
關注
38文章
1739瀏覽量
112652
原文標題:操作細節曝光:微軟是怎么人工審核你的Cortana錄音的?
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論