向中國科技目標推進的一些最關鍵工作,在中國中部腹地的一座原水泥廠里進行著,與北京和深圳那些向往成為硅谷的地方相距十萬八千里。工廠院內還擺著一臺閑置的混凝土攪拌機。隔壁的一座倉庫里堆著一箱箱密胺餐具。
院子里,侯夏夢經營著一家幫助人工智能理解世界的公司。24個年輕人在瀏覽照片和視頻,標記他們看到的每樣東西。這是一輛汽車,那是一個紅綠燈。這是面包,這是牛奶,那是巧克力。這是一個人走路的樣子。
“我以前覺得機器很聰明,”24歲的侯夏夢說,“現在我知道,它所有的聰明都是我們給它的。”
在長期充當世界工廠的中國,新一代的低薪工人正在為未來奠定基礎。在規模較小、成本較低的城市,創業公司如雨后春筍般涌現,他們在給中國海量的圖像和監控錄像添加標簽。正如一位專家所說,如果把中國比做數據方面的沙特阿拉伯,那么這些公司就是煉油廠,它們將原始數據轉化為可以為中國的人工智能雄心提供動力的燃料。
通常認為中國和美國正在爭奪人工智能的霸主地位,而中國具有一定的優勢。中國政府在財政和政策上廣泛支持人工智能公司。2017年,全球計算機視覺市場中,中國創業公司占了三分之一,超過美國。中國的學術論文在研究論文中被引用的頻率更高了。在去年的一份重要政策聲明中,中國政府表示,預計到2030年,該國將成為人工智能領域的全球領導者。
更重要的是,這種想法認為,多虧了薄弱的隱私法律及其執行,中國政府和公司獲得了堆積如山的數據。在Facebook、谷歌和亞馬遜已經積累的數據之外,中國互聯網公司能獲得更多,因為那里的人們太常用他們的手機購物、支付餐費,以及購買電影票。
然而這些說法中的許多是存疑的。中國的論文和專利可能存在問題。政府的錢可能會被浪費掉。目前還不清楚人工智能競賽是否會是一場贏者通吃的零和博弈。除非有人能夠分析和歸類,否則數據是無用的。
但標記這些數據的能力,可能是中國真正的人工智能實力,也可能是美國唯一無法匹敵的力量。在中國,這個新興產業提供了一個政府長期承諾的未來的一瞥:一個建立在科技而非制造業基礎上的經濟。
“我們這些人屬于數據行業里的建筑工人。我們做的事就是壘磚頭,一塊一塊地壘,”中部省份河南郟縣一家數據標簽工廠的聯合創始人伊亞科說,“但我們在人工智能中扮演著重要角色,沒有我們,他們無法建造摩天大樓。”
雖然人工智能機器是超快的學習者,擅長處理復雜的運算,但它們缺乏就連5歲的孩子都具備的認知能力。小孩子們都知道棕色的可卡犬和黑色的大丹犬都是狗。它們可以分辨一輛福特皮卡和一輛大眾甲殼蟲,但還無法了解二者都是汽車。
人工智能需要被教導。它必須消化大量帶有標簽的照片和視頻,然后才能意識到,黑貓和白貓都是貓。這就是數據工廠及其工作人員起作用的地方。
標記幫助北京的人工智能公司AInnovation完善其為一家中國面包連鎖企業提供的自動收銀系統。用戶可以將糕點放在掃描儀下,在沒有人類幫助的情況下付費。但有三分之一的時候,由于商店照明和人體運動,圖像變得更加復雜,系統無法分辨瑪芬蛋糕、甜甜圈或叉燒包。AInnovation項目經理梁睿表示,標記在使用商店內部照片的情況下,準確度高達99%。
“有多少人工就有多少智能,”梁睿說。
AInnovation有不到30個標記員,但標簽初創公司的激增使得把工作外包出去變得很容易。有一次,梁睿為超市做標簽,需要在三天內拍攝大約20000張照片。同事們在數據工廠的幫助下,只花幾千美元就完成了工作。
“我們就是10年前流水線上的工人,”河南那家數據工廠的聯合創始人伊亞科說。
數據工廠開始在遠離大城市的地區涌現,通常是在相對偏遠的地區,勞動力和辦公空間都很便宜。許多數據工廠的工人都曾在大城市的流水線和建筑工地工作。但是那些工作正在枯竭,工資增長放緩,而且許多中國人更喜歡住在離家較近的地方。
36歲的伊亞科失業后聽說了人工智能標記,那時他試圖和小學同學一起做別的公司。在網上搜索后,他認為這項工作技術性不強,只需要廉價勞動力,而這正是河南不缺少的。
三月,伊亞科和朋友們成立了睿金科技,該公司以每年2.1萬美元的價格在工業園區租用了兩個專業籃球場。它以前是園區黨委會的活動空間,吊頂燈上覆蓋著紅色的鐮刀錘子圖案。
睿金的意思是智慧黃金,它現在雇傭了300名工人,但計劃在春節假期后擴大到1000人,春節期間,很多農民工會回家鄉。
與世界各地的工人和企業不同,伊亞科并不擔心人工智能會取代他的工作。
“機器還沒有聰明到自己教自己的程度,”他說。
招聘是一個更大的麻煩。
睿金每月400至500美元的薪酬高于郟縣的平均水平。一些潛在的求職者擔心自己對人工智能一無所知。也有人覺得這項工作很無聊。
19歲的靳煒祥表示,他將在春節后離開睿金,到南方城市廣州一家實體店賣家具。
“我喜歡和人打交道,”靳煒祥說。“做標注就是掙點錢。”
但對于一些以前的農民工來說,這項工作比在流水線上工作要好。
“工廠里每天是一樣的活,一樣的動作,天天都一樣,”曾在一家電子元件公司工作的睿金員工、28歲的伊真真說。“現在得稍微動動腦子。”
大多數情況下,客戶不會告訴數據工廠,他們的工作是用來做什么的。有些是顯而易見的。比如標記交通信號燈、道路標志和行人,它們通常用于自動駕駛。標記許多類型的山茶花可能是給搜索引擎用的。
有一次,睿金得到一個任務,為數百萬個人類的口部圖像做標記。伊亞科說他不確定這是用來做什么的。也許是面部識別?
大約向北300英里的河北南宮市,侯夏夢經營著一家數據工廠,由她婆家擁有的一間舊水泥廠改建而來。她在大學畢業后的第一份工作是給曠視科技做面部標記,這是一家價值20億美元的中國面部識別公司,其最著名的技術平臺名為Face++。到目前,一些面部識別系統可以比識別她的朋友更快地識別她,她說這是因為“我的臉在原始數據庫里。”
但北京的生活太過艱難而且昂貴。她和當時的未婚夫趙亞成決定搬回家鄉做數據工廠。她的父母可以出電腦和辦公桌的費用。他們正在翻新隔壁的倉庫,再雇用80多名員工。
像伊亞科一樣,侯夏夢并沒有花時間思考自己的工作所帶來的影響。它們是否有助于國家的監視,以及機器控制人類的反烏托邦未來?
“攝像頭讓我感覺安全,”她說。“最起碼現在是我們在控制機器。”
-
AI
+關注
關注
87文章
30851瀏覽量
269013 -
人工智能
+關注
關注
1791文章
47258瀏覽量
238417
原文標題:廉價勞動力如何推動中國的人工智能雄心
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論