人工智能時代的數據風險、信息壟斷和算法偏見與信息操控等幾個憂慮的介紹與分析
數據風險
人工智能時代,無論是個性化新
都是一種基于大數據的新聞生產,這
也是新聞業對于大數據的主動探索。
大數據的優勢在于四個 V,即 Volume
(體量大)、Velocity(速度快)、Va
riety(種類多)、Value(價值密度低)。
大數據的浪潮不可逆轉,然而在人工
智能時代,數據風險也隨之增大。
根本原因,在于數據源的不確定
性。數據的提供者可以是政府機構、
專業組織,也可以是社會個人,不同
的信源,在提供數據時有著不同的動
機、精準度、專業度等因素的差異。
這里面無法剔除數據造假、數據操縱
幅度增長,然而巨量數據的背后是價
值密度的稀釋。計算機學者指出,目
前的人工智能還達不到在短時間內高
效提取有價值的信息,有太多噪音和
熵影響精準度,呈現虛假關系的風險
也隨之增大。2016 年美國大選,NBC
和華爾街日報等機構的民調失敗就是
最直接的案例。AI 時代數據爆炸,數
據泄露的風險更令人擔憂,人工智能
的任何一款產品都可以充當社會傳感
器,可以進行個人數據的采集與監視,
這些數據一旦泄露,其問題處理起來
可能比 2013 年的“棱鏡門”事件還
要棘手。
信息壟斷
互聯網的基本精神之一就是信息
開放,但就現實而言,信息往往集中
在幾個政府以及大公司手中,而人工
智能技術目前也集中在這些公司與組
織。信息開放可以讓數據流動起來,
在社會的各個層面實現更大的價值,
然而無論是國外的微軟、谷歌,還是
國內的百度、騰訊和網易,在人工智
能的“利益爭奪戰”中都各自為陣,
基于各自用戶進行數據采集分析,信
息壁壘使數據缺乏多樣化,許多有價
值的層面例如重疊用戶的分析,無法
有效進行。
行業寡頭對于信息的壟斷不局限
于數據層面,還包括數據分析團隊的
壟斷。這里的團隊,是指能夠跨部門
融合的、跨領域合作的數據生產與分
析團隊。弱人工智能階段,數據分析
需要“專家系統”的參與,比如現階
段的個性信息推送以及機器人寫作,
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%