9月28日,在業內舉足輕重的科技巨擘Google、Facebook、IBM、亞馬遜和微軟共同宣布成立一家非營利機構——AI合作組織(Partnership on Artificial Intelligence to Benefit People and Society),首次在人工智能領域建立合作關系。
這一組織的成立旨在對有關人工智能具體如何影響社會的倫理問題展開研究,令人工智能技術的開發更加可控和透明,同時也是為了遏制人們對這項日益精進的技術產生的擔憂。
這是為“邪術”出籠前準備好的“十字架與圣水”,有悲觀人士如斯評價。
我們已經自覺或不自覺地開始步入人工智能時代了。
幾天前的Google硬件發布會上,CEO劈柴花大量時間介紹了Google Assistant(谷歌面向消費者的人工智能虛擬助手,其核心能力包括:知識圖譜、自然語言處理、翻譯、語音識別、圖像識別)的進步和價值。 Google已將這一服務植入到了Google手機Pixel和Google Home以及更多的應用領域當中,甚至包括智能穿戴以及智能汽車。透露出Google領跑人工智能時代的野心。
科技巨頭的野心預示著AI發展將進入更廣更深的領域,產生更大的影響,使工業生產、金融、律師、管理顧問、記者等眾多行業從業人員都面臨被AI 替代的失業風險。英國BBC電視臺甚至預測,將近一半的普通職業從業者面臨著50%被人工智能取代的危險。AI對新聞媒體行業從業者也將會帶來前所未有的強烈沖擊。
比如Google最新開發出的“神經機器翻譯”(Neural machine translation),已經非常接近人類的翻譯。話說,新聞翻譯的活兒是不是就可以直接交給機器來干了?
隨著人工智能程序AlphaGo完勝九段棋手李世石,自動化新聞寫作機器人的成功開發,不久的將來,新聞媒體記者是不是就要被替代呢?
什么是AI?
在探討AI帶給媒體行業的影響前,我們先要了解AI的正確含義。
AI是人工智能(Artificial Intelligence)的英文縮寫,是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
CrowdFlower眾包數據處理公司的CEO Robin Bordoli在《關于人工智能的七大常見誤解》一文中提出了人工智能的有3個互相連鎖的關鍵概念:
1.訓練數據(TrainingData,TD)訓練數據是機器可以用來學習的起始數據來源集。訓練數據有輸入值和帶有答案的輸出值,這樣機器學習模型可以從答案中尋找模式。比如,輸入可以是客服單,帶有客戶和公司的客服代表之間的電子郵件。輸出可以是基于公司某個分類定義的從1到5的分類標簽。
2.機器學習(MachineLearning,ML)機器學習是軟件從訓練數據中學習到某種模式,并把它應用到新的輸入數據中。比如,一個新的客服單,帶有某位客戶和某位公司客服代表的郵件來了,機器學習模型可以預測出一個分類,并告訴你它對該分類的把握有多大。機器學習的關鍵特征是,它不是通過固定的規則來學習。因此,當它消化新的數據后會調整其規則。
3.人機回圈(Human-in-the-Loop,HITL)人機回圈是人工智能的第三個核心部分。我們不能指望機器學習萬無一失。一個好的機器學習模型大約只有70%的準確性。因此你需要一個人機回圈流程,當模型的可信度低時,還可以依靠人。
于是我們可以得到AI的基本公式:AI = TD + ML + HITL
由此我們可以總結出有關AI的3個關鍵信息:
1.人工智能不是一開始就具有高超智能的,而是需要一個數據樣本集對其進行訓練。
2.機器獲得智能本質上是從大量的樣本數據中學會了一種模式,并隨樣本數據的更新不斷更新其對模式的認識。
3.至少在當今,人工智能要做到萬無一失還少不了人工把關。
AI會給新聞業帶來怎樣的影響?
了解了AI的含義,讓我們來看看AI在新聞領域的應用。
抓取歷史數據并生成圖表
2016年8月30日,路透社與語義技術公司Graphiq宣布合作,旨在讓數據可視化變得觸手可及。Graphic公司有一個集結了50多位研發人員和數據專家的團隊,專門負責收集經濟、體育、娛樂等各個領域的數據。路透社借此利用AI實現了迅速抓取歷史數據并生成圖表,增強了新聞的實效性和可視性。
篩選“熱門話題”
Facebook在8月26日宣布趨勢話題撤掉人工編輯,完全依靠算法篩選熱門新聞的趨勢話題,做出了擁抱AI的勇敢嘗試。但打臉的是,還不到3天,就讓一則關于美國??怂剐侣勚鞑ッ犯??凱利的假新聞登上了版面。
據報道,這是由于Facebook機器篩選“熱門話題”依賴于該話題的相關文章和貼文數量,而非對于內容的判斷。由此可見在當前技術情況下想要避免假新聞還得要人工把關。
制作視頻
2016年6月,原論壇報集團(Tribune Publishing)宣布將公司更名為Tronc,并專注于使用人工智能制作內容。在接受CNBC電視臺采訪時,公司CEO Michael Ferro表示Tronc將會使用人工智能制作大量視頻。但就目前的AI技術來說,利用AI是否能作出高質量的視頻引起業界人士的質疑。
撰寫新聞
人工智能寫新聞已經不是一件新鮮事了。
2015年7月,美聯社和科技公司Automated Insights合作,采用人工智能技術來報道商業領域的企業財報新聞。從300份一季度到3000份一季度,這次合作幫助美聯社大大地提高了財報數量,據顧客反映正確率也大大提高。
2015年9月10日,騰訊網財經頻道發出題為《8月CPI同比上漲2.0% 創12個月新高》的第一篇由自動化新聞寫作機器人完成的稿件,引起新聞界關注。
在今年的里約奧運會上,今日頭條實驗室自助研發的AI機器人張小明通過兩種文本生成技術產出新聞:一是針對數據庫中表格數據和知識庫生成自然語言的比賽結果報道,即簡訊;二是利用體育比賽文字直播精煉合成比賽過程的總結報道,即資訊。奧運會期間通過對接奧組委的數據庫信息,實時撰寫新聞稿件,在 6天共生成超200篇簡訊和資訊。
用戶分析,個性化推送
在信息爆炸,用戶需求多樣化個性化的時代, 媒體如果想為100萬讀者制作100萬個他們需要的個性化頭版,就只能依靠人工智能(算法)了。Youtube、SmartNews、今日頭條等新聞媒體都依靠人工智能算法獲得了成功。
由此可見,AI在抓取歷史數據并生成圖表;篩選“熱門話題”;制作視頻;撰寫新聞;用戶分析,個性化推送等方面都發揮著強大的作用,引領著新聞媒體行業走向一場深刻的變革。
但由于技術限制,當今的AI還有很多缺陷,短期內不可能完全取代新聞記者,但隨著技術不斷進步,AI逐步趨于完善,也許在不久的將來就會取代很多新聞記者。
尤其是通訊稿式的新聞,很快就可以只靠機器人加上簡單的人工把控輕易而高效率的完成了,這就要求新聞業工作者不能只求時效性和數量,更要追求內容的質量與深度。簡單傳達信息的工作將會被機器人取代,我們要轉而傳達思考與文化。
ColdFusionTV在《阿爾法狗背后的谷歌DeepMind:能自我學習的人工智能》中深入分析AI對未來的影響后得出結論:“人工智能可以接管很多信息密集型的專業工作,只為我們留下創造力和情感為本質的工作,這些或許是人工智能永遠無法習得的。”
這樣的結論讓我們感到些許欣慰,畢竟創造力和情感是機器無法與人比擬的。但是機器真的無法做出創造性的工作么?
AI有創造性么?
藝術領域一直被視為人類情感和感性的領域,但連這樣的領域AI都開始涉足。
Oscar Schwartz在題為《電腦能寫詩嗎?》的TED演講中證明了電腦是可以寫詩的。
現在我們來做一個小測試,下圖的兩首詩一首是人類詩人創作的,而另一首是由機器生成的,你能猜出哪一個是機器所作么?
這是講師在演講現場給觀眾提出的問題。
但當時只有個別幾個觀眾猜對了。
答案是,詩歌1是人類詩人格特魯德斯泰因寫成的,而第二首則是由RKCP的算法所寫的。RKCP是由谷歌設計師總管雷科茲威爾設計的演算法。原理是你給RKCP一個原文本,而它通過原文本了解到人類如何使用語言,然后創造出一種和該文本相似的語言。即為在本文開頭所提到的訓練數據+機器學習原理。詩歌2其實是受到詩人艾美莉迪金森的影響寫成的。
怎么樣?你猜對了么?
其實早在20世紀50年代,計算機科學和密碼學的先驅阿蘭?麥席森?圖靈就設計出了有名的圖靈測試,其內容是,如果電腦能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則電腦通過測試。2014年6月8日,一臺計算機成功讓人類相信它是一個13歲的男孩,成為有史以來首臺通過圖靈測試的計算機。這被認為是人工智能發展的一個里程碑事件。
除了會寫詩,AI最近又開始進軍音樂領域。
最近,索尼音樂的計算機科學研究實驗室(Sony CSL)發布了兩首完全由人工智能作曲的流行歌曲,稱這是有突破性的第一次。無數網友表示本以為會效果感人,但親測真的很好聽。旋律易記的《Daddy‘s Car》,是人工智能模仿The Beatles樂隊的風格創作的,有種陽光明媚在路上吹風的感覺,大家有興趣可以試聽感受一下。
詩歌、音樂、語言。曾近被我們認為最需要人類感性的領域,實踐證明AI同樣也可以做的很好。
照這個邏輯,在人工智能不斷發展下,不久的將來機器人寫分析性預測性的文章,寫深度長文報道,復雜選題的特稿是否也能得心應手呢?這不得不讓眾多媒體人感到恐慌。
機器人會取代媒體人么?
別著急,讓我們先來仔細想想機器人是怎么創作詩和歌曲的吧。
在這兩個案例中,機器人都是通過輸入大量的源樣本,從中進行模式學習,進而創作出有某人風格的作品,有的時候(如歌曲的最終完成)還需要加以人工輔助來完成的。
其實完全符合AI = TD + ML + HITL的公式。
即使是隨著技術的進步,人機回圈的必要性越來越小,AI是否就可以取代新聞媒體記者,寫出比人類更好的新聞報道呢?
也許你會說是的,畢竟阿爾法狗就戰勝了人類。
但是圍棋比賽和做新聞有本質區別。
記者的不斷創新才是AI創作的源泉
圍棋與創作最大的區別在于圍棋有勝負,并且只有圍棋本身的規律,不隨時代而改變。在阿爾法狗的訓練過程中,是先讓其學習無數的人類下棋模式后,再讓不同版本的阿爾法狗之間進行比賽,并對新的比賽過程進行學習,使其不斷超越機器自身,最終才得以超越人類。
而創作領域沒有輸贏之分,好壞也是很主觀的事情,所以沒有辦法讓其自身不同版本之間進行競爭,也就很難想到方法讓其只靠學習以前的文章就能持續提高水平,寫出比人類記者更優秀的文章。
要寫出好文章,就要輸入大量優秀的的樣本,而這些優秀的樣本創造需要無數記者充分發揮創造力,如果沒有無數記者的不斷創新,只有機器人在現有的文章中不斷學習,很難想象怎么能與時俱進地寫出越來越好的文章以及新聞報道。
也許隨著技術進步AI能寫出比大多數普通記者都好的文章,這就對記者提出了更高的要求,但AI最終無法超越不斷創新的廣大記者群體。
AI的前進方向由媒體人決定
另外,更重要的是,在為AI機器人訓練時,給它們怎樣的樣本取決于人類對這一工作本質的認識。
Oscar Schwartz講師在演講中提到,人工智能的發展是一面鏡子,AI機器人并非會創作,它們只會通過學習來做的無限像人的某一個方面。而我們則需要決定“要讓人工智能像人類的哪一個方面”。
這一決定需要我們對人本身,對新聞和媒介本身有更深的理解。
例如,如果要利用AI為用戶個性化篩選新聞,我們首先要想明白作為一個用戶最需要怎樣的新聞,如何避免僅靠用戶的瀏覽記錄來推送文章時可能引發的信息娛樂化和狹窄化。
如果想要利用AI寫出好的新聞深度報道,我們需要想明白究竟什么堪稱優秀的新聞報道,需要從我們自己平時寫深度報道時如何收集材料,如何歸納分析,如何創新中總結出一種規律。
如果寫分析預測,我們則需要知道需要考慮到哪些因素,收集哪些數據來進行分析預測。
需要與用戶進行互動,建立關系時,我們首先要知道用戶需要怎樣的關系,這個關系隨時代怎么改變。
也就是說,AI說到底是增強人類某一方面能力的輔助,而需要增強哪一方面能力,需要怎么增強,這個最關鍵的方向性問題需要我們來思考。
正如ColdFusionTV所說“人工智能研究的原點是人腦,是人類對于自己大腦的理解的反映”,所有的規律和奧秘其實都在我們自身。
所以對于每一個媒體人來說,只有我們更深入地了解新聞媒體行業的本質和人類通過媒介獲得信息、人的思考方式的本質,加深AI領域的人文探索,才能使AI更好的為我們所用。這是AI對所有媒體人全新的挑戰。
評論
查看更多