現有研究方法存在哪些問題?
“大數據”已儼然成為時代熱詞,社會學家說它是一座蘊含了大量信息的富礦,統計學家卻認為龐雜的結構為數據分析帶來了巨大的挑戰,從中提取有用信息猶如大海撈針。
相比于傳統數據類型,大數據的分析難度不言而喻。
如何用好這些數據,高效提取有價值的信息,是在數據豐富的今天需要探討的話題。
大數據輿情分析面臨著數據量大、維度多樣、結構復雜等問題。研究對象也從受眾個體發展到了受眾之間、傳受之間的復雜網絡關系,甚至雜糅了時間、空間維度等場景化信息。但現有的研究仍以數量統計和詞頻分析為主,難以深入挖掘大數據的潛在價值。
不同維度的數據都需要專業的分析方法,繼而革新了輿情研究的思維方式?;谪S富的輿情分析理論和經驗,科學研究方法才能使輿情研究如虎添翼。
科學分析大數據有助于研究者打開視野,從更開闊的角度切入研究。根據不同研究意圖搭建復雜模型檢驗,深入因果推論,可以實現輿情研究的數據化、動態化,也可以加強趨勢研判的延展性、科學性。
采用科學的研究方法、納入大數據模型,也是互聯網環境下輿情研究的發展趨勢,為更加全面立體地掌握輿情動態奠定了科學基礎。
科學研究方法的3大“用武之地”
筆者結合日常實踐,梳理了科學輿情研究方法在大數據層面的具體運用。
1、基礎統計分析方法:掌握輿情全貌
基礎統計分析方法是掌握輿情全貌的重要基礎。
輿情發展是一個分階段的動態過程,通過對數據所包含的維度進行基礎統計計算,能夠獲得橫向切面和縱向發展的雙向描述,進而掌握輿情全貌。
一是橫向比較橫截面數據,描繪當下輿論情況。
例如,在國際傳播研究中,首先要了解國際輿情。通過統計給定時間內的輿情數量規模、情感傾向、話題細分等數據,能夠快速勾勒基本輪廓,便于研究者了解某一時段的靜態輿情特征。
二是縱向對比時間序列數據,動態追蹤輿情態勢。
為深入研究國際輿情,還需長期追蹤基礎統計量。持續累積同口徑數據列,便能回溯其發展趨勢,并通過時間序列模型預測輿情發展態勢。
2、傳統量化研究方法:推動輿情研判
傳統量化研究方法是推動輿情研判的重要保障。
輿情研判是指通過特定方法對輿情信息的特性、態勢、走向進行研究判斷的專業工作。大數據輿情研判需要借力傳統量化研究方法,采用相關分析探索不同變量間相互作用的關系,采用回歸分析探索變量間的依賴關系,并預測變量的發展趨勢。
一方面,將相關分析用于輿情研究,適用于分辨看似無關的信息間潛在的相互關聯,能夠從龐雜的數據中發掘足以影響全局的非確定關系,從而確定如何在復雜環境中精準研判輿情態勢。
2018年6月23日,泰國一支青少年足球隊被困洞穴,7月10日獲救。該事件引發全球媒體和公眾廣泛持續的關注。筆者在分析該事件時發現,傳統媒體報道和社交平臺熱議話題間存在相關關系,兩個輿論場相互影響的復雜漸變關系還原了輿論觸發和影響機制。
另一方面,回歸分析應用到輿情分析領域,能夠探究相關變量間的因果關系及發展走勢,尋找輿情演變規律模型。通過建模分析,不僅可以判斷不同議題、國家、媒體間的關系,還能進一步探究相關輿論的未來走勢。
例如,以各國媒體就新冠肺炎疫情的報道為素材建模,能夠從宏觀角度把握國際輿論,并直觀展現各國媒體新聞敘事的關系,探明媒體報道與國際輿論的相互影響,找到國際輿情的演變路徑。
3、量化文本分析方法:深度挖掘輿情
量化文本分析方法是深度挖掘輿情的重要助力。
大數據背后隱藏著肉眼難以識別的深層信息,尤其是在面對大量文本數據時,難以靠傳統分析方法直接獲得全面信息。
以往針對文本的分析方法分析周期長、研究耗時長、人工工作量大,難以適應輿情研究求快求全的現實要求。因此便需借力量化文本分析方法,集中處理數十萬乃至數千萬量級的文本內容。
筆者在實踐中總結了適用于輿情研究的部分量化文本分析方法:
LDA主題模型算法
LDA(Latent Dirichlet Allocation)是統計學中常用的一種降維分析方法,即降低復雜的文本數據包含的維度。通過運算歸類,具有相同特性的文本被識別為一組,進而實現文本主題的機器分類。這一算法常用來提取子話題。
這種方法能夠大大縮短文本處理時間,通過計算實現文本內容歸類,提高輿情子話題提取效率。
文本位置估計模型
文本位置估計模型是政治學領域的成熟算法,旨在通過計算文本中包含的政治學詞匯特征,判斷文本的左右派傾向。輿情研究可以借用該算法原理,通過計算詞頻、詞距、詞語間共現關系等信息,計算特定文本的相對位置,判斷研究對象的態度傾向差異。
例如,以此分析中美關系輿情,可以直觀看到中美受眾的不同立場表達,并根據文本位置距離判斷未來發展趨勢。
基于社會網絡分析方法的詞語共現關系分析
如前文所述,文本之中也隱藏著復雜的詞語網絡。探詢文本的共現網絡,是還原語境的重要路徑。
前文的分析方法多將文本分裂為詞組,計算使用的矩陣也常常忽略了語句連接在一起的整體含義。采用社會網絡分析方法,可以描繪出詞語間的距離與聯系,可以在一定程度上探索其出現的語境,還原斷裂的文本。
數據輿情時代,研究方法的3大變遷
把握輿論脈搏,洞悉輿情走向,是信息化社會了解民意的重要因素。數據與輿情結合的產物——數據輿情也已應時代要求而生,亟待從業人員理論結合實踐,吸納科學分析方法,提升數據處理和輿情研判能力。
1、加強數據挖掘能力
數據是所有分析的原材料,沒有數據再精巧的方法也難為無米之炊。
數據輿情行業研究,需要以數據積累為目的長期挖掘和存儲,注重日常數據的挖掘和積累,不斷拓展數據邊緣。搭建龐大的數據倉庫,提升數據使用效率,是發展數據輿情的首要條件。
2、提升數據分析能力
在掌握了大量數據之后,分析能力便成為了挖掘輿情的主要難題。
在輿情研究領域,數據分析能力具體體現為科學研究方法的掌握和使用能力。為進一步提高輿情分析的效率和質量,強化量化研判與輿情工作的深度融合,提升數據分析能力,是發展數據輿情的必要條件。
3、強化數據合作共享
數據是取之不盡的可再生資源,研究者根據日常工作的專長和角度不同,掌握的數據形式大為不同。
因此,強化以行業實踐為基礎的合作機制,是推動數據輿情化和輿情數據化的大勢所趨。
-
互聯網
+關注
關注
54文章
11148瀏覽量
103239 -
數據分析
+關注
關注
2文章
1445瀏覽量
34050 -
大數據
+關注
關注
64文章
8882瀏覽量
137403
發布評論請先 登錄
相關推薦
評論