美國總統競選前,一些國外的大數據預測公司預測特朗普將連任,但是最終拜登當選了,現實打了臉。有些人疑問,大數據預測難道和算命術一樣不準嗎?
什么是大數據預測?
一般解釋,大數據是指海量的數據集。如今,萬物互聯,尤其是移動互聯網的普及,工作和生活都已經離不開信息設備,使用過程中無疑會產生大量的數據,大數據時代早就來臨。
我國網民數量全球第一,各種上網活動都會產生數據,這其中包括網購,每天千萬次以上級別的交易量。網頁搜索,同樣產生巨量的數據。即使我們不使用網絡,城市里各種各樣持續運行的監控以及傳感器,銀行、醫院、地鐵等單位處理業務的應用系統,都在產生大數據。大數據無處不在。
大數據預測則是大數據的核心應用,埃里克?西格爾在關于大數據預測的書中曾指出,大數據預測是通過學習和分析數據,來預測未來的一種科學技術,可以幫助執行人更好地決策。
大數據預測失效
這次美國大選,特朗普和拜登分屬的共和黨、民主黨都有自己固定的票倉,在這些州大數據預測也比較準。但是,往往決定總統競選結果的是那些搖擺州,搖擺州的民意調查也經常不精準,如何建立有效的預測模型,成了預測結果是否準確的關鍵。
一家預測特朗普連任的大數據公司,他們建立的模型是,分析網民搜索特朗普和拜登丑聞的比例。數據顯示搜索拜登丑聞的網民遠多于特朗普,通過丑聞搜索來預測競選結果,前幾次大選都顯示了這種模型的準確性。
大數據預測失效是因為建立的模型準確性有偏差。
但是,此次特朗普團隊對美國疫情的控制不力成為他很大的丑聞,網民查看新冠疫情,或者通過其他途徑知曉新冠疫情,其實也是在查看特朗普的丑聞。如果該公司考慮到新冠疫情的搜索情況,重新建立模型,大數據預測就將變為拜登勝選。
所以,不是大數據預測不準,是設計大數據模型的人沒有充分考慮到新冠疫情,也沒有把它納入預測模型中。另外數據源不準確,也會影響預測結果。例如有些人在做民意調查時,隱藏自己真正內心想法,這些都會變成錯誤的數據源。
國內一家大數據預測機構宣布,他們充分考慮了各種因素,建立了正確的預測模型,預測結果拜登勝選,說明大數據預測還是可信的。大數據預測模型的建立非常難,結果沒出來前,我們都沒法知道誰的模型正確,所以大數據預測有優點也有不足,企業決策需要全面均衡考慮。
應用領域多
數據每時每刻都在產生和被記錄,大數據預測也正在成為各個領域的關鍵技術,在我們社會中發揮重要作用。
1.天氣預報
大數據預測應用的典型案例是天氣預報,在信息技術日趨發達的今天,在云計算和人工智能的幫助下,用先進的大數據技術處理和融合數據,氣象預測會越來越準確。
氣象數據,主要來源于氣象衛星、氣象雷達、氣象站,以及各個專業機構的數據。天氣預報即在海量的“大數據”基礎下進行預測。
中國氣象局高級工程師唐千紅指出,不久的將來,地理信息和社會大數據均會為氣象服務,我們可以精準了解任何時間和空間的氣象信息。
2.軍事預測
“知己知彼,百戰不殆”。在軍事領域,大數據結合云計算和人工智能技術發揮著重要作用,可以提高軍事預測準確度,為戰略和戰術提供科學依據。
現代武器的信息化程度越來越高,智能化裝備也在增加,這些軍事裝備可以源源不斷采集各種戰場數據。例如,軍事衛星和雷達等系統會監測到各種數據;各種用電設備會產生電磁輻射,這也是戰場數據的一種來源,將各種數據匯集,利用大數據技術,可以對敵我雙方情況掌握更清楚,對戰爭狀況進行有效預測,并制定更加有效的作戰計劃。
“兵馬未動,糧草先行”,后勤補給在戰爭中非常重要,基于大數據的預測模型,可以采集作戰對象和作戰環境等數據,然后更科學預測出彈藥補給、傷亡情況等,以便很大程度地提供后勤保障。
3.交通預測
在城市修路,大數據可以分析出合適的路線,建設單位也可以利用大數據預測,得出未來的車流量,就知道該建幾條車道等,交通管理部門也可通過大數據預測,掌握各個時間段和區域的車流量,實施智能化的車輛調度。
我們經常使用的導航軟件,后臺也開啟了大數據系統,可預測出合適的路線,隨著技術的完善,預測的路線已經越來越精準。
4.疫情預測
2009年,一家互聯網科技巨頭利用美國人在互聯網的搜索數據,與歷史上流感傳播期的數據進行對比,并用預測模型進行分析,成功預測了2009年的美國流感,并把位置精細到州和地區,比官方數據更精準,時間更早。
此次新冠疫情,也有大數據預測公司根據某些國家的行政政策、人文環境、衛生習慣、醫療條件和隔離措施等數據,預測出哪些國家疫情會比較嚴重些。
5.其他應用
賽果預測,有些互聯網公司利用大數據平臺,預測體育賽事,也有些和博彩相關的公司,正在用大數據預測彩票的結果。
金融市場預測,有些金融公司希望借大數據預測知曉金融市場走向,有個別公司獲得了一定成功。
物價指數預測,大數據預測可以更加精準預測物價趨勢,能提前發現通貨膨脹或經濟危機的蛛絲馬跡。
用戶需求預測,通過收集消費者的上網行為數據,大數據可以分析和洞察消費者的需求,相關的公司可以利用這些分析數據,推出和優化商品。
自然災害預測,在物聯網時代,傳感器、攝像頭和無線通訊遍布全球,利用各種監測設備采集的大數據,可以更加有效地預測將要發生的洪澇、高溫等自然災害,有利于我們提前做好預防措施。
除了上面列舉的多個領域之外,在環境變化預測、污染排放預測、未來健康預測、行業發展預測、風險評估等領域,大數據預測正在發揮著重要作用,雖然大數據預測也未必百分百準確,但是這是預測領域比較好的方法。
處理好隱私,發展更廣
中研普華研究報告指出,44.1%的受訪企業表示,隱私保護成為制約大數據發展的第一障礙,既要保護好隱私,又要利用這些數據做預測,是大數據預測公司必須面對并解決好的難題。
中國科學院院士王小云教授指出,在信息時代,大數據面臨嚴峻的安全問題,個人隱私如何更好的保護面臨挑戰。舉例說,我們在超市和網上都會留下購物信息,在手機里存儲個人秘密,在醫院里有就診記錄。智慧城市系統有很多傳感器記錄,我們的指紋、臉部識別照片經常被其他機構獲取。而這些信息如果被泄露,可能會為黑色產業鏈提供財富。
大數據預測公司使用這些數據時,需要格外小心,既要做到不侵犯他人隱私,也要有足夠的措施保護好數據。
王小云教授強調,保護個人隱私,法律保障是基礎。在我國,已有了三部法律,分別是電子簽名法、網絡安全法和電子商務法,另外,個人信息保護法有望出臺,通過這些法律可為大數據保駕護航。
大數據預測公司,應在符合法律的基礎上,開展更多的預測應用。在未來,大數據預測的市場會越來越大。
責編AJX
-
數據分析
+關注
關注
2文章
1446瀏覽量
34050 -
大數據
+關注
關注
64文章
8883瀏覽量
137407 -
特朗普
+關注
關注
1文章
288瀏覽量
19807
發布評論請先 登錄
相關推薦
評論