量子計算已接近商業化階段,有很大的潛力改變我們的世界。利用量子計算的獨特能力來解決特定類型問題的早期采用者,有可能在建立新型業務模式方面實現突破。富有遠見卓識的企業已經開始調整戰略方向,為新興的量子計算生態系統做好準備,成為“量子就緒型企業”。這些具有前瞻性思維的企業正在探索用于解決復雜業務問題的用例和相關算法。
何為量子計算?
量子計算利用了自然科學中發現的量子力學定律,有潛力從根本上改變傳統的信息處理方式。量子行為的兩個特性,也就是疊加和糾纏,使量子計算機有能力解決目前的常規或傳統機器無能為力的問題:
1、疊加。傳統計算機使用的是只包含“1”或“0”的二進制位。而量子計算機則使用量子位,可以描述“1”、 “0”或者量子位的可能狀態的任意組合(稱為“疊加”)。因此,具有 n 個量子位的量子計算機通過這些量子位彼此疊加,形成了 2n 種可能性。這使量子計算機具有指數級數量的狀態,因此能夠比傳統計算機更有效地解決一些特定類型的問題。
2、糾纏。在量子世界,甚至相距光年的兩個量子位仍能以強相關的方式發揮作用。量子計算正是借助這種糾纏特性,利用量子位之間的相互依賴性破解問題。
量子的疊加和糾纏特性使量子計算機能夠快速研究一系列可能性,以確定有助于推動業務價值的最佳答案。由于未來的量子計算機在計算某些問題時,速度要比傳統計算機快上幾個指數級(見下圖),因此有望解決極為復雜的業務難題。盡管傳統計算機存在局限性,但在可以預見的未來,量子計算機并不會完全取代它們的作用。相反,結合了量子與傳統架構的混合型計算機有望浮出水面,將一部分難題“外包”給量子計算機。
比如說,要使傳統計算機的理論計算能力翻一番, 需要將晶體管數量增加一倍。要使量子計算機的理論計算能力翻倍,只需為某些應用額外添加一個量子位即可。未來的量子處理器可模擬咖啡因分子 — 傳統計算機要想做到這一點,個頭要比地球大上 10% 才行。近期內,量子計算機也許可以幫助設計一些新材料, 用于在將來創建更強大的量子計算機。
▲ 量子計算為運算加速的潛力遠遠超過傳統計算機
量子計算有潛力徹底轉變某些行業。例如,鑒于傳統計算機無法精確求解方程,導致當前的計算化學方法嚴重依賴于近似值。而量子算法有望在更長的時間范圍內進行準確的分子模擬,從而實現目前無法做到的精確建模。這有助于更快發現能夠挽救生命的藥物,并顯著縮短藥物開發周期。
此外,量子計算還有望解決當前令人束手無策的復雜的物流優化問題,從而實現可觀的成本節省,顯著減少碳排放。我們以量子計算幫助價值數萬億美元的航運業改善全球航線為例。即使量子計算只能將集裝箱利用率和運輸量提高哪怕一點點,也能為運輸企業節省數億美元的成本。為了利用量子計算的優勢獲得更多利潤,領先競爭對手,前瞻性的企業已開始培養專業能力,探索能給自己的行業帶來好處的用例。
量子優勢迎來曙光
量子計算機能夠解決傳統計算機無能為力的一些業務問題 — 我們通常將這種能力稱之為“量子優勢”,而實現這一優勢的時刻離我們越來越近了。例如, “恒定深度”的量子電路已展現出遠超傳統電路的優勢。下圖說明了面向特定業務用例的量子優勢。確切地說,由于面向特定用例的量子優勢尚不明確,因此,有關未來五年內量子計算市場價值的預測也天差地別 — 從大約 5 億美元到 290 億美元不等。
▲量子用例的商業化
由于人們對這項新技術所能創造的商機充滿期待,導致量子計算生態系統呈現出加速發展態勢。初創企業不斷涌現,研究機構與技術提供商之間的合作層出不窮,大家都在希望將量子研究成果轉化為商用能力。開發量子計算機的科技公司已經開始與企業合作,以確定潛在用例,開發量子算法,并在真正的量子計算機上測試解決方案。隨著量子技術的商業合作如雨后春筍般不斷涌現,第一批量子商業應用指日可待。
為企業選擇合適的量子計算機
量子計算機各不相同,解決的問題也各有偏重。從限制最多的類型到最通用的類型,量子計算機主要分為三類:量子退火、嘈雜中型量子(NISQ) 計算,以及容錯型通用量子計算。
科學界普遍認為,相較于傳統計算,量子退火法的提速效果并沒有多么明顯。此外,量子退火計算機最終也無法發展成為容錯型通用量子計算機。 因此,量子退火計算機不能算作真正的量子計算機。
在短期內, NISQ 計算機最有可能創造業務優勢,并且業界已針對這種計算機調整了許多新的算法。此外,隨著 NISQ 計算機不斷擴展,它們正朝著量子計算的終極目標邁進 — 成為容錯型通用量子計算機,能夠處理重要的商業和科學問題,而且計算速度通常比傳統計算機有指數級的提高。
為何需要立即開始為量子計算做準備?在技術力量和競爭力量的雙重作用下,量子時代的到來要比你想象中早得多。若能立即開始關注量子計算,企業就能占得先機,拉開與同行之間的距離。以下是企業應該立即開始備戰量子計算的三個理由:
1、量子計算機具有轉變行業價值鏈的潛力,特別是在化學、生物、醫療保健、材料科學、金融和人工智能 (AI) 等領域。
2、 由于量子計算的學習難度非常大,因此, “快速跟隨”的方法不僅花費巨大,而且只會被先行者越拉越遠。
3、 建立內部“量子能力中心”需要一定時間。
量子計算機具有轉變行業價值鏈的潛力。量子計算機有潛力解決傳統計算機無能為力的超級復雜的問題,因此有望轉變整個行業的面貌。未來的量子計算機有能力在化學、生物、醫療保健、金融、人工智能和材料科學等領域實現產品突破,幫助富有戰略眼光、采用量子計算的企業快速搶占市場份額,提高盈利能力。因此,量子計算的問題解決能力能夠徹底重新定義競爭優勢,轉變企業運營模式和價值鏈,最終徹底顛覆整個行業。
例如,物流系統的優化通常基于“中心輻射”型網絡模型。要在大規模物流網絡中,設計一條能夠滿足各種不同需求的點到點最優路線,是非常復雜的問題,完全超出傳統超級計算機的能力范圍。即使對于只有幾百個集散地的物流網絡,要逐一探索所有的可能性,傳統計算機也要花上數十億年的時間。而量子計算有能力顯著縮短這種探索所需的時間。
再例如,為了優化航空公司的調度工作,量子計算可以創建專為在特定日期飛往數百個目的地的數千名乘客而量身定制的每日航班時刻表,從而幫助旅客縮短旅行時間、避免空中交通擁堵并降低航空燃油成本。如果企業能為物流網絡設計優化工作開發量子解決方案,那么,在物流作為關鍵成功因素的所有行業,這樣的企業都能夠迅速成為市場領導者。
“快速跟隨”的方法不僅花費巨大,而且只會被先行者越拉越遠量子計算不同于線性或漸進式的技術進步, “快速跟隨”的方法不太可能奏效。原因有以下幾點:
1、量子計算的學習難度非常大。
2、與“追趕”領先者相關的成本過高。
可以考慮以下用例:通過量子計算機為電子或運輸行業設計比現有物質更輕、更強韌的專用材料,而且與傳統計算機相比,解決問題的速度呈指數級提升(見上圖)。這種革命性材料的加速發展可以幫助制造商在短時間把競爭對手遠遠甩在身后。
借助量子技術成功上位的新晉市場領導者以既有知識為基礎,學習難度相對較低,因此能夠更上一層樓,進一步優化其突破性的材料,以及發現專為其他應用領域量身定制的新材料,不斷擴大與競爭對手的差距。雖然只是假設,但這個示例卻生動說明了由于存在巨大的學習難度,使得所謂的“快速追隨者”極難趕上先行企業,從而可能導致某些行業出現“贏者通吃”的情景。即便對于特定用例,快速追隨者有可能追上先行企業,也需為此付出高昂的代價,例如,培養內部專業知識,采購最合適的基礎設施,投資與實力派企業建立合作關系和/或收購具有相關能力的企業等。
建立內部“量子能力中心”需要一定時間。盡管大多數企業現在都聽說過量子計算,但他們中有許多都因缺乏相關人才和專業知識而無法充分利用即將到來的業務轉型的優勢,而且獲得量子計算技術也并非易事。量子計算的人才供不應求,高技能資源更是炙手可熱。
即使招聘到了合適的人才,也可能需要數年時間才能深入了解量子計算對特定業務的潛在影響。 最近發生的技術轉變,例如,為加速處理大數據工作負載而遷移到圖形處理器 (GPU) 的過程花了近十年時間,使得我們深深了解到,為采用新技術而培養專業能力是一個漫長的過程。鑒于量子計算有潛力徹底轉變行業, 能夠以指數級提升解決問題的速度,再加上量子領域的專業人才難以獲得,因此,領先的企業應考慮立即采取行動。
把握量子優勢,助推企業前進
量子計算的商業化對貴公司意味著什么?從中短期看,量子計算可在以下三個方面帶來商業利益:量子模擬、量子優化和量子輔助機器學習。
▲NISQ量子計算的預期用途
量子優化。解決優化問題需要從可能存在的諸多答案中找到最佳或“最優”的解決方案。我們以制定包裹投遞時間表為例。從數學上講,在相鄰時段安排10 次包裹投遞可能有超過 360 萬種選項。 9但是,根據收件人的時間要求、可能產生的延誤以及所運貨物的保質期等變量,哪個時間表才是最佳解決方案呢?即使應用近似值技術,可能的選項對傳統計算機而言仍然太多而無法處理。
因此,目前的傳統計算機采用大量的快捷方式來解決大規模的優化問題。遺憾的是,這些解決方案往往并不理想。可受益于量子優化的企業包括:希望升級網絡基礎設施的電信公司;希望優化患者治療效果的醫療服務提供方;希望改善空中交通管制的政府機構;希望定制營銷推薦的消費品和零售企業;希望加強風險優化的金融服務公司;希望制定員工工作時間表的企業;希望安排課程的大學院校。
雖然還沒有數學方法可以證明量子計算能夠以指數級提升優化問題的解決速度,但研究人員正努力通過啟發式方式來證明這一點。富有遠見的企業已開始探索如何利用量子計算來解決優化問題,以期超越競爭對手。一旦量子優勢在解決優化問題方面的能力得到確認,這些企業的遠見卓識便會給他們帶來切實的回報。
量子增強型人工智能。量子計算可以探索傳統計算機無法處理的海量可能性,因此有助于提升人工智能的熟練度。事實上,人工智能與量子計算之間的共生關系已開始在這兩個領域實現良性循環。例如,量子算法可增強機器學習在數據聚類領域的能力,而機器學習則可用于更好地理解量子系統。
基于量子的認知計算機最終能夠滲透到幾乎所有行業,主動為專業人士提供高級決策支持;為員工提供針對性的響應式培訓;為客戶提供專門定制的自適應式供應商關系。
通過五項戰略迎接量子的未來
▲ 通往量子未來之路
1.選擇量子精英團隊
貴公司可能需要進一步了解量子計算的預期收益。以下是入門方法:1、將企業內的一些領軍專業人才指定為“量子精英”。2、為這些“量子精英”充電,幫助他們了解何為量子計算、對行業的潛在影響、競爭對手的應對方式以及貴公司的業務如何從中受益。3、要求“量子精英”定期向高層領導匯報工作,以便在整個企業中開展量子計算教育,確保該計劃始終與戰略目標保持一致。
2. 開始確定量子計算用例和相關價值主張
待量子精英團隊了解了量子計算的原理及其如何助您應對業務挑戰和把握機遇之后,讓他們開始確定貴公司可在哪些領域借助量子計算領先競爭對手。
根據量子系統的獨特能力及其加速解決問題的優勢來評估機遇。要求量子精英團隊監控量子應用的進展,確定哪些用例可以更快地實現商業化。為確保量子探索與業務成果緊密聯系在一起,請選擇前景最光明的量子計算應用,例如創建突破性產品和服務或者以全新方式優化供應鏈。
3.試用真正的量子系統
通過試用真正的量子計算機,揭開量子計算的神秘面紗。要求量子精英團隊了解量子計算如何解決業務問題,以及如何與現有工具互動。單一量子解決方案并不能“包治百病”。量子精英團隊應專注于解決傳統計算機無法有效解決的最高優先級用例。
4.繪制量子路線圖
繪制量子計算路線圖,包括可行的后續步驟,目的是解決可能會對企業參與競爭以及獲得可持續業務優勢產生巨大阻礙的問題。為了加速備戰量子計算,應考慮加入新出現的量子社區。這樣能夠幫助您更好地接觸了解技術基礎架構、不斷發展的行業應用,以及有助于增強特定量子應用開發能力的研究人員。
5.靈活敏捷地應對未來量子格局的變化
量子計算在迅速發展。應尋找有望成為行業標準并且推動生態系統整合的技術和開發工具包。應認識到,新的技術突破可能會促使企業調整量子開發方法,包括更換生態系統合作伙伴。應留意企業的量子計算需求如何與時俱進,特別是當您進一步深入地了解哪些業務問題可從量子計算解決方案中獲得最大收益之后。
在信息時代,量子計算技術一旦突破,掌握這種能力的國家,會在經濟、軍事、科研、安全等領域迅速建立全方位優勢。所以,世界各國都在啟動巨資積極投入研發量子計算技術。隨著技術的快速發展,現在我們已經處在了量子計算機即將商業化的時間節點,量子計算不僅是國家戰略,相關企業若能提早布局規劃量子計算技術,未來注定能在“量子霸權”時代贏得先機,脫穎而出。
看點:邊緣計算市場規模將超萬億,與云計算平分秋色。
隨著5G時代的日益臨近,實時、智能、安全、隱私這四大趨勢催生了邊緣計算與端智能的崛起。5G通信的超低時延與超高可靠要求,使得邊緣計算成為必然選擇。
據預測,全球物聯網終端設備安裝數量有望在2019年達到256億臺,2020年將有超過500億的終端與設備聯網,邊緣計算市場規模將超萬億,成為與云計算平分秋色的新興市場。
一、邊緣計算,5G時代的萬億市場
邊緣計算(Edge Computing)是在靠近物或數據源頭的網絡邊緣側,融合網絡、計算、存儲、應用核心能力的分布式開放平臺,就近提供邊緣智能服務。
從邊緣計算聯盟(ECC)提出的模型架構來看,邊緣計算主要由基礎計算能力與相應的數據通信單元兩大部分所構成。
隨著底層技術的進步以及應用的不斷豐富,近年來全球物聯網產業實現爆發式的增長,這也為邊緣計算提供了更多的場景。
參考數據,全球物聯網終端設備安裝數量有望在2019年達到256億臺,年復合增速高達21%。
國內物聯網市場的增速更高,據預測,2020年我國物聯網市場規模有望達到18300億元,年復合增速高達25%。
與此同時,5G通信的超低時延與超高可靠要求,使得邊緣計算成為必然選擇。在5G移動領域,移動邊緣計算是ICT融合的大勢所趨,是5G網絡重構的重要一環。
據表示,到2020年,將有超過500億的終端與設備聯網,而有50%的物聯網網絡將面臨網絡帶寬的限制,40%的數據需要在網絡邊緣分析、處理與儲存。
因此,邊緣計算市場規模將超萬億,成為與云計算平分秋色的新興市場。
二、5G時代“邊云協同”,服務器市場迎來巨大增量
雖然云計算中心具有強大的處理性能,但是邊緣計算不僅能夠克服云計算網絡帶寬與計算吞吐量的性能瓶頸,還能夠更實時地處理終端設備的海量“小數據”,并在保證終端的數據安全。
因此,在有了云計算的同時,邊緣計算市場潛力依舊巨大。5G時代,將會是一個“邊+云”的“邊云協同”時代,邊緣計算與云計算各有所長、協調配合。
作為5G商用的元年,國內的三大運營商無疑都在加緊部署5G基礎設施,這其中就包括大量的基站設備。
但由于5G基站的密度大于傳統的4G基站,這也就意味著更大量的基礎設施投入。
與此同時,相對于4G,5G定義了eMMB(更高數據速率)、URLLC(更低延遲和更可靠的鏈接)和mMTC(超大規模設備鏈接)等三大應用場景。而這些場景化概念的引入無一不對基站的計算性能提出了更高的要求。
因此,5G基站背后的服務器市場不僅將迎來爆發性需求增長,其產品升級也是勢在必行的。
這一潛在的巨大市場需求也正是浪潮、曙光、華為等一系列設備制造商不遺余力推動OTII標準迅速落地。
OTII,Open Telecom IT Infrastructure,開放電信IT基礎設施,是ODCC組織下發展的一個針對通訊類企業的服務器規格。它不僅與交換機等設備規格相同,并且很容易部署在基站附近的設備機架上,而且具備更好的耐熱、耐腐蝕、抗潮濕特性。
與通用服務器相比,邊緣計算服務器面向5G和邊緣計算等場景進行針對性定制,能耗更低、溫度適應性更寬、運維管理更加方便。
2017年6月,中國移動與中國電信、中國聯通、英特爾、浪潮等公司共同發布《OITT定制服務器參考設計和行動計劃書》,形成運營商行業面向電信應用的深度定制、開放標準、統一規范的服務器技術方案及原型產品。
三、5G MEC近在咫尺,通信光模塊市場受益最大
1、吸取4G教訓、全球統一標準
在4G網絡標準制定中,由于并沒有考慮把邊緣計算功能納入其中,導致出現大量“非標”方案,運營商在實際部署時“異廠家設備不兼容”,網絡互相割裂等,常常需要進行定制化的、特定的解決方案設計,不僅提高了運營商成本,還造成網絡架構不能滿足低時延、高帶寬、本地化等需求。
為了解決4G痛點,早在5G研究初期,MEC(多接入邊緣計算,Multi-Acess Edge Computing)與NFV和SDN一同被標準組織5G PPP認同為5G系統網絡重構的一部分。2014年ETSI(歐洲電信標準協會)就成立了MECISG(邊緣計算特別小組)。
在2018年,3GPP的第一個5G標準R-15已經凍結。3GPP SA2在R15中定義了5G系統架構和邊緣計算應用,其中核心網部分功能下沉部署到網絡邊緣,RAN架構也將發生較大改變。
預計2020年5G商用以后,MEC邊緣云的應用將進入百花齊放、百家爭鳴的開放階段。
2、光模塊是5G物理層基礎單元,受益巨大
光模塊是5G網絡物理層的基礎構成單元,廣泛應用于無線及傳輸設備,其成本在系統設備中的占比不斷增高,部分設備中甚至超過50~70%,是5G低成本、廣覆蓋的關鍵要素。
從2G~4G,光模塊技術迅速迭代,逐步向高速率發展。
2000年初,2G、2.5G基站從銅纜向光纖光纜切換,光模塊從1.25GSFP向2.5GSFP模塊發展。2008~2009年3G基站光模塊速率躍升至6G。
標準組織3GPP提出新的5G接口標準eCPRI,如果采用eCPRI接口,前傳接口帶寬至少需要25G光模塊,但前傳25G和100G都會并存,以應對5G三大應用場景的需求。
另外,5G光芯片也將從6G/10G升級到25G的芯片模組,光模塊產業鏈市場規模顯著變大。隨著速率的提高,光模塊制造工藝門口大幅提升,產品附加值將較4G有所提高,有利于具有深厚儲備的光模塊公司。
5G作為十年一遇的迭代升級,將是光通信行業下一個爆發機會。
3、三大運營商積極布局5G MEC
5G時代,運營商將會采用通用數據中心云化的組網方式,以區域、本地和邊緣三層的數據中心為基礎,來構建整個云化網絡。同時,5G邊緣計算促進采集、控制類業務將會帶來運營新的2B業務增量,包括精密工控、遠程醫療、車聯網等。
對于運營商,5G MEC的部署價值巨大。
目前,中國聯通是三大運營商中規劃最明確的,中國聯通提出MEC邊緣云演進路標主要分四個階段,計劃在2025年實現100%云化部署。
而從2014年ETSI成立MECISG開始,中國移動就積極跟蹤并加入。2017年中國移動發布MEC白皮書。目前,中國移動已經在10省20多個地市現網開展多種MEC應用試點。同時中國移動要將MEC預制到5G中,為此將從標準、技術、產業等方面發力。
中國電信認為工業互聯網是MEC的重要場景,5G MEC是運營商切入工業互聯網的重要技術手段。目前,中國電信進行了一些MEC的探索,例如打造邊緣計算開放平臺ECOP,構建邊緣云網融合的網絡服務平臺及應用使能環境,推進邊緣業務應用創新發展。
4、云數據中心資本開支持續增長
為了應對大工作負載和低延遲需求,云數據中心正在遷移到“葉脊”架構。
傳統大型云數據中心網絡架構為三層網絡,主要采用縱向的傳輸方式。伴隨著虛擬化、云計算、超融合系統等應用,使得東西向數據流成為主要流量。
原有的結構難以應對日益增長的需求,因而“葉脊”拓撲結構開始成為主流,這種結構在傳統縱向傳輸的基礎上增加對橫向傳輸的支撐。
葉脊網絡結構使得網絡規模變大、網絡扁平化、光纖覆蓋率提升,使得網絡需要更多的交換機、葉/脊交換機之間更快的傳輸速率,更需要更多橫向的流量接口實現(光模塊)。
葉脊架構所需要的高端光模塊數量10倍于傳統三層架構。帶來100G高速率光模塊市場容量大幅增加。
根據統計,云數據中心內網絡設備投資占整個云數據中心ICT投資的32%,僅次于服務器投資,光模塊是網絡設備間通信重要組成部分。
2019年200G和400G模塊有望放量。40G~200G光模塊市場規模將從2017年的79億美元增長到2020年的139億美元。
同時,數通100G光模塊市場規模也將從2017年34億美元增長到2020年75億美元,復合增速達到30%。
四、邊緣計算典型應用場景
5G時代將迎來一大批新興應用場景,如自動駕駛、安防前端智能化、工業控制、遠程操控(如醫療手術等)等。它們由于需要低于10ms的網絡時延,因此邊緣計算的發展最迫切,也最需要。
1、自動駕駛:車載平臺算力需求在20T以上
隨著汽車自動駕駛程度的提高,汽車自身所產生的數據將越來越龐大。
據測算,假設一輛自動駕駛汽車配臵了GPS、攝像頭、雷達和激光雷達等傳感器,則上述一輛自動駕駛汽車每天將產生約4000GB待處理的傳感器數據。不夸張的講,自動駕駛就是“四個輪子上的數據中心”。
高等級自動駕駛的本質是AI計算問題,車載邊緣計算平臺的計算力需求至少在20T以上。
從最終實現功能來看,邊緣計算平臺在自動駕駛中主要負責解決兩個主要的問題。
1)處理輸入的信號(雷達、激光雷達、攝像頭等);
2)做出決策判斷、給出控制信號。
2、安防:國內智能前端市場有望突破1500億
安防產業智能化升級是行業發展的大趨勢,前段智能不僅能夠為后端提供高質量、初步結構化的圖像數據,還能極大地節省帶寬和后端計算資源。后端智能化產品的核心功能則是利用計算能力對視頻數據進行結構化分析。
從產業調研結果來看,2018年以來,主流深度學習攝像頭芯片開始成熟量產,有效解決目前限制前端智能攝像頭放量的計算芯片瓶頸。
按照2021年智能攝像頭滲透率達到45%測算,預計國內智能安防前端硬件產品空間在2021年預計將超過1500億元。
工業高精度控制對時延和可靠性的敏感度極高,無論是中國、韓國和日本的運營商,都非常關注5G新業務中工業級客戶(2B)的價值。
這些行業市場包括運輸、物流、能源/公共設施監測、金融、醫療和農業。實現工業國產自動化、無線化和智能化,典型場景包括視頻監控、機器人控制、自動巡查安防等。
1)機器人控制:同步實時協作機器人要求小于1毫秒的網絡延遲。到2025年,預計全球狀態監測連接將上升到8800萬,全球工業機器人的出貨量也將從36萬臺增加到105萬臺。
2)饋線自動化:當通信網絡的延遲小于10ms時,饋線自動化系統可以在100ms內隔離故障區域,這將大幅度降低發電廠的能源浪費。參考華為5G白皮書,從2022年到2026年,預計5GIIoT的平均年復合增長率(CAGR)將達到464%。
3)視頻監控和無人機巡檢:配備無人機進行基礎設施、電力線和環境的密集巡檢是一項新興業務,LiDAR掃描所產生巨大的實時數據量將需要>200Mbps的傳輸帶寬。ABI Research的估計,小型無人機市場將從2016年的53億美元迅速增長到2026年的339億美元,包括來自軟件、硬件、服務和應用服務的收入。
4、VR/AR游戲:實時反饋讓云VR/AR成為可能
現階段VR游戲體驗不佳,本地重度游戲為主,設備典型盤根錯節,用戶容易絆倒;聯網游戲時延至容易高達50ms,導致用戶眩暈問題。
未來5G設備實現直接邊緣云端訪問,VR/AR時延問題解決:實時CG類云渲染VR/AR需要低于5ms的網絡時延和高達100Mbps至9.4Gbps的大帶寬。同時,5G可以支持多用戶近距離連線。
云VR/AR將大大降低設備成本,從而提供人人都能負擔得起的價格。5G將顯著改善這些云服務的訪問速度云市場以18%的速度快速增長。
5、視頻云:遠程醫療、4K/8K高清視頻
遠程醫療依賴5G網絡的低延遲和高QoS保障特性,例如無線內窺鏡和超聲波這樣的遠程診斷依賴于設備終端和患者之間的交互。力反饋的敏感性決定低延遲網絡才能滿足要求。
其它應用場景包括醫療機器人和醫療認知計算,這些應用對連接提出了不間斷保障的要求(如生物遙測,基于VR的醫療培訓,救護車無人機,生物信息的實時數據傳輸等)。
ABI Research預測,智慧醫療市場的投資預計將在2025年將超過2300億美元,智慧醫療市場將在2025年超過2300億美元。
同時,5G的高速率特性將是用戶不僅能觀看當下各類視頻內容,還將隨時隨地體驗4K以上的超高清視頻。
參考英特爾的《5G娛樂經濟報告》,預計未來10年內5G用戶的月平均流量將有望增長7倍,而其中90%將被視頻消耗,預計到2028年,僅憑消費者在視頻、音樂和游戲上的支出就會增加近一倍,全球總體量將達到近1500億美元。
由于數據量大、實時性需求高、數據隱私保護等問題,海量的物聯網設備對邊緣計算有著大量需求。隨著5G與AI芯片的崛起,邊緣計算已經越來越成為當下最熱門的話題之一,受到創投、設備、芯片等廠商的追捧。
如今線上的流量入口日益減少,并且價格高昂。未來人工智能的流量入口將分布在大大小小的比邊緣設備上,包括手機、攝像頭、傳感器、機器人等。端智能將會涵蓋我們生活中的方方面面,而這其中的很多領域巨頭都沒有完全覆蓋,是無數中小創企的絕佳機會。
看點:AI時代,不懂點數據挖掘怎么掘金?
數據挖掘(Data Mining)是一門跨學科的計算機科學分支,它用人工智能、機器學習、統計學和數據庫的交叉方法,在大規模數據中發現隱含模式,在零售、物流、旅游等行業有著廣泛應用場景。
在數據爆炸的時代里,如何利用手中數據資源提高行業效率、提高行業質量,成為了眾多企業決策者所關注的問題,數據挖掘也逐漸成為當下的熱門研究領域之一,受到了谷歌、亞馬遜、阿里、百度等科技巨頭的追捧。
一、數據挖掘與KDD
數據挖掘(Data Mining),是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性的數據和信息,并將其轉化為計算機可處理的結構化表示。
目前數據挖掘的主要功能包括概念描述、關聯分析、分類、聚類和偏差檢測等,用于描述對象內涵、概括對象特征、發現數據規律、檢測異常數據等。
一般來說,數據挖掘過程有五個步驟:確定挖掘目的、數據準備、進行數據挖掘、結果分析、知識的同化。
▲數據挖掘過程基本步驟
1、確定挖掘目的
認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結果是不可預測的,但要探索的問題應是有預見的。
2、數據準備
數據準備又分為三個階段:
1)數據的選擇:搜索所有與目標對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據;
2)數據的預處理:研究數據的質量,為進一步的分析做準備,并確定將要進行的挖掘操作的類型;
3)數據的轉換:將數據轉換成一個分析模型。這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。
3、進行數據挖掘
對得到的經過轉換的數據進行挖掘。
4、結果分析
解釋并評估結果,其使用的分析方法一般應視數據挖掘操作而定,通常會用到可視化技術。
5、知識的同化
將分析所得到的知識集成到所要應用的地方去。
▲數據挖掘的分類表
如上圖所示,數據挖掘有多種分類方式,可以按照挖掘的數據庫類型、挖掘的知識類型、挖掘所用的技術類型進行分類。
同時,數據挖掘也可以按照行業應用來進行分類,比如生物醫學、交通、金融等行業都有其獨特的數據挖掘方法,不能做到用同一個數據挖掘技術應用到各個行業領域。
數據挖掘是知識發現(KDD)的一個關鍵步驟。1989年8月,Gregory I. Piatetsky- Shapiro等人在美國底特律的國際人工智能聯合會議(IJCAI)上召開了一個專題討論會(workshop),首次提出了知識發現(Knowledge Discovery in Database,KDD)這一概念。
▲數據挖掘是知識發現的過程之一
KDD涉及數據庫、機器學習、統計學、模式識別、數據可視化、高性能計算、知識獲取、神經網絡、信息檢索等眾多學科和技術的集成,再后來的30年間KDD逐漸形成了一個獨立、蓬勃發展的交叉研究領域。
早期比較有影響力的發現算法有:IBM的Rakesh Agrawal的關聯算法、UIUC大學韓家煒(Jiawei Han)教授等人的FP Tree算法、澳大利亞的John Ross Quinlan教授的分類算法、密西根州立大學Erick Goodman的遺傳算法等等。
目前,數據挖掘已經引起國際、國內工業界的廣泛關注,IBM、谷歌、亞馬遜、微軟、Facebook、阿里巴巴、騰訊、百度等都在數據挖掘研究方面進行了應用與理論研究。
國際知識發現與數據挖掘大會(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,簡稱SIGKDD)是數據挖掘領域的頂級國際會議,由ACM的數據挖掘及知識發現專委會負責協調籌辦,會議內容涵蓋數據挖掘的基礎理論、算法和實際應用。
二、數據挖掘源于商業的直接需求
數據挖掘技術從一開始就是面向應用的,源于商業的直接需求。目前數據挖掘在零售、旅游、物流、醫學等領域都有所應用,可以大大提高行業效率和行業質量。
舉個例子,零售是數據挖掘的主要應用領域之一。這是因為由于條形碼技術的發展使得前端收款機系統可以收集大量售貨、顧客購買歷史記錄、貨物進出狀況、消費與服務記錄等數據。
數據挖掘技術有助于識別顧客購買行為,發現顧客購買模式和趨勢,改進服務質量,取得更高的顧客保持力和滿意程度,減少零售業成本。
同時,同一顧客在不同時期購買的商品數據可以分組為序列,序列模式挖掘可用于分析顧客的消費或忠誠度的變化,據此對價格和商品的花樣加以調整和更新,以便留住老客戶,吸引新客戶。
與此同時,社交網絡也是數據挖掘研究中的熱門領域,比如新浪微博就是擁有海量數據的資訊平臺。
截止到2017年12月,新郎微博已擁有接近4億活躍用戶,內容存量超千億,“大V”的一舉一動和社會熱點話題都會引起大量的評論與轉發,掀起一股“數據風暴”。
▲柯潔烏鎮大戰AlphaGo撼負后的微博熱議
微博上每個用戶的言論、轉發內容等都蘊藏著用戶個人的興趣、話題等信息,文字內容本身的智能分析理解也是數據分析領域長久以來孜孜不倦追求的目標。
社會網絡中的聚類被稱為社區發現,許多精心設計的高效算法可以很好地處理上億用戶的大規模網絡。
針對微博用戶的海量數據,對其進行數據描述性可以分析群體的年齡、性別比例、職業等;對于平均數、中位數、分位數、方差等統計指標可以幫助我們粗略了解數據分布;回歸分析、方差分析等方法則可以解釋年齡、職業等因素是否會影響用戶對某熱門話題的關注程度。
此外,數據挖掘在旅游、物流、醫學等領域都有著廣泛的應用場景。比如數據挖掘可以對旅游客流的趨向有著準確的預知性,同時對于游客的喜好也有著直接性的掌握;從醫學數據中尋找潛在的關系或規律,可以獲得對病人進行診斷、治療的有效知識,增加對疾病預測的準確性等。
三、人工智能與數據挖掘
數據挖掘從一個新的視角將數據庫技術、統計學、機器學習、信息檢索技術、數據可視化和模式識別與人工智能等領域有機結合起來,它組合了各個領域的優點,因而能從數據中挖掘到運用其他傳統方法不能發現的有用知識。
一般來說,統計特征只能反映數據的極少量信息。簡單的統計分析可以幫助我們了解數據,如果希望對大數據進行逐個地、更深層次地探索,總結出規律和模型,則需要更加智能的基于機器學習的數據分析方法。
所謂“機器學習”,是基于數據本身的,自動構建解決問題的規則與方法。數據挖掘中既可以用到非監督學習方法,也可以用到監督學習方法。
1、非監督學習
非監督學習是建立在所有數據的標簽,即所屬的類別都是未知的情況下使用的分類方法。對于特定的一組數據,不知道這些數據應該分為哪幾類,也不知道這些類別本來應該有怎樣的特征,只知道每個數據的特征向量。若按它們的相關程度分成很多類,最先想到的想法就是認為特征空間中距離較近的向量之間也較為相關,倘若一個元素只和其中某些元素比較接近,和另一些元素則相距較遠。
這時候,我們就希望每一個類有一個“中心”,“中心”也是特征向量空間中的向量,是所有那一類的元素在向量空間上的重心,即他的每一維為所有包含在這一類中的元素的那一維的平均值。如果每一類都有這么一個“中心”,那么我們在分類數據時,只需要看他離哪個“中心”的距離最近,就將他分到該類即可,這也就是K-means算法的思路。
K-means算法,在1957年由Stuart Lloyd在貝爾實驗室提出,最初用于解決連續的圖區域劃分問題,1982年正式發表。1965年,E.W.Forgy發明了Lloyd-Forgy or。James MacQueen在1967年將其命名為K-means算法。
上圖是以隨機生成的數據點為例,k=3的K-means算法的迭代過程,其中五角星為聚類中心,點的顏色是其類別。在實際應用中,為了獲得一個比較好的特征空間,使得“數據之間的相似性與他們在特征空間上的距離有關,距離越近越相似”這句話盡可能成立,我們往往會構建模型來把原數據變換到這么一個特征空間,然后使用K-means算法來進行分類。
2、監督學習
不同于非監督學習,若已知一些數據上的真實分類情況,現在要對新的未知的數據進行分類。這時候利用已知的分類信息,可以得到一些更精確的分類方法,這些就是監督學習方法。
1)決策樹模型
所謂決策樹,即是一種根據條件來進行判斷的邏輯框架。其中,判斷的條件,即提出有區分性的問題,以及對于不同的回答下一步的反映,以及最終的決策給出標簽。
決策樹算法:
1.選取包含所有數據的全集為算法的初始集合A0:
2.對于當前的集合A,計算所有可能的“問題”在訓練集上的F(A,D):
3.選擇F(A,D)最大的“問題”,對數據進行提問,將當前的集合由“問題”的不同回答,劃分為數個子集;
4.對每個子集,重復b、c,直到所有子集內所有元素的類別相同;
5.在實際應用中,數據往往有很多特征,因此,“問題”往往是選取數據的某一特征,而“回答”則是此特征對應的值。
在決策樹中,效度函數F(A,D)的選擇非常重要。決策樹的發展歷史,也基本是圍繞著F(A,D)的優化而展開。
2)kNN算法
只知道每個數據在特征空間下的特征向量情況下,可以對數據采用無監督分類方法K-means。如果我們擁有了其中一部分數據的標簽,我們就可以利用這些標簽進行kNN分類。
數據之間的相似性與他們在特征空間上的距離有關。距離越近越相似,越可能擁有相同的標簽。
假設我們已經有了很多既知道特征向量也知道具體標簽的數據對于新的只知道特征向量卻不知道具體標簽的數據,我們可以選取離這個特征向量最近的k個已經知道標簽的數據,然后選取他們中間最多的元素所屬于的那個標簽,作為新數據的預測標簽。也可以根據他們與新數據的特征向量之間的距離加權(如最近得5分,第二近得4分等),取權重總和最大的標簽作為預測標簽。
kNN算法不需要構建模型或者訓練,和K-means算法一樣,往往是和某個構建特征空間的模型一起使用。
此外,還有回歸分類、神經網絡、樸素貝葉斯分類等等。
四、巨頭們的數據挖掘之路
在當下,數據挖掘也逐漸成為當下的熱門研究領域之一,受到了谷歌、亞馬遜、微軟、百度、阿里、騰訊等科技巨頭的追捧。
1、谷歌
谷歌幾乎每年都會發表一些讓人驚艷的研究工作,包括之前的MapReduce、Word2Vec、BigTable,近期的BERT。數據挖掘是谷歌研究的一個重點領域。
2018年谷歌全球不同研究中心在數據挖掘頂級國際會議KDD上一共發表了7篇文章。
2、亞馬遜
亞馬遜公司近幾年發展勢頭超級猛,前幾年華麗的轉身:從一個網上商店公司變為云平臺公司再轉變到目前的人工智能公司,亞馬遜也在數據挖掘領域開始占有一席,尤其是在人才網羅、開源、核心技術研發。
2018年亞馬遜在數據挖掘頂級國際會議KDD的Applied Data Science Track(應用數據科學Track)上一共發表了2篇文章,另外還有兩個應用科學的邀請報告。
3、微軟
微軟是老牌論文王國,一直以來都在學術界特別活躍,因此在KDD上每年和微軟有關的論文非常多,因此這里只統計了微軟作為第一作者的文章。
2018年在數據挖掘頂級國際會議KDD上一共發表了6篇文章,另外還有一個應用科學的邀請報告,這些文章和報告都更多的從大數據的角度在思考如何更有效,更快速的分析。
4、阿里巴巴
阿里巴巴在電子商務方面做了大量的數據挖掘研究。尤其是在表示學習和增強學習做了幾個很有意思的工作。
2018年阿里巴巴在數據挖掘頂級國際會議KDD上作為第一作者單位一共發表了8篇文章。
5、騰訊
2018年騰訊在數據挖掘頂級國際會議KDD上作為第一作者單位一共發表了2篇文章。
6、百度
2018年百度在數據挖掘頂級國際會議KDD上作為第一作者單位一共發表了2篇文章。
五、大數據與數據挖掘
大數據是近年隨著互聯網、物聯網、通信網絡以及人類社交網絡快速發展的結果,成為一個交叉研究學科,和數據挖掘緊密相連。
大數據的迅速發展也使得數據挖掘對象變得更為復雜,不僅包括人類社會與物理世界的復雜聯系,還包括呈現出的高度動態化。這使得很多傳統數據挖掘算法不再適用,傳統數據挖掘算法必須滿足對真實數據和實時數據的處理能力,才能從大量無序數據中獲取真正價值。
一方面大數據包含數據挖掘的各個階段,即數據收集、預處理、特征選擇、模式挖掘、表示等;另一方面大數據的基礎架構又為數據挖掘提供上層數據處理的硬件設施。
▲大數據處理平臺技術架構圖
從技術架構角度,大數據處理平臺可劃分為4個層次:數據采集層、數據存儲層、數據處理層和服務封裝層。
除此之外,大數據處理平臺一般還包括數據安全和隱式保護模塊,這一模塊貫穿大數據處理平臺的各個層次。
隨著大數據時代的來臨,各行各業所積累的數據呈爆炸式增長,數據挖掘在各個領域的需求將會越來越強烈,與各個專業領域的結合也將會越來越廣泛。無論是在科學領域還是工程領域、理論研究還是現實生活中,數據挖掘都將有著極為廣闊的發展前景。
-
處理器
+關注
關注
68文章
19259瀏覽量
229653 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238265 -
量子計算
+關注
關注
4文章
1093瀏覽量
34941
原文標題:量子計算、邊緣計算、數據挖掘 前沿研究報告
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論