百分點技術負責人談大數據操作系統
大小:0.6 MB 人氣: 2017-10-11 需要積分:1
所謂“全球首款”,意味著Hadoop、Storm、Spark等當前主流大數據技術的相關從業者幾乎聽說過“大數據操作系統”的存在(之所以說“幾乎”,是因為Intel曾把Hadoop視為大數據操作系統,Apache Hadoop的一位committer聯合創立的海綿數據公司也曾推出一款名為Sponge的大數據操作系統,但百分點認為BD-OS首先實現了理論的突破)。那么,BD-OS的研發的意義何在?在百分點看來,一言蔽之,就是填補底層技術到數據應用之間的鴻溝。基于百分點的實踐,劉譯璟和劉國棟從大數據生命周期的角度闡述了這個核心觀點,并介紹了BD-OS的一些應用案例。
百分點眼中的大數據
劉譯璟介紹了百分點對大數據的認識。他認為,在整個信息化的方向上,有五個大的趨勢:云計算、大數據、物聯網、社會化和移動化。在這個數據世界里,大數據處于大腦的地位,要把這些數據進行收集加工轉化成信息,甚至轉化成知識,最后再通過物聯網的技術反饋到現實世界中,不斷地產生更多的價值。
大數據最核心的技術是跟人工智能的相關知識是緊密相關的,包括知識表示、自然語言理解、機器學習,還有相關的圖象語音識別、機器人,這都屬于這個范圍,但是為了實現人工智能,特別是機器學習,要處理相當多的數據需要有一些足夠堅實的底層架構來支持。像Hadoop技術的誕生,原因就是在搜索相關的智能應用里,原有的技術不能支撐了,所以說,大數據的發展一定是跟著業務或者跟著智能化的技術發展的。
整個大數據的產業主要分成四個方面,第一是底層的基礎技術和基礎架構。第二是在基礎架構上構建各種分析的無論是算法模型等等。第三層次,在分析之上更多結合到行業和業務的應用。當然還有很重要的一點是這里面產生的數據。BD-OS主要偏向于基礎軟件的層次,但是包含了很多分析應用方面的工具。
整個大數據產業的趨勢發展有六個特點。
更多往具體的應用里做,一定會形成行業的應用。雖然現在很多大數據方面服務過的企業還是偏向通用化,但是最終的業務價值一定是在行業應用里產生的。
服務化,通過服務的方式為企業和消費者提供服務,而不是提供最原始的軟件或者IT基礎設施。
云計算是未來的骨骼,所有的應用都會上到云端,所以云端化是未來的一個趨勢。
企業已經不單單需要一個大數據的底層和大數據某一個存儲的方案,而是想要從數據獲取到大數據的全鏈條的端到端的整體的解決方案,企業越來越務實。
大數據一定變的更加的實用。實用化的四個方面:第一,最基礎只是說描述,比如在做一些基礎的監控等等方面。第二個方面是診斷,發現里面的一些問題,把這些問題找出來。第三是做一些預測,預測未來整個的趨勢,是向好還是向壞,如果向壞的話可能問題發生在什么地方。最高級的一點,就是建議性的一些分析,不止是發現問題、發現趨勢,還要告訴企業和用戶應該怎么適應這種變化。
低成本化一直是大數據的一個方向。
一個企業或者一個組織如果想真的應用大數據,必須具備如下條件:
時代:相關的時代必須要到來,即不僅有信息化系統的基礎,有很多客戶,還要進入到互聯網的時代,有較高的數據化的程度。
理念:很多企業主覺得數據是核心資產,原因是他認為數據只有買才能得來,而不是自己的經營過程需要數據化。如果是這樣,說到底他并不認為數據能對他的業務產生核心的變化。所以需要真真切切地認為數據能夠產生最大的價值。
理論:從現實的業務,到時候可以建模型,中間有非常大的鴻溝,這個鴻溝包括數據如何采集如何建模以及如何把一個業務問題轉化成真正的數據的問題,這其實是需要有相當多的經驗和人做這件事。這是最麻煩的一件事,只有業務變換成了數學問題,底層的技術才能實現。比如地震預測,數據界并沒有把它完全用理論解釋清楚,顯然沒有任何技術手段可以實踐這件事。
技術:理論問題解決完以后,要通過一些基礎的技術手段來落地。比如說有一些基礎架構,或者軟件包的形式來實現。
BD-OS就是解決理論以及技術這兩方面的問題,把消費者數據化,并驅動企業數據化的經營。百分點大數據產品分為三層,最底下的大數據的技術層,主要解決的是數據的采集獲取以及數據如何分析建模這一套東西,以及數據如何運用到具體的業務上,提供這些基本的接口。中間的管理,最后流程的末端能看到用戶標簽管理以及商品的標簽管理,用戶畫像和產品畫像就是通過數據的方式來描述人,也就是人工智能領域的知識表示。有了數據化的消費者的描述以后,將來要做的事情把他應用到具體的業務里。百分點支持三大類的業務:個性化推薦引擎、自動化營銷引擎和、大數據分析引擎。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%