色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習中流式數據處理的使用場景及相關技術介紹

數據分析與開發 ? 來源:數據分析與開發 ? 作者:數據分析與開發 ? 2021-02-08 11:56 ? 次閱讀

工業界,當我們提到實時數據機器學習時,常常可以聽到如下討論:

他們希望有一個模型,這個模型利用最近歷史信息來進行預測分析。舉一個天氣的例子,如果最近幾天都是晴天,那么未來幾天極小概率會出現雨雪和低溫天氣

這個模型還需要是可更新的。當數據流經系統時,模型是可以隨之進化升級。舉個例子,隨著業務規模的擴大,我們希望零售銷售模型仍然保持準確。

實時機器學習應用是人工智能真正落地服務化的關鍵一步,因為工業界大部分場景下數據都是實時產生的。因此作為一名合格的人工智能領域專家,掌握流式場景下的算法設計必不可少。 本文主要介紹流式數據處理的使用場景、相關技術,并從服務管理的角度,介紹了針對流式計算服務的設計及關鍵指標。主要面向希望了解流式計算、服務管理的朋友們。

流式計算的使用場景

01

首先,當前業界已經有非常多數據處理的方式了,為什么還需要流式數據處理?要回答這個問題,我們先回顧一下傳統的的數據處理架構。 傳統的數據處理架構是一種典型的以數據庫為中心,適應存儲事務性數據處理的場景。由于數據處理能力優先,在該架構下,往往數據都是以批量的方式進行處理,例如:批量寫入數據庫、批量讀取數據庫進行數據處理。這種架構在面對實時性較低的場景中較為有效,但是在對實時性較高的場景則不太有效,例如:自動駕駛場景、工業機器人場景、基于會話的用戶統計等。

因此,流式計算或流式數據處理被提出。其實流處理它最接近數據產生的自然規律,只不過過去我們沒有流處理能力,只能做一些特殊的處理才能真正地使用流數據,比如將流數據攢成批量數據再處理,不然無法進行大規模的計算。使用流數據并不新鮮,新鮮的是我們有了新技術,從而可以大規模、靈活、自然和低成本地使用它們。 流式處理的核心目標有以下三點:

低延遲:近實時的數據處理能力

高吞吐:能處理大批量的數據

可以容錯:在數據計算有誤的情況下,可容忍錯誤,且可更正錯誤

流式處理框架

02

典型的流處理框架結合了消息傳輸層技術以及流處理層技術。具體如圖所示:

a4808860-5fd2-11eb-8b86-12bb97331649.jpg

消息傳輸層的引入流處理層提供了以下支持:

消息傳輸層的一個作用是作為流處理層上游的安全隊列,它相當于緩沖區,可以將事件數據作為短期數據保留起來,以防數據處理過程發生中斷

具有持久性的好處之一是消息可以重播。實現時間穿梭

在當前典型的流處理技術中,有這么幾類:

Lambda架構

基于Lambda架構,實現了離線計算的精確性的同時,且獲得了流式數據處理的實時性。但是,由于要開發同樣邏輯的代碼,開發、維護成本高

a81f2850-5fd2-11eb-8b86-12bb97331649.jpg

Kappa架構為了解決lambda架構中維護兩套同樣邏輯的代碼,kappa架構提出使用流式處理解決上述問題。當需要重新處理、計算數據時,使用另一個流程處理的作業(可以是相同的、優化的版本)進行數據處理。

a8b7e4d2-5fd2-11eb-8b86-12bb97331649.jpg

spark streaming

基于小批量進行數據處理

Flink

以上幾種技術中,flink既可以實現低延遲、高吞吐,還可以實現容錯。

Flink概況

03

Flink技術除支持流處理外,還支持批處理,其架構如下圖所示:

a9d244e8-5fd2-11eb-8b86-12bb97331649.jpg

另外,Flink具有分布式的特點,具體體現在它能夠在成百上千臺機器上運行,它將大型的計算任務分成許多小的部分,每個機器執行一個部分。 Flink能夠自動地確保在發生機器故障或者其他錯誤時計算能持續進行,或者在修復bug或進行版本升級后有計劃地再執行一次。這種能力使得開發人員不需要擔心失敗。 Flink本質上使用容錯性數據流,這使得開發人員可以分析持續生成且永遠不結束的數據(即流處理)。因為不用再在編寫應用程序代碼時考慮如何解決問題,所以工程師的時間得以充分利用,整個團隊也因此受益。好處并不局限于縮短開發時間,隨著靈活性的增加,團隊整體的開發質量得到了提高,運維工作也變得更容易、更高效。Flink讓應用程序在生產環境中獲得良好的性能。

總體來說,Flink的主要特性:

符合產生數據的自然規律:支持流式數據處理

發生故障后仍保持準確:具體容錯機制(exactly once)

及時給出所需結果:低延遲、實時性強

時間概念

在流數據處理的體系中,時間是一個重要的概念。總體來說,可分為以下三種時間:

事件時間:即事件實際發生的時間。更準確地說,每一個事件都有一個與它相關的時間戳,并且時間戳是數據記錄的一部分(比如手機或者服務器的記錄)。事件時間其實就是時間戳。處理時間,即事件被處理的時間。

處理時間:其實就是處理事件的機器所測量的時間

攝取時間:也叫作進入時間。它指的是事件進入流處理框架的時間

Flink允許用戶根據所需的語義和對準確性的要求選擇采用事件時間、處理時間或攝取時間定義窗口

窗口

窗口是一種機制,它用于將許多事件按照時間或者其他特征分組,從而將每一組作為整體進行分析(比如求和)

ab2e3fae-5fd2-11eb-8b86-12bb97331649.jpg

時間穿梭

處理器支持事件時間,這意味著將數據流“倒帶”,用同一組數據重新運行同樣的程序,會得到相同的結果

水印

假設第一個窗口從1000開始(即從10時0分0秒開始),需要計算從1000到1000的數值總和。當時間就是記錄的一部分時,我們怎么知道1000已到呢?換句話說,我們怎么知道蓋有時間戳1059的元素還沒到呢?Flink通過水印來推進事件時間。水印是嵌在流中的常規記錄,計算程序通過水印獲知某個時間點已到。

有狀態的計算

流式計算分為無狀態和有狀態兩種情況:

無狀態的計算觀察每個獨立事件,并根據最后一個事件輸出結果。例如,流處理應用程序從傳感器接收溫度讀數,并在溫度超過90度時發出警告。

有狀態的計算則會基于多個事件輸出結果。

數據處理容錯及一致性保障

在有狀態的數據處理中,如何保障數據的一致性是一個關鍵點。保障一致性的方式有以下三種:

at most once:這其實是沒有正確性保障的委婉說法——故障發生之后,計數結果可能丟失

at least once:這表示計數結果可能大于正確值,但絕不會小于正確值。也就是說,計數程序在發生故障后可能多算,但是絕不會少算

exactly once:這指的是系統保證在發生故障后得到的計數結果與正確值一致

Flink如何保證exactlyonce呢?它使用一種被稱為“檢查點”的特性,在出現故障時將系統重置回正確狀態。

有限流處理是無限流處理的一種特殊情況,它只不過在某個時間點停止而已。此外,如果計算結果不在執行過程中連續生成,而僅在末尾處生成一次,那就是批處理(分批處理數據)

原文標題:流式計算、數據處理及相關技術

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47344

    瀏覽量

    238730
  • 機器學習
    +關注

    關注

    66

    文章

    8421

    瀏覽量

    132710

原文標題:流式計算、數據處理及相關技術

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    低電平靈敏專用儀器的技術原理和應用場景

    低電平靈敏專用儀器是一種高精度、高靈敏度的測量工具,廣泛應用于各種需要精確測量微弱信號的場合。以下是對其技術原理和應用場景的詳細介紹:一、技術原理低電平靈敏專用儀器的工作原理基于精密的
    發表于 12-06 14:45

    倍頻器的技術原理和應用場景

    倍頻器是一種用于將輸入信號的頻率倍增的電子設備,以下是關于倍頻器的技術原理和應用場景的詳細解釋:技術原理倍頻器的技術原理主要基于非線性元件(如二極管、晶體管等)的特性和頻率變換
    發表于 11-29 14:49

    射頻分析儀的技術原理和應用場景

    射頻分析儀是一種功能強大的電子測量儀器,在無線通信、電子測試等領域具有廣泛的應用。以下是關于射頻分析儀的技術原理和應用場景的詳細介紹:一、射頻分析儀的技術原理射頻分析儀的工作原理主要基
    發表于 11-26 14:32

    系統放大器的技術原理和應用場景

    系統放大器是一種重要的電子設備,其技術原理和應用場景都具有一定的專業性和廣泛性。以下是對系統放大器的技術原理和應用場景的詳細介紹:一、
    發表于 11-18 14:46

    OTA測試暗箱的技術原理和應用場景

    OTA測試暗箱在無線通信設備的研發與測試中扮演著至關重要的角色。以下是對OTA測試暗箱技術原理和應用場景的詳細闡述:一、OTA測試暗箱的技術原理OTA測試暗箱的技術原理主要基于電磁波在
    發表于 11-14 14:36

    便攜式示波器的技術原理和應用場景

    便攜式示波器作為示波器的一種,具有體積小、重量輕、便于攜帶等特點,在多個領域有著廣泛的應用。以下是對其技術原理和應用場景的詳細介紹:一、技術原理便攜式示波器的基本原理與傳統示波器相同,
    發表于 10-24 14:31

    實時示波器的技術原理和應用場景

    波形圖像。在信號處理方面,示波器首先將接收到的被測信號進行放大和濾波等處理,以確保信號的準確性和穩定性。然后,通過A/D轉換技術,將模擬信號轉換為數字信號,以便進行后續的數字處理和顯示
    發表于 10-23 14:22

    高速數字化儀的技術原理和應用場景

    高速數字化儀是一種用于采集高速模擬信號,并將其轉換為數字信號進行處理和儲存的設備。以下是對其技術原理和應用場景的詳細介紹:一、技術原理 采樣
    發表于 10-21 14:34

    光學透過率測量儀的技術原理和應用場景

    光學透過率測量儀(也稱為光透過率檢測儀)是一種專門用于測量材料透光率的儀器。以下是對其技術原理和應用場景的詳細解析:技術原理光學透過率測量儀的技術原理主要基于光的透射原理。當光線通過物
    發表于 10-16 14:38

    超聲波測厚儀的技術原理和應用場景

    超聲波測厚儀的技術原理和應用場景詳細如下:技術原理超聲波測厚儀利用超聲波脈沖反射原理來測量材料的厚度。具體工作原理如下: 發射超聲波脈沖:測厚儀的探頭(也稱為換能器)向被測物體發射一束高頻超聲波脈沖
    發表于 09-27 15:06

    智能IC卡測試設備的技術原理和應用場景

    智能IC卡測試設備的技術原理和應用場景,可以從以下幾個方面進行闡述:技術原理智能IC卡測試設備的技術原理主要圍繞IC卡的通信和數據處理機制展
    發表于 09-26 14:27

    NFC協議分析儀的技術原理和應用場景

    NFC協議分析儀的技術原理和應用場景可以詳細闡述如下:技術原理NFC(Near Field Communication,近場通信)協議分析儀是一種用于分析NFC通信協議和性能的專業設備。其技術
    發表于 09-25 14:45

    RISC-V適合什么樣的應用場景

    器設計的理想工具,有助于培養更多的計算機專業人才。 綜上所述,RISC-V適合的應用場景非常廣泛,包括物聯網、嵌入式系統、人工智能、自動駕駛、汽車電子、數據中心和云計算以及教育和研究等多個領域。隨著RISC-V生態系統的不斷完善和技術
    發表于 07-29 17:16

    機器視覺檢測系統的關鍵技術和應用場景

    識別與定位能力,成為當前研究的熱點和應用的焦點。本文將從基本原理、關鍵技術、應用場景以及未來展望四個方面,深入探討基于深度學習機器視覺檢測系統。
    的頭像 發表于 07-08 10:33 ?1434次閱讀

    NanoEdge AI的技術原理、應用場景及優勢

    、NanoEdge AI 具有以下優勢: - 低延遲:由于數據處理任務在設備本地完成,因此 NanoEdge AI 可以實現較低的延遲,滿足實時性要求較高的應用場景。 - 高安全性:將數據處理任務保留在設備本地
    發表于 03-12 08:09
    主站蜘蛛池模板: 韩日美无码精品无码| qvod在线电影| a视频在线看| 果冻传媒2021一二三区| 三级黄视频| 成人高清护士在线播放| 欧美国产影院| 259luxu高跟黑色丝袜系列| 久久sese| 偷尝禁果H1V1幸运的山熊| 二级特黄绝大片免费视频大片| 女性露出奶头流出精子| 99爱视频在线观看| 麻豆乱码一卡二卡三卡视频| 一本道久久综合久久88| 久久精品国产亚洲AV忘忧草蜜臀| 亚洲视频中文字幕在线| 精品欧美一区二区三区久久久| 亚洲欧美日韩精品自拍| 九九热在线视频观看这里只有精品| 亚洲日本国产综合高清| 久久精品美女久久| 又紧又大又爽精品一区二区| 九九热在线视频观看这里只有精品| 尤物久久99国产综合精品| 美女在线永久免费网站| 99C视频色欲在线| 日本高清天码一区在线播放| 初中XXXXXL| 小向美奈子厨房magnet| 国产亚洲精品久久久闺蜜| 亚洲成年人在线观看| 国外色幼网| 亚洲精品九色在线网站| 久久sese| brazzers巨臀系列| 日日日操操操| 花季v3.0.2黄在线观看| 伊人yinren6综合网色狠狠| 麻豆产精品一二三产区区| yy4408午夜场理论片|