資料介紹
軟件簡介
Big Whale 巨鯨任務調度平臺為美柚大數據研發的分布式計算任務調度系統,提供 Spark、Flink 等批處理任務的 DAG 調度和流處理任務的運行管理和狀態監控,并具有Yarn應用管理、重復應用檢測、大內存應用檢測等功能。 服務基于 Spring Boot 2.0 開發,打包后即可運行。
概述
1.架構圖
2.特性
- 基于SSH的腳本執行機制,部署簡單快捷,僅需單個服務
- 基于Yarn Rest Api的任務狀態同步機制,對Spark、Flink無版本限制
- 支持失敗重試
- 支持任務依賴
- 支持復雜任務編排(DAG)
- 支持流處理任務運行管理和監控
- 支持Yarn應用管理
部署
1.準備
- Java 1.8+
- Mysql 5.1.0+
- 下載項目或git clone項目
- 為解決 github README.md 圖片無法正常加載的問題,請在hosts文件中加入相關域名解析規則,參考:hosts
2.安裝
- 創建數據庫:big-whale
- 運行數據庫腳本:big-whale.sql
- 根據Spring Boot環境,配置相關數據庫賬號密碼,以及SMTP信息
- 配置:big-whale.properties
- 修改:$FLINK_HOME/bin/flink,參考:flink(因flink提交任務時只能讀取本地jar包,故需要在執行提交命令時從hdfs上下載jar包并替換腳本中的jar包路徑參數)
- 打包:mvn clean package
3.啟動
- 檢查端口17070是否被占用,被占用的話,關閉占用的進程或修改項目端口號配置重新打包
- 拷貝target目錄下的big-whale.jar,執行命令:java -jar big-whale.jar
4.初始配置
-
打開:http://localhost:17070
- 輸入賬號admin,密碼admin
- 點擊:權限管理->用戶管理,修改當前賬號的郵箱為合法且存在的郵箱地址,否則會導致郵件發送失敗
-
添加集群
-
集群管理->集群管理->新增
- “yarn管理地址”為Yarn ResourceManager的WEB UI地址
- “程序包存儲目錄”為程序包上傳至hdfs集群時的存儲路徑,如:/data/big-whale/storage
- “支持Flink任務代理用戶”“流處理任務黑名單”和“批處理任務黑名單”為內部定制的任務分配規則,勿填
-
集群管理->集群管理->新增
-
添加集群用戶
-
集群管理->集群用戶->新增
- 該配置的語義為:平臺用戶在所選集群下可以使用的Yarn資源隊列(--queue)和代理用戶(--proxy-user)
-
集群管理->集群用戶->新增
-
添加代理
-
集群管理->代理管理->新增
- 可添加多個實例(僅支持IP地址,可指定端口號,默認為22),執行腳本的時候會隨機選擇一個實例執行,在實例不可達的情況下,會繼續隨機選擇下一個實例,在實例均不可達時執行失敗
- 選擇集群后,會作為該集群下提交Spark或Flink任務的代理之一
-
集群管理->代理管理->新增
-
添加計算框架版本
-
集群管理->版本管理->新增
- 同一集群下不同版本的Spark或Flink任務的提交命令可能有所不同,如Spark 1.6.0版本的提交命令為spark-submit,Spark 2.1.0版本的提交命令為spark2-submit
-
集群管理->版本管理->新增
使用
1.離線調度
1.1 新增
- 目前支持“Shell”、“Spark Batch”和“Flink Batch”三種類型的批處理任務
-
通過拖拽左側工具欄相應的批處理任務圖標,可添加相應的DAG節點
-
支持時間參數
${now} ${now - 1d} ${now - 1h@yyyyMMddHHmmss}
等(d天、h時、m分、s秒、@yyyyMMddHHmmss為格式化參數) - 非“Shell”類型的批處理任務應上傳與之處理類型相對應的程序包,此處為Spark批處理任務打成的jar包
- “資源選項”可不填
- 代碼有兩種編輯模式,“可視化視圖”和“代碼視圖”,可互相切換
- 點擊“測試”可測試當前節點是否正確配置并可以正常運行
- 為防止平臺線程被大量占用,平臺提交Saprk或Flink任務的時候都會強制以“后臺”的方式執行,對應spark配置:--conf spark.yarn.submit.waitAppCompletion=false,flink配置:-d,但是基于后臺“作業狀態更新任務”的回調,在實現DAG執行引擎時可以確保當前節點所提交的任務運行完成后再執行下一個節點的任務
-
支持時間參數
- DAG節點支持失敗重試
-
將節點按照一定的順序連接起來可以構建一個完整的DAG
-
DAG構建完成后,點擊“保存”,完成調度設置
1.2 操作
- 打開離線調度列表
- ?
-
點擊左側操作欄“調度實例”可查看調度實例列表、運行狀態和節點啟動日志
- 點擊左側操作欄“手動執行”可觸發調度執行
2.實時任務
2.1 新增
-
目前支持“Spark Stream”和“Flink Stream”兩種類型的流處理任務
-
啟用監控可以對任務進行狀態監控,包括異常重啟、批次積壓告警等
2.2 操作
- 打開實時任務列表
- ?
- 點擊左側操作欄“日志”可查看任務啟動日志
- 點擊左側操作欄“執行”可觸發任務啟動
3.任務告警
- 正確配置郵件或釘釘告警后在任務運行異常時會發送相應的告警郵件或通知,以便及時進行相應的處理
<巨鯨任務告警> 代理: agent1 類型: 腳本執行失敗 用戶: admin 任務: 調度示例1 - shell_test 時間: 2021-03-05 15:18:23
<巨鯨任務告警> 集群: 集群1 類型: spark離線任務異常(FAILED) 用戶: admin 任務: 調度示例1 - spark_test 時間: 2021-03-05 15:28:33
<巨鯨任務告警> 集群: 集群1 類型: spark實時任務批次積壓,已重啟 用戶: admin 任務: sparkstream_test 時間: 2021-03-05 15:30:41
- 除上述告警信息外還有其他告警信息此處不一一列舉
Change log
- v1.1開始支持DAG
- v1.2開始支持DAG節點失敗重試
- v1.3調度引擎進行重構升級,不支持從舊版本升級上來,原有舊版本的任務請手動進行遷移,離線調度移除“Python”類型腳本支持
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 分布式電源對配電系統的影響分析
- 基于Simulink的電子對抗分布式仿真系統 26次下載
- 基于KingSCADA的分布式運動控制監測系統 10次下載
- MapReduce框架下分布式編碼計算容錯算法 2次下載
- 一種分布式網絡掃描架構和任務調度算法 19次下載
- 如何通過YARN設計分布式資源動態調度協同分配系統 12次下載
- 分布式智能電網控制系統的設計與實現 2次下載
- 基于MapReduce架構的分布式母線保護 1次下載
- 電力系統分布式經濟調度 10次下載
- 分布式系統進程調度方法研究
- 三層分布式計算網格任務調度系統 25次下載
- 分布式計算的新聞自動編目系統
- 基于Multi-Agent的分布式測控系統任務調度算法
- 基于實數編碼免疫算法的分布式任務調度
- 分布式多媒體計算機系統教程 0次下載
- 分布式SCADA系統的特點的組成 324次閱讀
- 任務調度系統設計的核心邏輯 602次閱讀
- Java手寫分布式鎖的實現 424次閱讀
- tldb提供分布式鎖使用方法 761次閱讀
- 深入理解redis分布式鎖 763次閱讀
- 如何使用分布式存儲系統促進AI模型訓練 494次閱讀
- 利用NI VeriStand 2010實現分布式同步系統的設計 3154次閱讀
- 基于Jini互聯技術實現分布式嵌入式系統的設計 3008次閱讀
- 詳談分布式系統的定義及屬性 3689次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應用 8424次閱讀
- 分布式控制系統的介紹 5216次閱讀
- 存儲分布式系統中如何從CAP轉到PACELC 2692次閱讀
- 基于 FPGA 客戶端的分布式計算網絡設計 1177次閱讀
- 深度解讀分布式存儲技術之分布式剪枝系統 1773次閱讀
- 基于CAN總線的分布式網架健康狀態監測系統的設計 963次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多