KubeCon + CloudNativeCon + Open Source Summit China 2021 —— 年度最頂級的云原生開源技術峰會要來了!
可不要被這“超長”的大會名稱嚇到。四年前,Linux 基金會正式宣布將旗下的 LinuxCon + ContainerCon + CloudOpen 大會升級為 Open Source Summit (開源技術峰會),同時與 CNCF 主辦的 KubeCon + CloudNativeCon 大會合并 —— 由此,“三會合一”的 KubeCon + CloudNativeCon + Open Source Summit 成為了云原生與開源軟件領域最富盛名的技術盛會。
自 2018 年首次落地中國以來,歷年的 KubeCon + CloudNativeCon + Open Source Summit China 都得到了國內外眾多 IT 巨頭的鼎力支持,匯聚了全球最活躍的開源云原生社區、最先進的技術代表與行業的最佳落地實踐,推動云原生計算領域的知識更新和技術進步。除了聚焦行業發展方向的精彩主題演講以外,廣大開發者們最關心的云原生前沿技術革新與最新落地實踐都將在各大專題論壇中一一呈現。大會專題論壇涵蓋云基礎設施、可觀察性、存儲、定制和擴展 Kubernetes、性能、服務網格、無服務器、容器運行時、CI/CD、網絡等云原生與開源技術細分領域,將為開發者們帶來近百場云原生技術干貨分享。下面就讓我們來看看本屆大會上有哪些精彩的技術議題:
云基礎設施?| Cloud Infrastructure
本專題將與大家深入探討支撐云原生技術背后的基礎設施建設,包括混沌工程、邊緣計算基礎設施、基于 RISC-V 的云原生平臺搭建等。
Cwen Yin,PingCAP
議題:Chaos Mesh 2.0:讓混沌工程更為簡單 | Chaos Mesh 2.0: Make Chaos Engineering Easy - Cwen Yin, PingCAP
時間:12 月 10 日,11:20-11:55
簡介:混沌工程是一種通過模擬例外或破壞性條件來測試生產軟件系統穩健性的方法。然而,對于許多人來說,從學習混沌工程到在自己的系統上著手實踐的轉變是令人怯步的。在本會話中,Cwen Yin 將分享 Chaos Mesh,一個開源的云原生混沌工程平臺,在使混沌工程更為簡單的目標下是如何實施和發展的。他還將介紹 Chaos Mesh 2.0 GA 版本的特性,如何使用它來快速地做第一個混沌實驗,以及如何將混沌實驗集成到自己的系統中。
Yanjun Chen,China Mobile
議題:中國移動 5G 邊緣計算開源實踐與思考 | China Mobile 5G Edge Computing Open Source Practice and thinking - Yanjun Chen, China Mobile
時間:12 月 10 日,12:10-12:45
簡介:本文將介紹中國移動在 CNCF 等開源項目基礎上構建邊緣計算生態系統相關的實踐和思考。同時,本演講還將分享中國移動最好的 5G MEC 應用案例之一,即 5G 邊緣計算 + 區塊鏈的實施。就詳細內容而言,本演講將分享中國移動的 5G 邊緣計算產品如何與 CNCF 項目等開源項目相結合的最新實踐。還將介紹的另一關鍵內容是網絡運營商在邊緣計算開源方面的工作經驗及 LF 社區的未來思考。另外,本演講還將展示一個邊緣計算用例,即 5G 邊緣計算 + 區塊鏈,以更好地賦能 5G 垂直行業。
議題:RISC-V:來自源碼的 Kubernetes 工具棧 | RISC-V: Kubernetes Toolstack From Source - Xingyou Chen, The Linux Foundation APAC時間:12 月 10 日,13:15-13:50
簡介:本演講將介紹為一個不受官方支持的平臺搭建 Golang、docker、Kubernetes 的過程。觀眾可以學習到如何讓自定義平臺運行 Kubernetes。
可觀察性?| Observability
可觀察性(Observability)概念最初誕生于工業領域,隨后被引入軟件開發領域,尤其是在云原生開發領域尤為重要。無論是在敏捷開發,還是 DevOps 流程中,它可以幫助運維團隊在關鍵事件中盡早發現問題、進行控制并發出警告,更有效地查找出問題的根源,獲得實時反饋,更快地采取措施修復事件,避免問題再次出現。本專題將分享可觀察性技術在 Kubernetes 系統中的最佳實踐。
Arsh Sharma,VMware
議題:更新的 “Hitchhiker "指南對 Kubernetes 的評估依賴性 | The Hitchhiker's Guide to Evaluating Dependency Updates to Kubernetes - Arsh Sharma, VMware
時間:12 月 10 日,11:20-11:55
簡介:本次演講將討論在 Kubernetes 這樣的大型項目中跟蹤依賴關系的重要性,以及“depstat”,這是一個為跟蹤 Kubernetes 代碼庫的依賴關系更新而創建的工具。Depstat 是一個上游項目,用于分析 go 模塊支持的項目的依賴關系。它目前作為 Kubernetes 代碼庫中 prow 作業的一部分運行,并提供四個關鍵的依賴關系相關指標。“depstat”還提供了通過創建圖形直觀分析依賴關系的能力。
Ethan Gao,Intel
議題:利用智能運維 (AIOps) 對云基礎設施進行智能分析 | Intelligent Analysis on Cloud Infrastructure With AIOps - Ethan Gao, Intel & Pang Liye, Inspur
時間:12 月 10 日,12:10-12:45
簡介:對云本地基礎設施和工作負載進行監視和觀測的遙測技術是云服務的必要基礎,而收集到的遙測數據大多是時間序列公式。由于海量歷史/實時遙測數據的高維度和高容量,以及大規模云基礎設施和分布式微服務需要通過傳統方法處理,因此其效率通常較低。本課程將回顧管理/操作云基礎設施和微服務的傳統方式的現狀和挑戰,并將人工智能與轉換和機器學習算法相比較,在這些遙測數據上引入人工智能,以實現云基礎設施/工作負載管理和操作的更多智能,如異常檢測,資源預測、故障檢測、根本原因分析等。具體來說,使用 Chronos 為智能運維接入云基礎設施/服務鋪平道路。
存儲?| Storage
存儲能力是計算機軟件技術發展各個階段都要面臨的問題。在數據量如此龐大的當下,以 Kubernetes 為核心的云原生基礎設施如何處理海量數據存儲?本專題將著重探討這一問題。
Jie Chu,Shanghai Pudong Development Bank
Qingqing Shao,Shanghai Pudong Development Bank
議題:在上海浦東發展銀行探索云原生大數據平臺 | Exploring Cloud Native Big Data Platform in SPDB - Jie Chu & Qingqing Shao, Shanghai Pudong Development Bank
時間:12 月 10 日,12:10-12:45
簡介:在中國,采用金融科技 (FinTech) 已成為金融業的全行業共識。上海浦東發展銀行一直在其大數據平臺上部署越來越復雜的業務工作負載,其中的數據容量每天都在以拍字節增加。面對這樣的挑戰,上海浦東發展銀行利用云原生技術重組其傳統數據分析中臺,提升了上下游用戶體驗,促進了商業銀行服務的數字化轉型。本議題將基于浦發銀行云原生 IT 架構實踐介紹:1.在 Kubernetes 上構建金融產業級容器化大數據平臺,為用戶提供各種計算服務。2.采用 Piraeus 存儲技術,為數據應用提供持久卷,高效利用本地存儲介質以實現高可用性、動態卷供應和智能調度。3.Hive 和 Impala 的橫向擴展計算執行器4.將上海浦東發展銀行內部的大數據應用的容器化操作標準化。
Xing Yang, VMware
議題:為有狀態工作負載保持持久卷的健康性 | Keep Persistent Volumes Healthy for Stateful Workloads - Xing Yang, VMware & Yuquan Ren, ByteDance
時間:12 月 10 日,13:15-13:50
簡介:越來越多的有狀態工作負載已被遷移至 Kubernetes 平臺。這些工作負載依靠持久卷來儲存數據。然而,在有狀態工作負載配置卷并予以使用后,底層儲存系統可能會發生很多情況。該卷可能會因意外被刪除、該卷所在的磁盤可能會發生故障、磁盤可能會持續退化影響其性能等。Kubernetes 如何及早發現這些問題并提醒用戶?Kubernetes 引入了卷健康監測功能,以發現這些存儲問題,并通過發送事件信息將這些問題公開給用戶。雖然這種方式很有用,但是需要用戶手動修復這些問題。如果 Kubernetes 偵測到卷異常情況后也有方法進行自動修正呢?在此次討論中,我們將討論目前卷健康監測功能有何作用,以及我們正在做哪些努力以將此功能提升至下一層次?
定制和擴展Kubernetes| Customizing+Extending Kubernetes
Kubernetes 快速成為云原生開發領域的基礎設施事實標準,離不開其超強的可擴展性。基于原生 Kubernetes 已經衍生出了眾多適用于不同特定場景的容器集群管理系統,不斷擴展 Kubernetes 生態的邊界。本專題將帶領開發者們一覽那些基于 Kubernetes 擴展的開源項目,并分享它們在跨集群管理、邊緣計算、大規模 AI 計算、流媒體工作負載等特定場景下的最佳落地實踐。
議題:Apiserver 生成器:通過聚合 Apiserver 擴展 Kubernetes 系統 | Apiserver Builder: Extending Kubernetes via Aggregated Apiserver - Min Kim, Ant Group
時間:12 月 9 日,11:20-11:55
簡介:目前有兩種可插拔的方式來擴展集群的自定義 Kubernetes 應用程序接口:自定義資源定義(也被稱為 CRD)和 Apiserver 聚合(也被稱為 AA)。經過多年的發展,自定義資源定義 (CRD) 現在在幾個版本的 GA 階段處于穩定工作狀態,但另一方面,我們可能會發現自定義資源定義由于可擴展性有限,并不總是最佳選擇——例如,我們將不得不引入多個網絡鉤子 apiservers,以便在新的資源類型上建立準入/轉換。或者,為了保持良好的兼容性,在多個版本之間切換可能在技術上很困難。因此,如果我們希望以編碼復雜度為代價實現軟件開發工具包框架級的擴展,我們可以將 Apiserver 聚合作為自定義資源定義的替代方案。我作為這個特定的官方 SIG 子項目的維護者已經 3 年多了,我將通過一個名為 apiserver-builder 的強大命令行工具,與觀眾分享構建您自己的聚合 apiserver 的實用方法。
Shao Qiang,Intel
議題:擴展 OpenYurt 用于視頻分析工作負載的端到端部署 | Extending OpenYurt for End-to-End Deployment of Video Analytics Workloads - Shao Qiang & Linda Yu, Intel
時間:12 月 9 日,12:10-12:45
簡介:OpenYurt 是一個云邊緣解決方案,適合在視頻分析、云游戲等邊緣環境中部署具有低延遲和大數據特性的工作負載。要以端到端和高度可擴展的方式部署工作負載,應將一些關鍵組件擴展到 OpenYurt,它們是:1.入口操作符:用于將請求分派到目標工作負載
2.應用程序負載平衡器 (ALB) 操作符:用于將請求分派到正確的普通舊數據 (POD)
3.端到端部署操作符:為了便于用戶在本演示文稿中輕松部署用例,Linda 和 Shaoqiang 將描述添加到 OpenYurt 組件的詳細信息,包括將 ingress-nginx controller 擴展到 OpenYurt Nodepool(OpenYurt 的邊緣),從頭開始為 Nodepool 實現應用程序負載平衡器,以及端到端部署操作符,通過提供簡單的應用程序接口 (API) 方便部署。視頻分析用例被用作示例工作負載。
Hongming Wan, QingCloud
議題:Kubernetes 與基于角色的訪問控制 (RBAC) 和 KubeFed 的多集群和隔離 | Kubernetes Multi-Cluster and Multi-Tenancy With RBAC and KubeFed - Hongming Wan, QingCloud
時間:12 月 9 日,13:15-13:50
簡介:軟隔離是一種沒有嚴格隔離不同用戶、工作負載或應用程序的隔離形式。就 Kubernetes 而言,軟隔離通常由 RBAC 和命名空間隔離。當集群管理員跨多個 Kubernetes 集群實現隔離時,會遇到許多挑戰,如身份驗證和授權、資源配額、網絡策略、安全策略等。在本次演講中,KubeSphere 維護人員將分享他們在設計隔離體系結構方面的經驗和最佳實踐。如何跨多個集群管理用戶和身份驗證。如何管理不同集群租戶的資源配額。資源隔離機制以及如何跨多個集群授權資源。
Fei Xu,Huawei
議題:用 KubeEdge 管理不穩定網絡上的大規模邊緣集群 | Managing Large-Scale Edge Cluster Over Unstable Network with KubeEdge - Fei Xu, Huawei
時間:12 月 9 日,14:05-14:40
簡介:眾所周知,Kubernetes 已經成為協調運行在數據中心中的容器化工作負載的事實上的標準,并依賴于數據中心的穩定網絡。但在邊緣計算場景中,我們將在數據中心運行主節點,在各個分散區域運行邊緣節點。此時,K8s 主節點和邊緣節點之間沒有穩定的網絡連接,節點甚至可能長時間處于離線狀態。此外,由于邊緣節點的數量大于數據中心服務器的數量,如何管理這些大規模的邊緣節點是一個巨大的挑戰。在這一節中,我們將分享如何使用 KubeEdge 來管理不穩定網絡下的大規模邊緣集群。它支持向大規模邊緣節點發送控制事件,有助于我們在大規模邊緣集群的不穩定網絡環境下實現可靠的邊緣應用管理。
Tiejun Chen,VMware
Dingping Yuan,VMware
議題:在 Kubernetes 邊緣集群上運行 wasm 應用 | Run wasm applications on kubernetes edge cluster - Dingping Yuan & Tiejun Chen, VMware
時間:12 月 10 日,11:20-11:55
簡介:Wasm 正變得越來越受歡迎,盡管它并沒有被視為容器的替代品,但社區確實看到了它的潛力。在 Kubernetes 集群上運行 wasm 應用程序的試驗有很多,但很少有團隊能夠在邊緣集群上運行它們。我們一直在基于 krustlet 項目開發邊緣產品,并在作為 krustlet 后端提供商支持邊緣集群方面取得了一些有趣的進展。在本次會議中,我們將與您分享:
為什么我們需要由 k8s 在邊緣上支持的 wasm 應 用程序
用 k8s 構建 wasm 到邊緣的差異和挑戰
用 krustlet 構建 wasm 到邊緣的方法 * 體系結構 * 支持邊緣的 krustlet 后端 * 針對邊緣的優化 * 使用 k3s 開源邊緣項目集成
演示
議題:Kubernetes 上的 Vivo 人工智能計算平臺 | Vivo's AI Computing Platform on Kubernetes - Ziyang Wu, Vivo
時間:12 月 10 日,12:10-12:45
簡介:Vivo 是世界上最大的智能手機公司之一。人工智能實驗室的數百名工程師和研究人員在 NLP、CV、推薦、演講等各個領域工作,帶來了各種各樣復雜的模型訓練和服務案例。人工智能計算平臺的建立是為了解決兩大挑戰:1.為大規模分布式模型培訓和服務提供有效的資源調度。2.實現計算資源的高利用率,特別是昂貴的 GPU 設備。今天,該平臺有幾個生產集群,數千個 GPU 節點和數百個 GPU 節點。每天會部署數百個服務,運行數百個 ML 作業。這一節將討論如何使用 Kubernetes、kube-batch、kubeflow 和其他開源軟件構建平臺。它還將涵蓋他們遇到的問題,來之不易的最佳實踐和他們對開源社區的貢獻。?
應用程序+開發|Application+Developmet
容器技術與 Kubernetes 誕生之后,徹底改變了很多行業的應用開發模式。本專題將聚焦云原生時代的應用程序與開發模式,一起來看看云原生對開發者來說究竟改變了什么。
Ju Zhen,Huawei
議題:用 Kubernetes 系統加速機器人應用開發 | Accelerating Robot Application Development with Kubernetes - Chunxu Hu, Jingfeng Micro Control Technology & Ju Zhen, Huawei
時間:12 月 9 日,11:20-11:55
簡介:在現實世界中開發機器人應用程序具有挑戰性。開發人員必須處理各種各樣的傳感器和硬件,每個傳感器和硬件都有獨特的軟件開發工具包 (SDK)、數據格式,并在不同的軟件環境中運行,這使得機器人系統很脆弱,隨時可能出現故障。那是機器人操作系統出現之前的黑暗時代。機器人操作系統統一了編程接口和通信機制,為機器人應用開發人員帶來了曙光。而我們相信云原生會使這種曙光更光明。通過容器和 Kubernetes 系統,開發人員可以啟動大量資源并行進行機器人仿真,并有效地管理機器人應用程序的整個生命周期。在本次演講中,演講者將介紹“云原生之前”的機器人開發情況,以及云原生如何讓機器人開發人員的生活更輕松。內容包括:——將機器人應用程序移植到容器中——用 Kubernetes 系統在云端進行多個機器人模擬——在真正的機器人上部署和管理應用程序 ——機器人編隊操作,遠程操作
Jianbo Sun,Alibaba
Yong Feng,Alibaba
議題:以一致的經驗構建和管理多集群應用 | Build and Manage Multi-cluster Application with Consistent Experience - Yong Feng & Jianbo Sun, Alibaba
時間:12 月 9 日,12:10-12:45
簡介:與在多集群環境中部署和管理應用程序相比,當前在本地環境中開發應用程序的用戶體驗存在巨大差距。將經過良好測試的應用程序移到多集群環境時,需要付出大量的努力。在本分享中,我們將演示如何將 KubeVela 和 OCM(開放集群管理)結合起來解決阿里云中的問題。用戶只需根據 KubeVela 應用程序規范定義一個應用程序另一種標記語言 (YAML),其余的將由 KubeVela 和開放集群管理處理。KubeVela 將準備一個部署工作流,包括在需要時創建 Kubernetes 集群。開放集群管理將幫助注冊集群并在集群之間分配資源。因此,在本地開發和多集群生產部署之間部署和管理應用程序的用戶體驗是一致的。我們將討論這些用例、挑戰以及相關的工作和經驗。
????????????????????????????????????????性能?| Performance
當新的業務需求到來時,您是否好奇 Kubernetes 集群是否能夠滿足性能需求?本專題將聚焦開發者普遍關心的 Kubernetes 在各個場景下的性能問題,看看 Kubernetes 如何幫助企業開發者實現降本增效。
Dongdong Chen,Tencent
議題:基于 Kubernetes 的全場景工作負載混部 | A full-scenario colocation of workloads based on Kubernetes - Dongdong Chen & Lingpeng Chen, Tencent
時間:12 月 9 日,12:10-12:45
簡介:對不同的工作負載(在線服務和離線作業)及時交錯使用資源,使混部成為可能,可以有效提高資源利用率,降低成本。該講座介紹了如何通過資源預測、資源隔離、干擾檢測、離線逐出等方式,在不中斷在線服務 SLO 的情況下最大限度地提高資源利用率。此外,即使用戶無法提供在線服務的延遲度量,我們也可以通過 eBPF 收集內核級度量來檢測干擾。所有這些技術都是建立在原生 Kubernetes 上的。托管支持多種場景,包括容器化和非容器化在線服務,以及 Kubernetes 和 Hadoop 生態系統中的離線作業。在騰訊,它已經部署了超過 40,000 臺機器,擁有 2,000,000 多個核心,包括廣告和 Ceph 存儲等服務,利用率平均提高 15%,成本節約數億美元。
議題:一個關于管理具有 15k 節點和各種工作負載的 Kubernetes 集群的故事 | A story of managing kubernetes cluster with 15k nodes and various workloads - Bo Tang & Chongkang Tan, Ant Group
時間:12 月 9 日,13:15-13:50
簡介:最近,我們的 Kubernetes 集群已經進化,以滿足大規模混合長時間運行的工作負載和離線大數據/機器學習訓練工作的需求。這使得我們的 Kubernetes 集群能夠達到 15k 個節點,成為社區中最大的集群之一。在本次演講中,我們將介紹管理超大規模 Kubernetes 集群的方法,以滿足業務需求。通過實際流量分析、仿真和性能測試,確定了性能瓶頸。在此基礎上,優化 Kubernetes apiserver 性能,減少列表/創建/更新/刪除響應時間,以滿足 SLO 要求。我們將分享一些我們在 apiserver 端和客戶端所做的改進,例如不同的運營商。我們還將介紹 etcd 性能的一些方面。
議題:如何在零停機的情況下遷移 Kubernetes 集群 | How To Migrate Kubernetes Cluster With Zero Downtime - Jing Gu & Yaoyao Xie, Alibaba
時間:12 月 9 日,14:05-14:40
簡介:跨多個版本升級 Kuberentes 的風險更大。許多客戶選擇使用集群遷移(即創建一個新的高版本集群,然后將應用程序從低版本集群遷移到高版本集群)而不是升級集群。然而,如何在零停機的情況下遷移集群已經成為一個重大挑戰。這項建議提出了解決問題的辦法。
無服務器?| Serverless
Serverless 架構已被業內認為是引領云原生下一個十年的發展潮流。市場調查報告顯示,2020 年全球已有 20% 的企業采用 Serverless 技術部署,Serverless 從底層進行技術變革計算資源的形態,為企業的軟件架構設計和應用服務部署引入創新的技術設計思路。本專題將為大家介紹 Serverless 技術的發展現狀,以及其在生產環境中的落地實踐。
Benjamin Huo,QingCloud
議題:用云原生無服務器技術構建現代 FaaS(功能即服務)平臺 | Build a modern FaaS platform with Cloud Native Serverless technologies - Benjamin Huo & Wanjun Lei, QingCloud
時間:12 月 10 日,13:15-13:50
簡介:作為無服務器的核心,FaaS(功能即服務)越來越受到人們的關注。新興的云原生無服務器技術可以通過用更強大的云原生替代方案替換 FaaS(功能即服務)平臺的關鍵組件,從而構建一個強大的現代 FaaS(功能即服務)平臺。在本次討論中,OpenFunction 的維護人員將討論:- 構成 FaaS 平臺的關鍵組成部分,包括功能框架、功能構建、功能服務以及功能事件管理。- 新興云原生無服務器技術在 FaaS 各個關鍵領域中的優勢,包括 Knative 服務、云原生構建包、Shipwright、Tekton、KEDA 和 Dapr。- 如何以 OpenFunction 為例,利用這些云原生技術構建強大的現代 FaaS 平臺。- 事件管理對 FaaS 很重要的原因。- 既然已經有了 Knative eventing 和 Argo Events,為什么 OpenFunction 還要創建自己的事件管理系統“OpenFunction Events”?
Zhao Qingjie,Alibaba
議題:實現 Faas + Dapr + K8S 技術融合,構建全新的阿里巴巴云無服務器研發系統 | Achieving Faas + Dapr + K8S technology integration, and build a new Alibaba Cloud Serverless R&D system - Zhao Qingjie, Alibaba
時間:12 月 10 日,14:05-14:40
簡介:隨著云原生生態系統的不斷發展,Kubernetes 已經成為了一種云操作系統。與此同時,無服務器是云計算下一個十年的發展主題這種聲音越來越多,那么 Kubernetes 將如何更好地支持這種無服務器場景呢?如何使用 Kubernetes 生態系統更好地整合二者?盡管諸如 Kubernetes 原生和 Fission 一類基于 Kubernetes 的無服務器解決方案已經在行業內出現,但是其仍無法突破零還原和高密度 + 高頻率創建等技術瓶頸。本次討論主要介紹如何在阿里巴巴內部實現技術突破,以及如何實現現有應用的大規模遷移:
FaaS 在 Kubernetes 上的瓶頸。
如何突破節點瓶頸,實現單節點上 1200 個實例的高密度部署。
如何打破性能瓶頸,實現 1w+/5s 的高頻創建和刪除。
如何重復使用 Kubernetes 的生態能力,擴展 FaaS 的邊界。
如何快速大規模遷移現有應用的無服務器形式?
服務網格?| Service Mesh?????????????????????????????????????????
服務網格(Service Mesh)被很多人認為是云原生時代繼 Kubernetes 之后的下一件“大事”,開源軟件創業公司 Buoyant 于 2016 年推出針對微服務架構服務間通訊的解決方案 Linkerd,并首次提出了 Service Mesh 的概念。Service Mesh 的定位非常明確,就是用來處理服務與服務之間的通訊的云原生基礎設施。 經過這些年的發展,Service Mesh 的成熟度如何了呢?
Xu Liu,Tencent
議題:Envoy 網格加速從 iptables 到完全 BPF | Envoy Mesh Acceleration: From Iptables to Fully BPF - Xiyao Zhang & Xu Liu, Tencent
時間:12 月 9 日,13:15-13:50
簡介:eBPF sockmap 已經成為一種為服務網格加速 Envoy 和容器之間本地進程通信的理想方法。然而,這一方法依賴于 iptables 來實現透明的流量劫持。這已經成為了系統性能的主要瓶頸。本次討論將從針對當前解決方案、來自社區的 Cilium 以及我們去年在 KubeCon China 中引入的輕量級方法開始進行詳細調查。我們將解釋 iptables 重定向如何影響入站和出站流量上的 sockmap 匹配結果。然后我們將展示我們的第一個類決方案,此類方案根本不使用 iptables。此類解決方案:1. 通過掛鉤綁定調用,使用 eBPF 定向入站流量到 envoy。2. 使用 eBPF 執行透明出站流量重定向。3. 為 Daemonset 部署和維護提供集成的控制面,并通過注釋和配置地圖進行完全控制。
議題:在線視頻將彈性從 SC 熔斷器升級到服務網格 | Online Video upgrades resilience from SC Circuit Breaker to Service Mesh - Xu Shiyu, RR Video & Zhang Chaomeng, Huawei
時間:12 月 9 日,14:05-14:40
簡介:作為中國領先的在線視頻共享平臺,人人視頻業務的快速發展給其 IT 基礎設施帶來了巨大挑戰。日益增長的復雜性、容量和彈性要求給當前基于 Spring Cloud 熔斷器的微服務帶來了新的問題。在此演示中,Chaomeng 和 Shiyu 將重點介紹大規模生產環境中的服務網格彈性實踐,包括不健康實例的透明自動隔離、自動恢復和自我修復、連接池管理、重連服務器、精細增進速率限制和分布式跟蹤、延遲指標。通過分析熔斷器模式和比較 Spring Cloud 熔斷器和服務網格在各自生產實踐中不同的實現方式,結果表明優化不只是改善了系統的可靠性和可用性,還使得開發和操作工作更簡單便捷。
議題:解決服務網格應用者的困境 | Solving the Service Mesh Adopter’s Dilemma - Anita Ihuman, Layer5
時間:12 月 10 日,11:20-11:55
簡介:我該使用哪種服務網格,如何開始?有哪些不同的服務網格,它們的對比情況如何?了解不同服務網格的功能性,并直觀地操作網格配置。本次閃電式演講介紹了一種開源多服務網格管理平面,Meshery,其提供(五種并且未來還會持續增長)不同的服務網格,還介紹了其示例應用程序,并對服務網格部署的性能進行基準測試。Meshery 促使對 Istio 的各種配置場景進行基準測試,比較網格內外以及不同網格之間的服務(應用程序)的性能。其根據部署最佳實踐檢查網格和服務配置。部分服務網格項目使用 Meshery 作為每個版本的性能基準工具。
運行時?| Runtimes
容器運行時,是執行集裝箱化(或“約束”)的應用程序。運行時將在容器中啟動應用程序,并為其提供所需的資源。它以標準化方式在所有環境中啟動應用程序,并設置安全邊界以及容器的資源限制。沒有它,該應用程序可能會根據需要消耗資源,從而有可能占用其他應用程序的資源。當 Kubernetes 的場景邊界被不斷拓展時,相應的容器運行時又會如何發展?
Siyu Wang,Alibaba
議題:在 OpenKruise 中擴展容器運行時的操作 | Extend the operations for container runtime in OpenKruise - Siyu Wang, Alibaba
時間:12 月 10 日,13:15-13:50
簡介:通常情況下,人們只能使用普通舊數據作為 Kubernetes 中最小的操作單元。他們可以創建一個普通舊數據,但不能控制普通舊數據中的容器,也不能通過 Kubernetes 應用程序接口在某些節點上提取圖像。這是因為 Kubernetes 沒有提供操作運行時的應用程序接口,比如 Containerd 或 Docker。據我所知,一些公司在他們的集群中入侵了 Kubelet 的代碼,以便他們可以對容器做更多的事情。然而,為運行時擴展操作確實是一種錯誤的方法,因為它不利于開源和社區的合作。現在,云原生計算基金會沙箱項目之一 OpenKruise 提供了高級功能,可以在每個原始 Kubernetes 集群中操作容器運行時。它支持通過 CRD 進行大規模圖像預下載和容器重啟,因此用戶只需應用 CR 另一種標記語言即可完成這些工作。在本次演講中,我們將介紹 OpenKruise 中功能的用法,以及它如何與 Kubelet 和 CRI 合作。
Pengfei Jiang,Huawei
議題:KubeEdge 驅動的下一代云原生運行時邊緣設備 | KubeEdge Powered Edge-Devices With Next Generation Cloud Native Runtime - Pengfei Jiang, Huawei
時間:12 月 10 日,14:05-14:40
簡介:隨著云本地邊緣計算的實現,越來越多的邊緣設備需要與云協作。此外,隨著各種專業芯片、硬件加速卡和微機器學習技術的發展,許多通用資源較低的專用設備也需要邊緣云協同。因此,輕量級容器沙箱技術需要滿足低服務開銷、快速啟動和服務隔離的要求。為了解決邊緣設備的多體系結構系統遷移問題,實現統一的應用運行時,降低開發和維護成本,需要一種統一的跨體系結構運行時技術。
運營?| Operations???????????????????????????????????
大規模集群的管理是云原生時代的運維工作者需要面臨的巨大挑戰。本專題將與大家共同探討在管理 Kubernetes 集群的過程中可能遇到的問題和解決方案。
Chaofan Wang,Tencent
Cong Tang,Tencent
議題:如何有效管理數以萬計的 etcd 集群?| How to Efficiently Manage Tens of Thousands of etcd Clusters? - Cong Tang & Chaofan Wang, Tencent
時間:12 月 9 日,11:20-11:55
簡介:在管理 k8s 群集的過程中,您可能會遇到許多 etcd 管理和穩定性問題。例如,如何通過可視化平臺管理大量 etcd 集群?如何自動發現 etcd 集群的潛在危害,及時報警,甚至實現自愈?如何順利地將 k8s etcd 遷移到無停機時間的高性能 etcd 群集?騰訊是一家大型互聯網公司和云服務提供商。騰訊 Kubernetes 引擎擁有豐富的大規模 k8s 集群管理經驗,在騰訊云上管理數萬個 k8s 集群。騰訊 Kubernetes 引擎已經實現了開源的可視化 etcd 管理平臺 kstone,提供 etcd 集群注冊和管理、檢查、優化建議、備份、遷移、數據可視化等。基于 kstone 項目,騰訊 Kubernetes 引擎有效地管理了數萬個 etcd 集群,這大大降低了運營和維護成本。
議題:阿里巴巴如何在用戶面前發現和定位 k8s 集群問題 | How We Discover and Locate k8s Cluster Problems Before Users at Alibaba - Peng Nanguang, Alibaba
時間:12 月 9 日,12:10-12:45
簡介:快速發現和定位問題的能力是快速恢復系統的基石。只有首先快速發現和定位問題,我們才能討論如何解決問題并最大限度地減少用戶損失。那么,在復雜的大規模場景中,我們如何在用戶面前發現和定位問題呢?我將介紹一些我們在管理大型 K8S 集群過程中快速發現和定位問題的經驗和實踐——我們如何通過創建通用鏈接檢測 + 定向檢測工具 KubeProbe 來解決我們遇到的問題,以應對大規模集群的穩定性挑戰。鏈接檢測:模擬廣義用戶行為,檢測鏈接和進程是否異常:檢查集群的異常指標,找出未來系統增強中存在或可能存在的風險點:問題發現的效率和速度、問題發現后的根本原因分析,以及聊天操作。
Benjamin Wang,VMware
Wenli Wei,VMware
議題:Kubernetes 中 Windows 工作負載管理的最佳實踐 | Best Practice on Windows Workload Management In Kubernetes - Benjamin Wang & Wenli Wei, VMware
時間:12 月 10 日,14:05-14:40
簡介:隨著 Windows 容器的成熟,大部分 Windows 應用程序和服務正在遷移到 Kubernetes。即使擁有 Linux 工作負載管理的成功經驗,大規模管理 Windows 工作負載也是一項挑戰。您知道 Windows 工作負載的暫存空間嗎?您是否曾經因過度配置的暫存空間而導致節點崩潰?我們如何避免孤立磁盤?它怎么可能在滾動更新時陷入困境?如何優雅地關閉守護程序?組托管服務帳戶 (GMSA) 作為在 Windows 上運行任務和應用程序的更安全的方式,您知道組托管服務帳戶是如何集成到 Windows 群集中的嗎?你還在糾結于 Kubernetes 上的組托管服務帳戶與動態目錄的集成嗎?
CI/CD
CI/CD 是一種通過在應用開發階段引入自動化來頻繁向客戶交付應用的開發方法,其核心概念是持續集成、持續交付和持續部署。在云原生時代,CI/CD 如何更好地落地?本專題將帶你走進云原生時代的 CI/CD 系統。
Jinming Yue,ByteDance
議題:基于 Tekton 構建大規模云原生 CI/CD 系統 | Build a Large Scale Cloud Native CI/CD System Based on Tekton - Jinming Yue & Deyuan Deng, ByteDance
時間:12 月 10 日,11:20-11:55
簡介:隨著基于 Kubernetes 的生態系統的廣泛采用,社區和企業對微服務架構有著越來越大的興趣。伴隨著這一趨勢,需要云原生的 CI/CD 系統來支持微服務應用的快速迭代開發周期。Tekton 是基于 Kubernetes 的開源云原生 CI/CD 項目;但是,其主要設計用于單集群環境,不能解決跨不同區域在多個集群上同時運行多個線路的挑戰。在本次討論中,我們將介紹一種構建于 Tekton 之上的大規模云原生 CI/CD 系統,用于解決上述問題。該系統為字節跳動數以千計的應用程序交付提供動力。我們將分享設計該系統時的實際經驗和需要注意的陷阱,以及我們如何解決多區域部署帶來的性能和安全問題。
Jenny Chen,Qunar
Sheng Zou,Qunar
議題:去哪兒網規模下 Kubernetes 多集群和 Canary 的部署 | Kubernetes Multi-cluster and Canary Deployment at the Scale of Qunar - Sheng Zou & Jenny Chen, Qunar
時間:12 月 10 日,12:10-12:45
簡介:去哪兒網是中國領先的在線旅游平臺,成立于 2005 年 5 月,總部位于北京。去哪兒網基礎設施團隊在 2020 年底開始研究和應用 k8s,其計劃在 2021 年底前將在生產中將所有應用程序遷移到 Kubernetes 中。隨著云原生時代的到來,學習和擁抱云原生不可避免,因為其可以使業務運營更加敏捷。容器化是將應用轉移到 Kubernetes 之前的第一步。如何將數以千計的應用程序高效、順暢地從基于內核的虛擬機 (KVM) 遷移到容器已成為去哪兒網基礎設施團隊面臨的一個巨大挑戰。在此次討論中,去哪兒網基礎設施團隊將討論:- 如何將 CI/CD 模式從 KVM 發展到云原生時代——如何運用多集群和基于批量的 Canary 部署幫助應用程序、sdk 順利進行升級——從 CI/CD 演化路徑中吸取的教訓。
網絡?| Networking
與云原生技術帶來的高效與便利共生的,是網絡技術的挑戰。如何在多云跨集群、云邊端協同等復雜場景下構建穩定、安全、可靠的網絡解決方案?敬請關注本專題中由來自各大廠商的資深云原生技術專家帶來的精彩網絡技術分享。
Hongjun Ni,Intel
議題:支持零信任服務網絡的零信任網絡整體解決方案 | Zero Trust Network Turnkey Solution to Support Zero Trust Service Mesh - Hongjun Ni & Pan Zhang, Intel
時間:12 月 9 日,11:20-11:55
簡介:隨著越來越多的員工在遠程工作,大多數數據/用戶/設備/應用程序都在傳統企業范圍之外移動。成功的數字轉型需要零信任安全模型。本演示將介紹一種具有高性能和可擴展性的零信任網絡整體解決方案。此解決方案包含 VPP 上的安全網關和 DPDK 上的負載平衡器,支持零信任安全模型。可用于 K8s 入口/出口網關和邊緣云網關,支持零信任云服務網格。本主題將涵蓋以下要點:
1)介紹零信任網絡整體解決方案的總體架構。
2)在 VPP 和 WireGuard 上實現零信任安全網關。
3)在 DPDK 和 WireGuard 上實現零信任云網關。
4)使用 IPsec MB 庫和 AVX512 加速基于 VPP 的 WireGuard 協議。5)實現基于 DPDK 的 WireGuard 協議,具有高性能和可擴展性。
6)利用 SGX 構建用于機密管理的 T 形三通。
Yuning Xie, Alibaba
議題:最佳實踐:Kubernetes 集群中 DNS 故障的可觀測性與根因診斷 | Best Practice: DNS Failure Observability and Diagnosis in Kubernetes - Yuning Xie, Alibaba
時間:12 月 10 日,11:20-11:55
簡介:在阿里云數萬個 Kubernetes 集群中,DNS 域名解析故障是最常見的問題之一。DNS 解析故障的現象也千奇百怪,有些是間歇性的,有些是持續性的,有些影響了所有類型的域名查詢,有些只影響了小部分。其根因也不盡相同,大部分是容器網絡問題,有時候是配置錯誤。Yuning Xie 將介紹在 Kubernetes 中 DNS 解析故障的可觀測性與根因診斷,本主題將包括以下內容:
1. 介紹 Kubernetes 中常見的 DNS 解析故障場景
2.介紹 CoreDNS 內置的可觀測性插件,例如 log/errors/trace/dump/metrics
3. 如何通過 dnstap 協議診斷 CoreDNS 異常,以替代 tcpdump 等傳統高開銷的方法
4. 如何基于 BPF 完成客戶端側 DNS 異常的根因診斷
議題:用 Kube-OVN 創建一個跨 Kubernetes 的統一網絡平面 | Creating a Unified Network Plane across Kubernetes with Kube-OVN - Cheng Chen, PingCAP
時間:12 月 10 日,12:10-12:45
簡介:Kubernetes 的網絡組件一直是運營人員非常重要的一部分。Kube OVN 作為一個新的網絡組件加入云原生計算基金會組織,這豐富了 Kubernetes 網絡組件生態系統。Kube-OVN 具有許多特性,其中集成多個 Kubernetes 網絡以開放和創建一個共同的網絡平面的特性是其中最吸引人的特性之一。通過集成多個 Kubernetes 網絡,并允許應用程序在多個 Kubernetes 集群上運行而無需感知。可以提高節點的使用效率;降低應用程序和體系結構的復雜性;更重要的是,支持數據中心級別的災難恢復。本次演講將介紹如何使用 Kube-OVN 構建一個跨 Kubernetes 網絡平面。它還將通過在跨 Kubernetes 網絡平面上部署 TiDB 來解釋類似部署場景的重要性和概念。
Wang Jiezhang,Huawei
議題:邊緣計算場景下 Service Mesh 的延伸和擴展 | Extension and expansion of Service Mesh in edge computing scenarios - Wang Jiezhang, Huawei
時間:12 月 10 日,13:15-13:50
簡介:EdgeMesh 是 KubeEdge 的一部分,為邊緣場景中服務之間的交互通信提供了一個簡單的網絡解決方案。KubeEdge 基于 Kubernetes 構建,將云本地容器化應用程序編排功能擴展到邊緣。然而,在邊緣計算機場景下,網絡拓撲結構更加復雜。不同區域中的邊緣節點通常不相互連接,應用程序之間的流量交互通信是業務的主要需求。對于這個場景,EdgeMesh 提供了一個解決方案。作為 KubeEdge 群集上數據面板的組件,EdgeMesh 為 KubeEdge 群集上運行的應用程序提供樣本容量(例如,服務發現、流量代理等),從而屏蔽邊緣場景的復雜網絡拓撲。
議題:異構多集群全網格通信實踐 | Heterogeneous multi-cluster full mesh communication practice - Li Yang, Transwarp; Liu Wenfeng, VMware
時間:12 月 10 日,14:05-14:40
簡介:許多大數據業務都在 Kubernetes 集群上運行。為了使運行在不同 Kubernetes 集群上的大數據業務能夠高效地訪問彼此的數據,需要一種新的方式在異構多 Kubernetes 集群之間建立高性能、簡單的網絡通信。在第二層網絡中,我們選擇主機路由進行通信,以保證網絡性能。主流容器網絡接口 (CNI) 支持此功能。在第三層網絡中,我們選擇主流容器網絡接口支持的 vxlan 隧道技術連接網絡。對于異構容器網絡接口,在第二層網絡中,它們可以直接通信。在第三層網絡中,它們的 VNI 可能不同,因此無法在集群之間創建 vxlan 隧道,因此至少可以通過編程擴展一個容器網絡接口以適應另一個容器網絡接口,確保使用相同的 VNI 在兩個容器網絡接口之間建立 vxlan 隧道,我們選擇 antrea 作為核心容器網絡接口以支持可配置的 VNI。
社區?| Community
對于開源軟件來說,社區的活力是項目前進的動力和發展的源泉。如何從一個開源愛好者變成開源貢獻者,再逐步進入社區,加入開源項目的維護與管理之中?本專題將與各位分享開源社區的點點滴滴。
Guo Xudong, JiHu GitLab
議題:如何參與云原生計算基金會 (CNCF) 開源項目并成為維護者 | How to Participate in CNCF Open Source Projects and Become a Maintainer - Guo Xudong, GitLab
時間:12 月 9 日,13:15-13:50
簡介:如何參與開源項目?如果我不知道如何編寫代碼,我能參與開源項目嗎?如何從一個普通的貢獻者一步一步地成為維護者?這次演講可能會幫助你找到答案。
?Kubernetes 企業最終用戶可以免費申請大會門票,獲得全程免費參會資格,僅限 500 個名額。
另外,符合多樣化計劃的高校大學生、女性開發者、開源愛好者、開源社區領袖、開源社區創業者、新興技術社區共建者也可以免費申請大會門票,共享云原生開源技術盛宴。
?KubeCon + CloudNativeCon + Open Source Summit China 2021 由云原生計算基金會 CNCF 主辦。本屆大會的議程安排已全面上線,報名通道限時開放。更多詳情請查看大會官網。
審核編輯:符乾江
評論
查看更多