色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

前沿開源技術(shù)領(lǐng)域的開源大數(shù)據(jù)一一解讀

OSC開源社區(qū) ? 來源:2022 中國開源開發(fā)者報告 ? 2023-02-21 15:19 ? 次閱讀

近日,OSCHINA 和 Gitee 聯(lián)合發(fā)布了《2022 中國開源開發(fā)者報告》。

其中“前沿開源技術(shù)領(lǐng)域解讀” 部分,多位在其領(lǐng)域有所建樹的一線開發(fā)者和開源商業(yè)化公司創(chuàng)始人,對目前國內(nèi)外流行的前沿開源技術(shù)領(lǐng)域過去的發(fā)展和未來的趨勢進行了深入的洞察,覆蓋開源云原生、開源 AI、開源大前端、開源大數(shù)據(jù)、開源 DevOps、RISC-V、開源操作系統(tǒng)、開源數(shù)據(jù)庫、編程語言九大領(lǐng)域。

本篇為開源大數(shù)據(jù)領(lǐng)域的解讀。

近幾年,數(shù)據(jù)技術(shù)快速發(fā)展,技術(shù)棧逐漸成熟,從新一代數(shù)據(jù)源體系到數(shù)據(jù)處理體系,再到數(shù)據(jù)分析、AI 算法體系,數(shù)據(jù)技術(shù)逐步相互融合、相互支持形成有機整體。OLAP、數(shù)據(jù)湖、數(shù)據(jù)集成、DataOps、MLOps 等領(lǐng)域變得更加火熱。未來,大數(shù)據(jù)技術(shù)會沿著異構(gòu)計算、批流融合、云化、兼容AI、內(nèi)存計算等方向持續(xù)更迭。

新一代數(shù)據(jù)棧將逐步替代國內(nèi)單一“數(shù)據(jù)中臺”

2021 年,美國硅谷最火爆的詞匯就是現(xiàn)代數(shù)據(jù)棧(Modern Data Stack,簡稱 MDS),它們是以云原生、開源為背景的一系列全新數(shù)據(jù)技術(shù)引擎。相對于傳統(tǒng)的閉源、私有化的數(shù)據(jù)技術(shù)來講,現(xiàn)代數(shù)據(jù)棧憑借其開放性及公有云的 SaaS 服務(wù)快速得到了大量企業(yè)用戶的認(rèn)可。

現(xiàn)代數(shù)據(jù)棧分為若干層次,每個層次相互支持,相互協(xié)助,形成一個有機的整體。企業(yè)使用的時候,很容易就能利用 SaaS 模式將其整合到一起解決企業(yè)數(shù)據(jù)問題。而開源模式,又給 MDS 生態(tài)加入了新的活力,快速發(fā)展社區(qū)的同時讓上下游快速出現(xiàn)新的合作。

201500fa-aaa4-11ed-bfe3-dac502259ad0.png

近幾年,國內(nèi)出現(xiàn)了大量的開源數(shù)據(jù)技術(shù)。2022 年,這些技術(shù)形成了具有上下游的有機集合體,從新一代數(shù)據(jù)源體系到數(shù)據(jù)處理體系,再到數(shù)據(jù)分析、AI 算法體系,逐步相互融合、相互支持形成有機整體。可以看到,國內(nèi)新一代的數(shù)據(jù)棧在支持云原生技術(shù)基礎(chǔ)上,還支持私有云/公有云部署,用新一代的計算引擎、算法、調(diào)度、同步機制來支持新一代的數(shù)據(jù)基礎(chǔ)建設(shè)。

202c2000-aaa4-11ed-bfe3-dac502259ad0.png

這些新一代技術(shù)棧的流行和商業(yè)工具生態(tài)的整合,將逐步替代國內(nèi)單一“數(shù)據(jù)中臺”服務(wù)四五個領(lǐng)域的局面。這變得跟美國類似——若干家各自領(lǐng)域的專業(yè)企業(yè)相互集成,最終給用戶提供高效且靈活的專業(yè)解決方案。

同時,我也高興看到,這些開源現(xiàn)代數(shù)據(jù)棧中很多的商業(yè)公司,正在美國、歐洲快速建立社區(qū)、SaaS 和相關(guān)的商業(yè)服務(wù),也有一些公司已經(jīng)和全球的開源現(xiàn)代技術(shù)棧公司進行競爭。整體上,來自國內(nèi)的新一代的開源現(xiàn)代數(shù)據(jù)棧(Open-source MDS)現(xiàn)在剛剛興起。我相信,國內(nèi)具有大量優(yōu)秀的開發(fā)者、豐富的場景和大量的數(shù)據(jù)基礎(chǔ),一定會有若干家卓越的開源商業(yè)公司出現(xiàn),最終在全球開源現(xiàn)代數(shù)據(jù)棧中有一席之地!

20407dc0-aaa4-11ed-bfe3-dac502259ad0.png

郭煒

Apache 基金會成員,Apache 孵化器導(dǎo)師,ClickHouse 華人社區(qū)創(chuàng)始人, Apache Dolphin Scheduler PMC,Apache SeaTunnel(incubating) 導(dǎo)師。郭煒先生畢業(yè)于北京大學(xué),曾任易觀 CTO,聯(lián)想研究院大數(shù)據(jù)總監(jiān),萬達(dá)電商數(shù)據(jù)部總經(jīng)理,先后在中金、IBM、Teradata 任大數(shù)據(jù)方重要職位,對大數(shù)據(jù)前沿研究做出卓越貢獻(xiàn)。同時郭先生參與多個技術(shù)社區(qū)工作,Presto、 Alluxio、Hbase 等,是國內(nèi)開源社區(qū)領(lǐng)軍人物。

數(shù)據(jù)湖與 LakeHouse 依然炙手可熱

2022 年,數(shù)據(jù)湖與 LakeHouse 依然是炙手可熱的話題。一方面,在 Apache Iceberg、Apache Hudi、Delta 等知名開源項目的帶動下,國內(nèi)的一些基礎(chǔ)軟件公司也開始在數(shù)據(jù)湖開源領(lǐng)域積極布局,代表有網(wǎng)易數(shù)帆開源的湖倉管理系統(tǒng) Arctic,阿里云開源的流式數(shù)倉 Flink Tablestore;另一方面,一些傳統(tǒng)架構(gòu)的開源數(shù)倉軟件,以及閉源的數(shù)據(jù)分析引擎,也開始積極擁抱開放的數(shù)據(jù)湖格式,標(biāo)志性事件如 Snowfake 可以對接 Delta 和 Iceberg,Doris 系的開源數(shù)倉可以查詢 Iceberg 數(shù)據(jù)。

在眾多開源項目與頭部企業(yè)的帶動下,行業(yè)和市場相比去年對 LakeHouse 的價值認(rèn)知有了長足進步。

目前,用戶切入 LakeHouse 主要有兩點:一是數(shù)據(jù)湖上云,公有云的對象存儲與私有化的 Hadoop 在一些功能上有較大不同,比如 list 和 rename 接口的性能缺陷,導(dǎo)致用戶在把圍繞 Hadoop 構(gòu)建的數(shù)倉體系遷往云端時需要應(yīng)對各種問題,而以 Iceberg 為代表的新型表格式在使用上天然不依賴這些接口,并且提供了 ACID、模式演進等高階特性,為用戶提供了更好的上云方案;二是數(shù)據(jù)處理的流批一體,新型數(shù)據(jù)湖格式的快照機制對流更加友好,可以將數(shù)據(jù)湖拓展到更多流計算場景,甚至演進到流式湖倉的場景,實現(xiàn)實時數(shù)倉和離線數(shù)倉在湖倉上的統(tǒng)一。

但需要承認(rèn)的是,LakeHouse 這項技術(shù)還沒有瓜熟蒂落,尤其在流批一體方面,依然有很多想象空間。在 Gartner 技術(shù)成熟度曲線中,LakeHouse 處于期望膨脹期的臨界點,距離主流市場采納還需要 2-5 年的時間。得益于數(shù)據(jù)湖天然的體量和成本優(yōu)勢,可以預(yù)見當(dāng) LakeHouse 成為標(biāo)準(zhǔn)技術(shù)方案時,它將給企業(yè)的數(shù)字化轉(zhuǎn)型帶來極具意義的變革。

20501d70-aaa4-11ed-bfe3-dac502259ad0.png

馬進

網(wǎng)易數(shù)帆大數(shù)據(jù)實時計算技術(shù)專家、湖倉一體項目負(fù)責(zé)人,負(fù)責(zé)網(wǎng)易集團分布式數(shù)據(jù)庫、數(shù)據(jù)傳輸平臺、實時計算平臺、實時數(shù)據(jù)湖等項目,長期從事中間件、大數(shù)據(jù)基礎(chǔ)設(shè)施方面的研究和實踐,目前帶領(lǐng)團隊聚焦于流批一體、湖倉一體的平臺方案和技術(shù)演進,及流式湖倉服務(wù) Arctic 項目開源。

數(shù)據(jù)技術(shù)快速更迭, DataOps 應(yīng)運而生

今年的大數(shù)據(jù)發(fā)展如火如荼,OLAP、數(shù)據(jù)湖、數(shù)據(jù)集成、DataOps、MLOps 等領(lǐng)域非常火熱,企業(yè)數(shù)字化、數(shù)智化發(fā)展十分蓬勃,開源原生公司發(fā)展迅速,數(shù)據(jù)湖三劍客 Apache Iceberg、Apache Hudi 加上 DataBricks 主導(dǎo)的 Delta Lake 都已經(jīng)有商業(yè)化公司的助力。數(shù)據(jù)領(lǐng)域的估值愈發(fā)突起,比如 DBT Labs 估值已經(jīng)達(dá)到 40 多億美金,Airbyte 估值已經(jīng) 15 億美金。國內(nèi)以天謀科技、思斐、SelectDB、白鯨開源為代表的大數(shù)據(jù)開源原生公司開始展露頭角。

數(shù)據(jù)技術(shù)正在快速迭代,且迭代速度比以往任何時候都更快,每年新誕生的技術(shù)多達(dá)幾十種,在此的背景下,DataOps 應(yīng)運而生。DataOps 圍繞云原生、敏捷智能化、多云能力等方向重構(gòu)現(xiàn)代數(shù)據(jù)技術(shù)棧,涵蓋了現(xiàn)代數(shù)據(jù)處理的整個生命周期,包括數(shù)據(jù)采集、數(shù)據(jù)加工(ELT/ETL)、數(shù)據(jù)集成、數(shù)據(jù)安全、數(shù)據(jù)治理等多個方面,利用 DataOps 可以高效打造現(xiàn)代數(shù)據(jù)智能高速公路。

根據(jù) Gartner 的總結(jié),我們來看一下 DataOps 在數(shù)據(jù)運營體系關(guān)鍵要素中的作用:

(1)流程控制:在 DataOps 中,自動化測試和統(tǒng)計流程控制在數(shù)據(jù)管道的每一步運行,過濾和消除數(shù)據(jù)錯誤,這些數(shù)據(jù)錯誤會破壞分析,并產(chǎn)生大量計劃外工作影響生產(chǎn)效率。

(2)變更管理:DataOps 關(guān)注的是跟蹤、更新、同步、集成和維護驅(qū)動數(shù)據(jù)分析管道的代碼、文件和功能組件。

(3)并行開發(fā):DataOps 組織并劃分?jǐn)?shù)據(jù)開發(fā)各個階段,以便團隊成員可以高效地協(xié)同工作,而不會發(fā)生資源沖突。

(4)虛擬化技術(shù)環(huán)境:DataOps 會虛擬化技術(shù)環(huán)境,以便將開發(fā)與生產(chǎn)隔離。虛擬化可以讓業(yè)務(wù)創(chuàng)新更輕松地通過開發(fā)流程,并快速流向生產(chǎn)環(huán)境。當(dāng)需要時,數(shù)據(jù)分析師可以快速啟動一個開發(fā)環(huán)境,其中包括所需的工具、安全訪問、數(shù)據(jù)、代碼。

(5)復(fù)用:DataOps 支持復(fù)用模型,標(biāo)準(zhǔn)化被廣泛使用的功能和分析組件,并簡化虛擬環(huán)境之間的遷移。

(6)響應(yīng)能力和靈活性:DataOps 設(shè)計數(shù)據(jù)分析管道以適應(yīng)不同的運行時情況。這種靈活性使分析能夠更好地響應(yīng)組織的需求和不斷變化的優(yōu)先級。

(7)快速變化:DataOps 將構(gòu)建技術(shù)環(huán)境,以實現(xiàn)盡可能短的開發(fā)周期時間,同時滿足數(shù)據(jù)使用者的要求。DataOps 的設(shè)計理念就是基于變革,DataOps 體系結(jié)構(gòu)將動態(tài)數(shù)據(jù)處理能力視為 “核心思想”,而不是 “亡羊補牢”,做事后的更改。

(8)團隊協(xié)同:DataOps 協(xié)調(diào)任務(wù)、角色和工作流,以打破不同數(shù)據(jù)團隊和業(yè)務(wù)團隊之間的障礙,以便更好地協(xié)同工作。

可以說,DataOps 是快速實踐數(shù)字化轉(zhuǎn)型的理論指導(dǎo),貫穿于現(xiàn)代數(shù)據(jù)技術(shù)棧的始末,DataOps 也是降本提效的最佳路徑,實踐 DataOps 路徑的收益立竿見影。

2063ec38-aaa4-11ed-bfe3-dac502259ad0.png

代立冬

白鯨開源聯(lián)合創(chuàng)始人,Apache DolphinScheduler PMC 主席,Apache SeaTunnel PPMC,Apache 基金會正式成員,Apache 孵化器導(dǎo)師,ApacheCon Asia 大數(shù)據(jù)論壇主席。

更多內(nèi)容請查看《2022 中國開源開發(fā)者報告》

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3309

    瀏覽量

    42471
  • 內(nèi)存計算
    +關(guān)注

    關(guān)注

    1

    文章

    15

    瀏覽量

    12154
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8882

    瀏覽量

    137396
  • 云原生
    +關(guān)注

    關(guān)注

    0

    文章

    248

    瀏覽量

    7947

原文標(biāo)題:前沿開源技術(shù)領(lǐng)域解讀——開源大數(shù)據(jù)

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    介紹幾大引人注目的開源大數(shù)據(jù)工具

    大數(shù)據(jù)技術(shù)領(lǐng)域正被越來越多的公司關(guān)注,而開源一直是大數(shù)據(jù)技術(shù)的靈魂。隨著一些細(xì)分領(lǐng)域
    的頭像 發(fā)表于 01-29 08:46 ?8898次閱讀
    介紹幾大引人注目的<b class='flag-5'>開源</b><b class='flag-5'>大數(shù)據(jù)</b>工具

    常用大數(shù)據(jù)處理技術(shù)歸類

    性能方面更加出色。想要學(xué)習(xí)大數(shù)據(jù),建議從應(yīng)用切入、以點帶面,先從一個實際的應(yīng)用領(lǐng)域需求,搞定一個一個技術(shù)點,有一定功底之后,再舉一反三橫向擴展,這樣學(xué)習(xí)效果就會好很多。
    發(fā)表于 02-28 17:02

    大數(shù)據(jù)運用的技術(shù)

    處理、集群、實時性計算等,匯集了當(dāng)前IT領(lǐng)域熱門流行的IT技術(shù)。想要學(xué)好大數(shù)據(jù)需掌握以下技術(shù):1. Java編程技術(shù)Java編程
    發(fā)表于 04-08 16:50

    阿里巴巴高級技術(shù)專家章劍鋒:大數(shù)據(jù)發(fā)展的 8 個要點

    8、開源閉源并駕齊驅(qū)11 月 28-30 日,Apache Flink 及大數(shù)據(jù)領(lǐng)域年度盛會 Flink ForwardAsia 2019 將在北京國家會議中心舉辦,更多大數(shù)據(jù)
    發(fā)表于 10-14 10:56

    螞蟻集團基礎(chǔ)設(shè)施委員會主席何征宇:開源是核心技術(shù)戰(zhàn)略

    ,另一方面也開源了SOFAStack,其中,MOSN為雙十一提供了Mesh化解決方案。在安全容器技術(shù)領(lǐng)域,Kata Containers是Open Infra頂級項目,于2022年拿到SuperUser
    發(fā)表于 08-17 11:37

    征集令 | 首屆開放原子全球開源大賽等你來戰(zhàn)!

    基于開源技術(shù)和智慧交通領(lǐng)域相融合的創(chuàng)新解決方案,不斷融合大數(shù)據(jù)、邊緣計算、物聯(lián)網(wǎng)等技術(shù)能力,以全棧開源
    發(fā)表于 12-08 11:38

    中國開源未來發(fā)展峰會“問道 AI 分論壇”即將開幕!

    過去幾個月,AI 幾乎已經(jīng)成為全民熱議的話題。各式開源大模型、訓(xùn)練框架層出不窮;AI 技術(shù)也加速應(yīng)用在各個領(lǐng)域和行業(yè),例如服務(wù)運營優(yōu)化、解決供應(yīng)鏈問題等等;數(shù)據(jù)庫、云計算、大前端等多類
    發(fā)表于 05-09 09:49

    大數(shù)據(jù)開源技術(shù)大變遷

    在這個基礎(chǔ)上,我們看到很多開源云計算、大數(shù)據(jù)技術(shù)框架得到了飛速發(fā)展,其中更有一些已經(jīng)成文業(yè)內(nèi)事實上的標(biāo)準(zhǔn)。這些開源框架的出現(xiàn)大幅度降低了云計算和大數(shù)
    發(fā)表于 10-10 17:02 ?0次下載

    深度解讀大數(shù)據(jù)的應(yīng)用現(xiàn)狀和開源未來

    本文對當(dāng)前最前沿開源大數(shù)據(jù)基準(zhǔn)測試集進行全面總結(jié),闡述其歷史、現(xiàn)狀并展望下一步研究方向。
    的頭像 發(fā)表于 12-21 15:57 ?4648次閱讀

    解讀ArduBee開源技術(shù)背后的創(chuàng)新

    這兩年,隨著開源技術(shù)在國內(nèi)的普及,越來越多用戶開始接觸到開源產(chǎn)品。技術(shù)的精進,使產(chǎn)品也發(fā)生了翻天覆地的變化。一些產(chǎn)品正在顛覆你的想象,比如ArduBee: ArduBee是什么?是一款
    的頭像 發(fā)表于 04-12 16:41 ?1207次閱讀
    <b class='flag-5'>解讀</b>ArduBee<b class='flag-5'>開源</b><b class='flag-5'>技術(shù)</b>背后的創(chuàng)新

    《2022開源大數(shù)據(jù)熱力報告》重磅發(fā)布

    開放原子開源基金會副秘書長劉京娟對報告進行了深度解讀 。報告基于公開數(shù)據(jù)研究最活躍的102個開源大數(shù)據(jù)項目,探尋出
    的頭像 發(fā)表于 11-06 22:15 ?795次閱讀

    開源“摩爾定律”即將打破《2022開源大數(shù)據(jù)熱力報告》云棲大會上發(fā)布

    京娟女士對報告進行了深度解讀。報告基于公開數(shù)據(jù)研究最活躍的102個開源大數(shù)據(jù)項目,探尋出開源大數(shù)據(jù)
    的頭像 發(fā)表于 11-09 15:07 ?637次閱讀

    前沿開源技術(shù)領(lǐng)域解讀——開源大前端

    WebGPU 是由 W3C GPU for the Web 社區(qū)組所發(fā)布的規(guī)范,目標(biāo)是允許網(wǎng)頁代碼以高性能且安全可靠的方式訪問 GPU 功能。WebGPU 是一套為瀏覽器設(shè)計的次時代圖形 API 標(biāo)準(zhǔn),為了彌合各個平臺圖形 API 的差異性
    的頭像 發(fā)表于 02-13 10:45 ?1046次閱讀

    誠邀報名|黃向東邀您共話開源工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)

    提供了堅實的技術(shù)基礎(chǔ)。 在推進 新型工業(yè)化建 設(shè)的征程 中, 應(yīng)對各種復(fù) 雜的 工業(yè)場 景,亟 需在 底層操作系統(tǒng)、物聯(lián) 網(wǎng)數(shù)據(jù)采集、數(shù)據(jù)管 理以及數(shù)據(jù)分 析應(yīng)用等 全生命周期取得 軟
    的頭像 發(fā)表于 12-05 19:35 ?545次閱讀
    誠邀報名|黃向東邀您共話<b class='flag-5'>開源</b>工業(yè)物聯(lián)網(wǎng)<b class='flag-5'>大數(shù)據(jù)</b>

    誠邀報名|黃向東邀您共話開源工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)

    堅實的技術(shù)基礎(chǔ)。在推進新型工業(yè)化建設(shè)的征程中,應(yīng)對各種復(fù)雜的工業(yè)場景,亟需在底層操作系統(tǒng)、物聯(lián)網(wǎng)數(shù)據(jù)采集、數(shù)據(jù)管理以及數(shù)據(jù)分析應(yīng)用等全生命周期取得軟件
    的頭像 發(fā)表于 12-20 16:54 ?370次閱讀
    誠邀報名|黃向東邀您共話<b class='flag-5'>開源</b>工業(yè)物聯(lián)網(wǎng)<b class='flag-5'>大數(shù)據(jù)</b>
    主站蜘蛛池模板: 草莓国产视频免费观看| 交换:年轻夫妇-HD中文字幕| 亚洲AV久久无码精品蜜桃| 恋夜秀场支持安卓版全部视频国产| 成人永久免费视频网站在线观看| 亚洲无码小格式| 日本熟妇乱人伦A片精品软件| 精品手机在线视频| 粉嫩自拍 偷拍 亚洲| 8050午夜二级一片| 亚洲 综合 自拍 精品 在线| 强被迫伦姧惨叫VIDEO| 久久视频在线视频| 国内精品蜜汁乔依琳视频| 超污视频带污疼免费视频| 中文成人在线视频| 亚洲精品天堂无码中文字幕影院| 日本精品久久久久中文字幕 1| 捆绑调教网站| 精品高潮呻吟99AV无码| 国产爱豆剧果冻传媒在线| 99久久伊人一区二区yy5o99 | 亚洲精品拍拍央视网出文| 秋霞伦理电影在2017韩国在线伦| 久久精品AV麻豆| 国产一区二区三区内射高清| 富婆夜店找黑人猛男BD在线 | 美娇妻的性奴史1一4| 精品一区二区三区四区五区六区 | 绝对诱惑在线试听| 国产在线精品亚洲观看不卡欧美| 高清观看ZSHH96的视频素材| brazzers情欲狂欢| 99热久久这里只有精品视频| 131美女爱做视频午夜剧场| 亚洲色 图| 亚洲中文在线偷拍| 亚洲日韩在线观看| 亚洲视频精品| 夜色女人香| 亚洲综合香蕉在线视频|