色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AWS數據湖怎么脫穎而出的

汽車玩家 ? 來源:大數據在線 ? 作者:大數據在線 ? 2020-04-12 19:34 ? 次閱讀

數據湖,是一個并不新穎卻越來越被用戶看重的名詞。

從2010年Pentaho公司的創始人兼首席技術官詹姆斯·狄克遜(James Dixon)首次提出數據湖的概念開始,數據湖十年發展之路可謂是兜兜轉轉、起起伏伏。在這期間,既有開源廠商們提出的各種營銷理念,也有傳統存儲廠商打造的各類解決方案,更有業界對于數據湖帶來的數據沼澤、數據價值探索等問題的深入思考。

時至如今,數據湖雖然經歷了各種各樣的“挫折”,但是數據湖在數字化時代給用戶帶來的價值已經愈發清晰。而率先幫助用戶走出數據湖價值落地之路的,不是開源廠商,也不是傳統存儲廠商,恰恰是以AWS為代表的云服務提供商們。

這背后有何緣由?這一切還得從數據湖的本質談起。

數據湖的價值凸顯

維基百科對于數據湖的定義是:“Data Lake是一個以原始格式存儲數據的存儲庫或系統。它按原樣存儲數據,而無需事先對數據進行結構化處理。一個數據湖可以存儲結構化數據、非結構化數據以及二進制數據等。”

數據湖最大的價值在于可以幫助用戶梳理清楚從數據存儲、數據匯聚到數據挖掘這些過程。比如,相比于數據倉庫對于數據協作有規則限制,數據湖對于數據寫入沒有限制,可以更容易的收集數據;數據湖可以匯聚來自各種數據源的數據,并進行數據拉通,從而消除數據孤島的問題;而數據湖中存放著最原始的數據則更加有利于數據價值的挖掘。

千萬不要小看數據湖所能完成的這些數據處理過程。這些都是用戶們在數字化時代發揮數據價值所必不可少的基礎。時至今日,數據其實已經成為數字化時代的一種最為重要的生產資料,數據正在加速重塑企業與組織的生產、經營、銷售、服務等流程,就如AWS首席云計算企業戰略顧問張俠所指出的:“在當今企業中,數據流就是企業的血液流,企業的數字化轉型很重要的一個方向就是把數字化的資產好好利用起來。”

數據湖成為大勢所趨

與此同時,數據湖在過去十年并不缺乏產品與解決方案,為何數據湖失敗的案例依然不少,為何又是以AWS為代表的云服務提供商們率先走在數據湖解決方案落地的最前沿?

事實上,作為很早推動數據湖服務的公司,AWS的數據湖解決方案成功并不是偶然。首先,Amazon作為全球最大的互聯網公司之一,其數據規模、數據復雜度、數據處理難度、數據價值挖掘在業界無出其右,由于背靠Amazon,AWS數據湖解決方案天然就得到了不斷的歷練,比如Amazon內部一個數據湖部署--Galaxy,就存儲了超過50PB的數據量,每天進行著多達60萬的數據分析任務。

其次,AWS數據湖在產品技術層面進行了持續的提升與完善,其產品組合的成熟度和豐富程度走在了業界的前列。舉個例子,大部分數據湖解決方案都是基于開源Hadoop的,但之前Hadoop集群的計算和存儲緊耦合架構,使得數據湖架構的擴展成本高、效率低;而AWS在構建數據湖解決方案時候,很重要的一個選擇就是讓計算與存儲分離,在存儲上采用S3對象存儲服務,從而讓數據湖解決方案可以更好地應用在用戶業務領域。

另外,AWS作為云計算市場的龍頭,其公有云的環境也有利于數據湖解決方案的部署,在過去十年中為多個不同行業、不同規模的用戶提供相關的數據湖服務,積累了豐富的用戶實踐經驗。

在產品、解決方案以及用戶實踐上的領先其實就是AWS在數據湖領域脫穎而出的秘訣所在。

十年之后,AWS描繪出數據湖全景圖

從十年前的概念到如今被越來越多行業用戶所認同和采用,數據湖如今不再只是一個名詞,它更代表著一種進化,它是過去十年數字化驅動下,用戶在數據層面的需求、技術、產品不斷進化的一個縮影。

過去十年移動化、社交化帶來了數據指數級增長、數據來源廣泛化、數據類型多元化,而像5G物聯網、邊緣計算的興起,只會加劇數據應用的趨勢,并且會讓現代數據應用的復雜性進一步提升,這恰恰反映出用戶過去十年對數據應用的需求不斷驅動著數據湖走向落地。

在技術層面來看,云計算、大數據以及人工智能具備天然融合在一起的屬性,云計算無疑是過去十年對整個IT產業界帶來最大變革的技術,它的彈性、靈活為數據湖帶來了堅實的基礎;而人工智能在過去幾年取得突破性的發展,使之成為驅動數據湖發展的最大驅動力之一。

而過去十年也是數據湖產品與解決方案不斷走向成熟的十年。像AWS這樣的供應商已經逐步打造出非常全面與完善的數據湖解決方案,可以涵蓋從數據收集、匯聚到分析、應用、可視化等方方面面。“數據湖從2014年進入了發展的第二個階段。以AWS為例,圍繞數據湖相關的技術、產品已經基本成熟。”張俠如是說。

根據介紹,AWS數據湖平臺包括了數據倉庫、大數據處理、交互查詢、運營分析、數據交換、可視化、實時分析、推薦、預測分析。事實上,AWS這種全面的數據湖生態完整覆蓋了數據湖的數據收集、存儲、分析、應用四個階段,并且這些產品、工具以及服務彼此之間并不是孤立的,互相配合可以達到更加出色效果,快速、便捷地幫助用戶構建起數據湖相關應用。

AWS擁有涵蓋全面的數據分析組件

在AWS 數據湖平臺中有很多非常出色的組件,可以幫助用戶解決數據湖中典型的挑戰。比如,Amazon EMR大數據處理組件,可以在AWS上輕松運行Spark、Hadoop、Hive等大數據分析。EMR解決了開源生態集群部署與維護升級繁雜的痛點,這對于用戶快速應用數據湖開源產品與工具大有裨益,

而 Amazon Redshift是一款性能優秀、強大、使用簡單、全托管的數據倉庫服務,可以輕松進行大規模并行處理,支持TB級規模數據的擴展,可以通過Spectrum引起將查詢擴展到Amazon S3,與數據湖集成可以進行EB級的數據湖分析。

其他像Amazon Kinesis、AWS Lake Formation、Amazon Aurora、Amazon S3等都是AWS上深受用戶喜歡的產品與服務。張俠認為:“數據湖在云計算時代得以快速發展,它發展到現在已經包含了所有的數據庫、數據倉庫等服務,是企業數據體系的基礎。數據湖其實比國內流行的數據中臺更加全面,任何想構建數據中臺的企業其實都可以在AWS找到全面的解決方案。”

多款新品落地,AWS加速中國數據湖應用

在中國市場,各個行業用戶對于數據湖也是經歷了一個從認知到認可的過程。張俠坦言,當前中國市場的數據湖應用依然處于早期階段,整個市場有著非常大的潛力。

中國數據湖市場之所以是一個重要且廣闊的市場,無外乎三點:

首先,中國對于數字經濟的重視程度超乎想象,從國家政策還是企業自身都對于發展數字經濟有著廣泛的共識,數字經濟加速推動了各個行業的數字化進程。根據IDC《數據時代2025》白皮書預測,中國數據量預計在未來7年將每年平均增長30%,位居世界第一,隨之而來的就是對于數據存儲、匯聚、分析越來越多的需求。

其次,在經歷了多年的“企業上云”之后,各行各業對于云計算的認知和認可已經形成,在企業加速上云這個過程中,數據湖作為與云計算天然緊密聯系在一起的應用,其實已經具備了非常好的基礎設施環境,用戶在上云之后逐步采用數據湖服務也是順勢而為。

再次,中國市場在5G、人工智能、物聯網等領域的步伐快速,尤其是5G商用所帶來的云計算、通信、大數據、人工智能等多項技術走向融合,未來在各個行業中會催生出更多新的現代化數據應用場景,數據湖在這個過程中將會起到重要的支撐作用。

AWS在數據湖領域深厚的積累有助于推動中國數據湖應用落地

據悉,針對中國市場,AWS近期在中國兩個區域陸續上線了多款重磅級的新產品與新服務,其中就包括AWS Glue和Amazon Athena兩款跟數據湖相關的服務。張俠透露:“AWS中國之后會陸續上線數據湖相關的產品與服務。隨著越來越多服務落地中國,中國區用戶可以在短短幾天之內完成數據湖的建立工作。”

例如,AWS Glue是數據湖應用中一款非常重要的服務,它可以幫助用戶建立起無服務器架構的數據目錄和ETL服務,自動發現數據并存儲Schema,與AWS上運行的Aurora、RDS、Redshift、S3和數據庫引擎天然集成,這將給用戶在使用數據湖帶來巨大好處。舉個例子,用戶之前想將數據導入Redshift云數據倉庫,之前需要自己寫ETL管道,非常不方便,如今有了AWS Glue能夠快速完成數據的抽取、轉換和加載。

“中國市場的確是到了該好好研究與使用數據湖的階段了,尤其是5G、邊緣計算應用上來之后,在數據層面更應該匹配走數據湖這條路。”張俠最后表示道。

總體而言,數據湖一晃已經走過了十年,從一個概念逐步走向落地。在這十年中,以AWS為代表云服務提供商們真是洞悉了用戶在數據湖上的需求,并且圍繞數據湖打造出來的一系列全面的產品體系,使得數據湖真正走出了一條價值之路。

十年意味著一個階段的結束,也預示著下一個階段的開啟。數據湖在未來會有更大的舞臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AWS
    AWS
    +關注

    關注

    0

    文章

    431

    瀏覽量

    24355
收藏 人收藏

    評論

    相關推薦

    喜報!全國首批!賽思成功獲選國家級專精特新重點“小巨人”企業!

    萬里挑一!賽思從16000多家專精特新“小巨人”企業中脫穎而出,榮獲國家級專精特新“重點小巨人企業。
    的頭像 發表于 12-05 11:46 ?334次閱讀
    喜報!全國首批!賽思成功獲選國家級專精特新重點“小巨人”企業!

    重磅!賽思榮膺投資家網“2024年度最具投資價值企業TOP100”!

    入選率僅2%!賽思憑借在時鐘同步及混合數模領域的卓絕表現,從4600余家企業中脫穎而出
    的頭像 發表于 12-03 18:52 ?176次閱讀
    重磅!賽思榮膺投資家網“2024年度最具投資價值企業TOP100”!

    尼爾森數據背后:Shokz韶音如何在全球運動耳機市場脫穎而出

    全球市場調研機構尼爾森,近日在巴黎馬拉松期間發布了Sport2024調研報告。數據表明,68%的消費者在跑步時有聽音樂的習慣,而在消費者跑步時最常佩戴的耳機品牌中,蘋果、韶音等榜上有名。其中,定位
    的頭像 發表于 11-18 14:53 ?247次閱讀
    尼爾森<b class='flag-5'>數據</b>背后:Shokz韶音如何在全球運動耳機市場<b class='flag-5'>脫穎而出</b>

    國產MCU廠商,靠什么從內卷中脫穎而出

    的競爭日益激烈,價格戰已成常態,MCU市場亦不例外。SIA數據顯示,中國MCU市場占全球25%左右。盡管市場規模龐大,但國內MCU廠商的產品主要集中在中低端市場,同質
    的頭像 發表于 10-22 16:20 ?308次閱讀
    國產MCU廠商,靠什么從內卷中<b class='flag-5'>脫穎而出</b>?

    NAS求變,“0成本、低門檻”的魯大師能否脫穎而出

    多年來,NAS不斷集成新技術,諸如硬盤容量提升、用于數據保護的RAID技術配置、引入家用級NAS設備等。到21世紀初,NAS系統開始支持多種協議、并提供諸如遠程訪問、自動備份解決方案等特性。至此,NAS革命的舞臺已經搭建完畢。
    的頭像 發表于 09-24 09:26 ?260次閱讀
    NAS求變,“0成本、低門檻”的魯大師能否<b class='flag-5'>脫穎而出</b>?

    三星貼片電容CL10B104KA85PN 0603/100nF/25Vdc/X7R --芯引力產品中心

    芯引力貼片電容 電子元器件一站式配單 助您SMT 貼片加工的產品脫穎而出
    的頭像 發表于 08-07 16:37 ?243次閱讀

    美光發布全新數據中心SSD

    近日,全球領先的存儲解決方案提供商美光科技股份有限公司宣布了一項重大創新成果——美光9550 NVMe? SSD的正式推出。這款專為數據中心設計的高端存儲產品,以業界領先的性能表現脫穎而出,同時在處理AI工作負載時展現出非凡的能效與穩定性。
    的頭像 發表于 07-30 16:41 ?636次閱讀

    NAS設備鐵威馬F4-424是如何從市場中脫穎而出

    簡便又性能卓越的家用NAS,成為了眾多家庭面臨的難題。今天,我們將聚焦于鐵威馬F4-424這款NAS設備,探討它是如何憑借其出色的性能與易用性,在家用NAS市場中脫穎而出,成為家庭用戶的理想之選。
    的頭像 發表于 07-18 17:28 ?772次閱讀

    運動相機為什么會脫穎而出

    ? 01 運動相機為什么會脫穎而出 與傳統相機或手機拍攝相比,運動相機具備防水和耐沖擊的特性,適合在戶外活動中使用。運動相機通常具有的廣角鏡頭、高分辨率和高幀率的功能,可以拍攝的范圍更廣,畫面也更
    的頭像 發表于 06-27 16:01 ?645次閱讀
    運動相機為什么會<b class='flag-5'>脫穎而出</b>

    通過在AWS發布命令,讓io的電平狀態上報給AWS,為什么上傳的同時一模一樣的數據在串口調試助手打印?

    我在平臺上發布命令4.png 通過回調函數判斷是否上報數據1.png 判斷io的狀態并把數據上傳到AWS2.png 但為什么上傳的同時一模一樣的數據在串口調試助手打印? : esp32
    發表于 06-20 06:09

    新一代驅動器產品,PI SCALE-iFlex? XLT如何脫穎而出

    即插即用!作為新一代驅動器產品,看SCALE-iFlex? XLT如何以其獨特的設計和出色的性能,在市場中脫穎而出! 在電力電子領域,高效、緊湊且安全的門極驅動器產品設計一直是研發的焦點。隨著儲能
    的頭像 發表于 05-27 14:55 ?311次閱讀
    新一代驅動器產品,PI SCALE-iFlex? XLT如何<b class='flag-5'>脫穎而出</b>?

    什么是數據數據數據倉庫有什么區別?

    從本質上說,數據就是一個信息資源庫。人們常常將數據數據倉庫混為一談,但兩者在架構和滿足的業務需求上都不一樣。尤其是,隨著社交媒體
    的頭像 發表于 05-20 12:38 ?606次閱讀
    什么是<b class='flag-5'>數據</b><b class='flag-5'>湖</b>?<b class='flag-5'>數據</b><b class='flag-5'>湖</b>和<b class='flag-5'>數據</b>倉庫有什么區別?

    慧視圖像處理板 究竟憑什么脫穎而出

    市面上的圖像處理板有很多,如何通過分析獲得自己滿意的產品,從而減少自身項目的開發時間,是一個重要的過程。如果你有圖像處理板的需要,那么這篇短文你應該往下看一看!經驗豐富成都慧視光電多年來一直致力于圖像處理板的開發應用,有著超十年開發經驗的團隊成員,能夠快速進行軟硬件的模塊化集成,定制出符合行業需求的圖像處理板。曾服務過安防巡檢、鐵路、空港、高校研究院、事業研
    的頭像 發表于 04-30 08:29 ?435次閱讀
    慧視圖像處理板  究竟憑什么<b class='flag-5'>脫穎而出</b>?

    stm32 AWS云連接怎么使用?

    stm32 AWS云連接怎么使用,官方的擴展包看不明白
    發表于 04-01 07:21

    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎

    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎而出 隨著AI時代的到來,人們對于人工智能的需求越來越迫切。 在這個競爭激烈的時代里,如果你不懂得使用AI技術,很有可能被淘汰出局。 而訊
    的頭像 發表于 03-25 13:37 ?548次閱讀
    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代<b class='flag-5'>脫穎</b>
    主站蜘蛛池模板: 精品无码久久久久久久动漫| 暖暖视频中国在线观看免费韩国| 最近高清日本免费| 色偷偷777| 久久一er精这里有精品| 高清视频在线观看SEYEYE| 伊人影院香蕉久在线26| 无套内射CHINESEHD| 年轻夫妇韩剧中文版免费观看 | 伊人伊人伊人| 午夜AV内射一区二区三区红桃视| 男污女XO猛烈的动态图| 火影忍者高清无码黄漫| 国产AV一区二区三区传媒| SM脚奴调教丨踩踏贱奴| 在线自拍亚洲视频欧美| 一本道久在线综合色姐| 亚洲国产在线2020最新| 亚洲裸舞 hd| 亚洲成人免费在线| 小寡妇好紧进去了好大看视频 | 荡公乱妇HD中文字幕| 亚洲精品www久久久久久| 欧美日韩在线亚洲一| 精品欧美一区二区三区久久久 | 老师给美女同学开嫩苞| 久久免费视频1| 麻豆产精品一二三产区区| 美女内射少妇一区二区四区| 久久久久久九九| 老司机福利在视频在ae8| 芒果视频看片在线观看| 首页_亚洲AV色老汉影院| 十八禁啪啦啪漫画| 无码人妻视频又大又粗欧美| 香蕉尹人综合精品| 影音先锋 av天堂| jzz大全18| 黄色免费在线网址| 男人J桶女人P视频无遮挡网站| 青娱乐视觉盛宴国产视频|