很多人都認為大數據應用程序是IT行業的未來,Hadoop是開發大數據應用程序最常用的技術之一。Hadoop 最早誕生于 2006 年,并在2008年成為Apache頂級項目,至今,Hadoop已經走過了12個年頭,這對于任何軟件的生命周期來說是很長的。
雖然早有唱衰Hadoop的聲音,但許多國內外企業的大數據平臺用到了非常多的 Hadoop 生態組件,因此,Hadoop技術并非老矣。話說回來,學習Hadoop并使用它并不容易,要掌握這項技術并成為一名成功的開發人員,你可能需要一些好書來助你一臂之力
在本文,我收集了一系列最好的Hadoop書籍,這些書籍可以幫助你更輕松的上手這項技術:
1、《Hadoop: The Definitive Guide》
本書對于那些需要分析數據集和建立Hadoop集群的程序員來說,絕對是一本理想指南,它將教你如何使用Apache Hadoop構建和維護可靠的、可伸縮的分布式系統。還有一些關于YARN的章節以及與Hadoop相關的幾個項目(包括 Parquet, Flume, Crunch, and Spark),你將可以通過本書挖掘Hadoop構建分布式數據集的強大功能。
2、《Hadoop Explained》
本書主要向讀者介紹Hadoop的基本概念,通過本書你將學到的有:
Hadoop組件的基礎知識
如何使用MapReduce
Yarn基礎知識
使用HDFS Federation
Hadoop的優勢
Hadoop如何處理大數據
3、《Programming Hive》
這是一本全面的指南,通過它你將了解Hive在Hadoop生態系統中的工作方式,并了解如何在你的環境中設置和配置Hive。它還提供了真實的案例研究,幫助你解決大數據相關的疑難雜癥。
4、《Modern Big Data Processing with Hadoop》
本書對Hadoop組件進行了一個全面的解釋,使你能夠使用Hadoop設計、構建和執行有效的大數據分析。如果你想成為一名Hadoop架構專家,這將是你必讀的一本書,通過它你將學到:
企業數據架構原則
Hadoop與Apache Spark、Elasticsearch等多種大數據框架結合使用
使用Apache Ambari設置和部署大數據環境
使用Spark開發大規模數據處理解決方案
理解Hadoop管理和集群部署
5、《Hadoop Security》
美亞評分4.5。如果你更關注Hadoop的安全性,那么你應該閱讀這本書,它展示了在安全漏洞發生時,如何制止攻擊者破壞和修改數據的解決辦法,從本書你將學到:
如何構建安全的Hadoop集群硬件
數據提取和客戶端訪問安全性
6、《Data Analytics with Hadoop》
美亞評分4.0。本書同樣是介紹Hadoop生態圈技術的指南書籍,它向你展示了如何利用Hadoop在大數據集上使用統計和機器學習技術。你將從這本書中學到
理解Hadoop和集群計算的基本概念
使用Spark進行內存計算
使用Apache Hive和HBase執行數據挖掘和存儲
使用高級API進行分析
使用Spark的MLlib進行機器學習
7、《Expert Hadoop Administration》
美亞評分4.3。對于希望在任何環境中創建、配置、保護、管理和優化Hadoop集群的Hadoop管理員來說,本書絕對是一本很棒的書。這本書解釋了復雜的Hadoop環境,并向你展示了在管理集群時背后的原理,并對問題和解決方案進行詳細的解釋。
8、《Architecting Modern Data Platforms》
美亞評分滿分5分。如果你是一位希望構建端到端企業數據平臺的企業架構師或數據工程師,那么,這本書將是你的必備指南。這本書將教你如何將Hadoop這樣的大數據技術應用到你的大數據應用程序當中去,并學會在本地和云中構建大數據平臺
9、《Practical Hive》
美亞評分滿分5分。對于希望將關系數據庫遷移到Hadoop的人來說,這本書絕對是必讀書籍,本書由數據庫專家和大數據專家共同撰寫,具體內容包括:Hive的安裝和配置,其核心組件和架構,Hive數據操作語言,如何加載、查詢和分析數據,Hive的性能調優以及安全性,等等。
10、《Hadoop 2.x Administration Cookbook》
這是一本入門書籍,它將通過示例逐步解釋如何將數據導入和導出到Hive,并使用Oozie管理工作流。它還提供了實用的方法來保護Hadoop集群,并使其高度可用。通過它,入門Hadoop應該是沒有什么大問題。
-
數據集
+關注
關注
4文章
1208瀏覽量
24764 -
Hadoop
+關注
關注
1文章
90瀏覽量
15995 -
大數據
+關注
關注
64文章
8902瀏覽量
137599
原文標題:書來了 | 2019年了,12歲的Hadoop還值得你學習么?
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論