![]() ![]() |
Cloudera Hadoop大數(shù)據(jù)平臺實(shí)戰(zhàn)指南
對于入門和學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者來說,大數(shù)據(jù)技術(shù)的生態(tài)圈和知識體系過于龐大,可能還沒有開始學(xué)習(xí)就已經(jīng)陷入眾多的陌生名詞和泛泛的概念中。本書的切入點(diǎn)明確而清晰,從Hadoop 生態(tài)系統(tǒng)的明星 Cloudera 入手,逐步引出各類大數(shù)據(jù)基礎(chǔ)和核心應(yīng)用框架。
本書分為18章,系統(tǒng)介紹Hadoop 生態(tài)系統(tǒng)大數(shù)據(jù)相關(guān)的知識,包括大數(shù)據(jù)概述、Cloudera Hadoop平臺的安裝部署、HDFS分布式文件系統(tǒng)、MapReduce計(jì)算框架、資源管理調(diào)度框架YARN 、Hive數(shù)據(jù)倉庫、數(shù)據(jù)遷移工具Sqoop、分布式數(shù)據(jù)庫HBase、ZooKeeper分布式協(xié)調(diào)服務(wù)、準(zhǔn)實(shí)時(shí)分析系統(tǒng)Impala、日志采集工具Flume、分布式消息系統(tǒng)Kafka、ETL工具Kettle、Spark計(jì)算框架等內(nèi)容,最后給出兩個(gè)綜合實(shí)操案例,以鞏固前面所學(xué)的知識點(diǎn)。 本書既適合Hadoop初學(xué)者、大數(shù)據(jù)技術(shù)工程師和大數(shù)據(jù)技術(shù)愛好者自學(xué)使用,亦可作為高等院校和培訓(xùn)機(jī)構(gòu)大數(shù)據(jù)相關(guān)課程的培訓(xùn)用書。
你還可能感興趣
我要評論
|