Hadoop理論與實踐/大數(shù)據(jù)人工智能系列叢書
定 價:58 元
叢書名:大數(shù)據(jù)人工智能系列叢書
- 作者:李平 著,北京百里半網(wǎng)絡技術有限公司 編
- 出版時間:2021/1/1
- ISBN:9787302559504
- 出 版 社:清華大學出版社
- 中圖法分類:TP274
- 頁碼:217
- 紙張:膠版紙
- 版次:1
- 開本:16開
《Hadoop理論與實踐/大數(shù)據(jù)人工智能系列叢書》按照高等學校大數(shù)據(jù)、人工智能課程基本要求,以案例驅動的形式來組織內容,突出該課程的實踐性特點。
《Hadoop理論與實踐/大數(shù)據(jù)人工智能系列叢書》主要包含四大部分:Hadoop技術、數(shù)據(jù)倉庫與Hive、Flume分布式日志處理系統(tǒng)、Spark及其生態(tài)圈概述。其中,Hadoop技術包括大數(shù)據(jù)與數(shù)據(jù)分析、Hadoop生態(tài)系統(tǒng)介紹、Hadoop存儲、Hadoop計算之MapReduce、Hadoop安全等;數(shù)據(jù)倉庫與Hive包括Hive與數(shù)據(jù)庫的基礎知識、Hive的高級特性、Hive優(yōu)化及案例的應用;Flume分布式日志處理系統(tǒng)包括Flume介紹、Flume使用案例及Flume開發(fā)案例的應用;Spark及其生態(tài)圈概述包括Spark簡介及Spark生態(tài)系統(tǒng)詳解。
《Hadoop理論與實踐/大數(shù)據(jù)人工智能系列叢書》內容安排合理,層次清晰,通俗易懂,實例豐富,突出理論與實踐的結合,可作為各類高等院校人工智能與大數(shù)據(jù)相關專業(yè)的教材,也可供廣大程序設計人員參考。
大數(shù)據(jù)是什么?在過去的十年間,恐怕沒有一個詞比大數(shù)據(jù)更高頻了,也沒有一個概念如大數(shù)據(jù)一樣,眾說紛紜。2014年,阿里巴巴集團總裁馬云提出,“人類正從IT時代走向DT時代”。DT(data technology)時代,以服務大眾、激發(fā)生產力為主。以物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)和人工智能為代表的新技術革命正在滲透至各行各業(yè),改變著我們的生活。
Hadoop是Apache軟件基金會下的一個頂級項目,它是目前大數(shù)據(jù)行業(yè)的基礎支撐。Hadoop改變了大數(shù)據(jù)的存儲、處理和分析的過程,強有力地驅動了大數(shù)據(jù)行業(yè)的發(fā)展,形成了自己的生態(tài)圈。
本書對Hadoop的架構、原理和生態(tài)系統(tǒng)組成進行了詳細的解讀,結構清晰,對于需要詳細了解和應用Hadoop的讀者是一個不錯的選擇。
本書是北京百里半網(wǎng)絡技術有限公司所編著的“大數(shù)據(jù)人工智能系列叢書”中的一本,它為該系列的其他幾本專業(yè)教材提供了大數(shù)據(jù)入門的支撐。
本書凝聚了編委會多年來的教學經驗和成果,內容安排合理,層次清晰,通俗易懂,實例豐富,突出理論和實踐相結合,可作為各類高等院校教材,也可供廣大程序設計人員參考。
本書由北京百里半網(wǎng)絡技術有限公司和李平老師編著。本書編者長期從事項目開發(fā)和教學實施,并且對當前高校的教學情況非常熟悉,在編寫過程中充分考慮到不同學生的特點和需求,加強了項目實戰(zhàn)方面的教學。在本書的編寫過程中,得到了武漢厚溥教育科技有限公司各級領導的大力支持,在此對他們表示衷心的感謝。
北京百里半網(wǎng)絡技術有限公司,武漢厚溥企業(yè)集團成員單位,致力于互聯(lián)網(wǎng)相關信息技術產品和服務的研究與開發(fā),以及在線教育行業(yè)產品、服務的集成運營。公司擁有雄厚的具備學術、教育及產業(yè)背景的研發(fā)團隊。
公司為政府、高校、企業(yè)等提供極具競爭力的產品服務。在人工智能、大數(shù)據(jù)及IT運維、互聯(lián)網(wǎng)用戶行為分析、在線教育等領域推出了自有知識產權的獨特而領先的產品,為公司的持續(xù)發(fā)展奠定了堅實的基礎。
北京百里半網(wǎng)絡技術有限公司長期以來堅持并弘揚“以人為本,本在心;以厚為道,道在行。創(chuàng)造機遇,成就潛能。IT成就**潛能”的企業(yè)文化,努力成為值得客戶信賴的、具有獨特價值的優(yōu)秀企業(yè),并使之基業(yè)長青。
李平,男,1981年出生,工學博士,任教于黃岡師范學院數(shù)學與統(tǒng)計學院。主要研究方向為大數(shù)據(jù)技術與應用、數(shù)學建模等,有豐富的高校教學經驗與企業(yè)實踐經歷,發(fā)表科研論文十余篇,主持參與省部級科研項目三項,多次指導本?茖W生及研究生參加數(shù)據(jù)挖掘競賽、數(shù)學建模競賽并獲得***獎項。
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)與數(shù)據(jù)分析
1.1.1 Hadoop的基礎組件
1.1.2 Hadoop分布式文件系統(tǒng)
1.1.3 MapReduce
1.1.4 YARN
1.2 ZooKeeper
1.3 HiVe
1.4 與其他系統(tǒng)集成
1.4.1 Hadoop生態(tài)系統(tǒng)
1.4.2 數(shù)據(jù)集成與Hadoop
1.4.3 Hadoop商用平臺CDH
第2章 Hadoop存儲
2.1 HDFS的基礎知識
2.1.1 HDFS概念
2.1.2 架構
2.1.3 接口
2.2 在分布式模式下設置HDFS集群
2.3 HDFS的高級特性
2.3.1 快照
2.3.2 離線查看器
2.3.3 分層存儲
2.4 文件格式
2.5 云存儲
第3章 數(shù)據(jù)倉庫和Hive
3.1 數(shù)據(jù)倉庫和Hive簡介
3.1.1 數(shù)據(jù)倉庫簡介
3.1.2 數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別
3.1.3 Hive簡介
3.1.4 查看CDH中Hive版本
3.2 Hive與數(shù)據(jù)庫
3.2.1 Hive與RDBMS
3.2.2 HiveQL與SQL
3.3 Hive的高級特性
3.3.1 Hive的優(yōu)缺點和適用場景
3.3.2 Hive進程介紹
3.3.3 Hive訪問方式
3.3.4 Hive體系結構
3.3.5 HiveMetastore
3.3.6 Hive數(shù)據(jù)類型
3.3.7 Hive的常用參數(shù)配置
3.3.8 Hive的數(shù)據(jù)模型
3.3.9 Hive函數(shù)
3.4 案例演示
3.4.1 準備數(shù)據(jù)
3.4.2 修改和查詢
3.4.3 表連接
3.4.4 創(chuàng)建視圖
3.4.5 創(chuàng)建索引
3.4.6 JDBC開發(fā)
3.4.7 UDF的開發(fā)
3.4.8 UDAF
3.5 Hive優(yōu)化和Hive中的鎖
3.5.1 注意事項
3.5.2 Hive鎖
3.6 問題匯總
……
第4章 Hadoop計算
第5章 Hadoop安全
第6章 Flume分布式日志處理系統(tǒng)
第7章 Spark及其生態(tài)圈概述