大數(shù)據(jù)與人工智能導(dǎo)論 第二版
定 價(jià):98 元
- 作者:姚海鵬 王露瑤 劉韻潔 買(mǎi)天樂(lè)
- 出版時(shí)間:2020/11/1
- ISBN:9787115547330
- 出 版 社:人民郵電出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:194
- 紙張:
- 版次:02
- 開(kāi)本:16開(kāi)
本書(shū)主要涉及數(shù)據(jù)工程與人工智能算法原理、大數(shù)據(jù)平臺(tái)技術(shù)、人工智能算法在大數(shù)據(jù)平臺(tái)上的實(shí)現(xiàn)等,共7章。第1章介紹大數(shù)據(jù)與人工智能的歷史、應(yīng)用;第2章介紹數(shù)據(jù)工程;第3章介紹大數(shù)據(jù)平臺(tái);第4章介紹人工智能基礎(chǔ)算法的原理;第5章以第4章為基礎(chǔ),介紹深度學(xué)習(xí)相關(guān)內(nèi)容;第6章介紹當(dāng)前熱門(mén)的強(qiáng)化學(xué)習(xí)技術(shù);第7章為數(shù)據(jù)分析與深度學(xué)習(xí)項(xiàng)目實(shí)踐。
本書(shū)可作為希望快速了解和入門(mén)大數(shù)據(jù)與人工智能領(lǐng)域知識(shí)的本科生、研究生的參考書(shū),也可供互聯(lián)網(wǎng)領(lǐng)域中對(duì)人工智能算法感興趣的工程技術(shù)人員參考使用。
對(duì)如何快速把握大數(shù)據(jù)與人工智能的精髓、避免陷入過(guò)多的數(shù)學(xué)細(xì)節(jié)推導(dǎo)的問(wèn)題,以及人工智能算法和大數(shù)據(jù)平臺(tái)技術(shù)的結(jié)合問(wèn)題,本書(shū)作者做出了不懈探索。
1.選材上,不僅分別單獨(dú)講授人工智能和大數(shù)據(jù),還突出兩者相結(jié)合的內(nèi)容。
2.內(nèi)容上,突出淺顯易懂,繁雜的數(shù)學(xué)推導(dǎo)適當(dāng)做減法,宏觀的介紹和實(shí)戰(zhàn)技能適當(dāng)做加法。
3.結(jié)構(gòu)上,由淺入深,由宏觀到比微觀,由基礎(chǔ)知識(shí)到新技術(shù),由理論到實(shí)踐。
本書(shū)主要突出優(yōu)點(diǎn)如下:
1.知識(shí)點(diǎn)覆蓋全。本書(shū)共七章,對(duì)大數(shù)據(jù)與人工智能領(lǐng)域的常用基礎(chǔ)技術(shù)、算法、模型均有介紹,保障讀者知識(shí)體系的完整性。
2.知識(shí)點(diǎn)覆蓋新。本書(shū)緊跟本領(lǐng)域最新研究成果。尤其重點(diǎn)介紹了深度學(xué)習(xí)基礎(chǔ)知識(shí)及其應(yīng)用。深度學(xué)習(xí)是當(dāng)前人工智能領(lǐng)域的潮流和趨勢(shì)。另外,本書(shū)新版所增加的強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)新興起的一個(gè)類(lèi)別,在許多領(lǐng)域都具有重要作用,具有研究?jī)r(jià)值。
3.知識(shí)點(diǎn)難易程度嚴(yán)格控制。有利于讀者構(gòu)建完整、清晰的知識(shí)體系,抓住主干,避免鉆進(jìn)個(gè)別牛角尖。
4.理論與實(shí)戰(zhàn)相結(jié)合。本書(shū)不僅介紹了理論知識(shí),還注重問(wèn)題建模、數(shù)據(jù)分析、算法實(shí)現(xiàn)、模型應(yīng)用等實(shí)戰(zhàn)技能。
5.知識(shí)脈絡(luò)構(gòu)建有特色。本書(shū)認(rèn)為,當(dāng)前人工智能取得重要進(jìn)展的最根本原因是大數(shù)據(jù),絕不能把兩者割裂開(kāi)來(lái)。
姚海鵬,北京郵電大學(xué)副教授, 主要研究方向?yàn)槲磥?lái)網(wǎng)絡(luò)體系架構(gòu)、網(wǎng)絡(luò)大數(shù)據(jù)、物聯(lián)網(wǎng)等。
劉韻潔,中國(guó)工程院院士,現(xiàn)任中國(guó)聯(lián)通科技委主任,兼任國(guó)家信息化專(zhuān)家咨詢(xún)委員會(huì)委員、國(guó)務(wù)院三網(wǎng)融合專(zhuān)家組成員、中國(guó)通信學(xué)會(huì)常務(wù)理事、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)常務(wù)理事,國(guó)家未來(lái)網(wǎng)絡(luò)試驗(yàn)設(shè)施重大科技基礎(chǔ)設(shè)施項(xiàng)目負(fù)責(zé)人,面向服務(wù)的未來(lái)互聯(lián)網(wǎng)體系結(jié)構(gòu)及機(jī)制研究973項(xiàng)目首席科學(xué)家,獲得“2014中國(guó)互聯(lián)網(wǎng)年度人物”特別貢獻(xiàn)獎(jiǎng)。
目 錄
第 1章 緒論 1
1.1 日益增長(zhǎng)的數(shù)據(jù) 1
1.1.1 大數(shù)據(jù)基本概念 1
1.1.2 大數(shù)據(jù)發(fā)展歷程 2
1.1.3 大數(shù)據(jù)的特征 3
1.1.4 大數(shù)據(jù)的基本認(rèn)識(shí) 3
1.2 人工智能 4
1.2.1 認(rèn)識(shí)人工智能 4
1.2.2 人工智能的派別與發(fā)展史 4
1.2.3 人工智能的現(xiàn)狀與應(yīng)用 5
1.2.4 當(dāng)人工智能遇上大數(shù)據(jù) 7
1.3 大數(shù)據(jù)與人工智能的機(jī)遇與挑戰(zhàn) 7
1.3.1 大數(shù)據(jù)與人工智能面臨的難題 7
1.3.2 大數(shù)據(jù)與人工智能的前景 8
第 2章 數(shù)據(jù)工程 10
2.1 數(shù)據(jù)的多樣性 10
2.1.1 數(shù)據(jù)格式的多樣性 10
2.1.2 數(shù)據(jù)來(lái)源的多樣性 11
2.1.3 數(shù)據(jù)用途的多樣性 11
2.2 數(shù)據(jù)工程的一般流程 12
2.3 數(shù)據(jù)的獲取 13
2.3.1 數(shù)據(jù)來(lái)源 14
2.3.2 數(shù)據(jù)采集方法 14
2.3.3 大數(shù)據(jù)采集平臺(tái) 15
2.4 數(shù)據(jù)的存儲(chǔ)與數(shù)據(jù)倉(cāng)庫(kù) 16
2.4.1 數(shù)據(jù)存儲(chǔ) 16
2.4.2 數(shù)據(jù)倉(cāng)庫(kù) 16
2.5 數(shù)據(jù)的預(yù)處理技術(shù) 17
2.5.1 數(shù)據(jù)預(yù)處理的目的 17
2.5.2 數(shù)據(jù)清理 18
2.5.3 數(shù)據(jù)集成 19
2.5.4 數(shù)據(jù)變換 19
2.5.5 數(shù)據(jù)歸約 19
2.6 模型的構(gòu)建與評(píng)估 20
2.6.1 模型的構(gòu)建 20
2.6.2 評(píng)價(jià)指標(biāo) 20
2.7 數(shù)據(jù)的可視化 22
2.7.1 可視化的發(fā)展 22
2.7.2 可視化工具 23
第3章 大數(shù)據(jù)框架 28
3.1 Hadoop簡(jiǎn)介 28
3.1.1 Hadoop的由來(lái) 28
3.1.2 MapReduce和HDFS 28
3.2 Hadoop大數(shù)據(jù)處理框架 30
3.2.1 HDFS組件與運(yùn)行機(jī)制 30
3.2.2 MapReduce組件與運(yùn)行機(jī)制 33
3.2.3 YARN框架和運(yùn)行機(jī)制 34
3.2.4 Hadoop相關(guān)技術(shù) 35
3.2.5 Hadoop的安裝 36
3.3 MapReduce編程 39
3.3.1 MapReduce綜述 39
3.3.2 Map階段 40
3.3.3 Shuffle階段 40
3.3.4 Reduce階段 41
3.4 Spark簡(jiǎn)介 41
3.4.1 Spark概述 41
3.4.2 Spark基本概念 42
3.4.3 Spark生態(tài)系統(tǒng) 42
3.4.4 Spark組件與運(yùn)行機(jī)制 44
3.4.5 Spark的安裝 44
3.5 Storm簡(jiǎn)介 47
3.5.1 Storm概述 47
3.5.2 Storm組件和運(yùn)行機(jī)制 48
3.5.3 Storm的應(yīng)用 50
3.5.4 Storm的安裝 50
3.6 Flink簡(jiǎn)介 53
3.6.1 Flink概述 53
3.6.2 Flink組件和運(yùn)行機(jī)制 54
3.6.3 Flink的應(yīng)用 55
3.6.4 Flink的安裝和實(shí)例講解 56
第4章 機(jī)器學(xué)習(xí)算法 58
4.1 機(jī)器學(xué)習(xí)緒論 58
4.1.1 機(jī)器學(xué)習(xí)基本概念 58
4.1.2 評(píng)價(jià)標(biāo)準(zhǔn) 59
4.1.3 機(jī)器模型的數(shù)學(xué)基礎(chǔ) 61
4.2 決策樹(shù)理論 64
4.2.1 決策樹(shù)模型 65
4.2.2 決策樹(shù)的訓(xùn)練 67
4.2.3 本節(jié)小結(jié) 72
4.3 樸素貝葉斯理論 72
4.4 線性回歸 75
4.5 邏輯斯蒂回歸 77
4.5.1 二分類(lèi)邏輯回歸模型 77
4.5.2 二分類(lèi)邏輯斯蒂回歸的訓(xùn)練 79
4.5.3 Softmax分類(lèi)器 81
4.5.4 邏輯斯蒂回歸和softmax的應(yīng)用 81
4.5.5 本節(jié)小結(jié) 82
4.6 支持向量機(jī) 82
4.6.1 間隔 83
4.6.2 支持向量機(jī)的原始形式 84
4.6.3 支持向量機(jī)的對(duì)偶形式 85
4.6.4 特征空間的隱式映射:核函數(shù) 87
4.6.5 支持向量機(jī)拓展 88
4.6.6 支持向量機(jī)的應(yīng)用 89
4.7 集成學(xué)習(xí) 89
4.7.1 基礎(chǔ)概念 89
4.7.2 Boosting 91
4.7.3 Bagging 94
4.7.4 Stacking 95
4.8 神經(jīng)網(wǎng)絡(luò) 95
4.8.1 生物神經(jīng)元和人工神經(jīng)元 95
4.8.2 感知機(jī) 97
4.8.3 BP神經(jīng)網(wǎng)絡(luò) 98
4.8.4 Sklearn中的神經(jīng)網(wǎng)絡(luò) 100
4.8.5 本節(jié)小結(jié) 101
4.9 聚類(lèi) 101
4.9.1 聚類(lèi)思想 101
4.9.2 性能計(jì)算和距離計(jì)算 101
4.9.3 原型聚類(lèi) 102
4.9.4 密度聚類(lèi) 103
4.9.5 層次聚類(lèi) 104
4.9.6 Sklearn中的聚類(lèi) 105
4.9.7 本節(jié)小結(jié) 105
4.10 降維與特征選擇 105
4.10.1 維數(shù)爆炸與降維 105
4.10.2 降維技術(shù) 106
4.10.3 特征選擇技術(shù) 108
4.10.4 Sklearn中的降維 108
4.10.5 本節(jié)小結(jié) 108
第5章 深度學(xué)習(xí)簡(jiǎn)介 110
5.1 從神經(jīng)網(wǎng)絡(luò)到深度神經(jīng)網(wǎng)絡(luò) 110
5.1.1 深度學(xué)習(xí)應(yīng)用 110
5.1.2 深度神經(jīng)網(wǎng)絡(luò)的困難 111
5.2 卷積神經(jīng)網(wǎng)絡(luò) 112
5.2.1 卷積神經(jīng)網(wǎng)絡(luò)的生物學(xué)基礎(chǔ) 112
5.2.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 113
5.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 116
5.3.1 循環(huán)神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介 116
5.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 116
5.4 生成對(duì)抗網(wǎng)絡(luò) 118
5.4.1 生成對(duì)抗網(wǎng)絡(luò)簡(jiǎn)介 118
5.4.2 生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu) 119
第6章 強(qiáng)化學(xué)習(xí)簡(jiǎn)介 124
6.1 有限馬爾可夫決策過(guò)程 125
6.1.1 目標(biāo)和獎(jiǎng)勵(lì) 125
6.1.2 回報(bào)和分幕 126
6.1.3 策略和值函數(shù) 127
6.1.4 最優(yōu)策略和最優(yōu)狀態(tài)值函數(shù) 127
6.2 動(dòng)態(tài)規(guī)劃 129
6.2.1 策略評(píng)估 129
6.2.2 策略改進(jìn) 132
6.2.3 策略迭代 133
6.2.4 價(jià)值迭代 134
6.3 時(shí)序差分學(xué)習(xí) 135
6.3.1 時(shí)序差分預(yù)測(cè) 136
6.3.2 TD(0)學(xué)習(xí) 136
6.3.3 Sarsa算法 137
6.3.4 Q學(xué)習(xí)算法 138
6.4 策略梯度方法 139
6.4.1 策略梯度定理 140
6.4.2 蒙特卡羅策略梯度 141
6.4.3 “Actor-Critic”方法 142
6.5 深度強(qiáng)化學(xué)習(xí) 143
6.5.1 深度Q-learning 143
6.5.2 深度確定性策略梯度 146
第7章 數(shù)據(jù)分析實(shí)例 149
7.1 基本數(shù)據(jù)分析 149
7.1.1 數(shù)據(jù)介紹 149
7.1.2 數(shù)據(jù)導(dǎo)入與數(shù)據(jù)初識(shí) 149
7.1.3 分類(lèi) 152
7.1.4 回歸 153
7.1.5 降維 154
7.2 深度學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn) 155
7.2.1 Tensorflow與Keras安裝部署 155
7.2.2 使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行手寫(xiě)數(shù)字識(shí)別 156
7.2.3 使用LSTM進(jìn)行文本情感分類(lèi) 158
參考文獻(xiàn) 162
附錄A 矩陣基礎(chǔ) 163
附錄B 梯度下降 166
附錄C 拉格朗日對(duì)偶性 169
附錄D Python語(yǔ)法知識(shí) 172
附錄E Java語(yǔ)法基礎(chǔ)介紹 184