本書是深度學習的入門教材,系統(tǒng)地介紹了深度學習的基本概念與實戰(zhàn)應(yīng)用,包括深度學習在圖像、語音、文本方向的應(yīng)用,以及前沿發(fā)展等。本書分為10章,大致為3個部分:第1部分(1-3章)介紹深度學習的基礎(chǔ)知識。第2部分(4-6章)介紹深度學習的各個方面,從算法設(shè)計到模型實現(xiàn)。第3部分(8-10章)介紹深度學習的實戰(zhàn)應(yīng)用以及前沿發(fā)展。每章都附有相應(yīng)的習題和參考文獻,以便感興趣的讀者進一步深入思考。"讓學習變得輕松”是本書的基本編寫理念。本書適合作為相關(guān)專業(yè)本科和研究生教材,也適合作為深度學習研究與開發(fā)人員的入門書籍。
清華大學博士,解放軍理工大學教授、學科帶頭人,中國云計算專家委員會委員。主要研究方向為信息網(wǎng)格和云計算,完成科研課題18項,發(fā)表論文70余篇,獲部級科技進步獎6項。曾奪得國際計算機排序比賽冠軍,并二次奪得全國高校科技比賽*高獎,獲“全軍十大學習成才標兵”、“南京十大杰出青年”和“清華大學學術(shù)新秀”等稱號。2002年首倡的“網(wǎng)格計算池”和2003年研發(fā)的“反垃圾郵件網(wǎng)格”分別為云計算和云安全的前身。創(chuàng)辦了知名的中國網(wǎng)格和中國云計算網(wǎng)站。
第1章 深度學習的來源與應(yīng)用 1
1.1 人工智能的思想、流派與發(fā)展起落 1
1.1.1 人工智能的思潮流派和主要研究與應(yīng)用領(lǐng)域 2
1.1.2 人工智能的三起三落 4
1.2 什么是深度學習 6
1.2.1 我們不分離――數(shù)據(jù)和算法 6
1.2.2 深度學習基礎(chǔ) 9
1.3 機器學習與深度學習 10
1.3.1 機器學習的定義與種類 10
1.3.2 機器學習的任務(wù)與方法 13
1.3.3 深度學習的提出 16
1.4 深度學習的應(yīng)用場景 18
1.4.1 應(yīng)用場合和概念層次 18
1.4.2 主要開發(fā)工具和框架 20
1.4.3 人工智能、深度學習有關(guān)學術(shù)會議和賽事 22
習題 24
參考文獻 24
第2章 深度學習的數(shù)學基礎(chǔ) 26
2.1 線性代數(shù) 26
2.1.1 向量空間 26
2.1.2 矩陣分析 28
2.2 概率與統(tǒng)計 30
2.2.1 概率與條件概率 30
2.2.2 貝葉斯理論 33
2.2.3 信息論基礎(chǔ) 35
2.3 多元微積分 39
2.3.1 導數(shù)和偏導數(shù) 39
2.3.2 梯度和海森矩陣 42
2.3.3 最速下降法 44
2.3.4 隨機梯度下降算法 45
習題 48
參考文獻 50
第3章 人工神經(jīng)網(wǎng)絡(luò)與深度學習 51
3.1 探秘大腦的工作原理 52
3.1.1 人類活動抽象與深度學習模型 53
3.1.2 人腦神經(jīng)元的結(jié)構(gòu) 54
3.1.3 人腦神經(jīng)元功能 55
3.1.4 人腦視覺機理 57
3.2 人腦神經(jīng)元模型 59
3.2.1 人腦神經(jīng)元模型介紹 60
3.2.2 激活函數(shù) 62
3.3 M-P模型 64
3.3.1 標準M-P模型 65
3.3.2 改進的M-P模型 66
3.4 人腦神經(jīng)網(wǎng)絡(luò)的互連結(jié)構(gòu) 66
3.4.1 前饋神經(jīng)網(wǎng)絡(luò) 67
3.4.2 反饋網(wǎng)絡(luò) 67
3.5 人工神經(jīng)網(wǎng)絡(luò)的學習 68
3.5.1 人工神經(jīng)網(wǎng)絡(luò)的學習方式 68
3.5.2 神經(jīng)網(wǎng)絡(luò)的學習規(guī)則 71
3.5.3 人工神經(jīng)網(wǎng)絡(luò)算法基本要求 73
3.5.4 神經(jīng)網(wǎng)絡(luò)計算特點 74
3.6 人工神經(jīng)網(wǎng)絡(luò)的特點 75
3.7 神經(jīng)網(wǎng)絡(luò)基本概念與功能 76
3.7.1 幾個基本概念 76
3.7.2 基本功能 78
3.7.3 感知機的局限性 83
3.8 深度學習其他網(wǎng)絡(luò)結(jié)構(gòu) 84
3.8.1 卷積神經(jīng)網(wǎng)絡(luò) 88
3.8.2 循環(huán)(遞歸)神經(jīng)網(wǎng)絡(luò) 94
習題 97
參考文獻 98
第4章 深度學習基本過程 99
4.1 正向?qū)W習過程 99
4.1.1 正向?qū)W習概述 99
4.1.2 正向傳播的流程 100
4.1.3 正向傳播的詳細原理 100
4.2 反向調(diào)整過程 102
4.2.1 反向調(diào)整概述 102
4.2.2 反向傳播過程詳解 103
4.2.3 深層模型反向調(diào)整的問題與對策 106
4.3 手寫體數(shù)字識別實例 107
4.3.1 數(shù)據(jù)準備 107
4.3.2 網(wǎng)絡(luò)設(shè)計 109
4.3.3 模型訓練 115
4.3.4 模型測試 116
習題 121
參考文獻 121
第5章 深度學習主流模型 122
5.1 卷積神經(jīng)網(wǎng)絡(luò) 123
5.1.1 CNN概念 123
5.1.2 CNN常用算法 127
5.1.3 CNN訓練技巧 131
5.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 132
5.2.1 RNN結(jié)構(gòu) 132
5.2.2 RNN訓練 133
5.2.3 RNN訓練技巧 135
習題 136
參考文獻 136
第6章 深度學習的主流開源框架 138
6.1 Caffe 138
6.1.1 Caffe框架 138
6.1.2 安裝Caffe 139
6.1.3 案例:基于Caffe的目標識別 145
6.2 TensorFlow 146
6.2.1 TensorFlow框架 146
6.2.2 安裝TensorFlow 147
6.2.3 案例:基于TensorFlow的目標識別 149
6.3 其他開源框架 150
6.3.1 CNTK 150
6.3.2 MXNet 151
6.3.3 Theano 151
6.3.4 Torch 151
6.3.5 Deeplearning4j 152
習題 153
參考文獻 153
第7章 深度學習在圖像中的應(yīng)用 154
7.1 圖像識別基礎(chǔ) 154
7.2 基于深度學習的大規(guī)模圖像識別 155
7.2.1 大規(guī)模圖像數(shù)據(jù)庫:ImageNet 155
7.2.2 AlexNet網(wǎng)絡(luò)結(jié)構(gòu) 156
7.2.3 非線性激活函數(shù)ReLU 157
7.2.4 在多GPU上進行實現(xiàn) 158
7.2.5 增加訓練樣本 158
7.2.6 dropout技術(shù) 159
7.3 應(yīng)用舉例:人臉識別 160
7.3.1 人臉識別的經(jīng)典流程 160
7.3.2 人臉圖像數(shù)據(jù)庫 161
7.3.3 基于深度學習的人臉識別方法 162
7.4 應(yīng)用舉例:圖像風格化 163
7.4.1 內(nèi)容重構(gòu) 164
7.4.2 風格重構(gòu) 165
7.4.3 內(nèi)容與風格的重組 166
7.5 應(yīng)用舉例:圖像標注 167
7.5.1 基于深度網(wǎng)絡(luò)的圖像標注方法概述 168
7.5.2 視覺語義對齊 169
7.5.3 為新圖像生成對應(yīng)文本描述 171
習題 172
參考文獻 172
第8章 深度學習在語音中的應(yīng)用 174
8.1 語音識別基礎(chǔ) 174
8.1.1 人類之間的交流 175
8.1.2 人機交流 175
8.1.3 語音識別系統(tǒng)的基本結(jié)構(gòu) 176
8.1.4 特征提取 176
8.1.5 聲學模型 177
8.1.6 語言模型 177
8.1.7 解碼器 178
8.1.8 用于語音識別的GMM-HMM模型 178
8.2 基于深度學習的連續(xù)語音識別 181
8.2.1 DNN-HMM混合系統(tǒng) 181
8.2.2 CD-DNN-HMM的關(guān)鍵模塊及分析 185
8.3 應(yīng)用舉例:語音輸入法 190
8.3.1 案例背景 190
8.3.2 語音輸入法設(shè)計 191
8.3.3 語音中心SpeechCenter的設(shè)計 192
8.3.4 輸入法FreeVoice的設(shè)計 194
8.3.5 FreeVoice和SpeechCenter之間的通信設(shè)計 196
習題 198
參考文獻 198
第9章 深度學習在文本中的應(yīng)用 201
9.1 自然語言處理基礎(chǔ) 201
9.1.1 正則表達式和自動機 202
9.1.2 句法處理 203
9.1.3 詞的分類和詞性標注 203
9.1.4 上下文無關(guān)語法 205
9.1.5 淺層語法分析 205
9.1.6 語義分析 206
9.1.7 語義網(wǎng)絡(luò) 206
9.1.8 詞匯關(guān)系信息庫 206
9.2 基于深度學習的文本處理 207
9.2.1 詞匯向量化表示 207
9.2.2 句法分析 209
9.2.3 神經(jīng)機器翻譯 209
9.2.4 情感分析 210
9.3 應(yīng)用舉例:機器翻譯 211
9.4 應(yīng)用舉例:聊天機器人 215
9.4.1 聊天機器人的主要功能模塊 216
9.4.2 主要的技術(shù)挑戰(zhàn) 217
9.4.3 深度學習構(gòu)建智能聊天機器人 218
習題 220
參考文獻 220
第10章 深度學習前沿發(fā)展 222
10.1 增強學習 222
10.1.1 增強學習的基本概念 222
10.1.2 增強學習的過程 224
10.1.3 增強學習的應(yīng)用 225
10.2 遷移學習 225
10.2.1 遷移學習的定義 226
10.2.2 遷移學習的分類 226
10.2.3 遷移學習的應(yīng)用場景 226
10.3 記憶網(wǎng)絡(luò) 228
10.3.1 循環(huán)神經(jīng)網(wǎng)絡(luò) 228
10.3.2 長短期記憶網(wǎng)絡(luò) 228
10.3.3 長短期記憶變體 231
10.4 深度學習的硬件實現(xiàn) 232
10.4.1 FPGA 232
10.4.2 ASIC 233
10.4.3 TPU 234
10.4.4 寒武紀 235
10.4.5 TrueNorth 237
習題 238
參考文獻 238
附錄A 人工智能和大數(shù)據(jù)實驗環(huán)境 240