本書共分12個章節(jié),其中前半部分分別介紹了目前研究領(lǐng)域已經(jīng)較為成熟的生成對抗網(wǎng)絡(luò)模型,比如DCGAN、WGAN等等,以及大量不同結(jié)構(gòu)的生成對抗網(wǎng)絡(luò)變種。生成對抗網(wǎng)絡(luò)毫無疑問是當(dāng)今熱門的人工智能技術(shù)之一,曾被美國《麻省理工科技評論》評選為“全球十大突破性技術(shù)”!渡蓪咕W(wǎng)絡(luò)入門指南》是一本結(jié)合基礎(chǔ)理論與工程實踐的入門型書籍,深入淺出地講解了生成對抗網(wǎng)絡(luò)的各類模型以及技術(shù)發(fā)展。本書面向機(jī)器學(xué)人員、在校相關(guān)專業(yè)學(xué)生以及具備一定基礎(chǔ)的人工智能領(lǐng)域愛好者。通過本書的學(xué)夠了解生成對抗網(wǎng)絡(luò)的技術(shù)原理,并通過書中的代碼實例深入技術(shù)細(xì)節(jié)。本書共分12個章節(jié),其中前半部分分別介紹了目前研究領(lǐng)域已經(jīng)較為成熟的生成對抗網(wǎng)絡(luò)模型,比如DCGAN、WGAN等等,以及大量不同結(jié)構(gòu)的生成對抗網(wǎng)絡(luò)變種。本書后半部分介紹了文本到圖像的生成、圖像到圖像的生成、離散數(shù)據(jù)的生成以及當(dāng)前前沿的高質(zhì)量生成技術(shù),結(jié)結(jié)了目前生成對抗網(wǎng)絡(luò)在行業(yè)應(yīng)用中的研究與發(fā)展。希望本書能夠幫助廣大讀者跟上新技術(shù)的前沿,成為人工智能時代的先行者。
第 1 章 人工智能入門 1
1.1 人工智能的歷史以及發(fā)展 1
1.1.1 人工智能的誕生 3
1.1.2 人工智能的兩起兩落 6
1.1.3 新時代的人工智能 8
1.2 機(jī)器學(xué)度學(xué) 10
1.2.1 機(jī)器學(xué) 11
1.2.2 神經(jīng)網(wǎng)絡(luò)與深度學(xué) 12
1.2.3 深度學(xué)用 13
1.3 了解生成對抗網(wǎng)絡(luò) 15
1.3.1 從機(jī)器感知到機(jī)器創(chuàng)造 15
1.3.2 什么是生成對抗網(wǎng)絡(luò) 18
1.4 本章小結(jié) 20
第 2 章 預(yù)備知識與開發(fā)工具 21
2.1 Python 語言與開發(fā)框架 21
2.1.1 Python 語言 21
2.1.2 常用工具簡介 23
2.1.3 第三方框架簡介 26
2.2 TensorFlow 基礎(chǔ)入門 27
2.2.1 TensorFlow 簡介與安裝 27
2.2.2 TensorFlow 實例:圖像分類 30
2.3 Keras 基礎(chǔ)入門 32
2.3.1 Keras 簡介與安裝 32
2.3.2 Keras 使用入門 34
2.3.3 Keras 實例:文本情感分析 37
2.4 本章小結(jié) 39
第 3 章 理解生成對抗網(wǎng)絡(luò) 40
3.1 生成模型 40
3.1.1 生成模型簡介 40
3.1.2 自動編碼器 42
3.1.3 變分自動編碼器 44
3.2 GAN 的數(shù)學(xué)原理 47
3.2.1 似然估計 47
3.2.2 GAN 的數(shù)學(xué)推導(dǎo) 50
3.3 GAN 的可視化理解 54
3.4 GAN 的工程實踐 55
3.5 本章小結(jié) 63
第 4 章 深度卷積生成對抗網(wǎng)絡(luò) 64
4.1 DCGAN 的框架 64
4.1.1 DCGAN 設(shè)計規(guī)則 64
4.1.2 DCGAN 框架結(jié)構(gòu) 68
4.2 DCGAN 的工程實踐 69
4.3 DCGAN 的實驗性應(yīng)用 77
4.3.1 生成圖像的變換 77
4.3.2 生成圖像的算術(shù)運(yùn)算 79
4.3.3 殘缺圖像的補(bǔ)全 81
4.4 本章小結(jié) 83
第 5 章 Wasserstein GAN 84
5.1 GAN 的優(yōu)化問題 84
5.2 WGAN 的理論研究 88
5.3 WGAN 的工程實踐 91
5.4 WGAN 的實驗效果分析 95
5.4.1 代價函數(shù)與生成質(zhì)量的相關(guān)性 95
5.4.2 生成網(wǎng)絡(luò)的穩(wěn)定性 96
5.4.3 模式崩潰問題 99
5.5 WGAN 的方案:WGAN-GP 99
5.6 本章小結(jié) 103
第 6 章 不同結(jié)構(gòu)的 GAN 104
6.1 GAN 與監(jiān)督式學(xué) 104
6.1.1 條件式生成:cGAN 104
6.1.2 cGAN 在圖像上的應(yīng)用 106
6.2 GAN 與半監(jiān)督式學(xué) 109
6.2.1 半監(jiān)督式生成:SGAN 109
6.2.2 輔助分類生成:ACGAN 111
6.3 GAN 與無監(jiān)督式學(xué) 112
6.3.1 無監(jiān)督式學(xué)解釋型特征 112
6.3.2 理解 InfoGAN 114
6.4 本章小結(jié) 119
第 7 章 文本到圖像的生成 120
7.1 文本條件式生成對抗網(wǎng)絡(luò) 120
7.2 文本生成圖階:GAWWN 124
7.3 文本到高質(zhì)量圖像的生成 127
7.3.1 層級式圖像生成:StackGAN 128
7.3.2 層級式圖像生成的優(yōu)化:StackGAN-v2 133
7.4 本章小結(jié) 135
第 8 章 圖像到圖像的生成 136
8.1 可交互圖像轉(zhuǎn)換:iGAN 136
8.1.1 可交互圖像轉(zhuǎn)換的用途 136
8.1.2 iGAN 的實現(xiàn)方法 138
8.1.3 iGAN 軟件簡介與使用方法 141
8.2 匹配數(shù)據(jù)圖像轉(zhuǎn)換:Pix2Pix 144
8.2.1 理解匹配數(shù)據(jù)的圖像轉(zhuǎn)換 144
8.2.2 Pix2Pix 的理論基礎(chǔ) 146
8.2.3 Pix2Pix 的應(yīng)用實踐 150
8.3 非匹配數(shù)據(jù)圖像轉(zhuǎn)換:CycleGAN 157
8.3.1 理解非匹配數(shù)據(jù)的圖像轉(zhuǎn)換 157
8.3.2 CycleGAN 的理論基礎(chǔ) 162
8.3.3 CycleGAN 的應(yīng)用實踐 165
8.4 多領(lǐng)域圖像轉(zhuǎn)換:StarGAN 171
8.4.1 多領(lǐng)域的圖像轉(zhuǎn)換問題 171
8.4.2 StarGAN 的理論基礎(chǔ) 174
8.4.3 StarGAN 的應(yīng)用實踐 177
8.5 本章小結(jié) 182
第 9 章 序列數(shù)據(jù)的生成 183
9.1 序列生成的問題 183
9.2 GAN 的序列生成方法 184
9.3 自然語言生成 187
9.4 本章小結(jié) 191
第 10 章 GAN 與強(qiáng)化學(xué)向強(qiáng)化學(xué) 192
10.1 GAN 與強(qiáng)化學(xué) 192
10.1.1 強(qiáng)化學(xué) 192
10.1.2 Actor-Critic 195
10.1.3 GAN 與強(qiáng)化學(xué)聯(lián) 196
10.2 GAN 與逆向強(qiáng)化學(xué) 197
10.2.1 逆向強(qiáng)化學(xué) 197
10.2.2 經(jīng)典 IRL 算法 198
10.2.3 GAN 的模仿學(xué)AIL 200
10.3 本章小結(jié) 201
第 11 章 新一代 GAN 202
11.1 GAN 的評估方法 202
11.2 GAN 化 205
11.2.1 SNGAN 與 SAGAN 205
11.2.2 BigGAN 206
11.2.3 StyleGAN 208
11.3 本章小結(jié) 210
第 12 章 GAN 的應(yīng)用與發(fā)展 211
12.1 多媒體領(lǐng)域的應(yīng)用 211
12.1.1 圖像處理 211
12.1.2 音頻合成 218
12.2 藝術(shù)領(lǐng)域的應(yīng)用 221
12.2.1 AI 能否創(chuàng)造藝術(shù) 221
12.2.2 AI 與計算機(jī)藝術(shù)的發(fā)展 223
12.2.3 藝術(shù)生成網(wǎng)絡(luò):從藝術(shù)模仿到創(chuàng)意生成 231
12.3 設(shè)計領(lǐng)域的應(yīng)用 238
12.3.1 AI 時代的設(shè)計 238
12.3.2 AI 輔助式設(shè)計的研究 240
12.4 領(lǐng)域的應(yīng)用 249
12.5 本章小結(jié) 252
參考文獻(xiàn) 253