定 價(jià):120 元
叢書(shū)名:智能科學(xué)技術(shù)著作叢書(shū)
當(dāng)前圖書(shū)已被 37 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:
- 出版時(shí)間:2024/4/1
- ISBN:9787030774989
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP274
- 頁(yè)碼:
- 紙張:
- 版次:1
- 開(kāi)本:B5
在實(shí)際應(yīng)用中,需要處理的數(shù)據(jù)常常具有類別不平衡的特點(diǎn).例如,用于信用卡欺詐檢測(cè)、垃圾郵件過(guò)濾、機(jī)械故障診斷、疾病診斷、極端天氣預(yù)測(cè)預(yù)報(bào)等的數(shù)據(jù)都是類別非平衡數(shù)據(jù).研究非平衡數(shù)據(jù)分類問(wèn)題具有重要意義和實(shí)際應(yīng)用價(jià)值,引起機(jī)器學(xué)習(xí)領(lǐng)域研究人員的廣泛關(guān)注.本書(shū)結(jié)合作者團(tuán)隊(duì)在非平衡數(shù)據(jù)分類中的研究成果,系統(tǒng)介紹非平衡數(shù)據(jù)分類的理論基礎(chǔ)、模型評(píng)價(jià)、數(shù)據(jù)級(jí)方法、算法級(jí)方法和集成學(xué)習(xí)方法.
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
“信息科學(xué)技術(shù)學(xué)術(shù)著作叢書(shū)”序
前言
第1章 理論基礎(chǔ)1
1.1 數(shù)據(jù)分類1
1.2 K-近鄰4
1.3 決策樹(shù)5
1.3.1 離散值決策樹(shù)6
1.3.2 連續(xù)值決策樹(shù)19
1.4 神經(jīng)網(wǎng)絡(luò)25
1.4.1 神經(jīng)元模型25
1.4.2 梯度下降算法26
1.4.3 多層感知器模型29
1.4.4 卷積神經(jīng)網(wǎng)絡(luò)33
1.5 極限學(xué)習(xí)機(jī)43
1.6 支持向量機(jī)46
1.6.1 線性可分支持向量機(jī)46
1.6.2 近似線性可分支持向量機(jī)50
1.6.3 線性不可分支持向量機(jī)51
1.7 集成學(xué)習(xí)54
1.7.1 集成學(xué)習(xí)簡(jiǎn)介54
1.7.2 Bagging算法55
1.7.3 Boosting算法56
1.7.4 隨機(jī)森林算法57
1.7.5 模糊積分集成算法60
第2章 模型評(píng)價(jià)63
2.1 基本度量63
2.2 ROC曲線與AUC面積65
2.2.1 ROC曲線65
2.2.2 AUC面積68
2.3 損失函數(shù)71
2.4 偏差與方差80
2.5 多樣性度量81
2.5.1 成對(duì)多樣性度量82
2.5.2 非成對(duì)多樣性度量83
2.5.3 分類器集成的多樣性和分類精度之間的關(guān)系85
第3章 數(shù)據(jù)級(jí)方法86
3.1 數(shù)據(jù)級(jí)方法概述86
3.2 SMOTE算法88
3.3 B-SMOTE算法89
3.4 基于生成模型上采樣的兩類非平衡數(shù)據(jù)分類算法89
3.4.1 基于極限學(xué)習(xí)機(jī)自動(dòng)編碼器的上采樣算法91
3.4.2 基于生成對(duì)抗網(wǎng)絡(luò)的上采樣算法93
3.4.3 算法實(shí)現(xiàn)及與其他算法的比較98
3.5 基于自適應(yīng)聚類和模糊數(shù)據(jù)約簡(jiǎn)下采樣的兩類非平衡大數(shù)據(jù)分類算法109
3.5.1 大數(shù)據(jù)概述109
3.5.2 大數(shù)據(jù)處理系統(tǒng)110
3.5.3 聚類分析127
3.5.4 兩類非平衡大數(shù)據(jù)分類算法134
3.5.5 算法實(shí)現(xiàn)及與其他算法的比較138
第4章 算法級(jí)方法144
4.1 算法級(jí)方法概述144
4.2 基于代價(jià)敏感性學(xué)習(xí)的非平衡數(shù)據(jù)分類方法146
4.2.1 代價(jià)敏感性學(xué)習(xí)基礎(chǔ)146
4.2.2 代價(jià)敏感性支持向量機(jī)151
4.2.3 代價(jià)敏感Boosting算法151
4.3 基于深度學(xué)習(xí)的非平衡圖像數(shù)據(jù)分類方法153
4.3.1 針對(duì)非平衡圖像數(shù)據(jù)的深度表示學(xué)習(xí)153
4.3.2 針對(duì)長(zhǎng)尾識(shí)別的目標(biāo)監(jiān)督對(duì)比學(xué)習(xí)156
4.3.3 針對(duì)長(zhǎng)尾識(shí)別的深度嵌入和數(shù)據(jù)增廣學(xué)習(xí)方法159
第5章 集成學(xué)習(xí)方法163
5.1 集成學(xué)習(xí)方法概述163
5.2 SMOTEBoost算法與SMOTEBagging算法164
5.3 基于改進(jìn)D2 GAN上采樣和分類器融合的兩類非平衡數(shù)據(jù)分類166
5.3.1 基于改進(jìn)D2 GAN的上采樣方法166
5.3.2 基于改進(jìn)D2 GAN上采樣和分類器融合的兩類非平衡數(shù)據(jù)分類169
5.3.3 算法實(shí)現(xiàn)及與其他算法的比較172
5.4 基于MapReduce和極限學(xué)習(xí)機(jī)集成的兩類非平衡大數(shù)據(jù)分類179
5.4.1 交替上采樣方法179
5.4.2 基于交替上采樣和集成學(xué)習(xí)的兩類非平衡大數(shù)據(jù)分類180
5.4.3 算法實(shí)現(xiàn)及與其他算法的比較182
5.5 基于異類最近鄰超球上采樣和集成學(xué)習(xí)的兩類非平衡大數(shù)據(jù)分類186
5.5.1 基于MapReduce和異類最近鄰超球的上采樣186
5.5.2 基于異類最近鄰超球上采樣和模糊積分集成的兩類非平衡大數(shù)據(jù)分類188
5.5.3 算法實(shí)現(xiàn)及與其他算法的比較188
參考文獻(xiàn)194