定 價:49.8 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:葛東旭
- 出版時間:2020/4/1
- ISBN:9787111646396
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:320
- 紙張:
- 版次:
- 開本:16開
本書以數(shù)據(jù)挖掘項目的典型開發(fā)過程為線索,對數(shù)據(jù)挖掘的生命周期中的各個環(huán)節(jié),以及其中所涉及的概念、方法、技術和過程模型進行了全面細致的介紹。對于數(shù)據(jù)挖掘核心部分的典型基礎算法,通過細致的闡述、詳盡的示例和充分的討論,深入地展示了數(shù)據(jù)挖掘算法的內(nèi)涵,以便讀者認知、學習和掌握。
本書系統(tǒng)地介紹了數(shù)據(jù)挖掘原理、算法和應用的相關知識,內(nèi)容覆蓋數(shù)據(jù)挖掘的整個過程:數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)分類分析、數(shù)據(jù)聚類分析、數(shù)據(jù)關聯(lián)分析和數(shù)據(jù)挖掘系統(tǒng)的應用等。在內(nèi)容安排上通過數(shù)據(jù)挖掘的典型應用方法,將理論知識和工程技術應用有機地結合,淺顯易懂且實踐性強。
本書可以作為高等院校計算機科學與技術、信息管理、數(shù)據(jù)分析等專業(yè)的教科書,也可作為企業(yè)管理、信息分析人員的技術參考書籍。
本書配有電子課件,及與書中例題、作業(yè)題配套的數(shù)據(jù)素材,歡迎選用本書作教材的老師發(fā)郵件到jinacmp@163.com索取,或登錄www.cmpedu.com注冊下載。
目 錄
前 言
第1章 緒論1
1.1 信息爆炸與大數(shù)據(jù)1
1.2 什么是數(shù)據(jù)挖掘5
1.3 數(shù)據(jù)挖掘的任務6
1.4 數(shù)據(jù)挖掘的應用7
1.5 數(shù)據(jù)挖掘系統(tǒng)結構9
1.6 數(shù)據(jù)挖掘面臨的挑戰(zhàn)9
1.7 數(shù)據(jù)挖掘樣例數(shù)據(jù)和相關資料10
思考與練習13
參考文獻13
第2章 數(shù)據(jù)挖掘的過程14
2.1 數(shù)據(jù)分析能力14
2.2 數(shù)據(jù)挖掘的過程16
2.3 三階段過程模型17
2.4 SEMMA方法19
2.5 CRISP-DM過程模型21
2.6 5A模型25
2.7 模型融合26
本章小結26
思考與練習27
參考文獻27
第3章 數(shù)據(jù)準備28
3.1 數(shù)據(jù)收集28
3.2 數(shù)據(jù)抽樣29
3.3 數(shù)據(jù)集成32
3.4 數(shù)據(jù)清理39
3.5 數(shù)據(jù)歸約43
3.6 數(shù)據(jù)變換48
本章小結50
思考與練習51
參考文獻51
第4章 數(shù)據(jù)探索52
4.1 數(shù)據(jù)探索的作用52
4.2 數(shù)據(jù)可視化54
4.3 數(shù)據(jù)統(tǒng)計分析70
4.4 加載Excel插件78
本章小結79
思考與練習79
參考文獻79
第5章 關聯(lián)分析81
5.1 關聯(lián)分析原理81
5.2 由候選項集產(chǎn)生頻繁項集84
5.3 計算支持度計數(shù)94
5.4 FP-Growth算法98
5.5 產(chǎn)生頻繁項集算法復雜度105
5.6 生成規(guī)則106
5.7 關聯(lián)規(guī)則的評估111
本章小結116
思考與練習116
參考文獻118
第6章 分類預測119
6.1 分類的原理119
6.2 決策樹分類122
6.3 基于規(guī)則的分類器151
6.4 貝葉斯分類器156
6.5 人工神經(jīng)網(wǎng)絡173
6.6 支持向量機186
6.7 模型評估192
本章小結197
思考與練習197
參考文獻198
第7章 聚類分析199
7.1 聚類的基本概念200
7.2 K均值(K-means)聚類方法208
7.3 K中心點(K-medoids)算法215
7.4 層次聚類216
7.5 DBSCAN聚類222
7.6 聚類算法評估228
本章小結232
思考與練習232
參考文獻233
第8章 回歸分析234
8.1 回歸分析的概念234
8.2 回歸算法235
8.3 回歸的評估與檢驗244
本章小結249
思考與練習249
參考文獻251
第9章 數(shù)據(jù)挖掘的工具252
9.1 MATLAB252
9.2 SPSS Modeler253
9.3 SAS Enterprise Miner254
9.4 WEKA255
9.5 R256
本章小結256
參考文獻257
第10章 WEKA數(shù)據(jù)挖掘應用258
10.1 WEKA簡介258
10.2 Explorer261
10.3 Experimenter302
10.4 KnowledgeFlow304
10.5 WEKA API310
10.6 WEKA的設置和使用311
本章小結313
思考與練習313
參考文獻313