數(shù)據(jù)挖掘理論、方法與應(yīng)用
定 價(jià):35 元
- 作者:羅澤舉
- 出版時(shí)間:2014/12/1
- ISBN:9787121246333
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁(yè)碼:184
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
本書(shū)共分10章。第1章介紹了數(shù)據(jù)挖掘方法的歷史,另外討論了統(tǒng)計(jì)學(xué)習(xí)的一般模型。第2、3、4章介紹了三種數(shù)據(jù)挖掘模型:人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隱馬爾可夫模型。第5章介紹了一種新型支持向量誘導(dǎo)回歸模型,第6章介紹了一種基于快速訓(xùn)練算法的HMM/SVM混合系統(tǒng),第7章介紹了分解向前算法及PCA/ICA降維SVM模型,第8章介紹了不對(duì)稱支持向量機(jī)改進(jìn)算法,第9章介紹了一種基于隱馬爾可夫模型的多重序列分析方法,第10章介紹了一類基于SVM/RBF的氣象模型預(yù)測(cè)系統(tǒng)。
本書(shū)是站在數(shù)據(jù)挖掘的獨(dú)特角度對(duì)神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隱馬爾可夫理論這三個(gè)重要的理論與方法進(jìn)行重新剖析,并進(jìn)行方法論基礎(chǔ)上的應(yīng)用,通過(guò)講故事似的生動(dòng)而系統(tǒng)地闡述數(shù)據(jù)挖掘的本質(zhì),來(lái)引領(lǐng)讀者對(duì)數(shù)據(jù)挖掘的深入理解和應(yīng)用。
麗水學(xué)院商學(xué)院教授
第1章 緒論 1
1.1 研究背景 2
1.2 數(shù)據(jù)挖掘的基本數(shù)學(xué)問(wèn)題 5
1.2.1 相關(guān)概念 5
1.2.2 統(tǒng)計(jì)學(xué)習(xí)的一般模型 10
1.3 數(shù)據(jù)的變換 11
參考文獻(xiàn) 13
第2章 神經(jīng)網(wǎng)絡(luò)挖掘理論 19
2.1 神經(jīng)智能 19
2.2 生物神經(jīng)元和人工神經(jīng)元 21
2.2.1 生物神經(jīng)元 21
2.2.2 人工神經(jīng)元 23
2.2.3 建立數(shù)學(xué)模型 24
2.2.4 單層與多層網(wǎng)絡(luò)結(jié)構(gòu) 27
2.2.5 網(wǎng)絡(luò)學(xué)習(xí)方式 32 第1章 緒論 1
1.1 研究背景 2
1.2 數(shù)據(jù)挖掘的基本數(shù)學(xué)問(wèn)題 5
1.2.1 相關(guān)概念 5
1.2.2 統(tǒng)計(jì)學(xué)習(xí)的一般模型 10
1.3 數(shù)據(jù)的變換 11
參考文獻(xiàn) 13
第2章 神經(jīng)網(wǎng)絡(luò)挖掘理論 19
2.1 神經(jīng)智能 19
2.2 生物神經(jīng)元和人工神經(jīng)元 21
2.2.1 生物神經(jīng)元 21
2.2.2 人工神經(jīng)元 23
2.2.3 建立數(shù)學(xué)模型 24
2.2.4 單層與多層網(wǎng)絡(luò)結(jié)構(gòu) 27
2.2.5 網(wǎng)絡(luò)學(xué)習(xí)方式 32
2.2.6 經(jīng)典學(xué)習(xí)規(guī)則 34
2.3 LMS和SDA方法 35
2.3.1 平均平方誤差函數(shù) 36
2.3.2 LMS和SDA算法 39
2.4 后向傳播算法 43
2.4.1 概況 43
2.4.2 多層網(wǎng)絡(luò)BP算法 44
參考文獻(xiàn) 50
第3章 基于支持向量的挖掘理論 52
3.1 支持向量與分類超平面 52
3.1.1 一維情形 52
3.1.2 二維情形 54
3.1.3 三維情形 56
3.1.4 n維情形( ) 57
3.1.5 核函數(shù)(內(nèi)積回旋)思想 58
3.1.6 核函數(shù)定義 63
3.2 風(fēng)險(xiǎn)控制策略 65
3.2.1 VC維概念 65
3.2.2 經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則 66
3.2.3 結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則 67
3.3 樣本被錯(cuò)分的討論 68
3.3.1 最大間隔分類超平面 68
3.3.2 數(shù)據(jù)被錯(cuò)分的條件 70
3.4 最優(yōu)化策略 71
3.5 分類與回歸 74
3.5.1 分類算法 74
3.5.2 回歸算法 78
3.5.3 解的全局最優(yōu)討論 80
3.6 幾種經(jīng)典算法描述 82
3.6.1 分解算法 82
3.6.2 分塊算法 83
3.6.3 序貫最小化算法 84
3.6.4 核函數(shù)構(gòu)造算法 85
參考文獻(xiàn) 85
第4章 隱馬爾可夫挖掘理論 87
4.1 馬爾可夫思想 87
4.2 隱馬爾可夫鏈 90
4.3 隱馬爾可夫模型 94
4.3.1 隱馬爾可夫模型定義 94
4.3.2 三個(gè)基本算法 95
參考文獻(xiàn) 102
第5章 新型支持向量誘導(dǎo)回歸模型及應(yīng)用 104
5.1 新型支持向量誘導(dǎo)回歸模型 104
5.1.1 不敏感損失函數(shù) 104
5.1.2 系統(tǒng)模型 106
5.2 時(shí)間序列分析的相空間重構(gòu) 108
5.2.1 相空間重構(gòu) 108
5.2.2 性能評(píng)價(jià)指標(biāo) 109
5.2.3 重構(gòu)模式的近似算法 110
5.3 預(yù)測(cè)置信度估計(jì) 110
5.4 實(shí)驗(yàn)結(jié)果 111
5.4.1 參數(shù)的確定 111
5.4.2 預(yù)測(cè)指數(shù)分析 112
5.4.3 預(yù)測(cè)結(jié)果 113
5.4.4 SVM和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較 115
5.4.5 討論 116
參考文獻(xiàn) 117
第6章 基于快速訓(xùn)練算法的HMM/SVM混合系統(tǒng) 118
6.1 L值定義 118
6.2 快速訓(xùn)練算法和HMM/SVM混合過(guò)濾模型 119
6.2.1 基于HMM的快速訓(xùn)練算法 119
6.2.2 HMM/SVM的雙層混合系統(tǒng)模型 120
6.3 實(shí)驗(yàn)結(jié)果 121
6.3.1 數(shù)據(jù)的獲取及序列的編碼 122
6.3.2 DNA的兩類和多類分類識(shí)別 123
6.3.3 討論 126
參考文獻(xiàn) 127
第7章 分解向前算法及PCA/ICA降維SVM模型 129
7.1 主成分分析(PCA)的數(shù)學(xué)模型 129
7.2 獨(dú)立成分分析(ICA)的數(shù)學(xué)模型 131
7.3 分解向前支持向量機(jī) 133
7.3.1 三個(gè)距離區(qū)域 133
7.3.2 分解向前算法 134
7.3.3 DFSVM算法復(fù)雜度分析 136
7.3.4 PCA-DFSVM及ICA-DFSVM降維模型 137
7.4 實(shí)驗(yàn)結(jié)果 138
7.4.1 SCOP數(shù)據(jù)庫(kù) 138
7.4.2 實(shí)驗(yàn)1 138
7.4.3 實(shí)驗(yàn)2 139
7.4.4 各項(xiàng)實(shí)驗(yàn)指標(biāo)比較 140
7.4.5 討論 141
參考文獻(xiàn) 141
第8章 不對(duì)稱支持向量機(jī)改進(jìn)算法及應(yīng)用 143
8.1 不對(duì)稱支持向量機(jī) 143
8.1.1 樣本的不對(duì)稱性 143
8.1.2 不對(duì)稱支持向量機(jī)算法 143
8.1.3 不對(duì)稱SVM分類迭代模型 146
8.2 幾種多分類問(wèn)題的算法復(fù)雜度估計(jì) 146
8.3 實(shí)驗(yàn)結(jié)果 149
8.3.1 實(shí)驗(yàn)1 150
8.3.2 實(shí)驗(yàn)2 151
8.3.3 MISVM和標(biāo)準(zhǔn)SVM實(shí)驗(yàn)指標(biāo)比較 153
參考文獻(xiàn) 155
第9章 基于隱馬爾可夫模型的多重序列分析 156
9.1 研究背景 156
9.2 多重序列比對(duì) 157
9.2.1 多重序列比對(duì)的描述 157
9.2.2 特征序列 158
9.3 隱馬爾可夫模型的序列描述 158
9.4 建立多重序列隱馬爾可夫輪廓圖 160
9.5 實(shí)驗(yàn)結(jié)果和討論 161
9.5.1 Pfam數(shù)據(jù)庫(kù)簡(jiǎn)介 161
9.5.2 建立隱馬爾可夫模型 162
9.5.3 檢驗(yàn)HMMS模型 162
9.5.4 用HMMS進(jìn)行蛋白質(zhì)家族的模式分類 163
9.6 關(guān)于模型的局限性討論 164
參考文獻(xiàn) 165
第10章 一類基于SVM/RBF的氣象模型預(yù)測(cè)系統(tǒng) 167
10.1 支持向量機(jī)回歸模型 167
10.1.1 回歸支持向量機(jī) 167
10.1.2 模型中幾個(gè)重要參數(shù)分析 168
10.2 溫度序列數(shù)據(jù)分析 169
10.3 決策函數(shù)的確定 170
10.4 預(yù)測(cè)結(jié)果分析 171
10.5 結(jié)論 173
參考文獻(xiàn) 173
前 言
數(shù)據(jù)挖掘領(lǐng)域目前越來(lái)越引起人們的重視,在過(guò)去的幾十年里,數(shù)據(jù)挖掘技術(shù)已經(jīng)從人們的零散的方法發(fā)展成為了一系列系統(tǒng)的知識(shí)理論。隨著大數(shù)據(jù)時(shí)代的到來(lái),人們?cè)谶@方面投入了更大的研究興趣,數(shù)據(jù)挖掘的內(nèi)容越來(lái)越豐富,數(shù)據(jù)挖掘的應(yīng)用范圍也越來(lái)越廣泛,從經(jīng)濟(jì)到管理、從生物到醫(yī)學(xué)、從農(nóng)業(yè)到商業(yè),到處都呈現(xiàn)出數(shù)據(jù)挖掘?qū)W科發(fā)展的欣欣向榮的局面。進(jìn)行數(shù)據(jù)挖掘的動(dòng)力在于挖掘的信息能對(duì)我們的經(jīng)濟(jì)生活提供重要的幫助。商業(yè)數(shù)據(jù)挖掘可以為商家提供重要的商機(jī),氣象數(shù)據(jù)挖掘可以幫助我們防止自然災(zāi)害和提高農(nóng)作物產(chǎn)量,醫(yī)學(xué)數(shù)據(jù)挖掘可以幫助我們檢測(cè)疾病并進(jìn)行及早治療、管理數(shù)據(jù)挖掘可以幫助管理者提高決策效率等。
本書(shū)向讀者介紹了幾種重要的數(shù)據(jù)挖掘概念與算法,包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隱馬爾可夫理論,本書(shū)由淺入深,循序漸進(jìn),采用生動(dòng)樸實(shí)的語(yǔ)言向讀者介紹了這些理論的來(lái)龍去脈,使讀者對(duì)這些理論與方法有更深入的理解。神經(jīng)網(wǎng)絡(luò)部分,從人的大腦結(jié)構(gòu)開(kāi)始,從生物的刺激反應(yīng)到建立數(shù)學(xué)模型,遵循了知識(shí)的發(fā)現(xiàn)過(guò)程。支持向量機(jī)部分,由最大間隔分類超平面和支持向量介紹入手,從一維到多維,從獨(dú)特的角度介紹了這一理論的深刻內(nèi)涵。隱馬可夫理論部分,從馬爾可夫鏈的介紹開(kāi)始,通過(guò)引入雙重隨機(jī)過(guò)程使這一理論得到自然展現(xiàn)。
本書(shū)分為三個(gè)主要部分。緒論部分、主要理論部分及應(yīng)用部分。緒論部分介紹了神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)理論的產(chǎn)生過(guò)程,同時(shí)介紹了數(shù)據(jù)挖掘的基本數(shù)學(xué)問(wèn)題,對(duì)眾多算法概念進(jìn)行了剖析,并討論了統(tǒng)計(jì)學(xué)習(xí)的一般模型和常用數(shù)據(jù)變換方法。主要理論部分由神經(jīng)網(wǎng)絡(luò)挖掘理論、基于支持向量的挖掘理論及隱馬爾可夫挖掘理論3章組成,神經(jīng)網(wǎng)絡(luò)挖掘理論部分包括神經(jīng)智能、生物神經(jīng)元和人工神經(jīng)元、LMS和SDA方法及后向傳播算法;基于支持向量的挖掘理論部分由支持向量與分類超平面、風(fēng)險(xiǎn)控制策略、樣本被錯(cuò)分的討論、最優(yōu)化策略、分類與回歸、幾種經(jīng)典算法描述組成;隱馬爾可夫挖掘理論部分由馬爾可夫思想、隱馬爾可夫鏈、隱馬爾可夫模型組成。應(yīng)用部分介紹了這三種主要的數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)和計(jì)算生物學(xué)中的應(yīng)用,在這些章節(jié),改進(jìn)了傳統(tǒng)算法,提出了多個(gè)數(shù)據(jù)挖掘模型,包括第5章的新型支持向量誘導(dǎo)回歸模型,第6章的基于快速訓(xùn)練算法的HMM/SVM混合系統(tǒng),第7章的分解向前算法及PCA/ICA降維SVM模型,第8章的不對(duì)稱支持向量機(jī)改進(jìn)算法模型,第9章的基于隱馬爾可夫模型的多重序列分析模型,第10章的一類基于SVM/RBF的氣象模型預(yù)測(cè)系統(tǒng)。這些應(yīng)用章節(jié)的內(nèi)容也較為豐富,包含了許多有關(guān)數(shù)據(jù)挖掘的知識(shí)內(nèi)容,如降維方法、數(shù)據(jù)編碼、計(jì)算復(fù)雜度分析等。
本書(shū)內(nèi)容豐富,可供理工科中應(yīng)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算生物學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)具有一定數(shù)學(xué)背景并對(duì)數(shù)據(jù)挖掘方法有興趣的高校教師、研究生使用,也可供從事機(jī)器學(xué)習(xí)與模式識(shí)別的相關(guān)領(lǐng)域研究的科研人員和數(shù)據(jù)挖掘工作者參考。
感謝在本書(shū)編寫(xiě)過(guò)程中給予過(guò)我?guī)椭、扶持和關(guān)心的朋友,同是也感謝我的妻子,每天承擔(dān)了許多家務(wù),得讓我有時(shí)間來(lái)靜心工作,也感謝我的女兒,容忍了我由于睡眠而導(dǎo)致的有時(shí)性格的喜怒無(wú)常。
在本書(shū)撰寫(xiě)時(shí),參考了國(guó)內(nèi)外學(xué)者所著的有關(guān)相關(guān)文獻(xiàn),受益匪淺,特此向原作者致謝。由于作者水平有限,書(shū)中肯定存在不少疏漏與不足,懇請(qǐng)讀者批評(píng)指正。
羅澤舉
2014年8月于麗水學(xué)院