定 價:132 元
叢書名:普通高等教育“十三五”規(guī)劃教材普通高等院校工程實踐系列規(guī)劃教材
- 作者:陳燕,李桃迎,張金松編著
- 出版時間:2017/12/1
- ISBN:9787030531889
- 出 版 社:科學出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:1
- 開本:16K
《非結構化數(shù)據(jù)處理技術及應用》系統(tǒng)詳細地闡述了非結構化數(shù)據(jù)的處理方法與技術。通過對非結構化數(shù)據(jù)特點的分析,從非結構化數(shù)據(jù)的基礎知識和理論、開源工具及應用舉例、數(shù)據(jù)預處理、預測模型研究、網頁數(shù)據(jù)的采集、非關系型數(shù)據(jù)庫存儲、結構化大數(shù)據(jù)分析平臺、電商個性化推薦系統(tǒng)的應用、網購評語情感挖掘、全文檢索技術、基于主題的檢索系統(tǒng)等不同角度給出了結構化與非結構化數(shù)據(jù)的分析、挖掘與應用內容。
更多科學出版社服務,請掃碼獲取。
目錄
基礎知識篇
第1章 非結構化數(shù)據(jù)的基礎知識 3
1.1 大數(shù)據(jù)的基本概念 3
1.2 非結構化數(shù)據(jù)的基本概念 11
1.3 非結構化數(shù)據(jù)研究的必要性 12
1.4 非結構化數(shù)據(jù)挖掘的研究領域 13
第2章 非結構化數(shù)據(jù)挖掘的基礎理論 18
2.1 數(shù)據(jù)挖掘 18
2.2 數(shù)據(jù)挖掘與其他技術的關系 29
2.3 圖像挖掘 33
2.4 視頻挖掘 34
第3章 非結構化數(shù)據(jù)挖掘的開源工具及應用舉例 37
3.1 WEKA 37
3.2 R語言簡介 49
結構化數(shù)據(jù)挖掘技術篇
第4章 數(shù)據(jù)預處理技術 61
4.1 數(shù)據(jù)預處理 62
4.2 數(shù)據(jù)清理 63
4.3 數(shù)據(jù)集成和融合 66
4.4 數(shù)據(jù)變換 67
4.5 數(shù)據(jù)歸約 70
第5章 預測模型研究與應用 75
5.1 預測模型的基礎理論 75
5.2 回歸分析預測模型 77
5.3 趨勢外推預測模型 92
5.4 時間序列預測模型 99
5.5 基于神經網絡的預測模型 111
5.6 馬爾可夫預測模型 124
第6章 網頁數(shù)據(jù)的采集技術 129
6.1 網站信息采集相關技術研究 129
6.2 基于爬蟲的網站信息采集技術整合設計 138
6.3 基于爬蟲的網站信息采集技術整合實現(xiàn) 155
第7章 非關系型數(shù)據(jù)庫存儲技術 168
7.1 非關系型數(shù)據(jù)庫系統(tǒng)發(fā)展的必然性 168
7.2 非關系型數(shù)據(jù)庫理論 174
7.3 非關系型數(shù)據(jù)庫的使用范例 180
非結構化數(shù)據(jù)挖掘方法及應用篇
第8章 非結構化大數(shù)據(jù)的分析平臺 193
8.1 HDFS海量存儲 195
8.2 Map Reduce 200
8.3 Spark 207
第9章 電商個性化推薦系統(tǒng)的應用 211
9.1 國內外研究現(xiàn)狀 211
9.2 電子商務個性化推薦系統(tǒng)理論與技術介紹 212
9.3 基于協(xié)同過濾的個性化推薦算法研究與優(yōu)化 226
9.4 基于移動平臺的電商個性化推薦系統(tǒng)設計與實現(xiàn) 243
第10章 網購評語情感挖掘的應用 272
10.1 國內外研究現(xiàn)狀 272
10.2 情感挖掘理論知識基礎 275
10.3 改進情感傾向模型的建立 291
10.4 改進情感傾向模型的應用驗證 300
10.5 基于情感挖掘的預測分析應用 315
參考文獻 329
附錄一 肯定性和否定性參考詞組問卷調查 340
附錄二 特殊程度詞的影響程度問卷調查 341