定 價(jià):38 元
叢書名:高等學(xué)校信息管理學(xué)專業(yè)系列教材
當(dāng)前圖書已被 21 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:余肖生,陳鵬,姜艷靜 著
- 出版時(shí)間:2020/7/1
- ISBN:9787307215146
- 出 版 社:武漢大學(xué)出版社
- 中圖法分類:TP274
- 頁(yè)碼:215
- 紙張:膠版紙
- 版次:1
- 開本:16開
《大數(shù)據(jù)處理:從采集到可視化》共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問(wèn)題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點(diǎn)介紹了MGO方法;第4章數(shù)據(jù)存儲(chǔ),主要介紹了大數(shù)據(jù)時(shí)代的一些主流數(shù)據(jù)存儲(chǔ)平臺(tái)和相關(guān)技術(shù);第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機(jī)森林回歸等,并介紹了其實(shí)現(xiàn)的主要步驟以及相應(yīng)的Python語(yǔ)言實(shí)現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容過(guò)濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關(guān)鍵技術(shù),主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關(guān)的交互技術(shù)。
余肖生,博士,教授,三峽大學(xué)計(jì)算機(jī)學(xué)院教授,計(jì)算機(jī)學(xué)系書記,畢業(yè)于武漢大學(xué)信息管理學(xué)院。近年來(lái)發(fā)表各類學(xué)術(shù)論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。
第1章 數(shù)據(jù)采集
1.1 大數(shù)據(jù)概念
1.2 大數(shù)據(jù)類型及特征
1.3 數(shù)據(jù)采集方法
1.3.1 問(wèn)卷調(diào)查方法
1.3.2 網(wǎng)絡(luò)用戶數(shù)據(jù)收集方法
1.3.3 系統(tǒng)曰志采集方法
1.3.4 網(wǎng)絡(luò)數(shù)據(jù)采集方法
第2章 數(shù)據(jù)清洗
2.1 數(shù)據(jù)質(zhì)量維度
2.2 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)可能存在的問(wèn)題
2.3 數(shù)據(jù)質(zhì)量問(wèn)題的原因分析
2.3.1 數(shù)據(jù)源數(shù)據(jù)質(zhì)量問(wèn)題的原因分析
2.3.2 數(shù)據(jù)分析階段數(shù)據(jù)質(zhì)量問(wèn)題的原因分析
2.4 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)問(wèn)題處理方法
2.4.1 變化量識(shí)別
2.4.2 錯(cuò)誤拒絕
2.4.3 列清洗
2.4.4 行過(guò)濾
2.5 記錄匹配算法
……