本書采用知識理論與實驗案例相結(jié)合的方式展開講述。在相應(yīng)知識點闡述過程中,以人們在日常工作、學(xué)習(xí)中經(jīng)常碰到的具體問題作為案例,結(jié)合大數(shù)據(jù)挖掘和處理的基本理論與知識,展示解決問題的思路和基本方法,從而加強讀者對大數(shù)據(jù)的理解和感性認(rèn)知,找到大數(shù)據(jù)應(yīng)用背后的基本原理和邏輯路徑。本書內(nèi)容主要包括:大數(shù)據(jù)概述、大數(shù)據(jù)思維、大數(shù)據(jù)支撐技術(shù)、大數(shù)據(jù)采集與預(yù)處理、大數(shù)據(jù)分析與挖掘、深度學(xué)習(xí)與人工智能、大數(shù)據(jù)可視化。
郭清溥,教授,現(xiàn)任河南財經(jīng)政法大學(xué)現(xiàn)代教育技術(shù)中心主任兼計算機實驗教學(xué)中心主任。近五年來,共承擔(dān)本科生《大學(xué)計算機》、《Visual Basic程序設(shè)計》、《Excel數(shù)據(jù)分析與應(yīng)用》等課程的教學(xué)任務(wù)。發(fā)表教改論文、主持和參加省、學(xué)校教改項目8項,出版國家級規(guī)劃教材3部、河南省統(tǒng)編教材6部,在國際學(xué)術(shù)會議、全國性學(xué)術(shù)會議和多類科技期刊上發(fā)表學(xué)術(shù)論文20余篇,主持和參與河南省科技攻關(guān)計劃項目、河南省軟科學(xué)計劃項目等各類科研項目9項。擔(dān)任全國高等學(xué)校計算機基礎(chǔ)教育研究會常務(wù)理事,財經(jīng)管理專業(yè)委員會委員, 文科專業(yè)委員會委員兼文史分委會副主任。河南省高等學(xué)校計算機教育研究會常務(wù)理事,基礎(chǔ)教育委員會主任。中國大學(xué)生計算機設(shè)計大賽組織委員會委員。中國大學(xué)生計算機設(shè)計大賽河南省級賽組織委員會秘書長等社會兼職
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)時代
1.1.1 大數(shù)據(jù)時代的數(shù)據(jù)特征
1.1.2 大數(shù)據(jù)時代的大數(shù)據(jù)服務(wù)
1.2 大數(shù)據(jù)相關(guān)概念
1.2.1 大數(shù)據(jù)定義
1.2.2 大數(shù)據(jù)空間
1.2.3 大數(shù)據(jù)處理
1.2.4 大數(shù)據(jù)系統(tǒng)
1.3 大數(shù)據(jù)應(yīng)用現(xiàn)狀
1.3.1 金融與財務(wù)大數(shù)據(jù)應(yīng)用案例
1.3.2 其他領(lǐng)域的大數(shù)據(jù)應(yīng)用案例
1.4 大數(shù)據(jù)相關(guān)技術(shù)
1.4.1 物聯(lián)網(wǎng)技術(shù)
1.4.2 云技術(shù)
1.4.3 移動互聯(lián)網(wǎng)技術(shù)
1.4.4 人工智能技術(shù)
1.5 大數(shù)據(jù)解決方案
1.6 大數(shù)據(jù)與企業(yè)數(shù)字化轉(zhuǎn)型
1.6.1 財務(wù)智能化轉(zhuǎn)型的機遇與挑戰(zhàn)
1.6.2 數(shù)字化轉(zhuǎn)型案例
1.7 大數(shù)據(jù)面臨的挑戰(zhàn)與發(fā)展展望
第2章 大數(shù)據(jù)思維
2.1 大數(shù)據(jù)思維的重要意義
2.2 數(shù)據(jù)核心思維
2.3 數(shù)據(jù)決策思維
2.4 數(shù)據(jù)全樣思維
2.5 數(shù)據(jù)容錯思維
2.6 數(shù)據(jù)關(guān)聯(lián)思維
2.7 數(shù)據(jù)傳遞思維
2.8 數(shù)據(jù)乘法思維
第3章 大數(shù)據(jù)支撐技術(shù)
3.1 虛擬化技術(shù)
3.1.1 虛擬化技術(shù)概述
3.1.2 虛擬化技術(shù)的發(fā)展與分類
3.1.3 虛擬化包含的組件與方法
3.1.4 虛擬化的優(yōu)勢
3.1.5 虛擬化的應(yīng)用
3.1.6 虛擬化與云計算
3.1.7 存儲虛擬化
3.1.8 系統(tǒng)虛擬化
3.1.9 桌面虛擬化
3.1.10 應(yīng)用虛擬化
3.1.11 典型虛擬化產(chǎn)品
3.1.12 虛擬化實現(xiàn)案例
3.2 云計算
3.2.1 云計算概述
3.2.2 云計算產(chǎn)業(yè)鏈發(fā)展
3.2.3 云計算架構(gòu)與模式
3.2.4 云計算的關(guān)鍵技術(shù)
3.3 存儲技術(shù)
3.3.1 存儲介質(zhì)的發(fā)展
3.3.2 存儲體系架構(gòu)的發(fā)展
3.3.3 云存儲技術(shù)
3.4 開源大數(shù)據(jù)生態(tài)系統(tǒng)
3.4.1 Linux
3.4.2 Hadoop
3.4.3 基于Linux+Hadoop的大數(shù)據(jù)云系統(tǒng)構(gòu)建
3.5 Spark
3.6 數(shù)據(jù)庫與數(shù)據(jù)倉庫技術(shù)
3.6.1 大數(shù)據(jù)與數(shù)據(jù)庫的關(guān)系
3.6.2 數(shù)據(jù)庫技術(shù)概述
3.6.3 數(shù)據(jù)倉庫技術(shù)概述
第4章 大數(shù)據(jù)采集與預(yù)處理
4.1 數(shù)據(jù)爬取
4.1.1 數(shù)據(jù)爬取概述
4.1.2 數(shù)據(jù)爬取案例
4.2 數(shù)據(jù)變換與集成
4.2.1 數(shù)據(jù)變換與集成概述
4.2.2 數(shù)據(jù)變換案例
4.3 數(shù)據(jù)規(guī)約
4.3.1 數(shù)據(jù)規(guī)約概述
4.3.2 數(shù)據(jù)規(guī)約案例
4.4 數(shù)據(jù)清洗
4.4.1 數(shù)據(jù)清洗概述
4.4.2 數(shù)據(jù)清洗案例
4.5 數(shù)據(jù)管理平臺
第5章 大數(shù)據(jù)分析與挖掘
5.1 數(shù)據(jù)挖掘概述
5.1.1 數(shù)據(jù)挖掘起源
5.1.2 數(shù)據(jù)挖掘定義
5.1.3 數(shù)據(jù)挖掘技術(shù)與應(yīng)用
5.1.4 數(shù)據(jù)挖掘流程與模型
5.2 數(shù)據(jù)挖掘工具
5.2.1 Sklearn
5.2.2 Spark MLlib
5.3 數(shù)據(jù)挖掘算法
5.3.1 關(guān)聯(lián)
5.3.2 分類
5.3.3 聚類
第6章 深度學(xué)習(xí)與人工智能
6.1 深度學(xué)習(xí)概述
6.1.1 深度學(xué)習(xí)定義
6.1.2 深度學(xué)習(xí)應(yīng)用領(lǐng)域
6.2 人工智能與大數(shù)據(jù)
6.2.1 人工智能與大數(shù)據(jù)的區(qū)別
6.2.2 人工智能與大數(shù)據(jù)的關(guān)聯(lián)
6.3 深度學(xué)習(xí)工具
6.3.1 TensorFlow
6.3.2 PyTorch
6.4 深度學(xué)習(xí)案例
6.4.1 手寫數(shù)字識別案例
6.4.2 語音識別案例
6.4.3 人工智能與企業(yè)運營數(shù)字化
6.4.4 人工智能在企業(yè)財務(wù)工作中的應(yīng)用
第7章 大數(shù)據(jù)可視化
7.1 數(shù)據(jù)可視化概述
7.1.1 數(shù)據(jù)可視化的概念
7.1.2 數(shù)據(jù)可視化市場與發(fā)展
7.1.3 數(shù)據(jù)可視化的特征與趨勢
7.2 可視化工具與應(yīng)用案例
7.2.1 Excel
7.2.2 Matplotlib
7.2.3 Highcharts
7.2.4 可視化平臺—— 浪潮BA