這是一個大數(shù)據爆發(fā)的時代。面對信息的激流,多元化數(shù)據的涌現(xiàn),大數(shù)據已經為個人生活、企業(yè)經營,甚至國家與社會的發(fā)展都帶來了機遇和挑戰(zhàn),大數(shù)據已經成為IT信息產業(yè)中最具潛力的藍海!按髷(shù)據導論”是一門理論性和實踐性都很強的課程。本書是為高等職業(yè)院校大數(shù)據技術與應用專業(yè)“大數(shù)據導論”課程全新設計改編的,是一本具有豐富實踐特色的新形態(tài)教材。針對高等職業(yè)院校學生的發(fā)展需求,本書系統(tǒng)、全面地介紹了大數(shù)據技術與應用的基本知識和技能,詳細介紹了大數(shù)據與大數(shù)據時代、大數(shù)據時代思維變革、大數(shù)據促進行業(yè)發(fā)展、大數(shù)據方法的驅動力、大數(shù)據存儲技術、大數(shù)據處理技術、大數(shù)據分析技術、大數(shù)據在云端等內容,具有較強的系統(tǒng)性、可讀性和實用性。
張麗娜,女,副教授,浙江安防職業(yè)技術學院專業(yè)負責人,主持省部級項目3項,市廳級項目10余項。作為主要成員參與各級別項目多項。
項目1 大數(shù)據與大數(shù)據時代
任務1.1 進入大數(shù)據時代
【導讀案例】 準確預測地震
【任務描述】
【知識準備】 進入大數(shù)據時代
1.1.1 天文學——信息爆炸的起源
1.1.2 大數(shù)據的發(fā)展
1.1.3 重新認識數(shù)據
1.1.4 數(shù)據集與數(shù)據分析
【作 業(yè)】
【實訓操作】 ETI公司的背景信息
任務1.2 熟悉大數(shù)據的定義
【導讀案例】 得數(shù)據者得天下
【任務描述】
【知識準備】 定義大數(shù)據
1.2.1 大數(shù)據的定義
1.2.2 大數(shù)據的3V和5V特征
1.2.3 廣義的大數(shù)據
1.2.4 大數(shù)據的結構類型
【作 業(yè)】
【實訓操作】 為ETI公司確定數(shù)據特征與類型
項目2 大數(shù)據時代思維變革
任務2.1 理解思維轉變之一:樣本=總體
【導讀案例】 亞馬遜推薦系統(tǒng)
【任務描述】
【知識準備】 分析更多數(shù)據而不再是只依賴于隨機采樣
2.1.1 小數(shù)據時代的隨機采樣
2.1.2 大數(shù)據與喬布斯的癌癥治療
2.1.3 全數(shù)據模式:樣本=總體
【作 業(yè)】
【實訓操作】 搜索與分析,體驗“樣本=總體”
任務2.2 理解思維轉變之二:接受數(shù)據的混雜性
【導讀案例】 數(shù)據驅動≠大數(shù)據
【任務描述】
【知識準備】 不再熱衷于追求精確度
2.2.1 允許不精確
2.2.2 大數(shù)據的簡單算法與小數(shù)據的復雜算法
2.2.3 紛繁的數(shù)據越多越好
2.2.4 混雜性是標準途徑
2.2.5 新的數(shù)據庫設計
2.2.6 5%的數(shù)字數(shù)據與95%的非結構化數(shù)據
【作 業(yè)】
【實訓操作】 搜索與分析,體驗“接受數(shù)據的混雜性”
任務2.3 理解思維轉變之三:數(shù)據的相關關系
【導讀案例】 美國百億美元望遠鏡主鏡安裝完畢
【任務描述】
【知識準備】 不再熱衷于尋找因果關系
2.3.1 關聯(lián)物,預測的關鍵
2.3.2 “是什么”,而不是“為什么”
2.3.3 通過因果關系了解世界
2.3.4 通過相關關系了解世界
【作 業(yè)】
【實訓操作】 搜索與分析,體驗“數(shù)據的相關關系”
項目3 大數(shù)據促進行業(yè)發(fā)展
任務3.1 理解大數(shù)據促進醫(yī)療與健康
【導讀案例】 大數(shù)據變革公共衛(wèi)生
【任務描述】
【知識準備】 大數(shù)據促進醫(yī)療與健康
3.1.1 大數(shù)據促進循證醫(yī)學發(fā)展
3.1.2 大數(shù)據帶來醫(yī)療保健新突破
3.1.3 醫(yī)療信息數(shù)字化
3.1.4 超級大數(shù)據的最佳伙伴——搜索
3.1.5 數(shù)據決策的成功崛起
【作 業(yè)】
【實訓操作】 熟悉大數(shù)據在醫(yī)療健康領域的應用
任務3.2 理解大數(shù)據激發(fā)創(chuàng)造力
【導讀案例】 臉書的設計決策
【任務描述】
【知識準備】 大數(shù)據激發(fā)創(chuàng)造力
3.2.1 大數(shù)據幫助改善設計
3.2.2 大數(shù)據操作回路
3.2.3 大數(shù)據資產的崛起
【作 業(yè)】
【實訓操作】 熟悉大數(shù)據如何激發(fā)創(chuàng)造力
項目4 大數(shù)據方法的驅動力
任務4.1 理解采用大數(shù)據的商業(yè)動機
【導讀案例】 大數(shù)據企業(yè)的縮影——谷歌(Google)
【任務描述】
【知識準備】 將數(shù)據變成競爭優(yōu)勢
4.1.1 大數(shù)據的跨界年度
4.1.2 谷歌的大數(shù)據行動
4.1.3 亞馬遜的大數(shù)據行動
4.1.4 將信息變成一種競爭優(yōu)勢
4.1.5 市場動態(tài)
4.1.6 業(yè)務架構
4.1.7 業(yè)務流程管理
【作 業(yè)】
【實訓操作】 理解采用大數(shù)據的商業(yè)動機
任務4.2 理解大數(shù)據規(guī)劃考慮
【導讀案例】 Google搜索算法告訴你,如何將一個人變成“傻瓜”
【任務描述】
【知識準備】 大數(shù)據的規(guī)劃考慮
4.2.1 信息與通信技術
4.2.2 萬物互聯(lián)網
4.2.3 數(shù)據獲取與數(shù)據來源
4.2.4 不同的性能挑戰(zhàn)
4.2.5 不同的管理需求
【作 業(yè)】
【實訓操作】 ETI公司掌握大數(shù)據規(guī)劃方法
任務4.3 熟悉大數(shù)據商務智能
【導讀案例】 微信支付新廣告,講了一個支付之外的故事
【任務描述】
【知識準備】 大數(shù)據的商務智能
4.3.1 OLTP與OLAP
4.3.2 抽取、轉換和加載技術
4.3.3 數(shù)據倉庫與數(shù)據集市
4.3.4 傳統(tǒng)商務智能
4.3.5 大數(shù)據商務智能
4.3.6 大數(shù)據營銷
【作 業(yè)】
【實訓操作】 學習“五力模型”,熟悉大數(shù)據商務智能
項目5 大數(shù)據存儲技術
任務5.1 熟悉大數(shù)據存儲概念
【導讀案例】 2018未來交通峰會召開,高德地圖升級易行平臺
【任務描述】
【知識準備】 大數(shù)據存儲概念
5.1.1 數(shù)據清理
5.1.2 集群
5.1.3 文件系統(tǒng)和分布式文件系統(tǒng)
5.1.4 分片與復制
5.1.5 CAP定理
5.1.6 ACID設計原則
5.1.7 BASE設計原理
【作 業(yè)】
【實訓操作】 熟悉大數(shù)據存儲的概念
任務5.2 了解大數(shù)據存儲技術
【導讀案例】 基礎領域突破非一日之功,是數(shù)十年的耕耘
【任務描述】
【知識準備】 大數(shù)據存儲技術
5.2.1 RDBMS數(shù)據庫
5.2.2 NoSQL數(shù)據庫
5.2.3 NewSQL數(shù)據庫
5.2.4 內存存儲設備
5.2.5 內存數(shù)據網格
5.2.6 內存數(shù)據庫
【作 業(yè)】
【實訓操作】 熟悉大數(shù)據存儲技術
項目6 大數(shù)據處理技術
任務6.1 熟悉大數(shù)據處理技術
【導讀案例】 Cloudera領銜大數(shù)據基礎設施
【任務描述】
【知識準備】 大數(shù)據技術架構及處理技術
6.1.1 開源技術的商業(yè)支援
6.1.2 大數(shù)據的技術架構
6.1.3 Hadoop數(shù)據處理基礎
6.1.4 處理工作量
6.1.5 批處理模式
6.1.6 SCV原則
6.1.7 實時處理模式
【作 業(yè)】
【實訓操作】 理解和熟悉大數(shù)據處理技術
項目7 大數(shù)據分析技術
任務7.1 了解大數(shù)據預測分析
【導讀案例】 葡萄酒的品質
【任務描述】
【知識準備】 大數(shù)據預測分析的內容與技術
7.1.1 什么是預測分析
7.1.2 數(shù)據具有內在預測性
7.1.3 定量分析與定性分析
7.1.4 數(shù)據挖掘
7.1.5 統(tǒng)計分析
【作 業(yè)】
【實訓操作】 大數(shù)據準備度自我評分表
任務7.2 數(shù)據的內在預測性
【導讀案例】 Google AI:機器學習預測場景深度圖,模擬人眼更進一步
【任務描述】
【知識準備】 數(shù)據的內在預測能力
7.2.1 機器學習
7.2.2 語義分析
7.2.3 視覺分析
7.2.4 情感分析
7.2.5 人工神經網絡
【作 業(yè)】
【實訓操作】 熟悉ETI企業(yè)IT團隊采用的大數(shù)據分析技術
任務7.3 熟悉大數(shù)據分析的生命周期
【導讀案例】 百度大數(shù)據為新冠病毒社會影響“畫像”:解讀疫情發(fā)展,量化經濟擊,助力政府決策
導讀案例
【任務描述】
【知識準備】 大數(shù)據分析的生命周期
7.3.1 商業(yè)案例評估
7.3.2 數(shù)據標識
7.3.3 數(shù)據獲取與過濾
7.3.4 數(shù)據提取
7.3.5 數(shù)據驗證與清理
7.3.6 數(shù)據聚合與表示
7.3.7 數(shù)據分析
7.3.8 數(shù)據可視化
7.3.9 分析結果的使用
【作 業(yè)】
【實訓操作】 ETI企業(yè)所經歷的大數(shù)據分析生命周期
項目8 大數(shù)據在云端
任務8.1 熟悉云時代背景下的大數(shù)據
【導讀案例】 亞馬遜,數(shù)據在云端
【任務描述】
【知識準備】 云端大數(shù)據的基礎設施
8.1.1 云端大數(shù)據
8.1.2 計算虛擬化
8.1.3 存儲虛擬化
8.1.4 網絡虛擬化
8.1.5 數(shù)據即服務
8.1.6 云的挑戰(zhàn)
【作 業(yè)】
【實訓操作】 熟悉云端大數(shù)據的基礎設施
任務8.2 把握大數(shù)據發(fā)展的未來
【導讀案例】 智能大數(shù)據分析成熱點
【任務描述】
【知識準備】 數(shù)據科學和大數(shù)據人才
8.2.1 數(shù)據科學
8.2.2 數(shù)據科學家與數(shù)據工作者
8.2.3 隱私權與安全性
8.2.4 連接開放數(shù)據
8.2.5 數(shù)據市場的興起
8.2.6 將原創(chuàng)數(shù)據變?yōu)樵鲋禂?shù)據
8.2.7 大數(shù)據未來展望
【作 業(yè)】
【實訓操作】 ETI企業(yè)的大數(shù)據之旅
【課程學習與實訓總結】
附錄A 課程作業(yè)參考答案
附錄B 課程學習能力測評
參考文獻