Tableau數(shù)據(jù)分析與可視化(微課版)
本書(shū)共11章,主要內(nèi)容包括Tableau數(shù)據(jù)可視化概述、連接數(shù)據(jù)源、Tableau基礎(chǔ)操作、Tableau可視化分析、地圖、儀表盤、連接Hadoop Hive、連接Hadoop Spark、Tableau在線服務(wù)、電商行業(yè)案例、互聯(lián)網(wǎng)行業(yè)案例等。 作為普通高等院校計(jì)算機(jī)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的教材,也可作為數(shù)據(jù)分析行業(yè)從業(yè)人員的參考用書(shū)。 作為普通高等院校計(jì)算機(jī)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的教材,也可作為數(shù)據(jù)分析行業(yè)從業(yè)人員的參考用書(shū)。
1.本書(shū)以Tableau桌面軟件Desktop為主線,詳盡介紹了Tableau的基本概念、術(shù)語(yǔ)及數(shù)據(jù)分析與可視化的各種功能和知識(shí)。
2.本書(shū)配套微課視頻,將重要的可視化操作進(jìn)行視頻講解,同步教學(xué)。
3.本書(shū)配套資源豐富,案例數(shù)據(jù)源,課件,上機(jī)實(shí)驗(yàn)指導(dǎo)等。
王國(guó)平,主要從事大數(shù)據(jù)分析與研究等工作,在國(guó)內(nèi)中文核心期刊發(fā)表多篇文章。熟練掌握數(shù)據(jù)分析和可視化軟件,從事數(shù)據(jù)分析和研究工作多年,精通Tableau、SAS、SPSS Modeler、Stata、Matlab等軟件。
第1章 Tableau數(shù)據(jù)可視化概述 001
1.1 數(shù)據(jù)可視化概述 001
1.1.1 什么是數(shù)據(jù)可視化 001
1.1.2 如何實(shí)現(xiàn)數(shù)據(jù)可視化 002
1.1.3 數(shù)據(jù)可視化的注意事項(xiàng) 002
1.2 數(shù)據(jù)可視化常用軟件 003
1.2.1 Tableau Desktop 003
1.2.2 Microsoft Power BI 004
1.2.3 阿里DataV 004
1.2.4 騰訊云圖 005
1.2.5 百度Sugar 006
1.2.6 帆軟FineBI 006
1.3 Tableau軟件概況 007
1.3.1 Tableau Desktop 007
1.3.2 Tableau Prep 007
1.3.3 Tableau Online 007
1.3.4 Tableau Server 008
1.3.5 Tableau Public 008
1.3.6 Tableau Mobile 008
1.3.7 Tableau Reader 008
1.4 初識(shí)Tableau Desktop 008
1.4.1 新增功能 008
1.4.2 開(kāi)始頁(yè)面 009
1.4.3 “數(shù)據(jù)源”界面 010
1.4.4 數(shù)據(jù)類型及其轉(zhuǎn)換 011
1.4.5 運(yùn)算符及其優(yōu)先級(jí) 014
1.4.6 文件類型 015
1.5 練習(xí)題 015
第2章 Tableau連接數(shù)據(jù)源 016
2.1 連接數(shù)據(jù)文件 016
2.1.1 Microsoft Excel 016
2.1.2 文本文件 018
2.1.3 JSON文件 019
2.1.4 Microsoft Access 020
2.1.5 PDF文件 021
2.1.6 空間文件 022
2.1.7 統(tǒng)計(jì)文件 023
2.2 連接關(guān)系型數(shù)據(jù)庫(kù) 025
2.2.1 Microsoft SQL Server 025
2.2.2 MySQL 026
2.2.3 Oracle 027
2.2.4 PostgreSQL 028
2.2.5 IBM DB2 029
2.2.6 MemSQL 030
2.3 連接非關(guān)系型數(shù)據(jù)庫(kù) 031
2.3.1 MongoDB簡(jiǎn)介 031
2.3.2 安裝MongoDB 031
2.3.3 連接MongoDB 032
2.4 連接其他數(shù)據(jù)源 034
2.4.1 阿里MaxCompute 034
2.4.2 Databricks 034
2.4.3 更多服務(wù)器 034
2.5 練習(xí)題 035
第3章 Tableau基礎(chǔ)操作 036
3.1 工作區(qū)及其操作 036
3.1.1 工具欄及其功能 036
3.1.2 “數(shù)據(jù)”窗格操作 037
3.1.3 “分析”窗格操作 038
3.1.4 功能區(qū)和卡 039
3.1.5 工作表及其操作 040
3.2 維度和度量及相關(guān)操作 043
3.2.1 維度及其操作 043
3.2.2 度量及其操作 043
3.2.3 維度字段和度量字段的轉(zhuǎn)換及案例 043
3.3 連續(xù)和離散及相關(guān)操作 045
3.3.1 連續(xù)及其操作 045
3.3.2 離散及其操作 046
3.3.3 連續(xù)字段和離散字段的轉(zhuǎn)換及案例 046
3.4 數(shù)據(jù)及視圖的導(dǎo)出 047
3.4.1 導(dǎo)出數(shù)據(jù)文件 047
3.4.2 導(dǎo)出圖形文件 048
3.4.3 導(dǎo)出PDF文件 049
3.4.4 導(dǎo)出PowerPoint文件 050
3.4.5 導(dǎo)出低版本文件 051
3.5 練習(xí)題 052
第4章 Tableau高級(jí)操作 053
4.1 創(chuàng)建字段及其案例 053
4.1.1 創(chuàng)建字段簡(jiǎn)介 053
4.1.2 創(chuàng)建字段案例 053
4.2 表計(jì)算及其案例 055
4.2.1 表計(jì)算簡(jiǎn)介 055
4.2.2 表計(jì)算案例 057
4.3 創(chuàng)建參數(shù)及其案例 058
4.3.1 創(chuàng)建參數(shù)簡(jiǎn)介 058
4.3.2 創(chuàng)建參數(shù)案例 058
4.4 函數(shù)應(yīng)用及其案例 062
4.4.1 常用函數(shù)簡(jiǎn)介 062
4.4.2 函數(shù)應(yīng)用案例 070
4.5 練習(xí)題 072
第5章 Tableau數(shù)據(jù)可視化 073
5.1 簡(jiǎn)單視圖的可視化 073
5.1.1 條形圖 073
5.1.2 餅圖 074
5.1.3 直方圖 076
5.1.4 折線圖 078
5.1.5 氣泡圖 079
5.2 復(fù)雜視圖的可視化 081
5.2.1 樹(shù)狀圖 081
5.2.2 散點(diǎn)圖 082
5.2.3 箱形圖 084
5.2.4 環(huán)形圖 085
5.2.5 傾斜圖 090
5.3 統(tǒng)計(jì)分析的可視化 094
5.3.1 相關(guān)分析 095
5.3.2 回歸分析 096
5.3.3 聚類分析 099
5.3.4 時(shí)間序列分析 102
5.4 地理數(shù)據(jù)的可視化 106
5.5 練習(xí)題 107
第6章 Tableau儀表板和故事 108
6.1 創(chuàng)建儀表板的基本要求 108
6.1.1 熟悉業(yè)務(wù)并合理規(guī)劃 108
6.1.2 利用視圖充分展示 108
6.1.3 完善視圖以避免錯(cuò)誤 109
6.2 Tableau儀表板 109
6.2.1 認(rèn)識(shí)儀表板 109
6.2.2 創(chuàng)建儀表板 109
6.2.3 完善美化儀表板 111
6.3 Tableau故事 113
6.3.1 讓故事代替PPT 113
6.3.2 創(chuàng)建故事 113
6.3.3 完善美化故事 116
6.4 共享可視化視圖 118
6.5 練習(xí)題 118
第7章 連接Hadoop集群 119
7.1 認(rèn)識(shí)Hadoop 119
7.1.1 Hadoop分布式文件系統(tǒng) 120
7.1.2 MapReduce計(jì)算框架 120
7.1.3 Apache Hadoop發(fā)行版 120
7.2 連接的基本條件 122
7.2.1 連接的前提條件 122
7.2.2 安裝驅(qū)動(dòng)程序 122
7.2.3 啟動(dòng)Hive服務(wù) 122
7.3 連接的主要步驟 123
7.3.1 連接Cloudera Hadoop大數(shù)據(jù)集群 123
7.3.2 連接MapR Hadoop Hive大數(shù)據(jù)集群 127
7.4 連接性能優(yōu)化 128
7.4.1 自定義SQL語(yǔ)句 128
7.4.2 創(chuàng)建數(shù)據(jù)提取 129
7.5 練習(xí)題 130
第8章 Tableau在線服務(wù)器 131
8.1 認(rèn)識(shí)Tableau在線服務(wù)器 131
8.1.1 注冊(cè)和免費(fèi)試用Tableau Online 131
8.1.2 創(chuàng)建和激活站點(diǎn) 132
8.1.3 服務(wù)器配置選項(xiàng)介紹 134
8.2 Tableau在線服務(wù)器基礎(chǔ)操作 139
8.2.1 設(shè)置賬戶及內(nèi)容 139
8.2.2 設(shè)置顯示及排序樣式 140
8.2.3 快速搜索與搜索幫助 141
8.3 Tableau在線服務(wù)器用戶設(shè)置 142
8.3.1 設(shè)置站點(diǎn)角色及權(quán)限 142
8.3.2 向站點(diǎn)添加用戶 143
8.3.3 創(chuàng)建和管理群組 145
8.4 Tableau在線服務(wù)器項(xiàng)目操作 148
8.4.1 創(chuàng)建和管理項(xiàng)目 148
8.4.2 創(chuàng)建項(xiàng)目工作簿 151
8.4.3 移動(dòng)項(xiàng)目工作簿 153
8.5 練習(xí)題 155
第9章 電商行業(yè)案例實(shí)戰(zhàn) 156
9.1 客戶價(jià)值分析 156
9.1.1 2014年至2020年上半年有效訂單的客戶數(shù) 157
9.1.2 2020年上半年有效訂單客戶的分布 158
9.1.3 2020年上半年不同學(xué)歷客戶購(gòu)買額 159
9.1.4 2020年上半年有效訂單量客戶排名 159
9.2 商品配送分析 160
9.2.1 2020年上半年各月份平均延遲天數(shù) 161
9.2.2 2020年上半年各地區(qū)平均延遲天數(shù) 162
9.2.3 2020年上半年各類型商品平均延遲天數(shù) 163
9.2.4 2020年上半年各門店平均延遲天數(shù) 163
9.3 商品退貨分析 164
9.3.1 2020年上半年各月份商品退貨次數(shù) 165
9.3.2 2020年上半年各地區(qū)商品退貨金額 166
9.3.3 2020年各類型商品退貨金額 167
9.3.4 2020年上半年主要退貨商品及數(shù)量 167
9.4 商品預(yù)測(cè)分析 168
9.4.1 2020年下半年商品銷售額預(yù)測(cè) 169
9.4.2 2020年下半年商品利潤(rùn)額預(yù)測(cè) 170
9.4.3 2020年下半年商品銷售量預(yù)測(cè) 171
9.4.4 2020年下半年商品退貨量預(yù)測(cè) 171
9.5 練習(xí)題 172
第10章 客戶價(jià)值畫(huà)像實(shí)戰(zhàn) 173
10.1 認(rèn)識(shí)RFM模型 173
10.1.1 RFM模型簡(jiǎn)介 173
10.1.2 RFM模型的維度 174
10.1.3 RFM模型的客戶價(jià)值分類 174
10.2 數(shù)據(jù)處理與標(biāo)準(zhǔn)化 174
10.2.1 指標(biāo)數(shù)據(jù)處理 174
10.2.2 指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化 176
10.3 數(shù)據(jù)分析與建!177
10.3.1 設(shè)置指標(biāo)參考值 177
10.3.2 判斷指標(biāo)數(shù)據(jù)優(yōu)劣 178
10.3.3 劃分客戶價(jià)值類型 179
10.4 數(shù)據(jù)可視化分析 180
10.4.1 客戶價(jià)值類型的數(shù)量分析 180
10.4.2 客戶價(jià)值類型的占比分析 181
10.4.3 客戶價(jià)值類型的地區(qū)分析 182
10.4.4 客戶價(jià)值類型的詳細(xì)名單 183
10.4.5 客戶價(jià)值類型分析儀表板 183
10.5 練習(xí)題 184
附錄 185
參考文獻(xiàn) 200