從0到1——Python數(shù)據(jù)分析
定 價(jià):89.9 元
- 作者:莫振杰
- 出版時(shí)間:2022/5/1
- ISBN:9787115585868
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:436
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
作者根據(jù)自己多年的前后端開(kāi)發(fā)經(jīng)驗(yàn),站在完全零基礎(chǔ)讀者的角度,詳盡介紹了Pytho數(shù)據(jù)分析的基礎(chǔ)知識(shí),以及大量的開(kāi)發(fā)技巧,全書(shū)圍繞著“數(shù)據(jù)分析三劍客(NumPy、Pandas、Matplotlib)”進(jìn)行細(xì)致的介紹。這三款工具的知識(shí)點(diǎn)非常多,本書(shū)盡量系統(tǒng)細(xì)致地介紹最精華的知識(shí)點(diǎn),以便為讀者構(gòu)建一個(gè)完善的知識(shí)體系,并且為后續(xù)的工作打下堅(jiān)實(shí)的基礎(chǔ)。 每一章后面的實(shí)戰(zhàn)題以及練習(xí)題,經(jīng)過(guò)精心設(shè)計(jì),可以鍛煉讀者的數(shù)據(jù)分析實(shí)戰(zhàn)能力,對(duì)于鞏固基礎(chǔ)以及鍛煉技術(shù)是非常有幫助的。
·源自綠葉學(xué)習(xí)網(wǎng)Python教程
·內(nèi)容豐富,詳細(xì)教程,非理工科專業(yè)也能看得懂
·此系列教程被眾多院校與機(jī)構(gòu)選作核心教材
·講透NumPy,Pandas,Matplotlib三大數(shù)據(jù)分析利器
·通俗易懂,風(fēng)趣幽默,適合零基礎(chǔ)初學(xué)人士,無(wú)痛掌握新知識(shí)
·豐富資源:課件PPT+配套網(wǎng)站+源碼素材+配套練習(xí)+技術(shù)問(wèn)答
莫振杰,畢業(yè)于暨南大學(xué)信科院計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),從事前后端開(kāi)發(fā)4年多,開(kāi)發(fā)過(guò)綠葉學(xué)習(xí)網(wǎng)、廣州智能工程研究會(huì)網(wǎng)站、大量在線應(yīng)用工具及其他各種類型網(wǎng)站,著有多本編程書(shū)且銷量過(guò)萬(wàn), 現(xiàn)為綠葉學(xué)習(xí)網(wǎng)的站長(zhǎng),該網(wǎng)站用于分享其在前后端開(kāi)發(fā)中的一些經(jīng)驗(yàn),其制作的前后端開(kāi)發(fā)在線教程在互聯(lián)網(wǎng)引起廣泛關(guān)注,每一個(gè)教程廣受網(wǎng)友稱贊與推崇。
目 錄
前言 xvii
第 一部分 NumPy篇
第 1章 數(shù)據(jù)分析概述 3
1.1 數(shù)據(jù)分析簡(jiǎn)介 3
1.1.1 數(shù)據(jù)科學(xué)是什么? 3
1.1.2 數(shù)據(jù)分析是什么? 4
1.1.3 應(yīng)該學(xué)些什么? 4
1.2 課程介紹 6
1.2.1 課程說(shuō)明 6
1.2.2 常見(jiàn)問(wèn)題 6
1.3 使用 VSCode 7
1.3.1 安裝 VSCode 7
1.3.2 安裝插件 8
1.3.3 運(yùn)行代碼 9
第 2章 NumPy基礎(chǔ) 11
2.1 NumPy是什么? 11
2.2 創(chuàng)建數(shù)組 12
2.2.1 基本方法 12
2.2.2 隨機(jī)數(shù)組 18
2.2.3 數(shù)組與列表的區(qū)別 21
2.3 數(shù)組屬性 22
2.4 元素操作 24
2.4.1 訪問(wèn)元素 25
2.4.2 修改元素 26
2.4.3 添加元素 26
2.4.4 刪除元素 28
2.4.5 切片 29
2.5 數(shù)組操作 31
2.5.1 修改形狀 31
2.5.2 修改維度 33
2.5.3 翻轉(zhuǎn)數(shù)組 34
2.5.4 數(shù)組去重 34
2.5.5 合并數(shù)組 35
2.5.6 分割數(shù)組 37
2.6 各種運(yùn)算 39
2.6.1 基本運(yùn)算 39
2.6.2 比較運(yùn)算 41
2.6.3 標(biāo)量運(yùn)算 42
2.6.4 數(shù)學(xué)函數(shù) 43
2.6.5 統(tǒng)計(jì)函數(shù) 45
2.7 遍歷數(shù)組 53
2.8 大小排序 55
2.9 本章練習(xí) 57
第3章 NumPy進(jìn)階 58
3.1 淺拷貝和深拷貝 58
3.1.1 淺拷貝 58
3.1.2 深拷貝 59
3.2 axis的值 60
3.3 廣播機(jī)制 61
3.3.1 維數(shù)不同 61
3.3.2 維數(shù)相同 63
3.3.3 標(biāo)量運(yùn)算 64
3.4 讀寫(xiě)文件 65
3.4.1 讀取文件 65
3.4.2 寫(xiě)入文件 66
3.5 矩陣簡(jiǎn)介 67
3.5.1 全0矩陣 68
3.5.2 全1矩陣 69
3.5.3 單位矩陣 69
3.5.4 隨機(jī)矩陣 70
3.6 本章練習(xí) 71
第二部分 Pandas篇
第4章 Pandas簡(jiǎn)介 75
4.1 Pandas是什么? 75
4.2 Series 76
4.2.1 創(chuàng)建Series 76
4.2.2 Series的屬性 78
4.2.3 獲取某行的值 78
4.2.4 深入了解 79
4.3 DataFrame 79
4.3.1 創(chuàng)建DataFrame 79
4.3.2 DataFrame的屬性 83
4.3.3 深入了解 86
4.4 DataFrame的數(shù)據(jù)操作 88
4.4.1 訪問(wèn)數(shù)據(jù) 88
4.4.2 修改數(shù)據(jù) 95
4.4.3 添加數(shù)據(jù) 96
4.4.4 刪除數(shù)據(jù) 98
4.5 遍歷行列 101
4.5.1 遍歷行 101
4.5.2 遍歷列 102
4.6 深入了解 103
4.7 本章練習(xí) 105
第5章 獲取數(shù)據(jù) 107
5.1 數(shù)據(jù)分析流程 107
5.2 讀寫(xiě)數(shù)據(jù)簡(jiǎn)介 108
5.3 讀寫(xiě)JSON 109
5.3.1 JSON簡(jiǎn)介 109
5.3.2 讀取JSON 110
5.3.3 寫(xiě)入JSON 111
5.4 讀寫(xiě)CSV 113
5.4.1 CSV簡(jiǎn)介 113
5.4.2 讀取CSV 114
5.4.3 寫(xiě)入CSV 116
5.5 讀寫(xiě)Excel 117
5.5.1 Excel簡(jiǎn)介 117
5.5.2 讀取Excel 118
5.5.3 寫(xiě)入Excel 119
5.6 讀寫(xiě)HTML 120
5.7 深入文件讀取 122
5.7.1 分塊讀取 122
5.7.2 只讀取一部分 124
5.8 讀取數(shù)據(jù)庫(kù) 125
5.8.1 安裝MySQL 125
5.8.2 安裝Navicat for MySQL 129
5.8.3 讀取MySQL 134
5.9 本章練習(xí) 136
第6章 篩選數(shù)據(jù) 137
6.1 篩選數(shù)據(jù)簡(jiǎn)介 137
6.2 獲取行、列:loc[]、iloc[]和df[] 138
6.2.1 獲取行 138
6.2.2 獲取列 139
6.3 重新索引:reindex() 141
6.3.1 語(yǔ)法簡(jiǎn)介 141
6.3.2 深入了解 143
6.4 獲取首尾數(shù)據(jù):head()和tail() 145
6.5 隨機(jī)抽樣:sample() 147
6.6 邏輯比較 149
6.6.1 語(yǔ)法簡(jiǎn)介 149
6.6.2 深入了解 152
6.7 過(guò)濾操作 155
6.7.1 query() 155
6.7.2 filter() 157
6.8 模式匹配 159
6.9 本章練習(xí) 162
第7章 處理數(shù)據(jù) 164
7.1 處理數(shù)據(jù)簡(jiǎn)介 164
7.2 操作行名和列名 165
7.2.1 設(shè)置某一列為行名 165
7.2.2 重置行名 166
7.2.3 修改行名和列名 168
7.3 類型轉(zhuǎn)換 171
7.3.1 針對(duì)DataFrame 171
7.3.2 針對(duì)某一列 174
7.4 行列轉(zhuǎn)置:T 175
7.5 大小排序:sort_values() 176
7.6 數(shù)據(jù)排名:rank() 179
7.7 數(shù)據(jù)替換:replace() 181
7.8 數(shù)據(jù)移動(dòng):shift() 183
7.9 數(shù)據(jù)清洗 185
7.9.1 缺失值 186
7.9.2 重復(fù)值 192
7.9.3 異常值 196
7.10 數(shù)據(jù)合并 197
7.10.1 軸向合并:concat() 198
7.10.2 主鍵合并:merge() 203
7.10.3 行列連接:join() 207
7.10.4 縱向合并:append() 208
7.11 字符串處理 209
7.11.1 獲取長(zhǎng)度:len() 210
7.11.2 統(tǒng)計(jì)次數(shù):count() 211
7.11.3 去除空格:strip() 212
7.11.4 替換字符串:replace() 213
7.11.5 分割字符串:split() 214
7.11.6 重復(fù)字符串:repeat() 215
7.11.7 連接列:cat() 216
7.11.8 大小寫(xiě)轉(zhuǎn)換 219
7.11.9 判斷類型 220
7.11.10 判斷包含 221
7.12 自定義函數(shù) 222
7.12.1 map() 222
7.12.2 apply() 224
7.12.3 applymap() 226
7.13 實(shí)戰(zhàn)題:處理天氣數(shù)據(jù) 227
7.14 實(shí)戰(zhàn)題:拆分?jǐn)?shù)據(jù) 229
7.15 本章練習(xí) 230
第8章 分析數(shù)據(jù) 232
8.1 分析數(shù)據(jù)簡(jiǎn)介 232
8.2 基本統(tǒng)計(jì)函數(shù) 232
8.2.1 求和:sum() 233
8.2.2 統(tǒng)計(jì)個(gè)數(shù):count() 235
8.2.3 求最值:max()與min() 236
8.2.4 求中位數(shù):median() 238
8.2.5 求眾數(shù):mode() 239
8.2.6 求平均數(shù):mean() 240
8.2.7 求方差:var() 241
8.2.8 求標(biāo)準(zhǔn)差:std() 242
8.2.9 求分位數(shù):quantile() 243
8.3 其他統(tǒng)計(jì)函數(shù) 244
8.3.1 統(tǒng)計(jì)取值種類 244
8.3.2 統(tǒng)計(jì)取值個(gè)數(shù) 245
8.3.3 求變化百分比 246
8.3.4 求最值的行名 247
8.4 整體情況 247
8.4.1 describe() 248
8.4.2 info() 248
8.5 聚合函數(shù):agg() 249
8.6 數(shù)據(jù)分組 252
8.6.1 基本語(yǔ)法 252
8.6.2 統(tǒng)計(jì)分析 256
8.7 實(shí)戰(zhàn)題:求平均壽命 258
8.8 本章練習(xí) 259
第9章 時(shí)間序列 260
9.1 時(shí)間序列概述 260
9.1.1 時(shí)間序列簡(jiǎn)介 260
9.1.2 轉(zhuǎn)換類型 261
9.1.3 獲取日期 264
9.1.4 索引與切片 266
9.2 重采樣:resample() 268
9.2.1 降采樣 268
9.2.2 升采樣 271
9.3 移動(dòng)計(jì)算:rolling() 273
9.4 分組器:Grouper() 274
9.5 實(shí)戰(zhàn)題:求每個(gè)月的銷量總和 276
9.6 本章練習(xí) 277
第 10章 高級(jí)技術(shù) 279
10.1 透視表 279
10.1.1 透視表簡(jiǎn)介 279
10.1.2 統(tǒng)計(jì)函數(shù) 281
10.2 交叉表 282
10.3 層次化索引 284
10.3.1 層次化索引簡(jiǎn)介 284
10.3.2 常用操作 286
10.4 離散化處理 292
10.4.1 離散化簡(jiǎn)介 292
10.4.2 常用參數(shù) 293
10.5 啞變量處理 296
10.6 實(shí)戰(zhàn)題:創(chuàng)建透視表 298
10.7 本章練習(xí) 299
第 11章 其他操作 300
11.1 廣播機(jī)制 300
11.2 索引對(duì)象 301
11.3 inplace參數(shù) 304
11.4 缺失值 306
11.5 實(shí)戰(zhàn)題:統(tǒng)計(jì)每一列的缺失值個(gè)數(shù) 307
11.6 本章練習(xí) 308
第三部分 Matplotlib篇
第 12章 基礎(chǔ)圖表 313
12.1 Matplotlib簡(jiǎn)介 313
12.2 基本繪圖(折線圖) 315
12.2.1 基本語(yǔ)法 315
12.2.2 定義樣式 317
12.3 通用設(shè)置 325
12.3.1 畫(huà)布樣式 325
12.3.2 定義標(biāo)題 326
12.3.3 定義圖例 330
12.3.4 刻度標(biāo)簽 332
12.3.5 刻度范圍 335
12.3.6 網(wǎng)格線 338
12.3.7 參考線 340
12.3.8 參考區(qū)域 343
12.3.9 注釋文本(有指向) 345
12.3.10 注釋文本(無(wú)指向) 347
12.4 通用樣式 350
12.5 散點(diǎn)圖 350
12.5.1 基本語(yǔ)法 350
12.5.2 定義樣式 352
12.5.3 氣泡圖 354
12.6 柱形圖 356
12.6.1 基本語(yǔ)法 356
12.6.2 高級(jí)柱形圖 358
12.6.3 條形圖 361
12.7 直方圖 362
12.7.1 基本語(yǔ)法 362
12.7.2 定義樣式 364
12.8 餅狀圖 366
12.8.1 基本語(yǔ)法 366
12.8.2 定義樣式 367
12.8.3 圓環(huán)圖 372
12.9 實(shí)戰(zhàn)題:繪制氣溫折線圖 373
12.10 實(shí)戰(zhàn)題:瀏覽器所占市場(chǎng)份額柱形圖 375
第 13章 高級(jí)圖表 378
13.1 高級(jí)圖表簡(jiǎn)介 378
13.2 箱線圖 378
13.2.1 基本語(yǔ)法 378
13.2.2 樣式定義 381
13.3 面積圖 387
13.3.1 基本語(yǔ)法 387
13.3.2 高級(jí)面積圖 388
13.4 棉棒圖 389
13.4.1 基本語(yǔ)法 389
13.4.2 定義樣式 390
13.5 熱力圖 393
13.5.1 基本語(yǔ)法 393
13.5.2 定義樣式 394
13.6 子圖表 395
13.6.1 基本語(yǔ)法 395
13.6.2 實(shí)際案例 398
13.7 實(shí)戰(zhàn)題:使用箱線圖查找異常值 399
13.8 實(shí)戰(zhàn)題:繪制每月銷量的棉棒圖 401
第四部分 工具篇
第 14章 Jupyter Notebook 407
14.1 Jupyter Notebook簡(jiǎn)介 407
14.2 Jupyter Notebook的使用 408
14.2.1 安裝Anaconda 409
14.2.2 運(yùn)行Jupyter Notebook 409
14.3 應(yīng)用場(chǎng)景 411
14.4 常用技巧 414
14.4.1 問(wèn)號(hào)查詢 414
14.4.2 輸出多個(gè)變量 415
14.4.3 讀取文件 417
第五部分 附錄
附錄A 讀寫(xiě)文件(Pandas) 422
附錄B 統(tǒng)計(jì)函數(shù)(Pandas) 423
附錄C 繪圖函數(shù)(Matplotlib)424