高能物理科學(xué)大數(shù)據(jù)系統(tǒng)與應(yīng)用
定 價(jià):168 元
當(dāng)前圖書已被 3 所學(xué)校薦購過!
查看明細(xì)
- 作者:程耀東,汪璐,李海波
- 出版時(shí)間:2025/3/1
- ISBN:9787030778802
- 出 版 社:科學(xué)出版社
- 中圖法分類:O572-39
- 頁碼:312
- 紙張:
- 版次:1
- 開本:16
本書介紹了高能物理領(lǐng)域的實(shí)驗(yàn)數(shù)據(jù)存儲(chǔ)和管理技術(shù),全面講解了數(shù)據(jù)管理體系架構(gòu)、海量存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)、跨地域分布式數(shù)據(jù)管理、面向事例的數(shù)據(jù)庫、數(shù)據(jù)長期保存與共享等關(guān)鍵技術(shù)。特別強(qiáng)調(diào)了如何頗髙能物理大科學(xué)裝置所帶來的海量數(shù)據(jù)管理挑戰(zhàn),包括分布式處理、深度數(shù)據(jù)挖掘與科學(xué)數(shù)據(jù)的開放共享。通過案例分析和實(shí)際應(yīng)用,展示了科學(xué)大數(shù)據(jù)管理在高能物理研究中的重要性與實(shí)際 解決方案。
更多科學(xué)出版社服務(wù),請掃碼獲取。
目錄
前言
第1章 科學(xué)大數(shù)據(jù)基礎(chǔ) 1
1.1 大數(shù)據(jù)基本概念 1
1.1.1 大數(shù)據(jù)產(chǎn)生 1
1.1.2 大數(shù)據(jù)特點(diǎn) 2
1.1.3 大數(shù)據(jù)龍 4
1.1.4 科學(xué)大數(shù)據(jù) 4
1.2 高能物理大科學(xué)裝置 6
1.2.1 大型強(qiáng)子對撞機(jī)實(shí)驗(yàn) 7
1.2.2 北京譜儀Ⅲ實(shí)驗(yàn) 9
1.2.3 大亞灣和江門中微子實(shí)驗(yàn) 10
1.2.4 高海拔宇繊觀測站 11
1.2.5 中國散列中子源 13
1.2.6 高能同步輻射光源 14
1.3 髙能物理離線數(shù)據(jù)處理 16
1.3.1 數(shù)據(jù)處理的基本過程 16
1.3.2 數(shù)據(jù)存儲(chǔ) 16
1.3.3 數(shù)據(jù)傳輸 18
1.3.4 計(jì)算集群 19
1.3.5 賄計(jì)算與分布式計(jì)算 20
1.3.6 數(shù)據(jù)長期保存與開放共享 22
1.4 高能物理科學(xué)大數(shù)據(jù)特點(diǎn) 22
1.5本章小結(jié) 24
思考題 24
參考文獻(xiàn) 24
第2章 高能物理大數(shù)據(jù)管理體系 26
2.1 大數(shù)據(jù)系統(tǒng)架構(gòu) 26
2.1.1 IT基礎(chǔ)設(shè)施 26
2.1.2 數(shù)據(jù)采集與清洗 27
2.1.3 海量數(shù)據(jù)存儲(chǔ) 29
2.1.4 并行數(shù)據(jù)處理 32
2.1.5 數(shù)據(jù)分析和挖掘工具 35
2.2 大數(shù)據(jù)基礎(chǔ)設(shè)施 36
2.3 數(shù)據(jù)生命周期管理 38
2.4 高能物理計(jì)算平臺(tái)與發(fā)展 42
2.5 本章小結(jié) 44
思考題 44
參考文獻(xiàn) 44
第3章 存儲(chǔ)技術(shù)與系統(tǒng) 46
3.1 存儲(chǔ)硬件及發(fā)展 46
3.1.1 磁盤 46
3.1.2 固態(tài)釀 49
3.1.3 磁帶 52
3.1.4 光盤 53
3.2 磁盤陣列編碼 53
3.2.1 RAID 技術(shù) 53
3.2.2 動(dòng)態(tài)磁盤池 57
3.2.3 糾刪碼 58
3.3 分布式文件系統(tǒng) 60
3.3.1 分布式文件系統(tǒng)的發(fā)展 60
3.3.2 文件訪語義 63
3.3.3 文件系統(tǒng)設(shè)計(jì) 64
3.4 磁帶管理與分層存儲(chǔ) 65
3.4.1 數(shù)據(jù)讀寫 66
3.4.2 讀寫指定位置的文件 66
3.4.3 磁帶文件元數(shù)據(jù)管理 68
3.4.4 磁帶庫、磁帶卷以及磁帶驅(qū)動(dòng)器 69
3.4.5 虛擬磁帶文件系統(tǒng) 70
3.4.6 分層存儲(chǔ) 70
3.5 實(shí)際系統(tǒng)剖析 71
3.5.1 Lustre 71
3.5.2 EOS 74
3.6 本章小結(jié) 76
思考題 76
參考文獻(xiàn) 76
第4章 事例與元數(shù)據(jù)管理 78
4.1 高能物理事例組織 78
4.1.1 高能物理事例定義 78
4.1.2 事例結(jié)構(gòu) 78
4.1.3 基于事例的高能物理數(shù)據(jù)分析 80
4.2 事例特征索引 81
4.2.1 正向索引 81
4.2.2 倒排索引 81
4.2.3 高能物理中的事例特征索引 84
4.3 高能物理元數(shù)據(jù)組織 85
4.3.1 元數(shù)據(jù)的概念及意義 85
4.3.2 元數(shù)據(jù)的組織管理方式 86
4.3.3 Bookkeeping系統(tǒng) 86
4.4 斜示系統(tǒng)剖析(EventDB) 87
4.4.1 事例特征抽取 88
4.4.2 事例索引數(shù)據(jù)庫及查詢條件歸并 89
4.4.3 面向事例的緩存 89
4.4.4 面向事例賺據(jù)傳輸 94
4.4.5 EventDB系統(tǒng)性能分析 95
4.4.6 基于EventDB的事例分析 97
4.5 本章小結(jié) 98
思考題 99
參考文獻(xiàn) 99
第5章 高能物理大數(shù)據(jù)處理模式 101
5.1 高通量計(jì)算 101
5.1.1 PBS 101
5.1.2 HTCondor 102
5.2 高性能計(jì)算 104
5.2.1 SLURM介紹 105
5.2.2 SLURM作業(yè)調(diào)度 105
5.2.3 SLURM資源管理 106
5.2.4 SLURM作業(yè)運(yùn)行 106
5.3 流式計(jì)算 107
5.3.1 實(shí)時(shí)數(shù)據(jù)集成工具 108
5.3.2 消息隊(duì)列模型 111
5.3.3 流式計(jì)算過程 113
5.3.4 流式計(jì)算系統(tǒng) 115
5.4 交互式計(jì)算 116
5.4.1 JupyterLab 117
5.4.2 Kubemetes 118
5.5 本章小結(jié) 119
思考題 119
參考文獻(xiàn) 119
第6章 高能物理大數(shù)據(jù)分析工具 121
6.1 數(shù)學(xué)與統(tǒng)計(jì)工具 121
6.1.1 Python簡介 121
6.1.2 Julia簡介 121
6.1.3 Maxima簡介 122
6.2 數(shù)據(jù)可視化軟件 124
6.2.1 ROOT 124
6.2.2 gnuplot 128
6.2.3 Maxima 140
6.2.4 Julia 145
6.2.5 學(xué)習(xí)資源 149
6.3 粒子物理模擬工具 150
6.3.1 Geant4 簡介 150
6.3.2 安裝與配置 151
6.3.3 Geant4 IS 程簡介 154
6.3.4 學(xué)習(xí)資源 160
6.4 本章小結(jié) 160
思考題 161
參考文獻(xiàn) 161
第7章 高能物理云計(jì)算 162
7.1 云計(jì)算介紹 162
7.1.1 云計(jì)算概念 162
7.1.2 虛擬化技術(shù) 163
7.1.3 云計(jì)算與網(wǎng)格計(jì)算 165
7.1.4 高能物理與云計(jì)算 166
7.2 髙能物理云計(jì)算集群系統(tǒng) 169
7.2.1 KVM虛擬機(jī)的性能測試與優(yōu)化 169
7.2.2 高能物理作業(yè)在虛擬機(jī)上的性能測試 169
7.2.3 高能物理虛擬集群資源管理平臺(tái) 170
7.3 彈性計(jì)算資源管理調(diào)度 172
7.3.1 面向多個(gè)高能物理應(yīng)用的彈性資源管理算法 172
7.3.2 面向高能物理應(yīng)用的彈性資源管理框架 173
7.4 容器與調(diào)度 177
7.4.1 容器技術(shù)概述 177
7.4.2 容器與虛擬機(jī) 178
7.4.3 容器技術(shù)在國內(nèi)外的應(yīng)用 180
7.4.4 高能物理容器技術(shù)應(yīng)用 180
7.5 案例介紹 184
7.6 本章小結(jié) 185
思考題 185
參考文獻(xiàn) 186
第8章 跨地域數(shù)據(jù)管理技術(shù) 188
8.1 網(wǎng)格數(shù)據(jù)管理 188
8.1.1 數(shù)據(jù)管理的目標(biāo) 188
8.1.2 網(wǎng)絡(luò)數(shù)據(jù)管理架構(gòu) 189
8.2 全局?jǐn)?shù)據(jù)管理 191
8.2.1 統(tǒng)一命名空間 191
8.2.2 Kademlia算法 193
8.2.3 IPFS 194
8.3 存儲(chǔ)資源管理 196
8.3.1 存儲(chǔ)資源管理簡& 196
8.3.2 SRM定位 197
8.3.3 SRM文件和空間管理 198
8.3.4 SRM的應(yīng)用示例 199
8.3.5 存儲(chǔ)資源記賬 200
8.4 數(shù)據(jù)聯(lián)盟與數(shù)據(jù)湖 201
8.4.1 數(shù)據(jù)聯(lián)盟 201
8.4.2 數(shù)據(jù)湖 202
8.5 實(shí)際系統(tǒng)剖分、析ff 203
8.5.1 Rucio分布式數(shù)據(jù)管理系$ 203
8.5.2 Dynafed 208
8.6本章小結(jié) 211
思考題 211
參考文獻(xiàn) 211
第9章 高能物理數(shù)據(jù)長期保存與開放 213
9.1 概述 213
9.2 高能物理數(shù)據(jù)分類 214
9.2.1 數(shù)據(jù)保存級別 214
9.2.2 數(shù)據(jù)共享模式 216
9.3 數(shù)據(jù)長期保存策略 217
9.3.1 數(shù)據(jù)長期保存目標(biāo) 218
9.3.2 比特級數(shù)據(jù)的長期保存 219
9.3.3 計(jì)算環(huán)境的長期保存 220
9.3.4 分析過程的長期保存 221
9.4 數(shù)據(jù)標(biāo)識(shí) 222
9.4.1 標(biāo)識(shí)符的組織 222
9.4.2 幾種推薦的數(shù)據(jù)標(biāo)識(shí)系統(tǒng) 223
9.5 數(shù)據(jù)檢索 224
9.5.1 HEPData 224
9.5.2 CERN Open Data 225
9.6 案例分析 225
9.7本章小結(jié) 228
思考題 228
參考文獻(xiàn) 228
第10章 高能物理大數(shù)據(jù)中的深度學(xué)習(xí)應(yīng)用 230
10.1 深度學(xué)習(xí)及相關(guān)知識(shí) 230
10.1.1 深度學(xué)習(xí)的基本原理 230
10.1.2 基于深度神經(jīng)網(wǎng)絡(luò)的分類 232
10.1.3 基于卷積神經(jīng)網(wǎng)絡(luò)的分類和預(yù)測 .232
10.1.4 基于非監(jiān)督學(xué)習(xí)的分類 236
10.2 基于深度學(xué)習(xí)的數(shù)據(jù)壓縮 238
10.2.1 數(shù)據(jù)壓縮的基本方法 238
10.2.2 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)壓縮 244
10.3 數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)存儲(chǔ)管理 254
10.3.1 基于監(jiān)督學(xué)習(xí)的數(shù)據(jù)分層管理 254
10.3.2 基于強(qiáng)化學(xué)習(xí)的自動(dòng)化調(diào)參 264
10.3.3 基于非監(jiān)督學(xué)習(xí)的異常檢測 269
10.4 本章小結(jié) 273
思考題 274
參考文獻(xiàn) 274
第11章 前沿技術(shù)展望 277
11.1 高性能存儲(chǔ) 277
11.1.1 存儲(chǔ)硬件雌展 277
11.1.2 固態(tài)硬盤存儲(chǔ)優(yōu)化 283
11.1.3 高性能存儲(chǔ)開發(fā)套件 287
11.1.4 基于閃存的文件系統(tǒng) 290
11.1.5 分布式異構(gòu)對象存儲(chǔ) 294
11.2 可計(jì)算存儲(chǔ) 297
11.2.1 傳統(tǒng)體系架構(gòu)的挑戰(zhàn) 297
11.2.2 可計(jì)算存儲(chǔ)體系架構(gòu) 300
11.2.3 可計(jì)算存儲(chǔ)典型應(yīng)用 302
11.3 數(shù)據(jù)組織與管理 305
11.3.1 未來的挑戰(zhàn) 305
11.3.2 數(shù)據(jù)組織 306
11.3.3 數(shù)據(jù)管理 308
11.3.4 數(shù)據(jù)訪問 309
11.4 本章小結(jié) 310
思考題 310
參考文獻(xiàn) 311