實驗數(shù)據(jù)多元統(tǒng)計分析
定 價:78 元
叢書名:現(xiàn)代物理基礎(chǔ)叢書
- 作者:朱永生編著
- 出版時間:2017/3/1
- ISBN:9787030236760
- 出 版 社:科學(xué)出版社
- 中圖法分類:O212.4
- 頁碼:
- 紙張:膠版紙
- 版次:31
- 開本:B5
《現(xiàn)代物理基礎(chǔ)叢書·典藏版:實驗數(shù)據(jù)多元統(tǒng)計分析》介紹實驗或測量數(shù)據(jù)的多元統(tǒng)計分析方法,內(nèi)容包括:貝葉斯決策、線性判別方法、決策樹判別、人工神經(jīng)網(wǎng)絡(luò)、近鄰法、概率密度估計量法、H矩陣判別、函數(shù)判別分析、支持向量機法等,以及不同判別方法的比較。此外,還簡要介紹了將多種多元統(tǒng)計分析方法的計算機程序匯集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理實驗數(shù)據(jù)分析中應(yīng)用多元統(tǒng)計分析方法的一些實例。
《現(xiàn)代物理基礎(chǔ)叢書·典藏版:實驗數(shù)據(jù)多元統(tǒng)計分析》可供實驗物理工作者和大專院校相關(guān)專業(yè)師生、理論物理研究人員、工程技術(shù)人員及從事自然科學(xué)和社會科學(xué)的數(shù)據(jù)測量和分析研究人員參考。
更多科學(xué)出版社服務(wù),請掃碼獲取。
導(dǎo)語_點評_推薦詞
復(fù)雜大系統(tǒng)的科學(xué)研究往往都需要收集和處理大量反映系統(tǒng)特征和運行狀態(tài)的數(shù)據(jù)信息,這類原始數(shù)據(jù)集合由于樣本數(shù)量巨大,刻畫系統(tǒng)特征的指標變量眾多,并且?guī)в须S機性質(zhì),以致于形成了規(guī)模宏大、復(fù)雜難辨的數(shù)據(jù)海洋。利用統(tǒng)計學(xué)和數(shù)學(xué)方法對多維復(fù)雜數(shù)據(jù)集合進行科學(xué)的分析,挖掘出隱藏在復(fù)雜海量數(shù)據(jù)中的規(guī)律和信息,就是多元統(tǒng)計分析研究的基本內(nèi)容。
大型高能物理實驗就是典型的復(fù)雜大系統(tǒng)的科學(xué)研究工作。20世紀80年代末北京正負電子對撞機(BEPC)和北京譜儀(BES)的建成,是中國高能加速器實驗物理的真正開端。在北京譜儀上進行實驗工作的研究組是以譜儀的名稱(Beijing Spectrometer)命名的,簡稱BES合作組,它是由多國物理學(xué)家組成的國際合作研究組,我國物理學(xué)家在其中占有主導(dǎo)性的地位。北京譜儀成功地運行到2004年,獲取了-粲能區(qū)海量的高能物理實驗數(shù)據(jù)。在此基礎(chǔ)上,應(yīng)用多元統(tǒng)計分析方法對實驗數(shù)據(jù)進行分析,獲得了大量居于當(dāng)時世界領(lǐng)先水平的物理成果。其中,輕子質(zhì)量的精確測量、2-5GeV能區(qū)R值的精確測量、共振態(tài)X(1835)的實驗觀察、粒子的實驗確定,更是引起當(dāng)時國際高能物理界廣泛矚目的重大成就。
為了保持和發(fā)展我國在高能物理粲能區(qū)實驗研究的領(lǐng)先地位,我國政府又撥巨資對北京正負電子對撞機和北京譜儀進行升級改進,稱為BEPCII和BESIII。BEPCII的設(shè)計指標是產(chǎn)生粒子反應(yīng)的強度約為原對撞機的100倍,BESIII的性能則比原北京譜儀有大幅度的提高。目前,BEPCII和BESIII已經(jīng)完成安裝,并在2008年開始實驗取數(shù)。有理由期望,利用升級改進后的BESIII,可以獲得比原北京譜儀更多、更精細、更重要的物理成果。為了達到這一目標,應(yīng)用比原北京譜儀數(shù)據(jù)分析更為精細、更為有效的多元統(tǒng)計分析方法成為一個十分重要和急迫的任務(wù)。事實上,多元統(tǒng)計分析方法應(yīng)用于高能物理實驗數(shù)據(jù)分析近年來已經(jīng)成為國際高能物理界的一種普遍趨勢。
本書對于實驗數(shù)據(jù)分析中,特別是高能物理實驗數(shù)據(jù)分析中涉及的多元統(tǒng)計分析方法作一概略的介紹。重點討論統(tǒng)計識別的基本原理以及進行統(tǒng)計識別的具體方法;對于復(fù)雜的數(shù)學(xué)理論,只介紹其結(jié)果,而不作深奧的證明。目的是希望讀者能夠通過本書掌握多元統(tǒng)計分析的方法并將其付諸實施,特別是能在BESIII的數(shù)據(jù)
目錄
前言
第一章 緒論 1
1.1 模式和模式識別 1
1.2 模式識別系統(tǒng) 2
1.2.1 原始數(shù)據(jù)獲取 3
1.2.2 原始數(shù)據(jù)的預(yù)處理 3
1.2.3 特征提取和選擇 6
1.2.4 分類決策 6
1.3 數(shù)據(jù)矩陣與樣本空間 9
1.3.1 數(shù)據(jù)矩陣與樣本空間 9
1.3.2 模式的相似性度量 11
1.3.3 樣本點的權(quán)重和特征向量數(shù)據(jù)的預(yù)處理 12
1.4 主成分分析 15
1.4.1 主成分分析的基本思想 16
1.4.2 主成分分析算法 17
1.4.3 降維處理及信息損失 19
第二章 貝葉斯決策 21
2.1 基于最小錯誤率的貝葉斯決策 21
2.1.1 決策規(guī)則 21
2.1.2 錯誤率 23
2.1.3 分類器設(shè)計 25
2.2 Neyman-Pearson決策 26
2.3 正態(tài)分布時的貝葉斯決策 28
2.4 分類器的效率和錯誤率 30
2.4.1 分類器的效率、錯誤率和判選率矩陣 30
2.4.2 錯誤率的上界 32
2.4.3 利用檢驗樣本集估計判選率矩陣和錯誤率 33
2.4.4 訓(xùn)練樣本集和檢驗樣本集的劃分 35
2.4.5 利用判選率矩陣估計各類“真實”樣本數(shù) 37
2.4.6 分類器判定的“信號”樣本中錯判事例的扣除 39
2.5 討論 41
第三章 線性判別方法 43
3.1 線性判別函數(shù) 43
3.1.1 線性判別函數(shù)的基本概念 43
3.1.2 廣義線性判別函數(shù) 46
3.1.3 線性分類器的設(shè)計 48
3.2 Fisher線性判別 48
3.3 感知準則函數(shù) 54
3.3.1 幾個基本概念 54
3.3.2 感知準則函數(shù) 56
3.4 最小錯分樣本數(shù)準則函數(shù) 58
3.5 最小平方誤差準則函數(shù) 60
3.5.1 平方誤差準則函數(shù)及其MSE解 60
3.5.2 MSE準則函數(shù)的梯度下降算法 62
3.5.3 隨機MSE準則函數(shù)及其隨機逼近算法 63
3.6 多類問題 65
第四章 決策樹判別 68
4.1 超長方體分割法 68
4.1.1 超長方體分割法的基本思想 68
4.1.2 超長方體分割法中閾值的確定 69
4.1.3 超長方體分割法的優(yōu)缺點及其改進 71
4.1.4 超長方體分割法用于高能物理實驗分析 73
4.2 決策樹法 79
4.2.1 決策樹法的基本思想 79
4.2.2 信號/本底二元決策樹的構(gòu)建 81
4.2.3 決策樹的修剪 83
4.3 決策樹林法 84
4.3.1 決策樹林的構(gòu)建 85
4.3.2 決策樹林對輸入事例的分類 86
4.3.3 重抽樣法構(gòu)建決策樹林 87
第五章人工神經(jīng)網(wǎng)絡(luò) 88
5.1 概述 88
5.1.1 生物神經(jīng)元和人工神經(jīng)元 88
5.1.2 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成和學(xué)習(xí)規(guī)則 90
5.2 感知器 93
5.2.1 單輸出單元感知器 93
5.2.2 多輸出單元感知器 94
5.3 多層前向神經(jīng)網(wǎng)絡(luò)和誤差逆?zhèn)鞑ニ惴?96
5.3.1 BP網(wǎng)絡(luò)學(xué)習(xí)算法 97
5.3.2 BP網(wǎng)絡(luò)學(xué)習(xí)算法的改進 100
5.4 Hopfield神經(jīng)網(wǎng)絡(luò) 103
5.4.1 離散 Hopfield網(wǎng)絡(luò) 103
5.4.2 連續(xù) Hopfield網(wǎng)絡(luò) 109
5.4.3 Hopfield網(wǎng)絡(luò)在優(yōu)化計算中的應(yīng)用 111
5.5 隨機神經(jīng)網(wǎng)絡(luò) 115
5.5.1 隨機神經(jīng)網(wǎng)絡(luò)的基本思想 115
5.5.2 模擬退火算法 116
5.5.3 Boltzmann機及其工作規(guī)則 118
5.5.4 Boltzmann機學(xué)習(xí)規(guī)則 120
5.5.5 隨機神經(jīng)網(wǎng)絡(luò)小結(jié) 126
5.6 神經(jīng)網(wǎng)絡(luò)用于粒子鑒別 127
5.6.1 用于帶電粒子鑒別的特征變量 127
5.6.2 帶電粒子鑒別的神經(jīng)網(wǎng)絡(luò)的架構(gòu) 130
5.6.3 網(wǎng)絡(luò)的訓(xùn)練和粒子鑒別效果 132
第六章 近鄰法 135
6.1 最近鄰法 135
6.2 k近鄰法 136
6.3 剪輯近鄰法 138
6.3.1 兩分剪輯近鄰法 139
6.3.2 重復(fù)剪輯近鄰法 141
6.4 可作拒絕決策的近鄰法 143
6.4.1 具有拒絕決策的k近鄰法 143
6.4.2 具有拒絕決策的剪輯近鄰法 144
第七章 其他非線性判別方法 146
7.1 概率密度估計量方法 146
7.1.1 基本思想 146
7.1.2 總體概率密度的非參數(shù)估計 147
7.1.3 投影似然比估計 153
7.1.4 多維概率密度估計 155
7.1.5 近鄰體積中樣本數(shù)的確定 155
7.1.6 概率密度估計法與神經(jīng)網(wǎng)絡(luò)的性能對比 157
7.2 H矩陣判別 161
7.3 函數(shù)判別分析 162
7.4 支持向量機 165
7.4.1 最優(yōu)分類面 165
7.4.2 廣義最優(yōu)分類面 168
7.4.3 支持向量機 169
第八章 不同判別方法的比較 173
8.1 不同判別方法的特點 173
8.2 多元統(tǒng)計分析程序包TMVA簡介 178
參考文獻 186