本書提供了24個多元分析程序,涉及多元回歸分析、多因素分析、聚類分析和概率統(tǒng)計模型等內(nèi)容。為了方便讀者使用本書中所提供的程序,每個方法都對數(shù)學原理做了簡要的論述,對程序的使用做了較為詳細的說明,并附有實例和計算結果。
本書可供從事多元統(tǒng)計分析的研究人員使用,也可作為大專院校數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)及相關專業(yè)教師、學生學習多元統(tǒng)計分析或程序設計的參考書。
在科研和教學工作中,我們經(jīng)常會遇到多因素、多指標的實際問題,需要進行定量分析,探索其內(nèi)在規(guī)律和聯(lián)系。筆者開展了甘肅省哲學社會科學規(guī)劃項目“大數(shù)據(jù)推動農(nóng)民增收應用研究”課題的研究,研究的內(nèi)容涉及基于分布式計算的投入產(chǎn)出分析模型、多元回歸分析模型、多因素分析模型、預測分析模型、聚類分析模型和判別分析模型、時間序列分析模型、馬爾科夫鏈分析模型等統(tǒng)計分析模型。由于所處理的對象涉及較大規(guī)模的數(shù)據(jù)以及計算機技術的快速發(fā)展,一些原有的多元統(tǒng)計分析程序已經(jīng)不能直接用來分析、處理教學科研中所遇到的實際問題。為了解決科研項目中所遇到的難點,并適應計算機技術的發(fā)展和科研生產(chǎn)不斷增長的需求,我們將開展課題研究時編寫的程序進行了系統(tǒng)規(guī)劃和編排,編寫了本書,供從事此項工作的人員查閱和使用。
本書的選材著眼于我們在實際工作中常遇到的一些多因素、多指標問題的解析,每個方法都對數(shù)學原理做了簡要的論述,對程序的使用做了較為詳細的說明,每一程序之后均附有計算實例。這些計算實例有一部分來自于公開發(fā)表的文獻,讀者可通過所列出的參考文獻進行查閱,有一部分內(nèi)容是我們在科研教學活動中所使用的范例,可供讀者在調(diào)試有關程序時參考,以便增強對多元分析方法的理解,掌握相關分析方法的技巧,領會多元分析的運用,設計自己在科研教學工作中的有關程序。在編寫本書時,我們對利用Excel作為分析程序的輸入與輸出端進行了探索,由于Excel可以存儲數(shù)以億計的數(shù)據(jù),將有關科研教學工作中的海量數(shù)據(jù)存儲于Excel中,分析程序可非常方便地進行存取,這為開展大數(shù)據(jù)計算進行了有益的探索。但由于程序設計沒有統(tǒng)一的格式,讀者可根據(jù)自己的計算結果和數(shù)據(jù)讀取和存入的多少,進行有關程序設計,本書不再一一贅述。
書中所有的程序都在Visual Basic 6.0環(huán)境下進行了認真的調(diào)試。本書的出版得到了甘肅省哲學社會科學規(guī)劃項目“大數(shù)據(jù)推動農(nóng)民增收應用研究”課題的資助,在此表示誠摯謝意!
限于作者水平,書中難免有疏漏之處,懇請讀者批評指正!
第1章 多元回歸分析 1
1.1 多元線性回歸分析 1
1.2 逐步回歸分析 9
1.3 嶺回歸分析 17
1.4 配方回歸分析 32
1.5 階段回歸分析 38
1.6 多項式回歸分析 44
1.7 調(diào)和趨勢分析 49
第2章 多因素分析 61
2.1 主成分分析 61
2.2 因子分析 69
2.3 費歇準則二類線性判別分析 90
2.4 貝葉斯準則多類逐步判別分析 99
2.5 模糊模型識別 114
2.6 典型相關分析 121
2.7 多類訓練迭代法 143
2.8 主坐標分析 151
第3章 聚類分析 162
3.1 Q模式系統(tǒng)聚類分析 162
3.2 R模式系統(tǒng)聚類分析 176
3.3 圖論聚類分析 186
3.4 動態(tài)聚類分析 195
3.5 模糊聚類分析 203
3.6 費歇最優(yōu)分段法 208
3.7 非線性映射 216
第4章 概率統(tǒng)計模型 224
4.1 一維時間序列分析 224
4.2 馬爾科夫鏈分析 234
參考文獻 266