回歸診斷是用于探索存在于回歸分析中問(wèn)題及判斷某些假設(shè)是否合理的一種技術(shù)!痘貧w診斷簡(jiǎn)介》主要回顧蕞小二乘線(xiàn)性回歸,討論多元回歸中共線(xiàn)性的問(wèn)題,處理奇異與強(qiáng)影響數(shù)據(jù),探討誤差非線(xiàn)性、不一致的誤差方差和非線(xiàn)性問(wèn)題,簡(jiǎn)要闡釋離散數(shù)據(jù)產(chǎn)生的問(wèn)題,介紹基于蕞大似然法、計(jì)分檢驗(yàn)和構(gòu)造變量的較復(fù)雜的診斷方法。*后,探討了如何將介紹的具體診斷方法和技術(shù)應(yīng)用到研究中去。
《回歸診斷簡(jiǎn)介》針對(duì)回歸中經(jīng)常出現(xiàn)的影響估計(jì)精度的因素,對(duì)研究者的假設(shè)提出質(zhì)疑,運(yùn)用回歸診斷判斷假設(shè)的合理性并處理回歸分析中存在的問(wèn)題。本書(shū)從回歸分析中析出幾大重要方法,如蕞小二乘回歸、蕞大似然法、共線(xiàn)性、非線(xiàn)性、離散數(shù)據(jù)等,對(duì)該問(wèn)題進(jìn)行解釋?zhuān)Y(jié)構(gòu)分明,敘述清楚。
在社會(huì)科學(xué)的數(shù)據(jù)分析中,回歸可謂是最常用的方法。通過(guò)計(jì)算機(jī),獲得一個(gè)估計(jì)的回歸方程就和數(shù)1-2-3一樣簡(jiǎn)單,事實(shí)的確如此,因?yàn)槔萌魏我粋(gè)軟件程序,研究者都可以按如下操作:1-加載樣本數(shù)據(jù);2-確定回歸方程;3-利用普通最小二乘法進(jìn)行估計(jì),而這將獲得一個(gè)類(lèi)似下面的結(jié)果:
但是,這個(gè)估計(jì)的結(jié)果如實(shí)的反應(yīng)了真實(shí)世界的狀況嗎?例如,在X2保持不變的情況下,X1一個(gè)單位的變化是否將導(dǎo)致Y產(chǎn)生71.5的預(yù)期變化?我們往往可以非常自信的談?wù)摽傮w估計(jì)的精確度。但是,我們對(duì)回歸結(jié)果的信任程度取決于是否能夠成功處理以下常見(jiàn)問(wèn)題:多元共線(xiàn)性, 奇異值,非正態(tài),異方差性,以及非線(xiàn)性。
?怂梗‵ox)教授將診斷(diagnostics)引申為發(fā)現(xiàn)上述這些問(wèn)題。例如奇異觀測(cè)值,或更概括地講,即強(qiáng)影響(influential)觀測(cè)值產(chǎn)生的問(wèn)題。除了那些可以展示某一極端值如何影響回歸直線(xiàn)的常用圖形外,?怂箤(duì)其他測(cè)量方法也進(jìn)行了闡釋?zhuān)侯A(yù)測(cè)值(hat-values),學(xué)生殘差(studentized residuals),Cook距離,以及偏回歸散點(diǎn)圖(partial-regression plots)。這些測(cè)量方法大多可以通過(guò)常用的軟件程序獲得,例如SAS或SPSS。
在對(duì)回歸進(jìn)行了診斷之后,?怂箤(zhuān)注尋找可能的解決辦法。關(guān)于此類(lèi)的問(wèn)題非常多,例如:如果具有高度的共線(xiàn)性,則這個(gè)變量需要被剔除出回歸方程嗎?如果有奇異值出現(xiàn),這個(gè)觀測(cè)是否應(yīng)該被舍棄?當(dāng)誤差的分布是偏斜的,是否應(yīng)該對(duì)其進(jìn)行一些變換?在異方差性存在的情況下,是否應(yīng)該使用加權(quán)最小二乘法(weighted-least-square)以解決這一問(wèn)題?當(dāng)非線(xiàn)性問(wèn)題存在時(shí),是否應(yīng)該使用次方轉(zhuǎn)換(power transformation)?在面對(duì)這些重要的問(wèn)題時(shí),應(yīng)盡量避免使用機(jī)械的權(quán)宜方法。正如作者在本書(shū)中不斷強(qiáng)調(diào)的,這些方法永遠(yuǎn)不能取代判別和思想。
為了使得解釋更加豐富,?怂估昧嗽S多數(shù)據(jù)作為例子:美國(guó)的人口普查,職業(yè)聲望,人們報(bào)告的體重,加拿大公司中連鎖的董事會(huì)。 這些例子使得本書(shū)中的診斷適用于廣大的回歸方法使用者。此外,對(duì)那些有意受到更高級(jí)訓(xùn)練的讀者,可以在附錄中尋找答案(例如:對(duì)用于解決高度共線(xiàn)性的嶺回歸(ridge regression)的評(píng)估)。每一個(gè)使用回歸分析的都理所應(yīng)當(dāng)?shù)男枰M(jìn)行一系列回歸診斷。而這本專(zhuān)著也可謂是對(duì)回歸診斷介紹中的巔峰之作。
約翰·福克斯(John Fox)
加拿大多倫多市約克大學(xué)的社會(huì)學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)教授,并擔(dān)任社會(huì)調(diào)查研究所統(tǒng)計(jì)咨詢(xún)服務(wù)協(xié)調(diào)人。目前的研究工作主要包括統(tǒng)計(jì)學(xué)方法與加拿大的政治經(jīng)濟(jì)學(xué)研究。
序
第1章 概論
第2章 最小二乘回歸
第1節(jié) 回歸模型
第2節(jié) 最小二乘估計(jì)
第3節(jié) 回歸系數(shù)的統(tǒng)計(jì)推論
第4節(jié) 一般線(xiàn)性模型
第3章 共線(xiàn)性
第1節(jié) 共線(xiàn)性與方差膨脹
第2節(jié) 對(duì)共線(xiàn)性的處理:沒(méi)有速效方法
第4章 奇異值與強(qiáng)影響數(shù)據(jù)
第1節(jié) 測(cè)量影響力:預(yù)測(cè)值
第2節(jié) 查找奇異值:學(xué)生殘差
第3節(jié) 測(cè)量影響程度:Cook距離與其他診斷方法
第4節(jié) 診斷統(tǒng)計(jì)量中的數(shù)值截?cái)帱c(diǎn)
第5節(jié) 聯(lián)合的強(qiáng)影響觀測(cè)子集:偏回歸圖
第6節(jié) 非同尋常的數(shù)據(jù)應(yīng)該被拋棄嗎?
第5章 非正態(tài)分布誤差
第1節(jié) 殘差的正態(tài)分位數(shù)比較散點(diǎn)圖
第2節(jié) 殘差的直方圖
第3節(jié) 通過(guò)轉(zhuǎn)換矯正不對(duì)稱(chēng)
第6章 不一致的誤差方差
第1節(jié) 尋找不一致的誤差方差
第2節(jié) 矯正不一致的誤差方差
第7章 非線(xiàn)性
第1節(jié) 殘差與偏殘差散點(diǎn)圖
第2節(jié) 進(jìn)行線(xiàn)性轉(zhuǎn)換
第8章 離散數(shù)據(jù)
第1節(jié) 檢驗(yàn)非線(xiàn)性
第2節(jié) 檢驗(yàn)不一致誤差方差
第9章 最大似然法、計(jì)分檢驗(yàn)和構(gòu)造變量
第1節(jié) y的Box-Cox轉(zhuǎn)換
第2節(jié) 對(duì)x的Box-Tidwell轉(zhuǎn)換
第3節(jié) 對(duì)不一致誤差方差的矯正
第10章 建議
第1節(jié) 計(jì)算診斷量
第2節(jié) 延伸閱讀
附錄
參考文獻(xiàn)
譯名對(duì)照表