本書介紹了針對社會科學(xué)研究中經(jīng)常遇到的樣本數(shù)據(jù)缺失的處理方法。樣本數(shù)據(jù)缺失是指樣本中出現(xiàn)各種統(tǒng)計(jì)變量的缺失,以往研究者喜歡將這種缺失認(rèn)定為符合完全隨機(jī)缺失的特性,但實(shí)際上這一假設(shè)并不一定能完全符合,往往只能符合隨機(jī)缺失的特性,在對這種數(shù)據(jù)缺失進(jìn)行處理時,往往會出現(xiàn)刪除大量數(shù)據(jù)導(dǎo)致影響統(tǒng)計(jì)結(jié)果的問題。本書的主要內(nèi)容在于介紹了在有缺失數(shù)據(jù)時如何進(jìn)行*似然估計(jì)的方法。除此之外,本書還對插補(bǔ)的EM算法、多重插補(bǔ)法等方法進(jìn)行了介紹。并討論了不可忽略的缺失數(shù)據(jù)。
1.《缺失數(shù)據(jù)》從美國大專院校畢業(yè)率的數(shù)據(jù)為例,深入淺出地闡述了缺失數(shù)據(jù)這一主題。
2.《缺失數(shù)據(jù)》介紹了多種*的解決缺失數(shù)據(jù)問題的方法,有很強(qiáng)的實(shí)用性。
保羅 D. 阿利森(Paul D. ALLISON) 美國賓州大學(xué)社會學(xué)教授。于1976年由威斯康辛大學(xué)獲得博士學(xué)位,之后在芝加哥大學(xué)及賓州大學(xué)作統(tǒng)計(jì)學(xué)的博士后研究。關(guān)于社會科學(xué)中的統(tǒng)計(jì)方法,他已出版5本書及超過25篇文章。這些作品處理廣泛多樣的方法,包含線性回歸、對數(shù)線性分析、logit分析、probit分析、測量誤差、不平等測量、缺失數(shù)據(jù)、Markov processes及事件史分析。
序
第1章 導(dǎo)論
第2章 假設(shè)
第1節(jié) 完全隨機(jī)缺失的
第2節(jié) 隨機(jī)缺失的
第3節(jié) 可忽略的
第4節(jié) 不可忽略的
第3章 傳統(tǒng)的方法
第1節(jié) 成列刪除
第2節(jié) 成對刪除
第3節(jié) 虛擬變量調(diào)整
第4節(jié) 插補(bǔ)
第5節(jié) 總結(jié)
第4章 最大似然
第1節(jié) 回顧最大似然估計(jì)法
第2節(jié) 有缺失數(shù)據(jù)的ML
第3節(jié) 列聯(lián)表數(shù)據(jù)
第4節(jié) 具正態(tài)分布數(shù)據(jù)的線性模型
第5節(jié) EM算法
第6節(jié) EM實(shí)例
第7節(jié) 直接ML
第8節(jié) 直接ML實(shí)例
第9節(jié) 結(jié)論
第5章 多重插補(bǔ):基本原理
第1節(jié) 單一隨機(jī)插補(bǔ)
第2節(jié) 多元隨機(jī)插補(bǔ)
第3節(jié) 在參數(shù)估計(jì)值中考慮隨機(jī)變異
第4節(jié) 在多變量正態(tài)模型下的多重插補(bǔ)
第5節(jié) 多變量正態(tài)模型的數(shù)據(jù)擴(kuò)增法
第6節(jié) 在數(shù)據(jù)擴(kuò)增法中收斂
第7節(jié) 連續(xù)的數(shù)據(jù)擴(kuò)增法相對平行的數(shù)據(jù)擴(kuò)增法
第8節(jié) 對非正態(tài)或類別數(shù)據(jù)使用正態(tài)模型
第9節(jié) 探索分析
第10節(jié) MI實(shí)例1
第6章 多重插補(bǔ):復(fù)雜化
第1節(jié) MI中的交互作用和非線性
第2節(jié) 插補(bǔ)模型和分析模型之適合性
第3節(jié) 插補(bǔ)中因變量所扮演的角色
第4節(jié) 在插補(bǔ)過程中使用額外的變量
第5節(jié) 多重插補(bǔ)的其他參數(shù)方法
第6節(jié) 無參數(shù)及部分參數(shù)方法
第7節(jié) 連續(xù)的廣義回歸模型
第8節(jié) 線性假設(shè)檢驗(yàn)和最大似然比檢驗(yàn)
第9節(jié) MI實(shí)例2
第10節(jié) 長期的及其他集群數(shù)據(jù)的MI
第11節(jié) MI實(shí)例3
第7章 不可忽略的缺失數(shù)據(jù)
第1節(jié) 兩種模型
第2節(jié) Heckman的樣本選擇誤差模型
第3節(jié) 形態(tài)混合模型的ML估計(jì)
第4節(jié) 形態(tài)混合模型的多重插補(bǔ)
第8章 總結(jié)與結(jié)論
注釋
參考文獻(xiàn)
譯名對照表