出版時間:2008-5 出版社:科學出版社 作者:石磊 頁數:177
Tag標簽:無
內容概要
本書系統(tǒng)介紹了多水平模型中的統(tǒng)計模型診斷問題。主要內容是:介紹了異常值和影響點的定義和歷史發(fā)展,數據刪除法和局部影響分析的一些主要方法和結果,以及多水平模型的定義、參數估計及統(tǒng)計推斷;總結了已知協方差結構的廣義線性模型的統(tǒng)計診斷結果,并采用刪除多個數據點的方法研究了多水平模型中固定效應及隨機效應參數的診斷統(tǒng)計量;研究了多水平模型下基于均值漂移模型的異常點探測問題、高水平單元的局部影響分析和單個觀察值的局部影響分析。本書還介紹了目前關于多水平模型的統(tǒng)計軟件,同時給出了利用Matlab語言編寫的計算程序?! ”緯勺鳛閿道斫y(tǒng)計專業(yè)本科生、碩士生和博士生的教材或參考書,也可作為數學、生物、醫(yī)學、工程、經濟領域的教師及相關科技工作者的參考書。
書籍目錄
前言第1章 引論 1.1 基本概念 1.1.1 異常值 1.1.2 影響點 1.1.3 異常值和影響點的處理 1.2 預備知識 1.2.1 一些矩陣代數 1.2.2 矩陣微商 1.2.3 分布、估計及檢驗理論 1.3 數據刪除法 1.3.1 Cook距離 1.3.2 基于影響函數的研究 1.3.3 殘差 1.4 局部影響分析 1.4.1 Cook的局部影響分析方法 1.4.2 廣義影響函數及局部影響分析第2章 多水平模型 2.1 引言 2.2 參數估計 2.2.1 IGLS估計理論 2.2.2 RIGLS估計理論 2.3 假設檢驗及置信區(qū)間 2.3.1 固定效應參數 2.3.2 隨機效應參數 2.3.3 似然比檢驗 2.4 殘差 2.5 數據分析及建模 2.5.1 “小學項目”(JSP)數據 2.5.2 血清膽紅素數據 2.6 其他多水平模型 2.6.1 多元多水平模型 2.6.2 非線性多水平模型 2.6.3 離散數據的多水平模型第3章 GLM模型的影響分析 3.1 均值漂移模型及異常值檢驗 3.2 數據刪除法 3.3 “刪除=替代”方法 3.3.1 條件殘差 3.3.2 “刪除=替代”診斷 3.4 殘差及單個數據點的影響度量. 3.4.1 預測殘差 3.4.2 影響函數及單個數據點的影響度量 3.5 GLM模型的局部影響分析 3.5.1 協方差矩陣擾動 3.5.2 響應變量擾動 3.5.3 解釋性變量的擾動 3.5.4 實例分析:血清膽紅素數據 3.6 小結第4章 多水平模型的數據刪除 4.1 數據刪除度量 4.2 兩水平模型下的結論 4.3 線性混合模型中的應用 4.4 實例分析 4.4.1 血清膽紅素數據 4.4.2 JSP數據 4.5 小結第5章 多水平模型的異常點檢驗 5.1 異常點檢驗 5.1.1 均值漂移模型和檢驗統(tǒng)計量 5.1.2 兩水平模型中異常點的探測 5.2 隨機部分異常點單元的探測 5.3 計算問題 5.4 實例分析 5.4.1 JSP數據 5.4.2 血清膽紅素數據 5.5 小結第6章 多水平模型高水平單元的局部影響分析 6.1 模型和符號 6.2 擾動理論 6.2.1 V的一般結構 6.2.2 V的塊對角 6.3 局部影響分析 6.3.1 擾動的結果和局部影響測度 6.3.2 計算問題 6.4 局部影響的一步近似 6.5 實例分析 6.6 小結第7章 多水平模型觀測點的局部影響分析 7.1 擾動理論及結果 7.1.1 協方差矩陣的擾動模型 7.1.2 響應變量的擾動模型 7.1.3 解釋性變量的擾動模型 7.2 三種擾動模式下的局部影響分析 7.2.1 局部診斷統(tǒng)計量 7.2.2 計算問題 7.2.3 兩種特殊的模型 7.3 實例分析 7.3.1 JSP數據 7.3.2 血清膽紅素數據 7.4 小結第8章 多水平模型軟件及Matlab計算程序 8.1 多水平模型軟件介紹 8.2 基于Matlab多水平模型的計算程序 8.2.1 對角協方差矩陣 8.2.2 一般協方差矩陣參考文獻附錄 實例中的數據 附表A 血清膽紅素數據fSerum Bilirubin Datal 附表B JSP(junior school project)數據
章節(jié)摘錄
第1章 引論統(tǒng)計模型診斷是20世紀70年代中期發(fā)展起來的統(tǒng)計學領域一個新的研究方向,其主要目的是評價統(tǒng)計模型的適當性以及識別數據中可能存在的異常值和強影響點。在模型適當性的評價方面,線性模型中目前主要采用殘差分析來判斷模型擬合的好壞。異常值的識別主要在一定的異常模型假設下進行統(tǒng)計檢驗。而影響點的識別主要是研究數據點f或數據集)對我們關注的某個內容的影響程度并識別數據中的特殊結構,這項工作也稱之為影響分析。統(tǒng)計模型診斷可以為統(tǒng)計模型的改進提供重要的參考信息。在某些領域中,異常值及影響點還可以為我們提供某些特殊信息:如在地質找礦中,異常值及影響點可能對應著礦產資源富集信息;而在經濟領域,異常的出現還可能是某種預警信息的表現。本書主要討論多水平模型中異常值和影響點的識別,但主要集中于多水平線性模型。本章主要給出統(tǒng)計模型診斷中涉及的基本概念和方法。l.1節(jié)主要回顧了異常值及影響點識別的發(fā)展及相關概念;l.2節(jié)給出了本書中經常使用的一些矩陣知識;1.3節(jié)以線性模型為例,介紹了標準線性模型中數據刪除法及相關結果;l.4節(jié)是關于局部影響分析的介紹。1.1.1 異常值1.1 基本概念異常值對我們現代人來說并不陌生,我們甚至不自覺地會采用一些手段來處理現實生活中出現的異?,F象。最典型的就是在體育比賽中對裁判打分的平均算法:去掉一個最高分和最低分,再作平均。人們對異常值的認識可以追朔到l6世紀,Bernoulli提到:“在200多年前,人們丟掉異常值的處理方法已經是常見的現象?!碧幚砗妥R別異常值的統(tǒng)計方法可追溯到l850年。雖然異常值的識別和處理方法在現代已經發(fā)展很快,但是對異常值的定義依然有不同的理解和爭論。例如Edgeworth(1887)認為:不一致觀測值(discordant observation)可以定義為那些與所在樣本中其他數據點遵從的頻率規(guī)則flaw of frequency)不一致的觀測值。82年后,Grubbs(1969)又這樣表述:一個異常的觀測值,即異常值,是嚴重偏離所在樣本其他數據點的觀測值。這些表述實質上認為異常值是有目的的、后驗的.這種有目的性的識別異常值的方法,一般只能在數據中的異常值可以預先通過視覺觀察時才能使用(在一元小樣本中較多)。事實上,對樣本量較大或較為復雜的數據集,比如回歸、多元數據、試驗設計等,預先觀察到異常值是很困難的.因此,就有在觀察到異常值之前制定一種客觀的準則,這種準則大多依賴于異常值模型(outlier model)。由于近幾年來強調統(tǒng)計建模的重要性,許多研究者認為異常值是那些來自于非目標總體(某種統(tǒng)計模型)的觀察值.Hawkins(1980)給出了一種比較明確的定義:異常值是指污染的觀測值或不一致觀測值的總稱。不一致觀測值是指那些讓調查者感到吃驚或有較大偏差的數據點。而污染的觀測值是指來自非目標總體的觀測值。
編輯推薦
《多水平模型及其統(tǒng)計診斷》由科學出版社出版。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載