缺失數(shù)據(jù)下線性模型回歸系數(shù)嶺估計的大樣本性質(zhì).pdf_第1頁
已閱讀1頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、在許多實際問題中,由于各種人為或其它不可知因素,都容易導(dǎo)致大量缺失數(shù)據(jù)的產(chǎn)生,例如,在民意調(diào)查、市場調(diào)研、醫(yī)學(xué)研究以及社會經(jīng)濟研究等領(lǐng)域中普遍存在數(shù)據(jù)缺失現(xiàn)象.近年來,缺失數(shù)據(jù)情形的統(tǒng)計推斷已成為當(dāng)今統(tǒng)計界的一個熱門研究領(lǐng)域.在有數(shù)據(jù)缺失的情況下,通常的統(tǒng)計方法往往不能直接應(yīng)用,需要對數(shù)據(jù)進行必要的處理,缺失數(shù)據(jù)的處理方法常見的有Complete-Case方法和填補法, Complete-Case方法是將有缺失的數(shù)據(jù)項刪除,然后對剩余的

2、項構(gòu)成的“完全樣本”按照通常的統(tǒng)計方法進行統(tǒng)計推斷,填補法分為固定填補法和隨機填補法,它們都是對缺失值進行必要的補足,繼而得到“完全樣本”,再按照通常的統(tǒng)計方法進行統(tǒng)計推斷.線性模型有很強的實際應(yīng)用背景,在醫(yī)學(xué),生物,經(jīng)濟,金融,環(huán)境科學(xué)及工程技術(shù)等領(lǐng)域的數(shù)據(jù)分析中得到了越來越廣泛的應(yīng)用,在線性模型參數(shù)估計理論與方法中,最小二乘法占有中心的基礎(chǔ)地位,但當(dāng)設(shè)計矩陣X退化或接近退化時,最小二乘估計變得很不理想,于是一些學(xué)者提出了一種新的估計

3、方法――嶺估計法,嶺估計可以較好地解決設(shè)計矩陣接近退化時的統(tǒng)計推斷問題.Hoerl和Kennard (Ridge regression biased estimation for non-orthogonal problems[J]. Tech-nometrics, 1970, 12: 55-57.)于1970年提出了嶺估計β(k) = (S + kI)?1X Y用來改善最小二乘估計,其中k >; 0, S = X X, X和Y分別

4、為設(shè)計變量和響應(yīng)變量的資料陣, I為單位陣.嶺估計的研究和應(yīng)用一直受到廣泛的重視且已經(jīng)成為目前最有影響的一種有偏估計.嶺估計理論研究的早期成果見Hoerl和Kennard (Ridge regression biased estimation fornon-orthogonal problems[J]. Technometrics, 1970, 12: 55-57.)及Farebrothers (Further result onthe

5、 mean squared error of ridge regression[J]. J Roy Statist Soc B, 1976, 38: 248-259.)的論文,嶺估計理論的系統(tǒng)總結(jié)可見王松桂等(線性模型的理論及其應(yīng)用[M].合肥:安徽教育出版社,1987;線性模型引論[M].北京:高等教育出版社, 2004.)的著作,他們給出了一系列嶺估計優(yōu)于最小二乘估計的充分條件.戴儉華(嶺估計優(yōu)于最小二乘估計的條件[J].數(shù)理統(tǒng)計與

6、應(yīng)用概率, 1994, 9(2): 53-58.)討論在均方誤差意義下嶺估計優(yōu)于最小二乘估計的問題,給出了嶺估計優(yōu)于最小二乘估計的必要條件及較一般的充分條件;王啟應(yīng)(回歸系數(shù)嶺估計的相合性[J].數(shù)理統(tǒng)計與應(yīng)用概率, 1987, 3(1): 42-51.)討論了嶺估計的強相合性、r階相合性及基于嶺回歸的誤差估計的某些極限性質(zhì),獲得了同等條件下與通常的最小二乘估計完全同樣的大樣本性質(zhì).大量學(xué)者對嶺估計做了不同的改進,以期望縮小均方誤差來提

7、高估計的精度,對嶺估計進一步做改進的文章有很多,都在不同程度上提高了估計的精度.在有約束條件的線性模型中,正如鄭昌光(約束條件下的線性估計[J].應(yīng)用概率統(tǒng)計,1986, 2(1): 5-12.)所言,參數(shù)β的約束最小二乘估計β?的均方誤差在一定條件下可以變得很大,因此效果也不理想,這就促使人們在β的有偏估計類中尋找一類合理的估計去改進β?.雷慶祝(線性模型中回歸系數(shù)嶺估計的相合性[J].廣西師范大學(xué)學(xué)報, 1999, 10(1): 2

8、1-24.)討論了帶齊次等式Rβ= 0約束條件的線性模型中回歸系數(shù)嶺估計的強、弱相合性及均方相合性,得到了弱相合性的充要條件及強相合性的充分條件;史建紅(約束線性回歸模型回歸系數(shù)的條件嶺型估計[J].山西師范大學(xué)學(xué)報(自然科學(xué)版), 2001, 15(4): 10-16.)在齊次等式Rβ= 0約束條件下提出了線性回歸模型的一類新的嶺型估計β?(k) = (kW + I)?1β?,證明了β?(k)在一定的正則條件和優(yōu)良性準(zhǔn)則下優(yōu)于參數(shù)β的

9、約束最小二乘估計,并討論了估計的可容許性.農(nóng)秀麗,劉萬榮,李明輝(非齊次等式約束線性回歸模型回歸系數(shù)的條件嶺型估計[J].四川師范大學(xué)學(xué)報(自然科學(xué)版), 2007, 30(6): 721-725.)在非齊次等式Rβ= r約束下提出了約束線性回歸模型的一類嶺估計,討論了估計的統(tǒng)計性質(zhì),并討論了其與約束最小二乘估計的關(guān)系,在一定的正則條件和優(yōu)良性準(zhǔn)則下證明了參數(shù)的嶺型估計優(yōu)于約束最小二乘估計.在現(xiàn)實生活中經(jīng)常會產(chǎn)生數(shù)據(jù)缺失現(xiàn)象,但是對缺失

10、數(shù)據(jù)下線性模型回歸系數(shù)嶺估計的統(tǒng)計推斷問題尚未有研究.本文在第二章中研究了固定設(shè)計下帶線性約束的線性模型,在響應(yīng)變量有缺失的不完全數(shù)據(jù)情形,用三種不同的處理方法處理缺失數(shù)據(jù),即利用觀察到的完全數(shù)據(jù)對、確定性補足得到的“完全樣本”、隨機性補足得到的“完全樣本”分別給出回歸系數(shù)嶺估計的三種估計,并討論了估計的強、弱相合性,同時證明了回歸系數(shù)的任意線性函數(shù)的估計的強、弱相合性和漸近正態(tài)性.在第三章中研究了隨機設(shè)計下帶線性約束的線性模型,在響應(yīng)

11、變量有缺失的不完全數(shù)據(jù)情形,用三種不同的處理方法處理缺失數(shù)據(jù),即利用觀察到的完全數(shù)據(jù)對、確定性補足得到的“完全樣本”、隨機性補足得到的“完全樣本”分別給出回歸系數(shù)嶺估計的三種估計,并討論了估計的強、弱相合性,同時證明了回歸系數(shù)的任意線性函數(shù)的估計的強、弱相合性和漸近正態(tài)性.本文的特色體現(xiàn)在以下兩個方面:1.在MAR缺失機制下,研究了固定設(shè)計下帶線性約束的線性模型回歸系數(shù)嶺估計的大樣本性質(zhì),對缺失的響應(yīng)變量,利用三種不同的缺失數(shù)據(jù)處理方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論