2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、一元回歸分析,在現(xiàn)實問題中,處于同一個過程中的一些變量,往往是相互依賴和相互制約的,它們之間的相互關(guān)系大致可分為兩種:,相關(guān)關(guān)系問題,(1)確定性關(guān)系——函數(shù)關(guān)系;,(2)非確定性關(guān)系——相關(guān)關(guān)系;,相關(guān)關(guān)系表現(xiàn)為這些變量之間有一定的依賴關(guān)系,但這種關(guān)系并不完全確定,它們之間的關(guān)系不能精確地用函數(shù)表示出來,這些變量其實是隨機變量,或至少有一個是隨機變量。,相關(guān)關(guān)系舉例,例如:在氣候、土壤、水利、種子和耕作技術(shù)等條件基本相同時,某農(nóng)作物的

2、畝產(chǎn)量 Y 與施肥量 X 之間有一定的關(guān)系,但施肥量相同,畝產(chǎn)量卻不一定相同。畝產(chǎn)量是一個隨機變量。,又如:人的血壓 Y 與年齡 X 之間有一定的依賴關(guān)系,一般來說,年齡越大,血壓越高,但年齡相同的兩個人的血壓不一定相等。血壓是一個隨機變量。,農(nóng)作物的畝產(chǎn)量與施肥量、血壓與年齡之間的這種關(guān)系稱為相關(guān)關(guān)系,在這些變量中,施肥量、年齡是可控變量,畝產(chǎn)量、血壓是不可控變量。一般在討論相關(guān)關(guān)系問題中,可控變量稱為自變量,不可控變量稱為因變量。,

3、函數(shù)關(guān)系與相關(guān)關(guān)系的區(qū)別,相關(guān)關(guān)系——,影響,的值,,函數(shù)關(guān)系——,決定,的值,,因此,統(tǒng)計學上討論兩變量的相關(guān)關(guān)系時,是設(shè)法確定:在給定自變量 的條件下,因變量 的條件數(shù)學期望,不能確定。,回歸分析的概念,研究一個隨機變量與一個(或幾個)可控變量之間的相關(guān)關(guān)系的統(tǒng)計方法稱為回歸分析。,只有一個自變量的回歸分析稱為一元回歸分析;多于一個自變量的回歸分析稱為多元回歸分析。,引進回歸函數(shù),稱為回歸方程,回歸分析主要包

4、括三方面的內(nèi)容,(1)提供建立有相關(guān)關(guān)系的變量之間的數(shù)學關(guān)系式(稱為經(jīng)驗公式)的一般方法;,(2)判別所建立的經(jīng)驗公式是否有效,并從影響隨機變量的諸變量中判別哪些變量的影響是顯著的,哪些是不顯著的;,回歸分析的內(nèi)容,(3)利用所得到的經(jīng)驗公式進行預測和控制。,一元線性回歸模型,如果試驗的散點圖中各點呈直線狀,則假設(shè)這批數(shù)據(jù)的數(shù)學模型為,設(shè)隨機變量Y依賴于自變量x,作n次獨立試驗,得n對觀測值:稱這n對觀測值為容量為n的一個子樣,若

5、把這n對觀測值在平面直角坐標系中描點,得到試驗的散點圖.,則,,,,圖 9-1,,因此,其中 是與 無關(guān)的未知常數(shù)。,(9.1),一元線性回歸模型,一般地,稱如下數(shù)學模型為一元線性模型,而 稱為回歸函數(shù)或回歸方程。,稱為回歸系數(shù)。,回歸函數(shù)(方程)的建立,由觀測值 確定的回歸函數(shù) ,應(yīng)使得

6、 較小。,考慮函數(shù),問題:確定 ,使得 取得極小值。,這是一個二元函數(shù)的無條件極值問題。,回歸方程的建立,令,,,,回歸方程的建立,記,表示對 的估計值,則變量 對 的回歸方程為,簡寫為,,最小二乘法,回歸方程有效性的檢驗,對于任何一組數(shù)據(jù) ,都可按最小二乘法確定一個線性函數(shù),但變量 與 之間是否真有近似于線性函數(shù)的相關(guān)關(guān)系呢?尚需進行假設(shè)檢驗

7、。,假設(shè),如果 成立,則不能認為 與 有線性相關(guān)關(guān)系。,三種檢驗方法:F檢驗法、t-檢驗法、r檢驗法。,,,,,回歸方程有效性的F檢驗法,記,——總離差平方和,反映觀測值與平均值的偏差程度。,經(jīng)恒等變形,將 分解,,,,,回歸方程有效性的F檢驗法,——回歸平方和,反映回歸值與平均值的偏差,揭示變量 與 的線性關(guān)系所引起的數(shù)據(jù)波動。,——剩余平方和,反映觀測值與回歸值的偏差,揭示試驗誤差和非線性關(guān)系對試驗結(jié)果所引

8、起的數(shù)據(jù)波動。,,,,,回歸方程有效性的F檢驗法,如果 為真,則,于是,統(tǒng)計量,對給定的檢驗水平 ,,(1)當 時,拒絕 ,即可認為變量 與 有線性相關(guān)關(guān)系;,(2)當 時,接受 ,即可認為變量 與 沒有線性相關(guān)關(guān)系;,回歸方程有效性的F檢驗法,(2)當 時,接受 ,即可認為變量 與 沒有線性相關(guān)關(guān)系;,此時,可能有以下幾種情況:,(2) 對

9、 有顯著影響,但這種影響不能用線性關(guān)系表示,應(yīng)作非線性回歸;,(3)除 之外,還有其它變量對 也有顯著影響,從而削弱了 對 的影響,應(yīng)考慮多元回歸。,(1) 對 沒有顯著影響,應(yīng)丟棄自變量 ;,回歸方程有效性的r檢驗法,記,——樣本的相關(guān)系數(shù),可反映變量 與 之間的線性相關(guān)程度。,因為,回歸方程有效性的r檢驗法,記,——樣本的相關(guān)系數(shù),越大,變量 與 之間的線性相關(guān)程度越強。,因為,(1),(2) 時

10、,,(3) 時,,與 有線性相關(guān)關(guān)系;,與 無線性相關(guān)關(guān)系;,回歸方程有效性的r檢驗法,計算,對給定的檢驗水平 ,查相關(guān)系數(shù)的臨界值表,如果 ,則拒絕 ,即線性回歸方程有效;否則,接受 ,即線性回歸方程無效。,F檢驗與r檢驗是一致的:,回歸方程有效性的t檢驗法,統(tǒng)計量,H0成立時,,對給定的檢驗水平 ,H0的拒絕域為,即當 時,變量 與 有線性相關(guān)關(guān)系。,F檢驗與t檢

11、驗是一致的:,,試求出 與 的關(guān)系,并判斷是否有效。,例1 為了研究大豆脂肪含量 和蛋白質(zhì)含量 的關(guān)系,測定了九種大豆品種籽粒內(nèi)的脂肪含量和蛋白質(zhì)含量,得到如下數(shù)據(jù),解 (1)描散點圖,(2)建立模型,由散點圖,設(shè)變量 與 為線性相關(guān)關(guān)系:,確定回歸系數(shù) 和 :,所以,所求的回歸方程為,(3)檢驗回歸方程的有效性,查相關(guān)系數(shù)臨界值表,因為,所以回歸方程在 的檢驗水平下有統(tǒng)計意義。,即可以認為大豆的蛋白

12、質(zhì)含量與脂肪含量有線性相關(guān)性。,利用回歸方程進行預測,1、點預測,時, 即為 的點預測值。,2、區(qū)間預測,統(tǒng)計量,對給定的置信水平 , 的預測區(qū)間為,,續(xù)例1 求大豆脂肪含量為18.6%的條件下蛋白質(zhì)95%的預測區(qū)間。,解 由已求得的回歸方程,得蛋白質(zhì)的點預測值為,所以脂肪含量為18.6%時,蛋白質(zhì)的95%的預測區(qū)間為,利用回歸方程進行預測,控制則為預測的反問題:已知因變量的取值區(qū)間為,,確定自變量

13、的取值區(qū)間 使得,利用回歸方程進行控制,一般地,要解出 和 很復雜,可作簡化求解:,當樣本容量很大時,,,則,例1的上機操作步驟,分兩列輸入,回歸分析命令,,因變量,自變量,,預測點,置信水平,,,,,,,,t檢驗,r檢驗,F檢驗,,,預測區(qū)間,點預測值,,自變量值,,可線性化的一元非線性回歸,多重線性回歸簡介,前一節(jié),我們學習了一元線性回歸分析問題,在實際應(yīng)用中,有些變量之間并不是線性相關(guān)關(guān)系,但可以經(jīng)過適當?shù)淖?/p>

14、換,把非線性回歸問題轉(zhuǎn)化為線性回歸問題。,可線性化的一元非線性回歸,常見的幾種變換形式:,1、雙曲線,令,,2、冪函數(shù)曲線,令,,化非線性回歸為線性回歸,變形,3、指數(shù)函數(shù)曲線,令,,變形,4、負指數(shù)函數(shù)曲線,令,,化非線性回歸為線性回歸,變形,5、對數(shù)函數(shù)曲線,令,,6、S型(Logistic)曲線,令,,化非線性回歸為線性回歸,變形,例1 測定某肉雞的生長過程,每兩周記錄一次雞的重量,數(shù)據(jù)如下表,由經(jīng)驗知雞的生長曲線為Logi

15、stic曲線,且極限生長量為k=2.827,試求y對x的回歸曲線方程。,解 由題設(shè)可建立雞重y與時間x的相關(guān)關(guān)系為,令,則有,列表計算,所以,所以所求曲線方程為,上機操作,輸入原始數(shù)據(jù),上機操作,計算,上機操作,上機操作,上機操作,是y*,而不是y,,自變量,上機操作,,,回歸方程,還要回代系數(shù),多重回歸分析,在實際問題中,自變量的個數(shù)可能多于一個,隨機變量 y與多個可控變量x1,x2,x3,…,xk之間是否存在相關(guān)關(guān)系,則屬于多重

16、(元)回歸問題。本節(jié)討論多重線性回歸。,多重線性回歸模型,隨機變量 與 之間的線性關(guān)系,(1),其中,未知,則(1)式稱為多重線性回歸模型。,多重線性回歸模型,若對變量 與 分別作n次觀測,則可得一個容量為n的子樣,(2),其中,為待定參數(shù),稱為回歸系數(shù)。,(2)式含有k+1個參數(shù),故觀測次數(shù)應(yīng)滿足n>k+1。,則有,多重線性回歸模型的矩

17、陣形式,記,則(2)有矩陣形式,其中,確定 的最小二乘法,考慮多元函數(shù),目標:確定 使 最小,方法:,解得,——多重線性回歸方程,線性回歸方程的有效性檢驗——方差分析法,線性回歸方程是否有統(tǒng)計意義,可檢驗假設(shè),是否成立,方法:方差分析法,將總離差平方和分解,線性回歸方程的有效性檢驗——方差分析法,——回歸平方和,反映線性關(guān)系對觀測結(jié)果產(chǎn)生的數(shù)據(jù)波動,S

18、SR越大,線性相關(guān)關(guān)系越強。,——剩余平方和(或殘差平方和),反映除線性因素之外的其它因素對觀測結(jié)果產(chǎn)生的數(shù)據(jù)波動,SSE越大,則其它因素對Y的影響越大。,線性回歸方程的有效性檢驗——方差分析法,在H0成立的條件下,可以證明:,(n為觀測次數(shù),k為自變量個數(shù)),構(gòu)造F統(tǒng)計量,當 時,拒絕H0。,回歸系數(shù)的統(tǒng)計檢驗,回歸方程的有效性檢驗,只是解決了 與之

19、間是否有線性相關(guān)關(guān)系,至于變量 對 的影響是否有統(tǒng)計意義,無從看出,因此,還需對回歸系數(shù) 是否為0作統(tǒng)計檢驗。,提出假設(shè),如果H0成立,可以證明統(tǒng)計量,當 時,拒絕H0。,利用回歸方程作預測及控制,對于給定的,點估計值,置信水平為 的預測區(qū)間為,例2 某種水泥在凝固時放出的熱量Y(cal/g)與水泥中下列4種化學成分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論