版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第十章 統(tǒng)計回歸模型,10.1 牙膏的銷售量10.2 軟件開發(fā)人員的薪金10.3 酶促反應(yīng)10.4 投資額與國民生產(chǎn)總值和 物價指數(shù),,回歸模型是用統(tǒng)計分析方法建立的最常用的一類模型,數(shù)學建模的基本方法,機理分析,測試分析,通過對數(shù)據(jù)的統(tǒng)計分析,找出與數(shù)據(jù)擬合最好的模型,不涉及回歸分析的數(shù)學原理和方法,通過實例討論如何選擇不同類型的模型,對軟件得到的結(jié)果進行分析,對模型進行改進,
2、由于客觀事物內(nèi)部規(guī)律的復雜及人們認識程度的限制,無法分析實際對象內(nèi)在的因果關(guān)系,建立合乎機理規(guī)律的數(shù)學模型。,10.1 牙膏的銷售量,問題,建立牙膏銷售量與價格、廣告投入之間的模型,預(yù)測在不同價格和廣告費用下的牙膏銷售量,收集了30個銷售周期本公司牙膏銷售量、價格、廣告費用,及同期其它廠家同類牙膏的平均售價,基本模型,y ~公司牙膏銷售量,x1~其它廠家與本公司價格差,x2~公司廣告費用,x1, x2~解釋變量(回歸變量, 自變量),
3、y~被解釋變量(因變量),?0, ?1 , ?2 , ?3 ~回歸系數(shù),?~隨機誤差(均值為零的正態(tài)分布隨機變量),MATLAB 統(tǒng)計工具箱,模型求解,[b,bint,r,rint,stats]=regress(y,x,alpha),輸入,x= ~n?4數(shù)據(jù)矩陣, 第1列為全1向量,alpha(置信水平,0.05),b~?的估計值,bint~b的置信區(qū)間,r ~殘差向量y-xb,rint~r的置信區(qū)間,Stats~
4、檢驗統(tǒng)計量 R2,F, p,y~n維數(shù)據(jù)向量,輸出,由數(shù)據(jù) y,x1,x2估計?,結(jié)果分析,y的90.54%可由模型確定,F遠超過F檢驗的臨界值,p遠小于?=0.05,?2的置信區(qū)間包含零點(右端點距零點很近),x2對因變量y 的影響不太顯著,x22項顯著,可將x2保留在模型中,模型從整體上看成立,銷售量預(yù)測,價格差x1=其它廠家價格x3-本公司價格x4,估計x3,調(diào)整x4,控制價格差x1=0.2元,投入廣告費x2=650萬元,銷
5、售量預(yù)測區(qū)間為 [7.8230,8.7636](置信度95%),上限用作庫存管理的目標值,下限用來把握公司的現(xiàn)金流,若估計x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在 7.8320?3.7? 29(百萬元)以上,(百萬支),模型改進,x1和x2對y的影響?yīng)毩?,兩模型銷售量預(yù)測比較,(百萬支),區(qū)間 [7.8230,8.7636],區(qū)間 [7.8953,8.7592],(百萬支),控制價格差x1=0.2元,投入廣告費x
6、2=6.5百萬元,預(yù)測區(qū)間長度更短,略有增加,x2=6.5,x1=0.2,x1,x1,x2,x2,兩模型 與x1,x2關(guān)系的比較,交互作用影響的討論,價格差 x1=0.1,價格差 x1=0.3,加大廣告投入使銷售量增加 ( x2大于6百萬元),價格差較小時增加的速率更大,x2,,完全二次多項式模型,MATLAB中有命令rstool直接求解,從輸出 Export 可得,10.2 軟件開發(fā)人員的薪金,資歷~ 從事專業(yè)工作的年數(shù);
7、管理~ 1=管理人員,0=非管理人員;教育~ 1=中學,2=大學,3=更高程度,建立模型研究薪金與資歷、管理責任、教育程度的關(guān)系,分析人事策略的合理性,作為新聘用人員薪金的參考,分析與假設(shè),y~ 薪金,x1 ~資歷(年),x2 = 1~ 管理人員,x2 = 0~ 非管理人員,1=中學2=大學3=更高,資歷每加一年薪金的增長是常數(shù);管理、教育、資歷之間無交互作用,教育,線性回歸模型,a0, a1, …, a4是待估計的回歸系數(shù),?是隨機
8、誤差,模型求解,R2,F, p? 模型整體上可用,資歷增加1年薪金增長546,管理人員薪金多6883,中學程度薪金比更高的少2994,大學程度薪金比更高的多148,a4置信區(qū)間包含零點,解釋不可靠!,殘差分析方法,結(jié)果分析,殘差,e 與資歷x1的關(guān)系,e與管理—教育組合的關(guān)系,殘差全為正,或全為負,管理—教育組合處理不當,殘差大概分成3個水平, 6種管理—教育組合混在一起,未正確反映 。,應(yīng)在模型中增加管理x2與教育x3, x4的交互項
9、,,進一步的模型,增加管理x2與教育x3, x4的交互項,R2,F有改進,所有回歸系數(shù)置信區(qū)間都不含零點,模型完全可用,消除了不正?,F(xiàn)象,異常數(shù)據(jù)(33號)應(yīng)去掉,e ~ x1,e ~組合,去掉異常數(shù)據(jù)后的結(jié)果,e ~ x1,e ~組合,R2: 0.957 ? 0.999 ? 0.9998F: 226 ? 554 ? 36701 置信區(qū)間長度更短,殘差圖十分正常,最終模型的結(jié)果可以應(yīng)用,模型應(yīng)用,制訂6種管理—教育組合人員的“基
10、礎(chǔ)”薪金(資歷為0),中學:x3=1, x4=0 ;大學:x3=0, x4=1; 更高:x3=0, x4=0,x1= 0; x2 = 1~ 管理,x2 = 0~ 非管理,大學程度管理人員比更高程度管理人員的薪金高,大學程度非管理人員比更高程度非管理人員的薪金略低,對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個數(shù)應(yīng)比定性因素的水平少1,軟件開發(fā)人員的薪金,殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項常常能夠改善模型,
11、剔除異常數(shù)據(jù),有助于得到更好的結(jié)果,注:可以直接對6種管理—教育組合引入5個0-1變量,10.3 酶促反應(yīng),問題,研究酶促反應(yīng)(酶催化反應(yīng))中嘌呤霉素對反應(yīng)速度與底物(反應(yīng)物)濃度之間關(guān)系的影響,建立數(shù)學模型,反映該酶促反應(yīng)的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關(guān)系,設(shè)計了兩個實驗 :酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實驗數(shù)據(jù)見下表:,方案,線性化模型,經(jīng)嘌呤霉素處理后實驗數(shù)據(jù)的估計結(jié)果,,對?1 , ?2非線性,線性化模
12、型結(jié)果分析,x較大時,y有較大偏差,1/x較小時有很好的線性趨勢,1/x較大時出現(xiàn)很大的起落,參數(shù)估計時,x較?。?/x很大)的數(shù)據(jù)控制了回歸參數(shù)的確定,[beta,R,J] = nlinfit (x,y,’model’,beta0),beta的置信區(qū)間,MATLAB 統(tǒng)計工具箱,輸入,x~自變量數(shù)據(jù)矩陣y ~因變量數(shù)據(jù)向量,beta ~參數(shù)的估計值R ~殘差,J ~估計預(yù)測誤差的Jacobi矩陣,model ~模型的函數(shù)M文件名b
13、eta0 ~給定的參數(shù)初值,輸出,betaci =nlparci(beta,R,J),非線性模型參數(shù)估計,function y=f1(beta, x)y=beta(1)*x./(beta(2)+x);,x= ; y= ;beta0=[195.8027 0.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci
14、=nlparci(beta,R,J);beta, betaci,beta0~線性化模型估計結(jié)果,非線性模型結(jié)果分析,畫面左下方的Export 輸出其它統(tǒng)計結(jié)果。,拖動畫面的十字線,得y的預(yù)測值和預(yù)測區(qū)間,剩余標準差s= 10.9337,最終反應(yīng)速度為半速度點(達到最終速度一半時的x值 )為,其它輸出,命令nlintool 給出交互畫面,o ~原始數(shù)據(jù)+ ~ 擬合結(jié)果,混合反應(yīng)模型,x1為底物濃度, x2為一示性變量 x
15、2=1表示經(jīng)過處理,x2=0表示未經(jīng)處理 β1是未經(jīng)處理的最終反應(yīng)速度 γ1是經(jīng)處理后最終反應(yīng)速度的增長值 β2是未經(jīng)處理的反應(yīng)的半速度點 γ2是經(jīng)處理后反應(yīng)的半速度點的增長值,在同一模型中考慮嘌呤霉素處理的影響,,o ~原始數(shù)據(jù)+ ~擬合結(jié)果,混合模型求解,用nlinfit 和 nlintool命令,估計結(jié)果和預(yù)測,剩余標準差s= 10.4000,?2置信區(qū)間包含零點,表明?2對因變量y的影響
16、不顯著,簡化的混合模型,簡化的混合模型形式簡單,參數(shù)置信區(qū)間不含零點,剩余標準差 s = 10.5851,比一般混合模型略大,,估計結(jié)果和預(yù)測,一般混合模型與簡化混合模型預(yù)測比較,簡化混合模型的預(yù)測區(qū)間較短,更為實用、有效,預(yù)測區(qū)間為預(yù)測值 ? Δ,注:非線性模型擬合程度的評價無法直接利用線性模型的方法,但R2 與s仍然有效。,酶促反應(yīng),反應(yīng)速度與底物濃度的關(guān)系,非線性關(guān)系,求解線性模型,求解非線性模型,嘌呤霉素處理對反應(yīng)速度與底物濃度
17、關(guān)系的影響,混合模型,簡化模型,10.4 投資額與國民生產(chǎn)總值和物價指數(shù),問題,建立投資額模型,研究某地區(qū)實際投資額與國民生產(chǎn)總值 ( GNP ) 及物價指數(shù) ( PI ) 的關(guān)系,2.0688,3073.0,424.5,20,1.0000,1185.9,195.0,10,1.9514,2954.7,474.9,19,0.9601,1077.6,166.4,9,1.7842,2631.7,401.9,18,0.9145,992.7,
18、144.2,8,1.6342,2417.8,423.0,17,0.8679,944.0,149.3,7,1.5042,2163.9,386.6,16,0.8254,873.4,133.3,6,1.4005,1918.3,324.1,15,0.7906,799.0,122.8,5,1.3234,1718.0,257.9,14,0.7676,756.0,125.7,4,1.2579,1549.2,206.1,13,0.7436,691.1,
19、113.5,3,1.1508,1434.2,228.7,12,0.7277,637.7,97.4,2,1.0575,1326.4,229.8,11,0.7167,596.7,90.9,1,物價指數(shù),國民生產(chǎn)總值,投資額,年份序號,物價指數(shù),國民生產(chǎn)總值,投資額,年份序號,,,,,,,,,,,,,,,,,,,,,,,,,根據(jù)對未來GNP及PI的估計,預(yù)測未來投資額,該地區(qū)連續(xù)20年的統(tǒng)計數(shù)據(jù),時間序列中同一變量的順序觀測值之間存在自
20、相關(guān),以時間為序的數(shù)據(jù),稱為時間序列,分析,許多經(jīng)濟數(shù)據(jù)在時間上有一定的滯后性,需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型,若采用普通回歸模型直接處理,將會出現(xiàn)不良后果,投資額與國民生產(chǎn)總值和物價指數(shù),基本回歸模型,投資額與 GNP及物價指數(shù)間均有很強的線性關(guān)系,t ~年份, yt ~ 投資額,x1t~ GNP, x2t ~ 物價指數(shù),?0, ?1, ?2 ~回歸系數(shù),?t ~對t相互獨立的零均值正態(tài)隨機變量,基本回歸模型的結(jié)果與分析
21、,MATLAB 統(tǒng)計工具箱,剩余標準差 s=12.7164,沒有考慮時間序列數(shù)據(jù)的滯后性影響,R2=0.9908,擬合度高,模型優(yōu)點,模型缺點,可能忽視了隨機誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會有不良后果,自相關(guān)性的定性診斷,殘差診斷法,模型殘差,作殘差 et~et-1 散點圖,大部分點落在第1, 3象限,大部分點落在第2, 4象限,自相關(guān)性直觀判斷,在MATLAB工作區(qū)中輸出,et為隨機誤差?t 的估計值,自回歸性的定量診斷,
22、自回歸模型,ρ~自相關(guān)系數(shù),?0, ?1, ?2 ~回歸系數(shù),ρ= 0,ρ> 0,ρ< 0,如何估計ρ,如何消除自相關(guān)性,D-W檢驗,ut ~對t相互獨立的零均值正態(tài)隨機變量,D-W統(tǒng)計量與D-W檢驗,檢驗水平,樣本容量,回歸變量數(shù)目,,檢驗臨界值dL和dU,由DW值的大小確定自相關(guān)性,廣義差分變換,以?*0, ?1 , ?2 為回歸系數(shù)的普通回歸模型,原模型 DW值,無自相關(guān),有自相關(guān),新模型,新模型,步驟,原模型,變換,
23、,不能確定,投資額新模型的建立,DWold < dL,作變換,原模型殘差et,樣本容量n=20,回歸變量數(shù)目k=3,?=0.05,臨界值dL=1.10, dU=1.54,總體效果良好,剩余標準差 snew= 9.8277 < sold=12.7164,投資額新模型的建立,新模型的自相關(guān)性檢驗,dU< DWnew < 4-dU,新模型殘差et,樣本容量n=19,回歸變量數(shù)目k=3,?=0.05,臨界值dL=1.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論