課程設(shè)計(jì)---應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-01 格式：doc 頁數(shù)：36 大?。?09.50KB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

2023年全國(guó)碩士研究生考試考研英語一試題真題（含答案詳解+作文范文）_第1頁

已閱讀1頁，還剩35頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、　　課程設(shè) 計(jì)　　2017年 6 月 27 日　　課程設(shè)計(jì)任務(wù)書　　課程《數(shù)學(xué)模型》課程設(shè)計(jì)　　題目應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題　　主要內(nèi)容、基本要

2、求、主要參考資料等　　主要內(nèi)容　　簡(jiǎn)單介紹統(tǒng)計(jì)分析模型的基礎(chǔ)理論及本文所用的統(tǒng)計(jì)分析方法，了解MATLAB軟件和SPSS軟件的功能，進(jìn)一步通過實(shí)例來掌握如何應(yīng)用常用的統(tǒng)計(jì)分析方法建立數(shù)學(xué)模型及求解。并利用本文所介紹的統(tǒng)計(jì)分析方法來求解2005年數(shù)學(xué)建模的“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置問題。&

3、lt;p>　　課程設(shè)計(jì)的要求：　　1.獨(dú)立完成建模，并提交一篇建模論文。　　2.論文的主要內(nèi)容包括：摘要，問題的提出，問題的分析，模型假設(shè)，模型設(shè)計(jì)，模型解法與結(jié)果，模型結(jié)果的分析和檢驗(yàn)，包括誤差分析、穩(wěn)定性分析等。模型的優(yōu)缺點(diǎn)及改進(jìn)方向。必要的計(jì)算機(jī)程序。　　3.文

4、檔格式：參照《東北石油大學(xué)課程設(shè)計(jì)撰寫規(guī)范》和《數(shù)學(xué)模型課程設(shè)計(jì)教學(xué)大綱》。　　4.課程設(shè)計(jì)結(jié)束時(shí)參加答辯。　　主要參考資料： 　　[1]鄒志云，蔣忠海，梅亞楠，宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報(bào)，5(2):8-13,2007,6

5、　　[2]衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》，2007，（5）　　[3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文，2009,12　　[4]大連，北京，廣州，杭州，深圳，武漢、南京2013年年鑒　　[5]韓中庚.數(shù)學(xué)建模方法及其

6、應(yīng)用.北京：高等教育出版社，2005.6　　摘要　　統(tǒng)計(jì)，顧名思義即將信息統(tǒng)括起來進(jìn)行計(jì)算的意思，它是對(duì)數(shù)據(jù)進(jìn)行定量處理的理論與技術(shù)。統(tǒng)計(jì)分析，常指對(duì)收集到的有關(guān)數(shù)據(jù)資料進(jìn)行整理歸類并進(jìn)行解釋的過程。　　統(tǒng)計(jì)分析是統(tǒng)計(jì)工作中統(tǒng)計(jì)設(shè)計(jì)、資料收集、整理匯總、統(tǒng)計(jì)分析、信息反饋五

7、個(gè)階段最關(guān)鍵的一步。如果缺少這一步或這一步做得不好，均將降低統(tǒng)計(jì)工作的作用?？梢源_切地說，沒有統(tǒng)計(jì)分析，統(tǒng)計(jì)工作就沒有活力、沒有發(fā)展，也沒有統(tǒng)計(jì)工作的地位。所以統(tǒng)計(jì)工作者必須學(xué)會(huì)寫統(tǒng)計(jì)分析，積極地為領(lǐng)導(dǎo)決策服務(wù)，這既是統(tǒng)計(jì)工作者的職責(zé)，也是統(tǒng)計(jì)工作的最終目的。　　本文簡(jiǎn)要地介紹了統(tǒng)計(jì)分析中的聚類分析和回歸分析的概念和應(yīng)用，以及常用的求解聚類分析和回歸分析的方法，初步了解了統(tǒng)計(jì)分析問題的基本思想。

8、此外，本文還簡(jiǎn)要介紹了有關(guān)MATLAB和SPSS軟件的功能和特點(diǎn)，以便于用其去處理實(shí)際的統(tǒng)計(jì)分析問題。在對(duì)聚類分析和回歸分析的相關(guān)內(nèi)容做了簡(jiǎn)介之后，本文還列舉了聚類分析和回歸分析的相關(guān)實(shí)例，并用MATLAB和SPSS軟件對(duì)所舉實(shí)例進(jìn)行了編程求解，得出了模型的最優(yōu)化配置方案和選擇方案。最后，本文著重的探討了關(guān)于典型統(tǒng)計(jì)分析模型“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置的不同時(shí)空供求匹配程度的計(jì)算。　　隨著信

9、息科學(xué)的進(jìn)步，統(tǒng)計(jì)應(yīng)用的范圍越來越廣，數(shù)據(jù)處理及數(shù)據(jù)采集挖掘的方法呈現(xiàn)出多樣化，統(tǒng)計(jì)分析方法也相對(duì)復(fù)雜化，專業(yè)化。面對(duì)如今的大數(shù)據(jù)時(shí)代，統(tǒng)計(jì)分析的作用顯得越來越重要，因此我們需要掌握一些常見的統(tǒng)計(jì)分析方法，以便于在以后的工作和學(xué)習(xí)中能夠獨(dú)立而有效的處理相關(guān)問題。　　關(guān)鍵字：統(tǒng)計(jì)分析；聚類分析；回歸分析；MATLAB；SPSS 　　目錄

10、　　第1章統(tǒng)計(jì)分析問題基礎(chǔ)理論3　　1.1統(tǒng)計(jì)分析相關(guān)介紹3　　1.2 MATLAB和SPASS軟件介紹4　　1.3本章小結(jié)6　　第2章統(tǒng)計(jì)分析常用方法簡(jiǎn)介7

11、　　2.1 方法1——聚類分析7　　2.2 方法2——回歸分析8　　2.3 本章小結(jié)9　　第3章典型實(shí)例10　　3.1 實(shí)例1——聚類分析10　　3.2 實(shí)例2——回歸分析1

12、1　　3.3 本章小結(jié)15　　第4章數(shù)學(xué)模型案例16　　4.1 問題重述16　　4.2 問題分析17　　4.3 模型假設(shè)17　　4.4 符號(hào)說明18&

13、lt;p>　　4.5 模型建立與求解18　　4.6 模型評(píng)價(jià)28　　4.7 本章小結(jié)29　　結(jié)論30　　參考文獻(xiàn)31　　統(tǒng)計(jì)分析問題基礎(chǔ)理

14、論　　統(tǒng)計(jì)分析是指運(yùn)用統(tǒng)計(jì)方法及與分析對(duì)象有關(guān)的知識(shí)，從定量與定性的結(jié)合上進(jìn)行的研究活動(dòng)。它是繼統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理之后的一項(xiàng)十分重要的工作，是在前幾個(gè)階段工作的基礎(chǔ)上通過分析從而達(dá)到對(duì)研究對(duì)象更為深刻的認(rèn)識(shí)。它又是在一定的選題下，集分析方案的設(shè)計(jì)、資料的搜集和整理而展開的研究活動(dòng)。系統(tǒng)、完善的資料是統(tǒng)計(jì)分析的必要條件。本文主要介紹了有關(guān)聚類分析和回歸分析的有關(guān)知識(shí)，以及MATLAB和S

15、PSS軟件的功能。　　統(tǒng)計(jì)分析相關(guān)介紹　　聚類分析　　一、聚類分析的概念　　聚類分析指將物理或抽象對(duì)象的集合分組成為由類似的對(duì)象組成的多個(gè)類的分析過程。它是一

16、種重要的人類行為。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。　　二、聚類分析的應(yīng)用　　高維聚類分析已成為聚類分析的一個(gè)重要研究方向。同時(shí)高維數(shù)據(jù)聚類也是聚類技術(shù)的難點(diǎn)是隨著技術(shù)的進(jìn)步使得數(shù)據(jù)收集變得越來越容易，導(dǎo)致數(shù)據(jù)庫(kù)規(guī)模越來越大、復(fù)雜性越來越高，如各種類型的貿(mào)易交易數(shù)據(jù)、Web 文檔、基因表達(dá)數(shù)據(jù)等，它們的

17、維度（屬性）通?？梢赃_(dá)到成百上千維，甚至更高。但是，受“維度效應(yīng)”的影響，許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運(yùn)用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個(gè)非常活躍的領(lǐng)域，同時(shí)它也是一個(gè)具有挑戰(zhàn)性的工作。目前，高維數(shù)據(jù)聚類分析在市場(chǎng)分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的應(yīng)用。　　1.1.2回歸分析

18、　　一、回歸分析的概念　　回歸分析（regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛，回歸分析按照涉及的自變量的多少，可分為一元回歸分析和多元回歸分析；按照自變量和因變量之間的關(guān)系類型，可分為線性回歸分析和非線性回歸分析。如果在回歸分析中，只包括一個(gè)自變量和一個(gè)因變量，

19、且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量，且因變量和自變量之間是線性關(guān)系，則稱為多元線性回歸分析。　　回歸分析的主要內(nèi)容為：①?gòu)囊唤M數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式，即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)。估計(jì)參數(shù)的常用方法是最小二乘法。②對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。③在許多自變量共同影響著一個(gè)因變量的關(guān)系中，判斷哪個(gè)（或哪

20、些）自變量的影響是顯著的，哪些自變量的影響是不顯著的，將影響顯著的自變量選入模型中，而剔除影響不顯著的變量，通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對(duì)某一生產(chǎn)過程進(jìn)行預(yù)測(cè)或控制?；貧w分析的應(yīng)用是非常廣泛的，統(tǒng)計(jì)軟件包使各種回歸方法計(jì)算十分方便。　　二、回歸分析的應(yīng)用　　回歸分析是重要統(tǒng)計(jì)推斷方法。

21、在實(shí)際應(yīng)用中，回歸分析是數(shù)理統(tǒng)計(jì)學(xué)與實(shí)際問題聯(lián)系最為緊密，應(yīng)用最為廣泛，也是收效最為顯著的統(tǒng)計(jì)分析方法；是分析數(shù)據(jù)，尋求變量之間關(guān)系有利的工具。隨著科學(xué)技術(shù)的發(fā)展，生物、醫(yī)學(xué)、農(nóng)業(yè)、林業(yè)、經(jīng)濟(jì)、管理、金融、社會(huì)等領(lǐng)域的許多事跡新問題提出，有力的推動(dòng)了回歸分析的發(fā)展。　　MATLAB和SPASS軟件介紹　　1.2.1 MATLAB相關(guān)介紹

22、;　　MATLAB是美國(guó)MathWorks公司出品的商業(yè)數(shù)學(xué)軟件，用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境，主要包括MATLAB和Simulink兩大部分。　　MATLAB是matrix&laboratory兩個(gè)詞的組合，意為矩陣工廠（矩陣實(shí)驗(yàn)室）。是由美國(guó)mathworks公司發(fā)布的主要面對(duì)科學(xué)計(jì)算、可視化以及交互式程序設(shè)計(jì)的高

23、科技計(jì)算環(huán)境。它將數(shù)值分析、矩陣計(jì)算、科學(xué)數(shù)據(jù)可視化以及非線性動(dòng)態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個(gè)易于使用的視窗環(huán)境中，為科學(xué)研究、工程設(shè)計(jì)以及必須進(jìn)行有效數(shù)值計(jì)算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案，并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計(jì)語言（如C、Fortran）的編輯模式，代表了當(dāng)今國(guó)際科學(xué)計(jì)算軟件的先進(jìn)水平。　　MATLAB和Mathematica、Maple并稱為三大數(shù)學(xué)軟

24、件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計(jì)算方面首屈一指。MATLAB可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等，主要應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等領(lǐng)域。　　1.2.2 SPSS軟件相關(guān)介紹　　1984年SPSS總部首先推出了世界上第一個(gè)統(tǒng)計(jì)分析軟件微機(jī)版本SPSS/P

25、C+，開創(chuàng)了SPSS微機(jī)系列產(chǎn)品的開發(fā)方向，極大地?cái)U(kuò)充了它的應(yīng)用范圍，并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域。世界上許多有影響的報(bào)刊雜志紛紛就SPSS的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)。　　SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等等。SPSS統(tǒng)計(jì)分析過程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對(duì)數(shù)

26、線性模型、聚類分析、數(shù)據(jù)簡(jiǎn)化、生存分析、時(shí)間序列分析、多重響應(yīng)等幾大類，每類中又分好幾個(gè)統(tǒng)計(jì)過程，比如回歸分析中又分線性回歸分析、曲線估計(jì)、Logistic回歸、Probit回歸、加權(quán)估計(jì)、兩階段最小二乘法、非線性回歸等多個(gè)統(tǒng)計(jì)過程，而且每個(gè)過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng)，可以根據(jù)數(shù)據(jù)繪制各種圖形。　　SPSS軟件具有以下特點(diǎn)：<p

27、>　　操作簡(jiǎn)便　　界面非常友好，除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外，大多數(shù)操作可通過鼠標(biāo)拖曳、點(diǎn)擊“菜單”、“按鈕”和“對(duì)話框”來完成。　　編程方便　　具有第四代語言的特點(diǎn)，告訴系統(tǒng)要做什么，無需告訴怎樣做。只要

28、了解統(tǒng)計(jì)分析的原理，無需通曉統(tǒng)計(jì)方法的各種算法，即可得到需要的統(tǒng)計(jì)分析結(jié)果。對(duì)于常見的統(tǒng)計(jì)方法，SPSS的命令語句、子命令及選擇項(xiàng)的選擇絕大部分由“對(duì)話框”的操作完成。因此，用戶無需花大量時(shí)間記憶大量的命令、過程、選擇項(xiàng)。　　功能強(qiáng)大　　具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。自帶11種類型136個(gè)

29、函數(shù)。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法，比如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。　　數(shù)據(jù)接口　　能夠讀取及輸出多種格式的文件。比如由dBASE、

30、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件，文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件，Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及html格式的文件。　　模塊組合　　SPSS for Windows軟件分為若干功能模塊。用戶可以根

31、據(jù)自己的分析需要和計(jì)算機(jī)的實(shí)際配置情況靈活選擇。　　針對(duì)性強(qiáng)　　SPSS針對(duì)初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡(jiǎn)單的操作分析，大多青睞于SPSS，像薛薇的《基于SPSS的數(shù)據(jù)分析》一書也較適用于初學(xué)者。而那些熟練或精通者也較喜歡SPSS，因?yàn)樗麄兛梢酝ㄟ^編程來實(shí)現(xiàn)更強(qiáng)大的功能。

32、;　　本章小結(jié)　　本章主要介紹了聚類分析和回歸分析的概念以及他們?cè)趯?shí)際生活中的廣泛應(yīng)用。并且介紹了將要用到的MATLAB和SPSS軟件的功能和特點(diǎn)，以及他們?cè)趯?shí)際生活中的用處。　　第2章統(tǒng)計(jì)分析常用方法簡(jiǎn)介　　2.1 方法1——聚類分析</p&g

33、t;　　聚類分析是將樣品或變量按照它們?cè)谛再|(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計(jì)分析方法。聚類分析時(shí)，用來描述樣品或變量的親疏程度通常有來兩個(gè)途徑，一是把每個(gè)樣品或變量看成是多維空間上的一個(gè)點(diǎn)，在多維坐標(biāo)中，定一點(diǎn)與點(diǎn)，類和類之間的距離，用點(diǎn)與點(diǎn)間距離來描述樣品或變量之間的親疏程度：另一個(gè)是計(jì)算樣品或變量的相似系數(shù)，用相似系數(shù)來描述樣品或變量之間的親屬程度。　　聚類分析是實(shí)用多元

34、統(tǒng)計(jì)分析的一個(gè)新的分支，聚類分析的功能是建立一種分類方法，他將一批樣品或變量，按照它們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類。　　聚類分析的內(nèi)容十分豐富，按其聚類的方法可分為以下幾種：　　(1)系統(tǒng)聚類法：開始每個(gè)對(duì)象自成一類，然后每次將最相似的兩類合并，合并后重新計(jì)算新類與其他類的距離或相近性測(cè)度。這一過程可用一張譜系聚類圖描述。&l

35、t;p>　　(2)調(diào)優(yōu)法（動(dòng)態(tài)聚類法）：首先對(duì)n個(gè)對(duì)象初步分類，然后根據(jù)分類的損失函數(shù)盡可能小的原則對(duì)其進(jìn)行調(diào)整，直到分類合理為止。　　(3)最優(yōu)分割法（有序樣品聚類法）：開始將所有樣品看做一類，然后根據(jù)某種最優(yōu)準(zhǔn)則將它們分割為二類、三類，一直分割到所需的K類為止。這種方法適用于有序樣品的分類問題，也稱為有序樣品的聚類法。　　(4)模糊聚類法：利用

36、模糊集理論來處理分類問題，它對(duì)經(jīng)濟(jì)領(lǐng)域中具有模糊特征兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。　　(5)圖論聚類法：利用圖論中最小支撐樹的理論來處理分類問題，創(chuàng)造了獨(dú)具風(fēng)格的方法。　　(6)聚類預(yù)報(bào)法：利用聚類方法處理預(yù)報(bào)問題，在多元統(tǒng)計(jì)分析中，可以用來做預(yù)報(bào)的方法很多，如回歸分析和判別分析。但對(duì)一些異常數(shù)據(jù)，如氣象中的災(zāi)害性天氣的預(yù)報(bào)，使用回歸分析或判別分

37、析處理的效果都不好，而聚類預(yù)報(bào)彌補(bǔ)了這一不足，只是一個(gè)值得重視的方法。　　聚類分析根據(jù)對(duì)象的不同又分為R型和Q型兩大類，R型是對(duì)變量（指標(biāo)）進(jìn)行分類，Q型是對(duì)樣品進(jìn)行分類。　　R型聚類分析的目的有以下幾方面：　?。?）可以了解變量間及變量組合間的親疏關(guān)系；　?。?）對(duì)變量

38、進(jìn)行分類；　?。?）根據(jù)分類結(jié)果及它們之間的關(guān)系，在每一類中選擇有代表性的變量作為重要變量，利用少數(shù)幾個(gè)重要變量進(jìn)一步作分析計(jì)算，如進(jìn)行回歸分析或Q型聚類分析等。　　Q型聚類分析的目的主要是對(duì)樣品進(jìn)行分類。分類的結(jié)果是直觀的，且比傳統(tǒng)的分類方法更細(xì)致、全面、合理。當(dāng)然使用不同的分類方法通常有不同的分類結(jié)果。對(duì)任何觀測(cè)數(shù)據(jù)都沒有唯一“正確”的分類方法。實(shí)際

39、應(yīng)用中，常采用不同的分類方法，對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算，一邊對(duì)分類提供具體意見，并由實(shí)際工作者決定所需要的分類數(shù)及分類情況。　　2.2 方法2——回歸分析　　多元線性回歸模型的一般形式　　回歸分析是最靈活最常用的統(tǒng)計(jì)分析方法之一，它用于分析一個(gè)因變量與一個(gè)或多個(gè)自變量之間的關(guān)系。特別是用于：(1)定量的描述和解釋相互關(guān)

40、系；(2)估測(cè)或預(yù)測(cè)因變量的值。 　　回歸分析方法是在眾多的相關(guān)變量中，根據(jù)實(shí)際問題考察其中一個(gè)或多個(gè)變量與其余變量的依賴關(guān)系。如果只要考察一個(gè)變量與其余多個(gè)變量之間的相互依賴關(guān)系，我們稱為多元回歸問題。若要同時(shí)考察多個(gè)因變量與多個(gè)自變量之間的相互依賴關(guān)系，我們稱為多因變量的多元回歸問題。　　多元回歸分析是研究因變量Y與m個(gè)自變量的相關(guān)關(guān)系，而且總是

41、假設(shè)因變量Y為隨機(jī)變量，而為一般變量。　　下面我們來看一下多元線性回歸模型的建立。 　　假定因變量Y與線性相關(guān)。收集到的n組數(shù)據(jù)（）（t=1,2,···n）滿足以下回歸模型：　　記

42、C=，　　則所建回歸模型的矩陣形式為　　或　　并稱它們?yōu)榻?jīng)典多元回歸模型，其中Y是可觀測(cè)的隨機(jī)向量，是不可觀測(cè)的隨機(jī)向量，C是已知矩陣，是未知參數(shù)，并設(shè)n>m，且rank(C)=m+1。　　在經(jīng)典回歸分析中，

43、我們討論模型中參數(shù)和的估計(jì)和檢驗(yàn)問題。近代回歸分析中討論變量篩選、估計(jì)的改進(jìn)，以及對(duì)模型中的一些假設(shè)進(jìn)行診斷等問題。　　2.3 本章小結(jié)　　本章主要介紹了統(tǒng)計(jì)分析問題的聚類分析和回歸分析的概念及其常用的求解方法，了解了他們的基礎(chǔ)思想。并將這兩種分析方法運(yùn)用到第三章和第四章中去解決實(shí)際的數(shù)學(xué)問題。

44、　　第3章典型實(shí)例　　3.1 實(shí)例1——聚類分析　　下面是聚類分析的一個(gè)簡(jiǎn)單例子。有五個(gè)樣品，每個(gè)只測(cè)量了一個(gè)指標(biāo)，分別為1,2,6,8,11,我們用最短距離法將它們分類。　　(1)計(jì)算五個(gè)樣品兩兩間的距離，得初始類間的距離矩陣，

45、　　(2)由知類間最小距離為1，于是將和合并成，并計(jì)算和其他類之間的距離，的新的距離陣　　(3)由知，類間最小距離為2，合并和為，計(jì)算與其他類間的距離得矩陣，　　(4)由知，類間的最小距離為3，將和合并為，得新的距離矩陣，　　(5)最后將和合并為，這時(shí)五個(gè)樣品聚為一類。

46、　　3.2 實(shí)例2——回歸分析　　3.2.1數(shù)據(jù)的準(zhǔn)備　　《中國(guó)統(tǒng)計(jì)年鑒》把財(cái)政支出劃分為31個(gè)組成部分。本文只選取2005年我國(guó)31個(gè)省、市、自治區(qū)的地區(qū)生產(chǎn)總值和13個(gè)重要支出項(xiàng)，分別是：為基本建設(shè)支出，為企業(yè)挖潛改造資金，為科技三項(xiàng)費(fèi)用，為農(nóng)業(yè)支出，為農(nóng)林水利氣象等部門事業(yè)費(fèi)，為工業(yè)交通部門事業(yè)費(fèi)，為流動(dòng)部門事業(yè)費(fèi)，為教育事業(yè)費(fèi)，

47、為科學(xué)事業(yè)費(fèi)，為衛(wèi)生經(jīng)費(fèi)，為行政管理費(fèi)，為公檢法司支出，為城市維護(hù)費(fèi)。為地區(qū)生產(chǎn)總值。（數(shù)據(jù)單位為：萬元）　　3.2.2模型的建立及求解　　3.2.2.1 模型的建立　　將13個(gè)重要支出項(xiàng)設(shè)為自變量，用表示；將地區(qū)生產(chǎn)總值設(shè)為因變量。采用最小二乘法擬合一個(gè)多元線性回歸模型，采用數(shù)學(xué)軟件SPSS計(jì)算出回歸系數(shù)，運(yùn)行

48、結(jié)果如下表：　　表3.1 回歸系數(shù)表　　因而對(duì)13個(gè)自變量的線性回歸方程為:　　3.2.2.2模型的檢驗(yàn)　　首先，對(duì)模型（3.1）進(jìn)行擬合優(yōu)度的檢驗(yàn)，采用數(shù)學(xué)軟件SPSS計(jì)算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù)，運(yùn)行結(jié)果如下表<

49、;b>　　表3.2 模型匯總　　由表3.2可知，模型（3.1）擬合效果很好。　　然后，對(duì)模型（3.1）進(jìn)行顯著性F檢驗(yàn)，提出原假設(shè)：采用數(shù)學(xué)軟件SRSS計(jì)算出的方差分析表如下表　　表3.3 方差分析表　　表3.3中的Sig.即為顯著性P值，由P值

50、=0.000（近似值），，P值小于，所以，拒絕原假設(shè),認(rèn)為在顯著性水平的條件下，因變量對(duì)自變量有顯著的線性關(guān)系，即回歸方程（3.1）是顯著的。　　最后，對(duì)模型（3.1）進(jìn)行回歸系數(shù)的顯著性檢驗(yàn)，提出原假設(shè)其中。利用SPSS計(jì)算出關(guān)于的t統(tǒng)計(jì)量及相應(yīng)的P值，見表3.1。由表我們可以發(fā)現(xiàn)并不是所有的單獨(dú)對(duì)因變量都有顯著影響。這說明盡管回歸方程通過了顯著性檢驗(yàn)，但也會(huì)出現(xiàn)某些單個(gè)變量對(duì)并不顯著的情況

51、。　　由于某些變量不顯著，因此本文采取后退法[3]簡(jiǎn)單的剔除多余變量，由于變量間的交互作用，不能一次性剔除所有不顯著的變量，所以進(jìn)行依次剔除，首先剔除P值最大的一個(gè)變量，然后再進(jìn)回歸系數(shù)的顯著性檢驗(yàn)，如果有不顯著的變量，那么再進(jìn)行剔除，依次下去，知道保留的變量都對(duì)有顯著性影響為止。　　根據(jù)表3.1，我們首先剔除，用剩余變量與進(jìn)行回歸系數(shù)的顯著性檢驗(yàn)，SP

52、SS運(yùn)行結(jié)果如下表　　表3.4 回歸系數(shù)表　　由結(jié)果看，剔除后，剩余變量的顯著性都發(fā)生了變化，仍然有部分變量不顯著，所以繼續(xù)進(jìn)行剔除（由于剔除過程比較繁瑣，在此不一一列出，只列出最終保留的變量）。最終保留的變量為，，，，，，，。將剩余變量與做回歸分析，SPSS運(yùn)行結(jié)果如下表　　表3.5回歸系數(shù)表

53、　　由表3.5建立新的多元線性回歸模型　　（3.2）　　應(yīng)用SPSS軟件計(jì)算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù)，如下表　　表3.6 模型匯總<p&

54、gt;　　由表3.6可知，模型（3.2）擬合效果很好。　　然后，對(duì)模型（3.2）進(jìn)行顯著性F檢驗(yàn)，采用數(shù)學(xué)軟件SPSS計(jì)算出的方差分析表如下表　　表3.7 方差分析表　　由P值=0.000（近似值），，P值小于，所以，在顯著性水平的條件下，回歸方程（3.2）是顯著的。

55、經(jīng)過以上算法步驟，新建立的模型（3.2）通過了顯著性檢驗(yàn)，因此。模型（3.2）為最終確定的模型。　　3.3 本章小結(jié)　　本章主要根據(jù)典型例題更加詳細(xì)的說明了聚類分析和回歸分析的思想，并且利用SPSS軟件對(duì)它們的經(jīng)典案例進(jìn)行了編程求解，同時(shí)感受到了SPSS在解決數(shù)學(xué)規(guī)劃問題中的強(qiáng)大功能。<

56、p>　　第4章數(shù)學(xué)模型案例　　2015年3月，李克強(qiáng)總理在政府工作報(bào)告中指出，要制定“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃，推動(dòng)移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合。2015年7月4日，國(guó)務(wù)院印發(fā)了《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見》，提出著力創(chuàng)新政府服務(wù)模式，夯實(shí)網(wǎng)絡(luò)發(fā)展基礎(chǔ)，營(yíng)造安全網(wǎng)路環(huán)境，提升公共服務(wù)水平，并將“互聯(lián)網(wǎng)+”高效物流和“互聯(lián)網(wǎng)+”便捷交通作為其中兩項(xiàng)重點(diǎn)行動(dòng)。&

57、lt;/p>　　上世紀(jì)90年代末開始，我國(guó)互聯(lián)網(wǎng)蓬勃發(fā)展，形成具有國(guó)際先進(jìn)水平的用戶規(guī)模和普及率，并且培育形成了豐富的互聯(lián)網(wǎng)應(yīng)用產(chǎn)品和技術(shù)力量，為我國(guó)各行業(yè)融合互聯(lián)網(wǎng)，推動(dòng)技術(shù)進(jìn)步、效率提升和組織變革，提升實(shí)體經(jīng)濟(jì)創(chuàng)新力和生產(chǎn)力，打造大眾創(chuàng)業(yè)、萬眾創(chuàng)新，四項(xiàng)經(jīng)濟(jì)提質(zhì)增效升級(jí)奠定了技術(shù)、資源條件。事實(shí)上，從2014年以來，淘寶、微信、滴滴打車等基于互聯(lián)網(wǎng)（移動(dòng)互聯(lián)網(wǎng)）的新業(yè)態(tài)已經(jīng)在改變著社會(huì)經(jīng)濟(jì)的運(yùn)行?；诨ヂ?lián)

58、網(wǎng)平臺(tái)的交通運(yùn)輸服務(wù)已延展到客運(yùn)、貨運(yùn)、鐵路、停車、維修、公交、出租汽車、航空等交通行業(yè)，熱門手機(jī)APP達(dá)60余個(gè)，累計(jì)下載量超過50億人次。　　交通運(yùn)輸作為人類社交活動(dòng)、商品交易的支撐，不僅對(duì)城市建設(shè)和社會(huì)發(fā)展具有重要影響力，而且存在與科學(xué)技術(shù)同步發(fā)展的緊密互動(dòng)關(guān)系?？v觀交通發(fā)展史，每次科學(xué)技術(shù)的進(jìn)步都帶來交通運(yùn)輸方式的改變，交通運(yùn)輸方式的進(jìn)步又支撐起社會(huì)經(jīng)濟(jì)發(fā)展、科技進(jìn)步。同時(shí)，也注意在交通

59、行業(yè)的發(fā)展變革過程中，每一次新的交通運(yùn)輸方式出現(xiàn)，都會(huì)伴隨傳統(tǒng)模式與新型模式之間的沖突、轉(zhuǎn)變，運(yùn)輸?shù)男枨蠛凸┙o雙方都需有一個(gè)逐漸的轉(zhuǎn)變和相互適應(yīng)過程。本文就出租車供求關(guān)系、資源配置問題利用統(tǒng)計(jì)分析相關(guān)知識(shí)進(jìn)行了初步的探討。　　4.1 問題重述　　隨著經(jīng)濟(jì)的發(fā)展，近年來，人們對(duì)出行的要求不斷提高，城市出租車以其方便、快

60、捷、舒適和私密性的特點(diǎn)成為越來越多人的出行選擇。但是，國(guó)內(nèi)各大城市交通問題日趨嚴(yán)重，“打車難”也是人們關(guān)注的一個(gè)社會(huì)熱點(diǎn)問題。數(shù)據(jù)顯示，包括上海、杭州等眾多大城市，出租車非高峰期的空駛率始終在30%上下徘徊，而高峰期卻打不到車。這與眾多市民反映的打車難背后所隱藏的強(qiáng)烈需求看似形成了一個(gè)矛盾。究其原因，最主要的莫過于司機(jī)與乘客需求信息不對(duì)稱，缺乏及時(shí)溝通交流的平臺(tái)。　　隨著“互聯(lián)網(wǎng)+”時(shí)代的到來，

61、有多家公司依托移動(dòng)互聯(lián)網(wǎng)建立了打車軟件服務(wù)平臺(tái)，實(shí)現(xiàn)了乘客與出租車司機(jī)之間的信息互通，同時(shí)推出了多種出租車的補(bǔ)貼方案，吸引了越來越多的司機(jī)和乘客使用打車軟件。然而，打車軟件同時(shí)也導(dǎo)致出租車行業(yè)亂象叢生，存在馬路揚(yáng)招成功率降低、乘客怕司機(jī)接到大單拒載、司機(jī)分心忙于搶單影響行車安全等問題。　　請(qǐng)你們搜集相關(guān)數(shù)據(jù)，建立數(shù)學(xué)模型研究如下問題：　　問題：試建立合理

62、的指標(biāo)，并分析不同時(shí)空出租車資源的“供求匹配”程度。　　4.2 問題分析　　“打車難”是人們關(guān)注的一個(gè)社會(huì)熱點(diǎn)問題。但是，在北京也不是無論何時(shí)何地都難打到車。打車難往往出現(xiàn)在特殊時(shí)間和地點(diǎn)：上班高峰的住宅區(qū)，下班高峰的商務(wù)區(qū)，凌晨和深夜的郊區(qū)或偏僻地點(diǎn)，遇到雨雪天氣……　　“

63、互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置是一個(gè)十分復(fù)雜的社會(huì)問題。要想準(zhǔn)確得出合理的資源配置方案難以實(shí)現(xiàn)，同時(shí)也難以準(zhǔn)確收集大量出租車的各項(xiàng)數(shù)據(jù)如出租車的每天跑單數(shù)，收費(fèi)，拒載情況等，以及不同城市不同城區(qū)不同時(shí)間居民的出行行為特征數(shù)據(jù)。　　為了建立合理的指標(biāo)，分析不同時(shí)空出租車資源的供求匹配程度，首先從城市居民出行對(duì)出租車的需求量入手，分析與需求量有關(guān)的主要指標(biāo)，如城市居民出行量。為分析城市居民出行量與城

64、市經(jīng)濟(jì)指標(biāo)的相關(guān)性，先將這些指標(biāo)進(jìn)行聚類分析，繼而得出每類最具代表性的經(jīng)濟(jì)指標(biāo)，再將最具代表性的經(jīng)濟(jì)指標(biāo)與居民出行總量進(jìn)行回歸分析，得到多元線性回歸模型，從而預(yù)測(cè)居民的出行總量。通過查閱文獻(xiàn)可以確定居民出行選擇出租車作為出行方式的比例從而，計(jì)算得出城市的出租車運(yùn)輸量的需求量。然后根據(jù)供需平衡法預(yù)測(cè)出城市出租車需求量。將城市實(shí)際出租車數(shù)量與城市出租車需求數(shù)量作比，得到衡量出租車資源的供求匹配程度的指標(biāo)即供求匹配率。對(duì)未來城市的出租需求量進(jìn)

65、行灰色關(guān)聯(lián)預(yù)測(cè)，得到未來城市的出租需求量，通過計(jì)算不同城市的出租車需求量，進(jìn)行不同時(shí)空的出租車資源供求匹配的分析。　　對(duì)于各公司的出租車補(bǔ)貼方案是否對(duì)“緩解打車難”有幫助問題，由于難以得到各公司不同時(shí)間的補(bǔ)貼方案對(duì)居民打車難度的實(shí)際影響效果數(shù)據(jù)，我們從公司對(duì)每單的補(bǔ)貼金額入手，分析每單補(bǔ)貼金額范圍為0～15元，認(rèn)為補(bǔ)貼金額再高對(duì)公司利益有較大損失。司機(jī)的每日跑單數(shù)為平均每臺(tái)出租車每天接單數(shù)，有效

66、載客率等效為里程利用率。以每單補(bǔ)貼金額為自變量，司機(jī)的每日跑單數(shù)和有效載客率為因變量，建立阻滯增長(zhǎng)模型，基于前面的供求匹配率關(guān)系式算出不同每單補(bǔ)貼金額對(duì)應(yīng)的供求匹配率這一指標(biāo)。　　為一個(gè)新的打車軟件服務(wù)平臺(tái)設(shè)計(jì)合理的補(bǔ)貼方案，我們基于已建立的模型計(jì)算出租車單車日均載客次數(shù)、有效載客率與打車軟件平臺(tái)對(duì)每單補(bǔ)貼金額的關(guān)系式。綜合考慮每單補(bǔ)貼金額對(duì)出租車司機(jī)、乘客、打車軟件平臺(tái)三方各自的滿意度，利用熵

67、值法求出三方滿意度的權(quán)重，繼而將三方的標(biāo)準(zhǔn)化數(shù)據(jù)乘以權(quán)重得出綜合滿意度，比較得出最優(yōu)的補(bǔ)貼方案。　　4.3 模型假設(shè)　　1．假設(shè)城市中的黑車現(xiàn)象對(duì)居民出行沒有造成影響；　　2．假設(shè)所研究的城市沒有發(fā)生嚴(yán)重的自然災(zāi)害和社會(huì)動(dòng)蕩；　　3．

68、假設(shè)所研究的城市政府對(duì)出租車行業(yè)的政策基本不變；　　4．假設(shè)司機(jī)和乘客都是為自身利益考慮，即經(jīng)濟(jì)人假設(shè)；　　5．假設(shè)參考文獻(xiàn)中的數(shù)據(jù)來源可靠，真實(shí)可信。　　4.4 符號(hào)說明　　4.5 模型建立與求解<p&

69、gt;　　4.5.1建模前的準(zhǔn)備　　由參考文獻(xiàn)[2]可得到現(xiàn)有指標(biāo)體系見表1。　　表1 衡量出租車供求的三大指標(biāo)　　4.5.2問題一：建立評(píng)價(jià)出租車資源供求匹配程度的指標(biāo)　　為評(píng)價(jià)出租車資源的“供求匹配”程度，引入出租車資源的供求匹配率這一指標(biāo)，指標(biāo)的定義為城市中實(shí)際運(yùn)

70、行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之比，即　　(1)　　其中，引入P表示出租車資源的供求匹配率，M表示市民出行需要的出租車輛數(shù)，N表示城市中實(shí)際運(yùn)行的出租車輛數(shù)。市民出行需要的出租車輛M的意義是指這些出租車輛能夠恰好滿足市民打車出行的需求，即城市出租車資源供求平衡時(shí)的車輛數(shù)。<p&

71、gt;　　供求匹配率P反映了城市中實(shí)際運(yùn)行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之間的差異。供求匹配率P＝1為出租車資源供求平衡狀態(tài)，供求匹配率P越接近1，則說明城市出租車資源供求匹配程度越高，出租車數(shù)量配置越合理；當(dāng)供求匹配率P大于1時(shí)，表明城市中現(xiàn)有的出租車數(shù)量超過市民出行需要的數(shù)量，會(huì)增加出租車的空駛率，造成出租車司機(jī)的收益降低；當(dāng)供求匹配率P小于1時(shí)，表明城市中現(xiàn)有的出租車數(shù)量少于市民出行需要的數(shù)量，需要增加出租車的數(shù)量來緩解打

72、車難的情況。　　4.5.2.1建立市民出行需要的出租車輛數(shù)M的預(yù)測(cè)模型　　市民出行需要的出租車輛數(shù)M與市民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、市民出行選擇乘坐出租車的比例有關(guān)，也與每輛出租車日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān)，具體關(guān)系式為：　　符號(hào)表達(dá)式為：</p&

73、gt;　　(2)　　其中，M表示市民出行需要的出租車輛數(shù)（輛），Y表示市民人均日出行次數(shù)（單位：次/人日），W為城市總?cè)丝跀?shù)量（人），η表示市民選擇打車出行的比例，s表示出租車單車日均載客次數(shù)（單位：次/車日），λ表示出租車單車日均每次載客人數(shù)（人/車次），μ為出租車滿載率。　　根據(jù)參考文獻(xiàn)[3

74、]，選取出租車單車日均載客次數(shù)s=35（次/車日），出租車單車日均每次載客人數(shù)λ=2.0（人/車次），出租車滿載率μ=65%，居民選擇打車出行的比例為6%。　　接下來建立市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)關(guān)聯(lián)的量化模型　　市民人均日出行次數(shù)是居民出行強(qiáng)度的最直接反映，其與城市人口總數(shù)量的乘積即為市民的出行總量，而市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)有著極大聯(lián)系

75、。通常情況下，市民人均日出行次數(shù)的多少與出行目的、城市布局、交通設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān)。對(duì)于某一城市來說，影響居民人均出行次數(shù)的因素又間接地反映在該城市的相關(guān)經(jīng)濟(jì)指標(biāo)上。因此，多種因素與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)可以轉(zhuǎn)化為多種經(jīng)濟(jì)指標(biāo)與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)。　　STEP1：各經(jīng)濟(jì)指標(biāo)的聚類分析；　　STEP2：典型指標(biāo)的選取；</p

76、>　　STEP3：回歸模型的建立　　STEP4：模型的檢驗(yàn)。　　聚類分析是根據(jù)事物本身的特性來定量研究分類問題的一種多元統(tǒng)計(jì)分析。其基本思想是按照距離的遠(yuǎn)近將數(shù)據(jù)分為若干個(gè)類別，以使類別內(nèi)數(shù)據(jù)的“差異”盡可能小，類別間“差異”盡可能大。所用的變量可以被大致分成兩類：對(duì)樣本個(gè)體進(jìn)行聚類通常稱為Q型聚類，對(duì)研究變量進(jìn)行聚類稱為R型

77、聚類。　　選用歐幾里得距離（歐式距離）來度量指標(biāo)之間接近的程度。歐式距離就是空間中兩點(diǎn)之間的直線距離，其中各特征參數(shù)是等權(quán)的，記dij表示指標(biāo)vi和vj之間的距離，則有計(jì)算公式如下：　　聚類分析具體過程如下：　　首先將各聚類單位各自作為一類（這時(shí)有p類），按照所選取的距離計(jì)算各數(shù)據(jù)點(diǎn)之間的距離，形成一個(gè)距離陣。&

78、lt;/p>　　將距離最近的兩個(gè)單位并為一個(gè)類別，形成n-1個(gè)類別，計(jì)算新產(chǎn)生的類別與其他各類別之間的距離，形成新的距離陣。　　按照和第二步相同的原則，再將距離最接近的兩個(gè)類別合并，這時(shí)如果類別個(gè)數(shù)仍然大于1，則繼續(xù)重復(fù)這一步驟，直到所有的數(shù)據(jù)都被合并為成為一個(gè)類別為止。　　STEP1：選取北京、上海、天津、廣州、深圳、成都、

79、南京、杭州、武漢、長(zhǎng)春、珠海、大連、福州、蘇州、常州十五個(gè)大中城市為研究對(duì)象，分析各城市人均日出行次數(shù)和十二個(gè)經(jīng)濟(jì)指標(biāo)之間的關(guān)聯(lián)。十五個(gè)大中城市2001年人均日出行次數(shù)和各經(jīng)濟(jì)指標(biāo)見表2。　　表2 大中城市居民人均出行次數(shù)和經(jīng)濟(jì)指標(biāo)　　注：數(shù)據(jù)來源：參考文獻(xiàn)[1]。　　以12個(gè)經(jīng)濟(jì)指標(biāo)為聚類單位，指標(biāo)與指標(biāo)間的

80、距離選用歐式距離，采用組間平均聯(lián)接法，進(jìn)行聚類分析。利用SPSS19.0軟件進(jìn)行聚類分析，得到各經(jīng)濟(jì)指標(biāo)間的相關(guān)系數(shù)矩陣如表3，聚類過程中的運(yùn)算結(jié)果參數(shù)見表4所示，聚類分析的譜系圖如圖1。　　表3 相關(guān)系數(shù)矩陣R　　表4 聚類分析參數(shù)　　圖1 聚類分析的譜系圖　　根

81、據(jù)聚類分析的譜系圖可以看出，這十二個(gè)經(jīng)濟(jì)指標(biāo)可分為三大類：第一大類包括人均GDP（v4）；第二大類包括在崗職工平均工資（v10）和市區(qū)居民人均可支配收入（v11）；第三大類包括市區(qū)面積（v1）、市區(qū)總?cè)丝跀?shù)（v2）、第三產(chǎn)業(yè)值（v3）、工業(yè)產(chǎn)品銷售收入（v5）、社會(huì)消費(fèi)品零售總額（v6）、房地產(chǎn)開發(fā)投資（v7）、城鄉(xiāng)居民儲(chǔ)蓄存款（v8）、居民消費(fèi)價(jià)格總指數(shù)（v9）、農(nóng)民人均純收入（v12）。聚類分析的結(jié)果見表5&

82、lt;p>　　表5 聚類分析結(jié)果　　STEP2：將十二個(gè)指標(biāo)進(jìn)行聚類分析得到三類指標(biāo)后，出來第一類指標(biāo)外，其他兩類都包含多個(gè)指標(biāo)，為了選取各類指標(biāo)中的典型指標(biāo)，分別計(jì)算類中每一變量與其余變量的Pearson相關(guān)系數(shù)，繼而求得類中每一變量與其余變量的Pearson相關(guān)系數(shù)的平方和的平均值，最后把該值最大的變量作為典型指標(biāo)。　　Pearson相關(guān)系數(shù)

83、的定義為　?。?）　　相關(guān)系數(shù)R的數(shù)值范圍是介于-1與+1之間:　　如果|R|≈0，表明兩個(gè)變量沒有線性相關(guān)關(guān)系。　　如果|R|＝1，則表示兩個(gè)變量完全直線相關(guān)。線性相關(guān)的方向通過相關(guān)系數(shù)的符號(hào)來表示，“+”號(hào)表示正相關(guān)，“-”表示

84、負(fù)相關(guān)。　?。?）　　式中，表示變量與其余變量的Pearson相關(guān)系數(shù)R的平方和的平均值，m為變量的個(gè)數(shù)。　　將表3中的值代入公式(3)、(4)，計(jì)算得到第二類和第三類指標(biāo)中的各變量的，具體見表6所示。　　表6 同一類中每一變

85、量與其余變量的相關(guān)系數(shù)平方和的均值　　從表6中可以看出，第二類指標(biāo)中v10對(duì)應(yīng)的值最大，第三類指標(biāo)v3中對(duì)應(yīng)的值最大。所以，選擇v10、v3為典型數(shù)據(jù)。而第一類指標(biāo)只有一個(gè)指標(biāo)，故可選取v4、v10、 v3分別作為第一、二、三類指標(biāo)的典型指標(biāo)。　　STEP3：根據(jù)聚類分析得到的典型變量，利用表2中的數(shù)據(jù)，建立2001年人均日出行次數(shù)Y與第三產(chǎn)業(yè)值（v3）

86、、人均GDP（v4）、在崗+職工平均工資（v10）的多元線性回歸方程。　　多元線性回歸原理：　　多元線性回歸模型為　?。?）　　每個(gè)因變量的實(shí)測(cè)值由兩部分組成

87、：估計(jì)值，用表示，即給定各自變量取值時(shí)因變量y的估計(jì)值，它代表的是能與自變量決定的部分；ei為殘差，是因變量實(shí)測(cè)值與估計(jì)值之差，表示不由自變量決定的部分。　　應(yīng)用多個(gè)個(gè)回歸模型對(duì)每一條記錄求其因變量預(yù)測(cè)值與實(shí)測(cè)值之差的平方和，并將其累加，那么每個(gè)回歸模型都會(huì)得到一個(gè)累加值，而該數(shù)值的最小的那個(gè)回歸模型就是需要的模型，這就是最小二乘法。

88、　（6）　　利用SPSS19.0軟件計(jì)算得　?。?）　　R2=0.678表明因變量Y（人均出行次數(shù)）的67.8%可由回歸方程確定，回歸方程視為可用的。　　STEP4：模型檢驗(yàn)：<p&g

89、t;　　將表2中的第三產(chǎn)業(yè)值、人均GDP、在崗+職工平均工資代入得到的多元線性回歸方程（7）中，得到人均日出行次數(shù)的模型模擬值，作出模型值與調(diào)查值的折線圖如圖2所示。　　圖2 大中城市居民平均出行次數(shù)調(diào)查值與模型值比較　　由圖2可以看出所得到的2001年人均日出行次數(shù)的回歸方程具有較好的回歸效果。由于市民每天出行次數(shù)的多少與出行目的、城市布局、生活方

90、式、工作方式、家庭經(jīng)濟(jì)狀況、交通設(shè)施、通訊設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān)，隨著社會(huì)經(jīng)濟(jì)的迅猛發(fā)展，人民生活水平也日漸提高，私家車數(shù)量大幅增加，城市的交通更加發(fā)達(dá)，人們之間的聯(lián)系加強(qiáng)，越來越多的人選擇逛街、旅游等休閑方式，綜合考慮社會(huì)經(jīng)濟(jì)的發(fā)展帶來的影響，修正2001年人均日出行次數(shù)的回歸方程，得到2013年人均日出行次數(shù)的回歸方程：　?。?）

91、;　　根據(jù)從參考文獻(xiàn)[5]各城市2013年年鑒上收集到的數(shù)據(jù)（見表7），利用2013年人均日出行次數(shù)的回歸方程[8]，計(jì)算得到相應(yīng)城市的人均日出行次數(shù)，結(jié)果如表7所示。　　表7 國(guó)內(nèi)主要城市相關(guān)的經(jīng)濟(jì)指標(biāo)　　利用表7中的數(shù)據(jù)計(jì)算八座城市的出租車資源的供求匹配率，結(jié)果如表8所示。　　表8

92、國(guó)內(nèi)主要城市出行相關(guān)信息　　從表8可以看出，在所研究的八個(gè)國(guó)內(nèi)主要城市中，只有大連這一座城市的供求匹配率略大于1，而其余主要城市的供求匹配率均小于１，并且深圳和杭州兩地的供求匹配率與1相距最遠(yuǎn)。因此，城市出租車資源供求達(dá)到近似平衡的城市為大連，而城市出租車資源供小于求的城市為北京、廣州、武漢、南京、成都，嚴(yán)重供小于求的城市為杭州和深圳。　　4.5.2.2

93、不同時(shí)間的出租車資源的供求匹配　　由參考文獻(xiàn)[4]得到的在不同時(shí)刻蚌埠市居民出行的平均比例，將此比例作為成都市居民不同時(shí)刻的出行比例（見表9），計(jì)算得到各時(shí)段的出租車供求匹配率，結(jié)果見表9。　　表9 成都市不同時(shí)刻出租車資源供求情況　　由表9可以看出，在上班早高峰、下班晚高峰和中午時(shí)段成都市出租車資源的供求匹配

94、率均小于1，并且與1相距較遠(yuǎn)。所以這在四個(gè)時(shí)間段內(nèi)，成都市出租車資源都是嚴(yán)重供小于求。　　4.5.2.3利用灰色模型預(yù)測(cè)2018年成都市區(qū)人口數(shù)量和出租車需求量　　利用灰色模型預(yù)測(cè)2018年成都市區(qū)人口數(shù)量和出租車需求量，接下來介紹灰色預(yù)測(cè)方法原理。　　1．設(shè)已知參考數(shù)據(jù)列為x（0）=（x（0）（1），x（0）

95、（2），…，x（0）（n））,做1次累加（AGO），生成數(shù)列　　其中。求均值數(shù)列　　則z（1）=（z（1）（2），z（1）（3），…，z（1）（n））。于是建立灰微分方程為　　相應(yīng)的白化微分方程為　　記</b

96、>　　由最小二乘法，求得使　　達(dá)到最小值的　　于是求解方程得　　2．灰色預(yù)測(cè)的步驟 　?。?）數(shù)據(jù)的檢驗(yàn)與處理<p&g

97、t;　　首先，為了保證建模方法的可行性，需要對(duì)已知數(shù)據(jù)列做必要的檢驗(yàn)處理。設(shè)參數(shù)據(jù)為x（0）=（x（0）（1），x（0）（2），…，x（0）（n）） ,計(jì)算數(shù)列的級(jí)比　　, 　　如果所有的級(jí)比λ(k)都落在可容覆蓋內(nèi)，則數(shù)列x（0）可以作為模型　　GM(1,1)的數(shù)據(jù)進(jìn)行灰

98、色預(yù)測(cè)。否則，需要對(duì)數(shù)列x（0）做必要的變換處理，使其落入可容覆蓋內(nèi)。即取適當(dāng)?shù)某?shù)c ，作平移變換　　,　　則使數(shù)列的級(jí)比為　　,　?。?/p>

99、2）建立模型　　按1節(jié)中的方法建立模型GM(1,1)，則可以得到預(yù)測(cè)值　　，。　?。?）建立模型預(yù)測(cè)值　　殘差檢驗(yàn)：令殘差為ε(k),計(jì)算　　，</

100、b>　　如果ε(k)<0.2,則可認(rèn)為達(dá)到一般要求；如果ε(k)<0.1,則認(rèn)為達(dá)到較高的要求。　　級(jí)比偏差值檢驗(yàn)：首先由參考數(shù)據(jù)x（0）（k-1），x（0）（k），計(jì)算出級(jí)比λ(k),再用發(fā)展系數(shù)a求出相應(yīng)的級(jí)比偏差　　如果ρ（k）＜0.2，則可認(rèn)為達(dá)到一般要求；如果ρ（k）＜0.1，則認(rèn)為達(dá)

101、到較高的要求。　　利用灰色預(yù)測(cè)模型和成都市2002年至2013年的人口數(shù)量，對(duì)成都市2014年至2021年的人口數(shù)量進(jìn)行預(yù)測(cè)，結(jié)果見表10和表11。　　表10 成都市人口灰色預(yù)測(cè)　　表11 成都市區(qū)人口預(yù)測(cè)　　預(yù)測(cè)2018年成都市區(qū)人口632.27萬，選取人均日出行

102、次數(shù)為2.8次，將以上數(shù)據(jù)代入公式[1]，得到在出租車供求平衡即供求匹配率P＝1的情況下，成都市2018年需要出租車23345輛。　　4.6 模型評(píng)價(jià)　　模型優(yōu)點(diǎn)：　　模型充分考慮了影響城市居民對(duì)出租車需求量的重要因素，定量分析這些因素對(duì)

103、城市出租車需求量的影響，結(jié)果具有較高的可靠性。　　模型缺點(diǎn)　?。?）以整個(gè)城市為研究對(duì)象，對(duì)城市內(nèi)的局部區(qū)域缺乏更細(xì)致的研究，無法刻畫不同區(qū)域的差異，如市中心與市郊的情況會(huì)有所不同。打車難的問題在局部可能依然存在。　?。?）模型未考慮司機(jī)的挑客行為，即有些司機(jī)為了獲得更多利潤(rùn)

104、，會(huì)拒載一些短途生意，而專門接一些長(zhǎng)途活.　　4.7 本章小結(jié)　　本章研究的是“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置模型，應(yīng)用本文前兩章所介紹的聚類分析和回歸分析的方法理論，并結(jié)合MATLAB和SPSS兩種優(yōu)化軟件，對(duì)模型進(jìn)行了求解。本章首先通過對(duì)實(shí)際問題的分析，列出了關(guān)于聚類分析和回歸分析的基本模型。其后，通過結(jié)合實(shí)際背

105、景，為分析不同時(shí)空出租車資源的供求匹配程度，引入出租車資源供求匹配率這一指標(biāo)，指標(biāo)的定義為城市中實(shí)際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之比，反映城市中實(shí)際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之間的差異。計(jì)算得出成都2013年出租車供求匹配率為0.7766，表示供不應(yīng)求。　　居民出行需要的出租車輛數(shù)與居民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、居民出行選擇乘坐出租車的比例有關(guān)，也與每輛出租車

106、日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān)。對(duì)于居民人均日出行次數(shù)，利用十五個(gè)國(guó)內(nèi)大中城市的數(shù)據(jù)，將十二個(gè)城市經(jīng)濟(jì)指標(biāo)聚類分析選出每類指標(biāo)中典型的經(jīng)濟(jì)指標(biāo)，建立居民人均日出行次數(shù)與這些典型經(jīng)濟(jì)指標(biāo)間的多元線性回歸方程，而與居民出行需要的出租車輛數(shù)相關(guān)的其他指標(biāo)可查閱文獻(xiàn)或年鑒獲得。分析成都市每天6:00-8:30，11:00-12:30,13:30-14:30,17:00-18:30四個(gè)時(shí)間段得供求匹配率分別為0.4111，0.5678

107、,0.6062,0.5631，結(jié)果顯示供不應(yīng)求。得到大連、北京、廣州、武漢、南京、成都、杭州、深圳八座城市的出租車資源供求匹配率分別為1.0936、0.8827、0.9430、0.7040、0.7049、0.7666、0.6583、0.5252，表明只有大連的出租車資源是供大于求，而其余七座城市為供小于求。　　結(jié) 論

108、;　　隨著人類的社會(huì)實(shí)踐，統(tǒng)計(jì)分析的知識(shí)和思想在越來越多的領(lǐng)域顯示了它的應(yīng)用性和實(shí)用性。它從整體上反映和分析事物數(shù)量特征,觀察事物的本質(zhì)和發(fā)展規(guī)律,作出正確的判斷。我們社會(huì)中的每個(gè)人，都是特定事件的決策者，都要受到統(tǒng)計(jì)分析理論的影響，大到國(guó)家，小到個(gè)人。因此我們需要通過分析達(dá)到我們的預(yù)期目標(biāo)，并借助一些具有強(qiáng)大功能的軟件，比如SPSS和MATLAB等，幫助我們做出決策。　　本文共分四部分。第一部

109、分簡(jiǎn)要介紹了統(tǒng)計(jì)分析的概念和應(yīng)用，以及SPSS和MATLAB軟件的功能和特點(diǎn)。本文在求解的過程中主要借助了這兩個(gè)軟件。第二部分簡(jiǎn)要介紹了統(tǒng)計(jì)分析中最基礎(chǔ)的兩個(gè)個(gè)組成成分：聚類分析、回歸分析，對(duì)它們的概念和求解方法做了簡(jiǎn)要介紹。第三部分分別就這兩個(gè)方法給出了經(jīng)典案例，通過SPSS軟件編程分別求解了對(duì)五個(gè)樣品進(jìn)行分類的問題，得到了最優(yōu)分類策略，以及求解了地區(qū)生產(chǎn)總值與13個(gè)重要支出項(xiàng)的組成關(guān)系問題，得出了在生產(chǎn)總值與支出項(xiàng)的最簡(jiǎn)回歸模型。第

110、四部分是將所研究的聚類分析和回歸分析方法應(yīng)用到2015年數(shù)學(xué)建模競(jìng)賽試題“互聯(lián)網(wǎng)+時(shí)代的出租車資源配置模型”當(dāng)中，根據(jù)聚類分析和回歸分析的求解和簡(jiǎn)化方法，得到了簡(jiǎn)單的回歸分析模型，最后利用MATLAB和SPSS軟件，得到了不同時(shí)空出租車資源的供求匹配程度最優(yōu)決策方案。　　通過求解實(shí)際統(tǒng)計(jì)分析問題，可以了解到，統(tǒng)計(jì)分析理論結(jié)合相應(yīng)的優(yōu)化軟件，可以為決策者做出最優(yōu)決策提供相應(yīng)的簡(jiǎn)捷快速、準(zhǔn)確的最優(yōu)化

111、方案。因此，我們要利用統(tǒng)計(jì)分析的強(qiáng)大的決策作用以及現(xiàn)代計(jì)算機(jī)軟件的強(qiáng)大功能，使其為我們各個(gè)領(lǐng)域的發(fā)展和進(jìn)步發(fā)揮更大的促進(jìn)作用。　　參考文獻(xiàn)　　[1]鄒志云，蔣忠海，梅亞楠，宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報(bào)，5(2):8-13,2007,6　　[2]

112、衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》，2007，（5）　　[3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文，2009,12　　[4]大連，北京，廣州，杭州，深圳，武漢、南京2013年年鑒　　[5]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用.北京：高等教育出版社，20

113、05.6　　[6]成都2002-2013年年鑒　　附錄　?。?）文件名:first.m（2001年15個(gè)城市人均每日出行次數(shù)模型值）　　clear;

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

課程設(shè)計(jì)---應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

課程設(shè)計(jì)---應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載