版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 課 程 設(shè) 計(jì)</p><p> 2017年 6 月 27 日</p><p><b> 課程設(shè)計(jì)任務(wù)書</b></p><p> 課程 《數(shù)學(xué)模型》課程設(shè)計(jì)</p><p> 題目 應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題</p><p> 主要內(nèi)容、基本要
2、求、主要參考資料等</p><p><b> 主要內(nèi)容</b></p><p> 簡(jiǎn)單介紹統(tǒng)計(jì)分析模型的基礎(chǔ)理論及本文所用的統(tǒng)計(jì)分析方法,了解MATLAB軟件和SPSS軟件的功能,進(jìn)一步通過實(shí)例來掌握如何應(yīng)用常用的統(tǒng)計(jì)分析方法建立數(shù)學(xué)模型及求解。并利用本文所介紹的統(tǒng)計(jì)分析方法來求解2005年數(shù)學(xué)建模的“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置問題。</p>&
3、lt;p><b> 課程設(shè)計(jì)的要求:</b></p><p> 1.獨(dú)立完成建模,并提交一篇建模論文。</p><p> 2.論文的主要內(nèi)容包括:摘要,問題的提出,問題的分析,模型假設(shè),模型設(shè)計(jì), 模型解法與結(jié)果,模型結(jié)果的分析和檢驗(yàn),包括誤差分析、穩(wěn)定性分析等。模型的優(yōu)缺點(diǎn)及改進(jìn)方向。必要的計(jì)算機(jī)程序。</p><p> 3.文
4、檔格式:參照《東北石油大學(xué)課程設(shè)計(jì)撰寫規(guī)范》和《數(shù)學(xué)模型課程設(shè)計(jì)教學(xué)大綱》。</p><p> 4.課程設(shè)計(jì)結(jié)束時(shí)參加答辯。</p><p><b> 主要參考資料: </b></p><p> [1]鄒志云,蔣忠海,梅亞楠,宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報(bào),5(2):8-13,2007,6</p>
5、<p> [2]衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》,2007,(5)</p><p> [3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文,2009,12</p><p> [4]大連,北京,廣州,杭州,深圳,武漢、南京2013年年鑒</p><p> [5]韓中庚.數(shù)學(xué)建模方法及其
6、應(yīng)用.北京:高等教育出版社,2005.6</p><p><b> 摘 要</b></p><p> 統(tǒng)計(jì),顧名思義即將信息統(tǒng)括起來進(jìn)行計(jì)算的意思,它是對(duì)數(shù)據(jù)進(jìn)行定量處理的理論與技術(shù)。統(tǒng)計(jì)分析,常指對(duì)收集到的有關(guān)數(shù)據(jù)資料進(jìn)行整理歸類并進(jìn)行解釋的過程。</p><p> 統(tǒng)計(jì)分析是統(tǒng)計(jì)工作中統(tǒng)計(jì)設(shè)計(jì)、資料收集、整理匯總、統(tǒng)計(jì)分析、信息反饋五
7、個(gè)階段最關(guān)鍵的一步。如果缺少這一步或這一步做得不好,均將降低統(tǒng)計(jì)工作的作用??梢源_切地說,沒有統(tǒng)計(jì)分析,統(tǒng)計(jì)工作就沒有活力、沒有發(fā)展,也沒有統(tǒng)計(jì)工作的地位。所以統(tǒng)計(jì)工作者必須學(xué)會(huì)寫統(tǒng)計(jì)分析,積極地為領(lǐng)導(dǎo)決策服務(wù),這既是統(tǒng)計(jì)工作者的職責(zé),也是統(tǒng)計(jì)工作的最終目的。</p><p> 本文簡(jiǎn)要地介紹了統(tǒng)計(jì)分析中的聚類分析和回歸分析的概念和應(yīng)用,以及常用的求解聚類分析和回歸分析的方法,初步了解了統(tǒng)計(jì)分析問題的基本思想。
8、此外,本文還簡(jiǎn)要介紹了有關(guān)MATLAB和SPSS軟件的功能和特點(diǎn),以便于用其去處理實(shí)際的統(tǒng)計(jì)分析問題。在對(duì)聚類分析和回歸分析的相關(guān)內(nèi)容做了簡(jiǎn)介之后,本文還列舉了聚類分析和回歸分析的相關(guān)實(shí)例,并用MATLAB和SPSS軟件對(duì)所舉實(shí)例進(jìn)行了編程求解,得出了模型的最優(yōu)化配置方案和選擇方案。最后,本文著重的探討了關(guān)于典型統(tǒng)計(jì)分析模型“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置的不同時(shí)空供求匹配程度的計(jì)算。</p><p> 隨著信
9、息科學(xué)的進(jìn)步,統(tǒng)計(jì)應(yīng)用的范圍越來越廣,數(shù)據(jù)處理及數(shù)據(jù)采集挖掘的方法呈現(xiàn)出多樣化,統(tǒng)計(jì)分析方法也相對(duì)復(fù)雜化,專業(yè)化。面對(duì)如今的大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)分析的作用顯得越來越重要,因此我們需要掌握一些常見的統(tǒng)計(jì)分析方法,以便于在以后的工作和學(xué)習(xí)中能夠獨(dú)立而有效的處理相關(guān)問題。</p><p> 關(guān)鍵字:統(tǒng)計(jì)分析;聚類分析;回歸分析;MATLAB;SPSS </p><p><b> 目 錄
10、</b></p><p> 第1章 統(tǒng)計(jì)分析問題基礎(chǔ)理論3</p><p> 1.1統(tǒng)計(jì)分析相關(guān)介紹3</p><p> 1.2 MATLAB和SPASS軟件介紹4</p><p><b> 1.3本章小結(jié)6</b></p><p> 第2章 統(tǒng)計(jì)分析常用方法簡(jiǎn)介7
11、</p><p> 2.1 方法1——聚類分析7</p><p> 2.2 方法2——回歸分析8</p><p> 2.3 本章小結(jié)9</p><p> 第3章 典型實(shí)例10</p><p> 3.1 實(shí)例1——聚類分析10</p><p> 3.2 實(shí)例2——回歸分析1
12、1</p><p> 3.3 本章小結(jié)15</p><p> 第4章 數(shù)學(xué)模型案例16</p><p> 4.1 問題重述16</p><p> 4.2 問題分析17</p><p> 4.3 模型假設(shè)17</p><p> 4.4 符號(hào)說明18</p>&
13、lt;p> 4.5 模型建立與求解18</p><p> 4.6 模型評(píng)價(jià)28</p><p> 4.7 本章小結(jié)29</p><p><b> 結(jié)論30</b></p><p><b> 參考文獻(xiàn)31</b></p><p> 統(tǒng)計(jì)分析問題基礎(chǔ)理
14、論</p><p> 統(tǒng)計(jì)分析是指運(yùn)用統(tǒng)計(jì)方法及與分析對(duì)象有關(guān)的知識(shí),從定量與定性的結(jié)合上進(jìn)行的研究活動(dòng)。它是繼統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理之后的一項(xiàng)十分重要的工作,是在前幾個(gè)階段工作的基礎(chǔ)上通過分析從而達(dá)到對(duì)研究對(duì)象更為深刻的認(rèn)識(shí)。它又是在一定的選題下,集分析方案的設(shè)計(jì)、資料的搜集和整理而展開的研究活動(dòng)。系統(tǒng)、完善的資料是統(tǒng)計(jì)分析的必要條件。本文主要介紹了有關(guān)聚類分析和回歸分析的有關(guān)知識(shí),以及MATLAB和S
15、PSS軟件的功能。</p><p><b> 統(tǒng)計(jì)分析相關(guān)介紹</b></p><p><b> 聚類分析</b></p><p><b> 一、聚類分析的概念</b></p><p> 聚類分析指將物理或抽象對(duì)象的集合分組成為由類似的對(duì)象組成的多個(gè)類的分析過程。它是一
16、種重要的人類行為。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。</p><p><b> 二、聚類分析的應(yīng)用</b></p><p> 高維聚類分析已成為聚類分析的一個(gè)重要研究方向。同時(shí)高維數(shù)據(jù)聚類也是聚類技術(shù)的難點(diǎn)是隨著技術(shù)的進(jìn)步使得數(shù)據(jù)收集變得越來越容易,導(dǎo)致數(shù)據(jù)庫(kù)規(guī)模越來越大、復(fù)雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web 文檔、基因表達(dá)數(shù)據(jù)等,它們的
17、維度(屬性)通??梢赃_(dá)到成百上千維,甚至更高。但是,受“維度效應(yīng)”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運(yùn)用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個(gè)非常活躍的領(lǐng)域,同時(shí)它也是一個(gè)具有挑戰(zhàn)性的工作。目前,高維數(shù)據(jù)聚類分析在市場(chǎng)分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的應(yīng)用。</p><p><b> 1.1.2回歸分析</b></p>
18、<p><b> 一、回歸分析的概念</b></p><p> 回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一 個(gè)自變量和一個(gè)因變量,
19、且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。</p><p> 回歸分析的主要內(nèi)容為:①?gòu)囊唤M數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)。估計(jì)參數(shù)的常用方法是最小二乘法。②對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。③在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷哪個(gè)(或哪
20、些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對(duì)某一生產(chǎn)過程進(jìn)行預(yù)測(cè)或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計(jì)軟件包使各種回歸方法計(jì)算十分方便。</p><p><b> 二、回歸分析的應(yīng)用</b></p><p> 回歸分析是重要統(tǒng)計(jì)推斷方法。
21、在實(shí)際應(yīng)用中,回歸分析是數(shù)理統(tǒng)計(jì)學(xué)與實(shí)際問題聯(lián)系最為緊密,應(yīng)用最為廣泛,也是收效最為顯著的統(tǒng)計(jì)分析方法;是分析數(shù)據(jù),尋求變量之間關(guān)系有利的工具。隨著科學(xué)技術(shù)的發(fā)展,生物、醫(yī)學(xué)、農(nóng)業(yè)、林業(yè)、經(jīng)濟(jì)、管理、金融、社會(huì)等領(lǐng)域的許多事跡新問題提出,有力的推動(dòng)了回歸分析的發(fā)展。</p><p> MATLAB和SPASS軟件介紹</p><p> 1.2.1 MATLAB相關(guān)介紹</p>
22、;<p> MATLAB是美國(guó)MathWorks公司出品的商業(yè)數(shù)學(xué)軟件,用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境,主要包括MATLAB和Simulink兩大部分。</p><p> MATLAB是matrix&laboratory兩個(gè)詞的組合,意為矩陣工廠(矩陣實(shí)驗(yàn)室)。是由美國(guó)mathworks公司發(fā)布的主要面對(duì)科學(xué)計(jì)算、可視化以及交互式程序設(shè)計(jì)的高
23、科技計(jì)算環(huán)境。它將數(shù)值分析、矩陣計(jì)算、科學(xué)數(shù)據(jù)可視化以及非線性動(dòng)態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個(gè)易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計(jì)以及必須進(jìn)行有效數(shù)值計(jì)算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計(jì)語言(如C、Fortran)的編輯模式,代表了當(dāng)今國(guó)際科學(xué)計(jì)算軟件的先進(jìn)水平。</p><p> MATLAB和Mathematica、Maple并稱為三大數(shù)學(xué)軟
24、件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計(jì)算方面首屈一指。MATLAB可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等,主要應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等領(lǐng)域。</p><p> 1.2.2 SPSS軟件相關(guān)介紹</p><p> 1984年SPSS總部首先推出了世界上第一個(gè)統(tǒng)計(jì)分析軟件微機(jī)版本SPSS/P
25、C+,開創(chuàng)了SPSS微機(jī)系列產(chǎn)品的開發(fā)方向,極大地?cái)U(kuò)充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域。世界上許多有影響的報(bào)刊雜志紛紛就SPSS的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)。</p><p> SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等等。SPSS統(tǒng)計(jì)分析過程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對(duì)數(shù)
26、線性模型、聚類分析、數(shù)據(jù)簡(jiǎn)化、生存分析、時(shí)間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個(gè)統(tǒng)計(jì)過程,比如回歸分析中又分線性回歸分析、曲線估計(jì)、Logistic回歸、Probit回歸、加權(quán)估計(jì)、兩階段最小二乘法、非線性回歸等多個(gè)統(tǒng)計(jì)過程,而且每個(gè)過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。</p><p> SPSS軟件具有以下特點(diǎn):</p><p
27、><b> 操作簡(jiǎn)便</b></p><p> 界面非常友好,除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過鼠標(biāo)拖曳、點(diǎn)擊“菜單”、“按鈕”和“對(duì)話框”來完成。</p><p><b> 編程方便</b></p><p> 具有第四代語言的特點(diǎn),告訴系統(tǒng)要做什么,無需告訴怎樣做。只要
28、了解統(tǒng)計(jì)分析的原理,無需通曉統(tǒng)計(jì)方法的各種算法,即可得到需要的統(tǒng)計(jì)分析結(jié)果。對(duì)于常見的統(tǒng)計(jì)方法,SPSS的命令語句、子命令及選擇項(xiàng)的選擇絕大部分由“對(duì)話框”的操作完成。因此,用戶無需花大量時(shí)間記憶大量的命令、過程、選擇項(xiàng)。</p><p><b> 功能強(qiáng)大</b></p><p> 具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。自帶11種類型136個(gè)
29、函數(shù)。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。</p><p><b> 數(shù)據(jù)接口</b></p><p> 能夠讀取及輸出多種格式的文件。比如由dBASE、
30、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及html格式的文件。</p><p><b> 模塊組合</b></p><p> SPSS for Windows軟件分為若干功能模塊。用戶可以根
31、據(jù)自己的分析需要和計(jì)算機(jī)的實(shí)際配置情況靈活選擇。</p><p><b> 針對(duì)性強(qiáng)</b></p><p> SPSS針對(duì)初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡(jiǎn)單的操作分析,大多青睞于SPSS,像薛薇的《基于SPSS的數(shù)據(jù)分析》一書也較適用于初學(xué)者。而那些熟練或精通者也較喜歡SPSS,因?yàn)樗麄兛梢酝ㄟ^編程來實(shí)現(xiàn)更強(qiáng)大的功能。</p>
32、;<p><b> 本章小結(jié)</b></p><p> 本章主要介紹了聚類分析和回歸分析的概念以及他們?cè)趯?shí)際生活中的廣泛應(yīng)用。并且介紹了將要用到的MATLAB和SPSS軟件的功能和特點(diǎn),以及他們?cè)趯?shí)際生活中的用處。</p><p> 第2章 統(tǒng)計(jì)分析常用方法簡(jiǎn)介</p><p> 2.1 方法1——聚類分析</p&g
33、t;<p> 聚類分析是將樣品或變量按照它們?cè)谛再|(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計(jì)分析方法。聚類分析時(shí),用來描述樣品或變量的親疏程度通常有來兩個(gè)途徑,一是把每個(gè)樣品或變量看成是多維空間上的一個(gè)點(diǎn),在多維坐標(biāo)中,定一點(diǎn)與點(diǎn),類和類之間的距離,用點(diǎn)與點(diǎn)間距離來描述樣品或變量之間的親疏程度:另一個(gè)是計(jì)算樣品或變量的相似系數(shù),用相似系數(shù)來描述樣品或變量之間的親屬程度。</p><p> 聚類分析是實(shí)用多元
34、統(tǒng)計(jì)分析的一個(gè)新的分支,聚類分析的功能是建立一種分類方法,他將一批樣品或變量,按照它們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類。</p><p> 聚類分析的內(nèi)容十分豐富,按其聚類的方法可分為以下幾種:</p><p> (1)系統(tǒng)聚類法:開始每個(gè)對(duì)象自成一類,然后每次將最相似的兩類合并,合并后重新計(jì)算新類與其他類的距離或相近性測(cè)度。這一過程可用一張譜系聚類圖描述。</p>&l
35、t;p> (2)調(diào)優(yōu)法(動(dòng)態(tài)聚類法):首先對(duì)n個(gè)對(duì)象初步分類,然后根據(jù)分類的損失函數(shù)盡可能小的原則對(duì)其進(jìn)行調(diào)整,直到分類合理為止。</p><p> (3)最優(yōu)分割法(有序樣品聚類法):開始將所有樣品看做一類,然后根據(jù)某種最優(yōu)準(zhǔn)則將它們分割為二類、三類,一直分割到所需的K類為止。這種方法適用于有序樣品的分類問題,也稱為有序樣品的聚類法。</p><p> (4)模糊聚類法:利用
36、模糊集理論來處理分類問題,它對(duì)經(jīng)濟(jì)領(lǐng)域中具有模糊特征兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。</p><p> (5)圖論聚類法:利用圖論中最小支撐樹的理論來處理分類問題,創(chuàng)造了獨(dú)具風(fēng)格的方法。</p><p> (6)聚類預(yù)報(bào)法:利用聚類方法處理預(yù)報(bào)問題,在多元統(tǒng)計(jì)分析中,可以用來做預(yù)報(bào)的方法很多,如回歸分析和判別分析。但對(duì)一些異常數(shù)據(jù),如氣象中的災(zāi)害性天氣的預(yù)報(bào),使用回歸分析或判別分
37、析處理的效果都不好,而聚類預(yù)報(bào)彌補(bǔ)了這一不足,只是一個(gè)值得重視的方法。</p><p> 聚類分析根據(jù)對(duì)象的不同又分為R型和Q型兩大類,R型是對(duì)變量(指標(biāo))進(jìn)行分類,Q型是對(duì)樣品進(jìn)行分類。</p><p> R型聚類分析的目的有以下幾方面:</p><p> ?。?)可以了解變量間及變量組合間的親疏關(guān)系;</p><p> ?。?)對(duì)變量
38、進(jìn)行分類;</p><p> ?。?)根據(jù)分類結(jié)果及它們之間的關(guān)系,在每一類中選擇有代表性的變量作為重要變量,利用少數(shù)幾個(gè)重要變量進(jìn)一步作分析計(jì)算,如進(jìn)行回歸分析或Q型聚類分析等。</p><p> Q型聚類分析的目的主要是對(duì)樣品進(jìn)行分類。分類的結(jié)果是直觀的,且比傳統(tǒng)的分類方法更細(xì)致、全面、合理。當(dāng)然使用不同的分類方法通常有不同的分類結(jié)果。對(duì)任何觀測(cè)數(shù)據(jù)都沒有唯一“正確”的分類方法。實(shí)際
39、應(yīng)用中,常采用不同的分類方法,對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算,一邊對(duì)分類提供具體意見,并由實(shí)際工作者決定所需要的分類數(shù)及分類情況。</p><p> 2.2 方法2——回歸分析</p><p> 多元線性回歸模型的一般形式</p><p> 回歸分析是最靈活最常用的統(tǒng)計(jì)分析方法之一,它用于分析一個(gè)因變量與一個(gè)或多個(gè)自變量之間的關(guān)系。特別是用于:(1)定量的描述和解釋相互關(guān)
40、系;(2)估測(cè)或預(yù)測(cè)因變量的值。 </p><p> 回歸分析方法是在眾多的相關(guān)變量中,根據(jù)實(shí)際問題考察其中一個(gè)或多個(gè)變量與其余變量的依賴關(guān)系。如果只要考察一個(gè)變量與其余多個(gè)變量之間的相互依賴關(guān)系,我們稱為多元回歸問題。若要同時(shí)考察多個(gè)因變量與多個(gè)自變量之間的相互依賴關(guān)系,我們稱為多因變量的多元回歸問題。</p><p> 多元回歸分析是研究因變量Y與m個(gè)自變量的相關(guān)關(guān)系 ,而且總是
41、假設(shè)因變量Y為隨機(jī)變量,而為一般變量。</p><p> 下面我們來看一下多元線性回歸模型的建立。 </p><p> 假定因變量Y與線性相關(guān)。收集到的n組數(shù)據(jù)()(t=1,2,···n)滿足以下回歸模型:</p><p><b> 記</b></p><p><b>
42、C=,</b></p><p> 則所建回歸模型的矩陣形式為</p><p><b> 或</b></p><p> 并稱它們?yōu)榻?jīng)典多元回歸模型,其中Y是可觀測(cè)的隨機(jī)向量,是不可觀測(cè)的隨機(jī)向量,C是已知矩陣,是未知參數(shù),并設(shè)n>m,且rank(C)=m+1。</p><p> 在經(jīng)典回歸分析中,
43、我們討論模型中參數(shù)和的估計(jì)和檢驗(yàn)問題。近代回歸分析中討論變量篩選、估計(jì)的改進(jìn),以及對(duì)模型中的一些假設(shè)進(jìn)行診斷等問題。</p><p><b> 2.3 本章小結(jié)</b></p><p> 本章主要介紹了統(tǒng)計(jì)分析問題的聚類分析和回歸分析的概念及其常用的求解方法,了解了他們的基礎(chǔ)思想。并將這兩種分析方法運(yùn)用到第三章和第四章中去解決實(shí)際的數(shù)學(xué)問題。</p>
44、<p><b> 第3章 典型實(shí)例</b></p><p> 3.1 實(shí)例1——聚類分析</p><p> 下面是聚類分析的一個(gè)簡(jiǎn)單例子。有五個(gè)樣品,每個(gè)只測(cè)量了一個(gè)指標(biāo),分別為1,2,6,8,11,我們用最短距離法將它們分類。</p><p> (1)計(jì)算五個(gè)樣品兩兩間的距離,得初始類間的距離矩陣,</p>
45、<p> (2)由知類間最小距離為1,于是將和合并成,并計(jì)算和其他類之間的距離,的新的距離陣</p><p> (3)由知,類間最小距離為2,合并和 為,計(jì)算與其他類間的距離得矩陣,</p><p> (4)由知,類間的最小距離為3,將和合并為,得新的距離矩陣,</p><p> (5)最后將和合并為,這時(shí)五個(gè)樣品聚為一類。</p>
46、<p> 3.2 實(shí)例2——回歸分析</p><p> 3.2.1數(shù)據(jù)的準(zhǔn)備</p><p> 《中國(guó)統(tǒng)計(jì)年鑒》把財(cái)政支出劃分為31個(gè)組成部分。本文只選取2005年我國(guó)31個(gè)省、市、自治區(qū)的地區(qū)生產(chǎn)總值和13個(gè)重要支出項(xiàng),分別是:為基本建設(shè)支出,為企業(yè)挖潛改造資金,為科技三項(xiàng)費(fèi)用,為農(nóng)業(yè)支出,為農(nóng)林水利氣象等部門事業(yè)費(fèi),為工業(yè)交通部門事業(yè)費(fèi),為流動(dòng)部門事業(yè)費(fèi),為教育事業(yè)費(fèi),
47、為科學(xué)事業(yè)費(fèi),為衛(wèi)生經(jīng)費(fèi),為行政管理費(fèi),為公檢法司支出,為城市維護(hù)費(fèi)。為地區(qū)生產(chǎn)總值。(數(shù)據(jù)單位為:萬元)</p><p> 3.2.2模型的建立及求解</p><p> 3.2.2.1 模型的建立</p><p> 將13個(gè)重要支出項(xiàng)設(shè)為自變量,用表示;將地區(qū)生產(chǎn)總值設(shè)為因變量。采用最小二乘法擬合一個(gè)多元線性回歸模型,采用數(shù)學(xué)軟件SPSS計(jì)算出回歸系數(shù),運(yùn)行
48、結(jié)果如下表:</p><p> 表3.1 回歸系數(shù)表</p><p> 因而對(duì)13個(gè)自變量的線性回歸方程為:</p><p> 3.2.2.2模型的檢驗(yàn)</p><p> 首先,對(duì)模型(3.1)進(jìn)行擬合優(yōu)度的檢驗(yàn),采用數(shù)學(xué)軟件SPSS計(jì)算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù),運(yùn)行結(jié)果如下表</p><p><
49、;b> 表3.2 模型匯總</b></p><p> 由表3.2可知,模型(3.1)擬合效果很好。</p><p> 然后,對(duì)模型(3.1)進(jìn)行顯著性F檢驗(yàn),提出原假設(shè):采用數(shù)學(xué)軟件SRSS計(jì)算出的方差分析表如下表</p><p> 表3.3 方差分析表</p><p> 表3.3中的Sig.即為顯著性P值,由P值
50、=0.000(近似值),,P值小于,所以,拒絕原假設(shè),認(rèn)為在顯著性水平的條件下,因變量對(duì)自變量有顯著的線性關(guān)系,即回歸方程(3.1)是顯著的。</p><p> 最后,對(duì)模型(3.1)進(jìn)行回歸系數(shù)的顯著性檢驗(yàn),提出原假設(shè)其中 。利用SPSS計(jì)算出關(guān)于的t統(tǒng)計(jì)量及相應(yīng)的P值,見表3.1。由表我們可以發(fā)現(xiàn)并不是所有的單獨(dú)對(duì)因變量都有顯著影響。這說明盡管回歸方程通過了顯著性檢驗(yàn),但也會(huì)出現(xiàn)某些單個(gè)變量對(duì)并不顯著的情況
51、。</p><p> 由于某些變量不顯著,因此本文采取后退法[3]簡(jiǎn)單的剔除多余變量,由于變量間的交互作用,不能一次性剔除所有不顯著的變量,所以進(jìn)行依次剔除,首先剔除P值最大的一個(gè)變量,然后再進(jìn)回歸系數(shù)的顯著性檢驗(yàn),如果有不顯著的變量,那么再進(jìn)行剔除,依次下去,知道保留的變量都對(duì)有顯著性影響為止。</p><p> 根據(jù)表3.1,我們首先剔除,用剩余變量與進(jìn)行回歸系數(shù)的顯著性檢驗(yàn),SP
52、SS運(yùn)行結(jié)果如下表</p><p> 表3.4 回歸系數(shù)表</p><p> 由結(jié)果看,剔除后,剩余變量的顯著性都發(fā)生了變化,仍然有部分變量不顯著,所以繼續(xù)進(jìn)行剔除(由于剔除過程比較繁瑣,在此不一一列出,只列出最終保留的變量)。最終保留的變量為,,,,,,,。將剩余變量與做回歸分析,SPSS運(yùn)行結(jié)果如下表</p><p><b> 表3.5回歸系數(shù)表
53、</b></p><p> 由表3.5建立新的多元線性回歸模型</p><p><b> (3.2)</b></p><p> 應(yīng)用SPSS軟件計(jì)算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù),如下表</p><p><b> 表3.6 模型匯總</b></p><p&
54、gt; 由表3.6可知,模型(3.2)擬合效果很好。</p><p> 然后,對(duì)模型(3.2)進(jìn)行顯著性F檢驗(yàn),采用數(shù)學(xué)軟件SPSS計(jì)算出的方差分析表如下表</p><p> 表3.7 方差分析表</p><p> 由P值=0.000(近似值),,P值小于,所以,在顯著性水平的條件下,回歸方程(3.2)是顯著的。</p><p>
55、經(jīng)過以上算法步驟,新建立的模型(3.2)通過了顯著性檢驗(yàn),因此。模型(3.2)為最終確定的模型。</p><p><b> 3.3 本章小結(jié)</b></p><p> 本章主要根據(jù)典型例題更加詳細(xì)的說明了聚類分析和回歸分析的思想,并且利用SPSS軟件對(duì)它們的經(jīng)典案例進(jìn)行了編程求解,同時(shí)感受到了SPSS在解決數(shù)學(xué)規(guī)劃問題中的強(qiáng)大功能。</p><
56、p> 第4章 數(shù)學(xué)模型案例</p><p> 2015年3月,李克強(qiáng)總理在政府工作報(bào)告中指出,要制定“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃,推動(dòng)移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合。2015年7月4日,國(guó)務(wù)院印發(fā)了《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見》,提出著力創(chuàng)新政府服務(wù)模式,夯實(shí)網(wǎng)絡(luò)發(fā)展基礎(chǔ),營(yíng)造安全網(wǎng)路環(huán)境,提升公共服務(wù)水平,并將“互聯(lián)網(wǎng)+”高效物流和“互聯(lián)網(wǎng)+”便捷交通作為其中兩項(xiàng)重點(diǎn)行動(dòng)。&
57、lt;/p><p> 上世紀(jì)90年代末開始,我國(guó)互聯(lián)網(wǎng)蓬勃發(fā)展,形成具有國(guó)際先進(jìn)水平的用戶規(guī)模和普及率,并且培育形成了豐富的互聯(lián)網(wǎng)應(yīng)用產(chǎn)品和技術(shù)力量,為我國(guó)各行業(yè)融合互聯(lián)網(wǎng),推動(dòng)技術(shù)進(jìn)步、效率提升和組織變革,提升實(shí)體經(jīng)濟(jì)創(chuàng)新力和生產(chǎn)力,打造大眾創(chuàng)業(yè)、萬眾創(chuàng)新,四項(xiàng)經(jīng)濟(jì)提質(zhì)增效升級(jí)奠定了技術(shù)、資源條件。事實(shí)上,從2014年以來,淘寶、微信、滴滴打車等基于互聯(lián)網(wǎng)(移動(dòng)互聯(lián)網(wǎng))的新業(yè)態(tài)已經(jīng)在改變著社會(huì)經(jīng)濟(jì)的運(yùn)行?;诨ヂ?lián)
58、網(wǎng)平臺(tái)的交通運(yùn)輸服務(wù)已延展到客運(yùn)、貨運(yùn)、鐵路、停車、維修、公交、出租汽車、航空等交通行業(yè),熱門手機(jī)APP達(dá)60余個(gè),累計(jì)下載量超過50億人次。</p><p> 交通運(yùn)輸作為人類社交活動(dòng)、商品交易的支撐,不僅對(duì)城市建設(shè)和社會(huì)發(fā)展具有重要影響力,而且存在與科學(xué)技術(shù)同步發(fā)展的緊密互動(dòng)關(guān)系??v觀交通發(fā)展史,每次科學(xué)技術(shù)的進(jìn)步都帶來交通運(yùn)輸方式的改變,交通運(yùn)輸方式的進(jìn)步又支撐起社會(huì)經(jīng)濟(jì)發(fā)展、科技進(jìn)步。同時(shí),也注意在交通
59、行業(yè)的發(fā)展變革過程中,每一次新的交通運(yùn)輸方式出現(xiàn),都會(huì)伴隨傳統(tǒng)模式與新型模式之間的沖突、轉(zhuǎn)變,運(yùn)輸?shù)男枨蠛凸┙o雙方都需有一個(gè)逐漸的轉(zhuǎn)變和相互適應(yīng)過程。本文就出租車供求關(guān)系、資源配置問題利用統(tǒng)計(jì)分析相關(guān)知識(shí)進(jìn)行了初步的探討。</p><p><b> 4.1 問題重述</b></p><p> 隨著經(jīng)濟(jì)的發(fā)展,近年來,人們對(duì)出行的要求不斷提高,城市出租車以其方便、快
60、捷、舒適和私密性的特點(diǎn)成為越來越多人的出行選擇。但是,國(guó)內(nèi)各大城市交通問題日趨嚴(yán)重,“打車難”也是人們關(guān)注的一個(gè)社會(huì)熱點(diǎn)問題。數(shù)據(jù)顯示,包括上海、杭州等眾多大城市,出租車非高峰期的空駛率始終在30%上下徘徊,而高峰期卻打不到車。這與眾多市民反映的打車難背后所隱藏的強(qiáng)烈需求看似形成了一個(gè)矛盾。究其原因,最主要的莫過于司機(jī)與乘客需求信息不對(duì)稱,缺乏及時(shí)溝通交流的平臺(tái)。</p><p> 隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,
61、有多家公司依托移動(dòng)互聯(lián)網(wǎng)建立了打車軟件服務(wù)平臺(tái),實(shí)現(xiàn)了乘客與出租車司機(jī)之間的信息互通,同時(shí)推出了多種出租車的補(bǔ)貼方案,吸引了越來越多的司機(jī)和乘客使用打車軟件。然而,打車軟件同時(shí)也導(dǎo)致出租車行業(yè)亂象叢生,存在馬路揚(yáng)招成功率降低、乘客怕司機(jī)接到大單拒載、司機(jī)分心忙于搶單影響行車安全等問題。</p><p> 請(qǐng)你們搜集相關(guān)數(shù)據(jù),建立數(shù)學(xué)模型研究如下問題:</p><p> 問題:試建立合理
62、的指標(biāo),并分析不同時(shí)空出租車資源的“供求匹配”程度。</p><p><b> 4.2 問題分析</b></p><p> “打車難”是人們關(guān)注的一個(gè)社會(huì)熱點(diǎn)問題。但是,在北京也不是無論何時(shí)何地都難打到車。打車難往往出現(xiàn)在特殊時(shí)間和地點(diǎn):上班高峰的住宅區(qū),下班高峰的商務(wù)區(qū),凌晨和深夜的郊區(qū)或偏僻地點(diǎn),遇到雨雪天氣……</p><p> “
63、互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置是一個(gè)十分復(fù)雜的社會(huì)問題。要想準(zhǔn)確得出合理的資源配置方案難以實(shí)現(xiàn),同時(shí)也難以準(zhǔn)確收集大量出租車的各項(xiàng)數(shù)據(jù)如出租車的每天跑單數(shù),收費(fèi),拒載情況等,以及不同城市不同城區(qū)不同時(shí)間居民的出行行為特征數(shù)據(jù)。</p><p> 為了建立合理的指標(biāo),分析不同時(shí)空出租車資源的供求匹配程度,首先從城市居民出行對(duì)出租車的需求量入手,分析與需求量有關(guān)的主要指標(biāo),如城市居民出行量。為分析城市居民出行量與城
64、市經(jīng)濟(jì)指標(biāo)的相關(guān)性,先將這些指標(biāo)進(jìn)行聚類分析,繼而得出每類最具代表性的經(jīng)濟(jì)指標(biāo),再將最具代表性的經(jīng)濟(jì)指標(biāo)與居民出行總量進(jìn)行回歸分析,得到多元線性回歸模型,從而預(yù)測(cè)居民的出行總量。通過查閱文獻(xiàn)可以確定居民出行選擇出租車作為出行方式的比例從而,計(jì)算得出城市的出租車運(yùn)輸量的需求量。然后根據(jù)供需平衡法預(yù)測(cè)出城市出租車需求量。將城市實(shí)際出租車數(shù)量與城市出租車需求數(shù)量作比,得到衡量出租車資源的供求匹配程度的指標(biāo)即供求匹配率。對(duì)未來城市的出租需求量進(jìn)
65、行灰色關(guān)聯(lián)預(yù)測(cè),得到未來城市的出租需求量,通過計(jì)算不同城市的出租車需求量,進(jìn)行不同時(shí)空的出租車資源供求匹配的分析。</p><p> 對(duì)于各公司的出租車補(bǔ)貼方案是否對(duì)“緩解打車難”有幫助問題,由于難以得到各公司不同時(shí)間的補(bǔ)貼方案對(duì)居民打車難度的實(shí)際影響效果數(shù)據(jù),我們從公司對(duì)每單的補(bǔ)貼金額入手,分析每單補(bǔ)貼金額范圍為0~15元,認(rèn)為補(bǔ)貼金額再高對(duì)公司利益有較大損失。司機(jī)的每日跑單數(shù)為平均每臺(tái)出租車每天接單數(shù),有效
66、載客率等效為里程利用率。以每單補(bǔ)貼金額為自變量,司機(jī)的每日跑單數(shù)和有效載客率為因變量,建立阻滯增長(zhǎng)模型,基于前面的供求匹配率關(guān)系式算出不同每單補(bǔ)貼金額對(duì)應(yīng)的供求匹配率這一指標(biāo)。</p><p> 為一個(gè)新的打車軟件服務(wù)平臺(tái)設(shè)計(jì)合理的補(bǔ)貼方案,我們基于已建立的模型計(jì)算出租車單車日均載客次數(shù)、有效載客率與打車軟件平臺(tái)對(duì)每單補(bǔ)貼金額的關(guān)系式。綜合考慮每單補(bǔ)貼金額對(duì)出租車司機(jī)、乘客、打車軟件平臺(tái)三方各自的滿意度,利用熵
67、值法求出三方滿意度的權(quán)重,繼而將三方的標(biāo)準(zhǔn)化數(shù)據(jù)乘以權(quán)重得出綜合滿意度,比較得出最優(yōu)的補(bǔ)貼方案。</p><p><b> 4.3 模型假設(shè)</b></p><p> 1.假設(shè)城市中的黑車現(xiàn)象對(duì)居民出行沒有造成影響;</p><p> 2.假設(shè)所研究的城市沒有發(fā)生嚴(yán)重的自然災(zāi)害和社會(huì)動(dòng)蕩;</p><p> 3.
68、假設(shè)所研究的城市政府對(duì)出租車行業(yè)的政策基本不變;</p><p> 4.假設(shè)司機(jī)和乘客都是為自身利益考慮,即經(jīng)濟(jì)人假設(shè);</p><p> 5.假設(shè)參考文獻(xiàn)中的數(shù)據(jù)來源可靠,真實(shí)可信。</p><p><b> 4.4 符號(hào)說明</b></p><p> 4.5 模型建立與求解</p><p&
69、gt; 4.5.1建模前的準(zhǔn)備</p><p> 由參考文獻(xiàn)[2]可得到現(xiàn)有指標(biāo)體系見表1。</p><p> 表1 衡量出租車供求的三大指標(biāo)</p><p> 4.5.2問題一:建立評(píng)價(jià)出租車資源供求匹配程度的指標(biāo)</p><p> 為評(píng)價(jià)出租車資源的“供求匹配”程度,引入出租車資源的供求匹配率這一指標(biāo),指標(biāo)的定義為城市中實(shí)際運(yùn)
70、行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之比,即</p><p><b> (1)</b></p><p> 其中,引入P表示出租車資源的供求匹配率,M表示市民出行需要的出租車輛數(shù),N表示城市中實(shí)際運(yùn)行的出租車輛數(shù)。市民出行需要的出租車輛M的意義是指這些出租車輛能夠恰好滿足市民打車出行的需求,即城市出租車資源供求平衡時(shí)的車輛數(shù)。</p><p&
71、gt; 供求匹配率P反映了城市中實(shí)際運(yùn)行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之間的差異。供求匹配率P=1為出租車資源供求平衡狀態(tài),供求匹配率P越接近1,則說明城市出租車資源供求匹配程度越高,出租車數(shù)量配置越合理;當(dāng)供求匹配率P大于1時(shí),表明城市中現(xiàn)有的出租車數(shù)量超過市民出行需要的數(shù)量,會(huì)增加出租車的空駛率,造成出租車司機(jī)的收益降低;當(dāng)供求匹配率P小于1時(shí),表明城市中現(xiàn)有的出租車數(shù)量少于市民出行需要的數(shù)量,需要增加出租車的數(shù)量來緩解打
72、車難的情況。</p><p> 4.5.2.1建立市民出行需要的出租車輛數(shù)M的預(yù)測(cè)模型</p><p> 市民出行需要的出租車輛數(shù)M與市民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、市民出行選擇乘坐出租車的比例有關(guān),也與每輛出租車日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān),具體關(guān)系式為:</p><p><b> 符號(hào)表達(dá)式為:</b></p&
73、gt;<p><b> (2)</b></p><p> 其中,M表示市民出行需要的出租車輛數(shù)(輛),Y表示市民人均日出行次數(shù)(單位:次/人日),W為城市總?cè)丝跀?shù)量(人),η表示市民選擇打車出行的比例,s表示出租車單車日均載客次數(shù)(單位:次/車日),λ表示出租車單車日均每次載客人數(shù)(人/車次),μ為出租車滿載率。</p><p> 根據(jù)參考文獻(xiàn)[3
74、],選取出租車單車日均載客次數(shù)s=35(次/車日),出租車單車日均每次載客人數(shù)λ=2.0(人/車次),出租車滿載率μ=65%,居民選擇打車出行的比例為6%。</p><p> 接下來建立市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)關(guān)聯(lián)的量化模型</p><p> 市民人均日出行次數(shù)是居民出行強(qiáng)度的最直接反映,其與城市人口總數(shù)量的乘積即為市民的出行總量,而市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)有著極大聯(lián)系
75、。通常情況下,市民人均日出行次數(shù)的多少與出行目的、城市布局、交通設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān)。對(duì)于某一城市來說,影響居民人均出行次數(shù)的因素又間接地反映在該城市的相關(guān)經(jīng)濟(jì)指標(biāo)上。因此,多種因素與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)可以轉(zhuǎn)化為多種經(jīng)濟(jì)指標(biāo)與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)。</p><p> STEP1:各經(jīng)濟(jì)指標(biāo)的聚類分析;</p><p> STEP2:典型指標(biāo)的選取;</p
76、><p> STEP3:回歸模型的建立</p><p> STEP4:模型的檢驗(yàn)。</p><p> 聚類分析是根據(jù)事物本身的特性來定量研究分類問題的一種多元統(tǒng)計(jì)分析。其基本思想是按照距離的遠(yuǎn)近將數(shù)據(jù)分為若干個(gè)類別,以使類別內(nèi)數(shù)據(jù)的“差異”盡可能小,類別間“差異”盡可能大。所用的變量可以被大致分成兩類:對(duì)樣本個(gè)體進(jìn)行聚類通常稱為Q型聚類,對(duì)研究變量進(jìn)行聚類稱為R型
77、聚類。</p><p> 選用歐幾里得距離(歐式距離)來度量指標(biāo)之間接近的程度。歐式距離就是空間中兩點(diǎn)之間的直線距離,其中各特征參數(shù)是等權(quán)的,記dij表示指標(biāo)vi和vj之間的距離,則有計(jì)算公式如下:</p><p> 聚類分析具體過程如下:</p><p> 首先將各聚類單位各自作為一類(這時(shí)有p類),按照所選取的距離計(jì)算各數(shù)據(jù)點(diǎn)之間的距離,形成一個(gè)距離陣。&
78、lt;/p><p> 將距離最近的兩個(gè)單位并為一個(gè)類別,形成n-1個(gè)類別,計(jì)算新產(chǎn)生的類別與其他各類別之間的距離,形成新的距離陣。</p><p> 按照和第二步相同的原則,再將距離最接近的兩個(gè)類別合并,這時(shí)如果類別個(gè)數(shù)仍然大于1,則繼續(xù)重復(fù)這一步驟,直到所有的數(shù)據(jù)都被合并為成為一個(gè)類別為止。</p><p> STEP1:選取北京、上海、天津、廣州、深圳、成都、
79、南京、杭州、武漢、長(zhǎng)春、珠海、大連、福州、蘇州、常州十五個(gè)大中城市為研究對(duì)象,分析各城市人均日出行次數(shù)和十二個(gè)經(jīng)濟(jì)指標(biāo)之間的關(guān)聯(lián)。十五個(gè)大中城市2001年人均日出行次數(shù)和各經(jīng)濟(jì)指標(biāo)見表2。</p><p> 表2 大中城市居民人均出行次數(shù)和經(jīng)濟(jì)指標(biāo)</p><p> 注:數(shù)據(jù)來源:參考文獻(xiàn)[1]。</p><p> 以12個(gè)經(jīng)濟(jì)指標(biāo)為聚類單位,指標(biāo)與指標(biāo)間的
80、距離選用歐式距離,采用組間平均聯(lián)接法,進(jìn)行聚類分析。利用SPSS19.0軟件進(jìn)行聚類分析,得到各經(jīng)濟(jì)指標(biāo)間的相關(guān)系數(shù)矩陣如表3,聚類過程中的運(yùn)算結(jié)果參數(shù)見表4所示,聚類分析的譜系圖如圖1。</p><p> 表3 相關(guān)系數(shù)矩陣R</p><p> 表4 聚類分析參數(shù)</p><p> 圖1 聚類分析的譜系圖</p><p> 根
81、據(jù)聚類分析的譜系圖可以看出,這十二個(gè)經(jīng)濟(jì)指標(biāo)可分為三大類:第一大類包括人均GDP(v4);第二大類包括在崗職工平均工資(v10)和市區(qū)居民人均可支配收入(v11);第三大類包括市區(qū)面積(v1)、市區(qū)總?cè)丝跀?shù)(v2)、第三產(chǎn)業(yè)值(v3)、工業(yè)產(chǎn)品銷售收入(v5)、社會(huì)消費(fèi)品零售總額(v6)、房地產(chǎn)開發(fā)投資(v7)、城鄉(xiāng)居民儲(chǔ)蓄存款(v8)、居民消費(fèi)價(jià)格總指數(shù)(v9)、農(nóng)民人均純收入(v12)。聚類分析的結(jié)果見表5</p>&
82、lt;p> 表5 聚類分析結(jié)果</p><p> STEP2:將十二個(gè)指標(biāo)進(jìn)行聚類分析得到三類指標(biāo)后,出來第一類指標(biāo)外,其他兩類都包含多個(gè)指標(biāo),為了選取各類指標(biāo)中的典型指標(biāo),分別計(jì)算類中每一變量與其余變量的Pearson相關(guān)系數(shù),繼而求得類中每一變量與其余變量的Pearson相關(guān)系數(shù)的平方和的平均值,最后把該值最大的變量作為典型指標(biāo)。</p><p> Pearson相關(guān)系數(shù)
83、的定義為</p><p><b> ?。?)</b></p><p> 相關(guān)系數(shù)R的數(shù)值范圍是介于-1與+1之間:</p><p> 如果|R|≈0,表明兩個(gè)變量沒有線性相關(guān)關(guān)系。</p><p> 如果|R|=1,則表示兩個(gè)變量完全直線相關(guān)。線性相關(guān)的方向通過相關(guān)系數(shù)的符號(hào)來表示,“+”號(hào)表示正相關(guān),“-”表示
84、負(fù)相關(guān)。</p><p><b> ?。?)</b></p><p> 式中, 表示變量 與其余變量 的Pearson相關(guān)系數(shù)R的平方和的平均值,m為變量的個(gè)數(shù)。</p><p> 將表3中的值代入公式(3)、(4),計(jì)算得到第二類和第三類指標(biāo)中的各變量的,具體見表6所示。</p><p> 表6 同一類中每一變
85、量與其余變量的相關(guān)系數(shù)平方和的均值</p><p> 從表6中可以看出,第二類指標(biāo)中v10對(duì)應(yīng)的值最大,第三類指標(biāo)v3中對(duì)應(yīng)的值最大。所以,選擇v10、v3為典型數(shù)據(jù)。而第一類指標(biāo)只有一個(gè)指標(biāo),故可選取v4、v10、 v3分別作為第一、二、三類指標(biāo)的典型指標(biāo)。</p><p> STEP3:根據(jù)聚類分析得到的典型變量,利用表2中的數(shù)據(jù),建立2001年人均日出行次數(shù)Y與第三產(chǎn)業(yè)值(v3)
86、、人均GDP(v4)、在崗+職工平均工資(v10)的多元線性回歸方程。</p><p><b> 多元線性回歸原理:</b></p><p><b> 多元線性回歸模型為</b></p><p><b> ?。?)</b></p><p> 每個(gè)因變量的實(shí)測(cè)值由兩部分組成
87、:估計(jì)值,用表示,即給定各自變量取值時(shí)因變量y的估計(jì)值,它代表的是能與自變量決定的部分;ei為殘差,是因變量實(shí)測(cè)值與估計(jì)值之差,表示不由自變量決定的部分。</p><p> 應(yīng)用多個(gè)個(gè)回歸模型對(duì)每一條記錄求其因變量預(yù)測(cè)值與實(shí)測(cè)值之差的平方和,并將其累加,那么每個(gè)回歸模型都會(huì)得到一個(gè)累加值,而該數(shù)值的最小的那個(gè)回歸模型就是需要的模型,這就是最小二乘法。</p><p><b>
88、 (6)</b></p><p> 利用SPSS19.0軟件計(jì)算得</p><p><b> ?。?)</b></p><p> R2=0.678表明因變量Y(人均出行次數(shù))的67.8%可由回歸方程確定,回歸方程視為可用的。</p><p> STEP4:模型檢驗(yàn):</p><p&g
89、t; 將表2中的第三產(chǎn)業(yè)值、人均GDP、在崗+職工平均工資代入得到的多元線性回歸方程(7)中,得到人均日出行次數(shù)的模型模擬值,作出模型值與調(diào)查值的折線圖如圖2所示。</p><p> 圖2 大中城市居民平均出行次數(shù)調(diào)查值與模型值比較</p><p> 由圖2可以看出所得到的2001年人均日出行次數(shù)的回歸方程具有較好的回歸效果。由于市民每天出行次數(shù)的多少與出行目的、城市布局、生活方
90、式、工作方式、家庭經(jīng)濟(jì)狀況、交通設(shè)施、通訊設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān),隨著社會(huì)經(jīng)濟(jì)的迅猛發(fā)展,人民生活水平也日漸提高,私家車數(shù)量大幅增加,城市的交通更加發(fā)達(dá),人們之間的聯(lián)系加強(qiáng),越來越多的人選擇逛街、旅游等休閑方式,綜合考慮社會(huì)經(jīng)濟(jì)的發(fā)展帶來的影響,修正2001年人均日出行次數(shù)的回歸方程,得到2013年人均日出行次數(shù)的回歸方程:</p><p><b> ?。?)</b></p>
91、;<p> 根據(jù)從參考文獻(xiàn)[5]各城市2013年年鑒上收集到的數(shù)據(jù)(見表7),利用2013年人均日出行次數(shù)的回歸方程[8],計(jì)算得到相應(yīng)城市的人均日出行次數(shù),結(jié)果如表7所示。</p><p> 表7 國(guó)內(nèi)主要城市相關(guān)的經(jīng)濟(jì)指標(biāo)</p><p> 利用表7中的數(shù)據(jù)計(jì)算八座城市的出租車資源的供求匹配率,結(jié)果如表8所示。</p><p> 表8
92、國(guó)內(nèi)主要城市出行相關(guān)信息</p><p> 從表8可以看出,在所研究的八個(gè)國(guó)內(nèi)主要城市中,只有大連這一座城市的供求匹配率略大于1,而其余主要城市的供求匹配率均小于1,并且深圳和杭州兩地的供求匹配率與1相距最遠(yuǎn)。因此,城市出租車資源供求達(dá)到近似平衡的城市為大連,而城市出租車資源供小于求的城市為北京、廣州、武漢、南京、成都,嚴(yán)重供小于求的城市為杭州和深圳。</p><p> 4.5.2.2
93、不同時(shí)間的出租車資源的供求匹配</p><p> 由參考文獻(xiàn)[4]得到的在不同時(shí)刻蚌埠市居民出行的平均比例,將此比例作為成都市居民不同時(shí)刻的出行比例(見表9),計(jì)算得到各時(shí)段的出租車供求匹配率,結(jié)果見表9。</p><p> 表9 成都市不同時(shí)刻出租車資源供求情況</p><p> 由表9可以看出,在上班早高峰、下班晚高峰和中午時(shí)段成都市出租車資源的供求匹配
94、率均小于1,并且與1相距較遠(yuǎn)。所以這在四個(gè)時(shí)間段內(nèi),成都市出租車資源都是嚴(yán)重供小于求。</p><p> 4.5.2.3利用灰色模型預(yù)測(cè)2018年成都市區(qū)人口數(shù)量和出租車需求量</p><p> 利用灰色模型預(yù)測(cè)2018年成都市區(qū)人口數(shù)量和出租車需求量,接下來介紹灰色預(yù)測(cè)方法原理。</p><p> 1.設(shè)已知參考數(shù)據(jù)列為x(0)=(x(0)(1),x(0)
95、(2),…,x(0)(n)),做1次累加(AGO),生成數(shù)列</p><p><b> 其中 。求均值數(shù)列</b></p><p> 則z(1)=(z(1)(2),z(1)(3),…,z(1)(n))。于是建立灰微分方程為</p><p> 相應(yīng)的白化微分方程為</p><p><b> 記</b
96、></p><p> 由最小二乘法,求得使</p><p><b> 達(dá)到最小值的</b></p><p><b> 于是求解方程得</b></p><p> 2.灰色預(yù)測(cè)的步驟 </p><p> ?。?)數(shù)據(jù)的檢驗(yàn)與處理</p><p&g
97、t; 首先,為了保證建模方法的可行性,需要對(duì)已知數(shù)據(jù)列做必要的檢驗(yàn)處理。設(shè)參數(shù)據(jù)為x(0)=(x(0)(1),x(0)(2),…,x(0)(n)) ,計(jì)算數(shù)列的級(jí)比</p><p><b> , </b></p><p> 如果所有的級(jí)比λ(k)都落在可容覆蓋 內(nèi),則數(shù)列x(0)可以作為模型</p><p> GM(1,1)的數(shù)據(jù)進(jìn)行灰
98、色預(yù)測(cè)。否則,需要對(duì)數(shù)列x(0)做必要的變換處理,使其落入可容覆蓋內(nèi)。即取適當(dāng)?shù)某?shù)c ,作平移變換</p><p><b> ,</b></p><p><b> 則使數(shù)列 的級(jí)比為</b></p><p><b> ,</b></p><p><b> ?。?/p>
99、2)建立模型</b></p><p> 按1節(jié)中的方法建立模型GM(1,1),則可以得到預(yù)測(cè)值</p><p><b> ,。</b></p><p> ?。?)建立模型預(yù)測(cè)值</p><p> 殘差檢驗(yàn):令殘差為ε(k),計(jì)算</p><p><b> ,</
100、b></p><p> 如果ε(k)<0.2,則可認(rèn)為達(dá)到一般要求;如果ε(k)<0.1,則認(rèn)為達(dá)到較高的要求。</p><p> 級(jí)比偏差值檢驗(yàn):首先由參考數(shù)據(jù)x(0)(k-1),x(0)(k),計(jì)算出級(jí)比λ(k),再用發(fā)展系數(shù)a求出相應(yīng)的級(jí)比偏差</p><p> 如果ρ(k)<0.2,則可認(rèn)為達(dá)到一般要求;如果ρ(k)<0.1,則認(rèn)為達(dá)
101、到較高的要求。</p><p> 利用灰色預(yù)測(cè)模型和成都市2002年至2013年的人口數(shù)量,對(duì)成都市2014年至2021年的人口數(shù)量進(jìn)行預(yù)測(cè),結(jié)果見表10和表11。</p><p> 表10 成都市人口灰色預(yù)測(cè)</p><p> 表11 成都市區(qū)人口預(yù)測(cè)</p><p> 預(yù)測(cè)2018年成都市區(qū)人口632.27萬,選取人均日出行
102、次數(shù)為2.8次,將以上數(shù)據(jù)代入公式[1],得到在出租車供求平衡即供求匹配率P=1的情況下,成都市2018年需要出租車23345輛。</p><p><b> 4.6 模型評(píng)價(jià)</b></p><p><b> 模型優(yōu)點(diǎn):</b></p><p> 模型充分考慮了影響城市居民對(duì)出租車需求量的重要因素,定量分析這些因素對(duì)
103、城市出租車需求量的影響,結(jié)果具有較高的可靠性。</p><p><b> 模型缺點(diǎn)</b></p><p> ?。?)以整個(gè)城市為研究對(duì)象,對(duì)城市內(nèi)的局部區(qū)域缺乏更細(xì)致的研究,無法刻畫不同區(qū)域的差異,如市中心與市郊的情況會(huì)有所不同。打車難的問題在局部可能依然存在。</p><p> ?。?)模型未考慮司機(jī)的挑客行為,即有些司機(jī)為了獲得更多利潤(rùn)
104、,會(huì)拒載一些短途生意,而專門接一些長(zhǎng)途活.</p><p><b> 4.7 本章小結(jié)</b></p><p> 本章研究的是“互聯(lián)網(wǎng)+”時(shí)代的出租車資源配置模型,應(yīng)用本文前兩章所介紹的聚類分析和回歸分析的方法理論,并結(jié)合MATLAB和SPSS兩種優(yōu)化軟件,對(duì)模型進(jìn)行了求解。本章首先通過對(duì)實(shí)際問題的分析,列出了關(guān)于聚類分析和回歸分析的基本模型。其后,通過結(jié)合實(shí)際背
105、景,為分析不同時(shí)空出租車資源的供求匹配程度,引入出租車資源供求匹配率這一指標(biāo),指標(biāo)的定義為城市中實(shí)際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之比,反映城市中實(shí)際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之間的差異。計(jì)算得出成都2013年出租車供求匹配率為0.7766,表示供不應(yīng)求。</p><p> 居民出行需要的出租車輛數(shù)與居民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、居民出行選擇乘坐出租車的比例有關(guān),也與每輛出租車
106、日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān)。對(duì)于居民人均日出行次數(shù),利用十五個(gè)國(guó)內(nèi)大中城市的數(shù)據(jù),將十二個(gè)城市經(jīng)濟(jì)指標(biāo)聚類分析選出每類指標(biāo)中典型的經(jīng)濟(jì)指標(biāo),建立居民人均日出行次數(shù)與這些典型經(jīng)濟(jì)指標(biāo)間的多元線性回歸方程,而與居民出行需要的出租車輛數(shù)相關(guān)的其他指標(biāo)可查閱文獻(xiàn)或年鑒獲得。分析成都市每天6:00-8:30,11:00-12:30,13:30-14:30,17:00-18:30四個(gè)時(shí)間段得供求匹配率分別為0.4111,0.5678
107、,0.6062,0.5631,結(jié)果顯示供不應(yīng)求。得到大連、北京、廣州、武漢、南京、成都、杭州、深圳八座城市的出租車資源供求匹配率分別為1.0936、0.8827、0.9430、0.7040、0.7049、0.7666、0.6583、0.5252,表明只有大連的出租車資源是供大于求,而其余七座城市為供小于求。</p><p><b> 結(jié) 論</b></p><p>
108、; 隨著人類的社會(huì)實(shí)踐,統(tǒng)計(jì)分析的知識(shí)和思想在越來越多的領(lǐng)域顯示了它的應(yīng)用性和實(shí)用性。它從整體上反映和分析事物數(shù)量特征,觀察事物的本質(zhì)和發(fā)展規(guī)律,作出正確的判斷。我們社會(huì)中的每個(gè)人,都是特定事件的決策者,都要受到統(tǒng)計(jì)分析理論的影響,大到國(guó)家,小到個(gè)人。因此我們需要通過分析達(dá)到我們的預(yù)期目標(biāo),并借助一些具有強(qiáng)大功能的軟件,比如SPSS和MATLAB等,幫助我們做出決策。</p><p> 本文共分四部分。第一部
109、分簡(jiǎn)要介紹了統(tǒng)計(jì)分析的概念和應(yīng)用,以及SPSS和MATLAB軟件的功能和特點(diǎn)。本文在求解的過程中主要借助了這兩個(gè)軟件。第二部分簡(jiǎn)要介紹了統(tǒng)計(jì)分析中最基礎(chǔ)的兩個(gè)個(gè)組成成分:聚類分析、回歸分析,對(duì)它們的概念和求解方法做了簡(jiǎn)要介紹。第三部分分別就這兩個(gè)方法給出了經(jīng)典案例,通過SPSS軟件編程分別求解了對(duì)五個(gè)樣品進(jìn)行分類的問題,得到了最優(yōu)分類策略,以及求解了地區(qū)生產(chǎn)總值與13個(gè)重要支出項(xiàng)的組成關(guān)系問題,得出了在生產(chǎn)總值與支出項(xiàng)的最簡(jiǎn)回歸模型。第
110、四部分是將所研究的聚類分析和回歸分析方法應(yīng)用到2015年數(shù)學(xué)建模競(jìng)賽試題“互聯(lián)網(wǎng)+時(shí)代的出租車資源配置模型”當(dāng)中,根據(jù)聚類分析和回歸分析的求解和簡(jiǎn)化方法,得到了簡(jiǎn)單的回歸分析模型,最后利用MATLAB和SPSS軟件,得到了不同時(shí)空出租車資源的供求匹配程度最優(yōu)決策方案。</p><p> 通過求解實(shí)際統(tǒng)計(jì)分析問題,可以了解到,統(tǒng)計(jì)分析理論結(jié)合相應(yīng)的優(yōu)化軟件,可以為決策者做出最優(yōu)決策提供相應(yīng)的簡(jiǎn)捷快速、準(zhǔn)確的最優(yōu)化
111、方案。因此,我們要利用統(tǒng)計(jì)分析的強(qiáng)大的決策作用以及現(xiàn)代計(jì)算機(jī)軟件的強(qiáng)大功能,使其為我們各個(gè)領(lǐng)域的發(fā)展和進(jìn)步發(fā)揮更大的促進(jìn)作用。</p><p><b> 參考文獻(xiàn)</b></p><p> [1]鄒志云,蔣忠海,梅亞楠,宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報(bào),5(2):8-13,2007,6</p><p> [2]
112、衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》,2007,(5)</p><p> [3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文,2009,12</p><p> [4]大連,北京,廣州,杭州,深圳,武漢、南京2013年年鑒</p><p> [5]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用.北京:高等教育出版社,20
113、05.6</p><p> [6]成都2002-2013年年鑒</p><p><b> 附 錄</b></p><p> ?。?)文件名:first.m(2001年15個(gè)城市人均每日出行次數(shù)模型值)</p><p><b> clear;</b></p><p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題課程設(shè)計(jì)
- 數(shù)學(xué)建模課程設(shè)計(jì)-應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題
- 數(shù)學(xué)建模課程設(shè)計(jì)-應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題
- 數(shù)學(xué)建模-課程設(shè)計(jì)--應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題
- 數(shù)學(xué)建模課程設(shè)計(jì)-- 應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題
- 應(yīng)用統(tǒng)計(jì)分析模型解決實(shí)際問題-數(shù)學(xué)建模課程設(shè)計(jì)
- 應(yīng)用多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 應(yīng)用多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 多元統(tǒng)計(jì)分析-課程設(shè)計(jì)
- 多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 調(diào)度指揮與統(tǒng)計(jì)分析課程設(shè)計(jì)
- 應(yīng)用多元統(tǒng)計(jì)分析課程設(shè)計(jì)--各地區(qū)農(nóng)村住房問題分析
- 課程設(shè)計(jì)-spss統(tǒng)計(jì)分析課程網(wǎng)站設(shè)計(jì)與實(shí)現(xiàn)
- 運(yùn)籌學(xué)課程設(shè)計(jì)——線性規(guī)劃解決實(shí)際問題
- 應(yīng)用統(tǒng)計(jì)分析
- 統(tǒng)計(jì)分析軟件sas應(yīng)用課程學(xué)習(xí)
- 解決實(shí)際問題練習(xí)
- 統(tǒng)計(jì)分析相關(guān)問題
- 多元統(tǒng)計(jì)分析課程論文
評(píng)論
0/150
提交評(píng)論