數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)v0.2_第1頁
已閱讀1頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ),數(shù)據(jù)分析的重要性,,,制定具有針對性的營銷策略,幫助產(chǎn)品定位、生命周期管理與銷售分析,深層次研究競爭分析,理解市場動向與趨勢,為管理、經(jīng)濟以及投資決策提供依據(jù),我司目前數(shù)據(jù)分析的現(xiàn)狀,如何提升我司數(shù)據(jù)分析能力,,,統(tǒng)計學(xué)基礎(chǔ)參數(shù)估計假設(shè)檢驗方差分析回歸 - 線性回歸 - 方差回歸 - 邏輯回歸 - 定序回歸 - 生存回歸,,,,提升數(shù)據(jù)分析兩大方法,數(shù)據(jù)分析軟件E

2、xcel——初級SPSS——中級SAS——高級,默認(rèn)所有人都學(xué)過《概率論與數(shù)理統(tǒng)計》,統(tǒng)計學(xué)的基本概念——話術(shù),統(tǒng)計學(xué)的基本概念——度量,,集中趨勢的度量,,,離散程度的度量,,,偏態(tài)與峰態(tài)的度量,統(tǒng)計學(xué)基礎(chǔ),1,2,3,參數(shù)估計與假設(shè)檢驗,方差分析,回歸分析,統(tǒng)計學(xué)基礎(chǔ),1,2,3,參數(shù)估計與假設(shè)檢驗,方差分析,回歸分析,參數(shù)估計的基本原理與置信區(qū)間,參數(shù)估計:用樣本統(tǒng)計量去估計總體的參數(shù)參數(shù)估計的方法:點估計和區(qū)間估計,置信區(qū)

3、間的理解置信度95%指有95%的區(qū)間包含總體參數(shù)的真值,5%則不包含;通過樣本求得的區(qū)間是固定的、已知的,而總體是未知的、隨機的;在實際問題中,我們希望構(gòu)造的區(qū)間是包含總體真值其中的一個區(qū)間。,一個總體參數(shù)的區(qū)間估計,*Z α/2 =1.96(置信度95%),兩個總體參數(shù)的區(qū)間估計,*Z α/2 =1.96(置信度95%),通過Excel獲得參數(shù)估計所需的參數(shù),描述統(tǒng)計【數(shù)據(jù)】->【數(shù)據(jù)分析】->【描述統(tǒng)計】【輸入

4、區(qū)域】:源數(shù)據(jù)選擇“匯總統(tǒng)計”選擇“平均置信度”為95%,假設(shè)檢驗的基本原理及思路,假設(shè)檢驗的原理及判別依據(jù)先提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否成立。通過統(tǒng)計量及P值判斷。假設(shè)表達式原假設(shè):H0備擇假設(shè):H1舉例:H0= μ,H1≠ μ,檢驗兩個假設(shè)哪個成立假設(shè)檢驗的原則把希望證明的命題放在備擇假設(shè)上把原有的,傳統(tǒng)的觀點或結(jié)論放在原假設(shè)上基本思路根據(jù)樣本計算統(tǒng)計量,通過統(tǒng)計量或P來判斷到底接受哪個

5、假設(shè)其中P為累計概率密度,假設(shè)檢驗舉例,某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,今另換一種新機床進行加工,取200個零件進行檢驗,得到橢圓度均值為0.076mm,樣本標(biāo)準(zhǔn)差為0.025mm,問新機床加工零件的橢圓度總體均值與以前有無差別?H0: μ=0.081mm,沒有顯著差別H1: μ ≠0.081mm,有顯著差別選擇公式: ,且置信度

6、為95%得到Z=-2.83通過得到0.997672537,然后P=2x(1- 0.997672537 )= 0.004655 ,遠遠小于(1-95%)=0.05,因此拒絕H0,選擇H1,Z= 𝒙?μ𝟎 𝒔/ 𝒏,Excel:【插入】->【函數(shù)】->NORM.S.DIST,統(tǒng)計學(xué)基礎(chǔ),1,2,3,參數(shù)估計與假設(shè)檢驗,方差分析,回歸分析,方差分析基本原理及概

7、念,,通過誤差來判斷分類型自變量對數(shù)值型因變量的影響,,原理:,,SST(總誤差)=SSE(組內(nèi)誤差)+SSA(組間誤差),,誤差:,,通過假設(shè)檢驗,利用誤差分布或概率來檢驗各總體的均值是否相等。如果各總體的均值相等無影響,不相等則有影響,,思路:,方差分析表的一般形式及含義,SSA:反映自變量對因變量的影響。SSE:反映除自變量對因變量的影響之外,其他因素對因變量的影響。SST:反映自變量和殘差變量的共同影響。MSE和MSA:

8、組內(nèi)和組間均方差,為了計算F值。F值:統(tǒng)計決策。F值>F臨界值,拒絕原假設(shè),表明所檢驗因素對觀測值有顯著影響;F值<F臨界值,不拒絕原假設(shè),表明所檢驗因素對觀測值沒有顯著影響。,方差分析的強度測量與多重比較,,測量自變量與因變量之間的關(guān)系強度,R2表示 基本公式:R2= 聯(lián)合效應(yīng) 總效應(yīng),,強度測量,,測量均值之間存在的差異 最小顯著差異法,簡稱LSD LSD=tα/2* 𝑴𝑺

9、𝑬( 𝟏 𝒏𝒊 + 𝟏 𝒏𝒋 ),,多重比較,用Excel實現(xiàn)單雙因素方差分析,雙因素方差分析舉例,4個品牌的彩電在5個地區(qū)的銷售數(shù)量數(shù)據(jù),雙因素方差分析【數(shù)據(jù)】->【數(shù)據(jù)分析】->【方差分析:無重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”,統(tǒng)計學(xué)基礎(chǔ),1,2,3,參數(shù)估計與假設(shè)檢驗,方差分析

10、,回歸分析,我司可能用到的回歸及應(yīng)用場合,,,線性回歸的基本概念,回歸的由來,線性回歸模型,起源:回歸源于高爾頓的豌豆實驗現(xiàn)象:一個總體中在某一時期具有某一極端特性的個體在未來的某一時期將減弱它的極端性,y=β0+ β1x1+ β2x2+ β3x3+……+ βixi+ε,β0、β1、β2、……βi:回歸系數(shù)。若β0 ≠0,β1=β2=…=β𝑖=0,則稱y沒有任何線性關(guān)系。ε:隨機誤差,符合正態(tài)分布。在計算回歸系數(shù)時

11、,假設(shè)E(ε)=0用Excel計算回歸系數(shù)的方法:【數(shù)據(jù)】->【數(shù)據(jù)統(tǒng)計】->【回歸】,Excel輸出回歸分析結(jié)果,,,常規(guī)統(tǒng)計量,回歸方程的擬合優(yōu)度,對回歸方程的線性關(guān)系進行顯著性檢驗,回歸參數(shù)估計相關(guān)內(nèi)容,,回歸方程的擬合優(yōu)度,擬合優(yōu)度:回歸直線與各觀測點的接近程度,需計算判定系數(shù)R2或調(diào)整的R2。,R2=1- 𝑆𝑆𝐸 𝑆𝑆𝑇

12、; Adjusted R2=1-(1-R2)( 𝑛?1 𝑛?𝑘?1 ),,回歸方程的顯著性檢驗,顯著性檢驗:檢驗線性回歸方程是否能真實反映變量x和y之間的關(guān)系。顯著性檢驗分為兩部分:線性關(guān)系和回歸系數(shù)。,,線性關(guān)系顯著性檢驗 - F>F(4,20)分布,線性顯著 - Significance F>0.05,線性顯著,,回歸系數(shù)顯著性檢驗因涉及多元線性回歸,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論