2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計量地理學,胡碧松hubisong624@126.com,地理數據統(tǒng)計指標,地理數據的統(tǒng)計分組,統(tǒng)計整理的基本步驟: ①統(tǒng)計分組,就是根據研究目的,按照一定的分組標志將地理數據分成若干組。 ②計算各組數據的頻數、頻率,編制統(tǒng)計分組表。 ③繪制統(tǒng)計分布圖。,Why???,What???,What???,例: 對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調查數據進行統(tǒng)計整理,步驟如下:

2、 (1)以地塊面積作為統(tǒng)計分組標志進行分組; (2)計算各組數據的頻數、頻率,編制成如下的統(tǒng)計分組表; (3)做出頻數分布的直方圖; (4)將上圖各組的頻數分布從組中值位置用折線連接起來,得到頻數分布的散點曲線圖。,某縣人工造林地面積的統(tǒng)計分組數據,,,,,,頻數分布柱狀圖,頻數分布曲線圖,地理數據統(tǒng)計圖,,,,讀某邊的數值:向該邊作與其零起點相交邊的平行線,該平行線與該邊的交點即為該邊所對應的數

3、值。,,,,,,B,%,%,%,,AB兩國三大產業(yè)產值比重構成示意圖,平面正三角坐標圖,三維坐標圖,,,,,,,,,,,,,,,,1,4,7,10,(月),,,,,,,,,,,,,,0,10,20,-10,50,100,降水量(mm),氣溫(℃),,,雷達圖,風玫瑰圖,人口金字塔圖,,,,(1)描述地理數據一般水平的指標,(2)描述地理數據分布的離散程度的指標,(3)描述地理數據分布特征的參數,1,2,3,幾種常用的統(tǒng)計指標與參數,平均

4、值,一般水平指標,中位數,眾數,,,,描述地理數據一般平均水平,,=54.25,,,,xi: 第i組的組中值,fi: 第i組的頻數,m: 分組總數量,中國西部地區(qū)某城市2000年家庭月收入的抽樣調查結果,,,,= 300×2500+1300×3500+…+30×8500 2130 =3899.06(元),對于未分組的地理數據: 樣本數n為奇數時,中位數是位置排在第(n+1)/2位的數據;

5、 樣本數n為偶數時,中位數是排在中間位置的兩個數據的平均值。,,Me =61,升序排序,,Me =52.5,對于分組的地理數據,中位數的計算方法: 1) 確定中位數所在的組位置:——中位數應該在向上累計頻數包括∑fi/2的組中。 2) 按下述公式計算中位數:,或,Me 代表中位數;L 為中位數所在組的下限值;U 為中位數所在組的上限值;fm 為中位數所在組的頻數;Sm-1 為中位數所在組以下的

6、累計頻數;Sm+1 為中位數所在組以上的累計頻數;d 為中位數所在組的組距。,第1組,第n組,fm,f1,fn,∑fi/2,∑fm-1,∑fm,L,U,d=U-L,,,?,,,,∑fi/2=2130/2=1065,,300≤∑fi/2=1065≤1600,∴Me位于分組[3000,4000],L = 3000 U = 4000 d = L-U = 1000,fm = 1300,,,,Sm-1 = 300,=300

7、0+ 1065?300 1300 ×1000=3588.46,眾數即出現次數最多的那個數值。 對于未分組的地理數據,可以根據每一個數值出現的頻數大小取最大值可直接確定眾數。,,,M0 =50,對于已經分組的地理數據,中位數的計算步驟如下: 1) 確定頻數最多的組為眾數所在組; 2) 按以下公式計算眾數:,或,?1為眾數組頻數與上一組頻數之差;?2為眾數組頻數與下一組頻數之差。,,∴M0位

8、于分組[3000,4000],?1=1300-300=1000?2=1300-200=1100,=3000+ 1000 1000+1100 ×1000=3476.19,或,=4000? 1100 1000+1100 ×1000=3476.19,,極差,離差,離差平方和,方差,標準差,標準差無偏估計,變異系數,描述地理數據分布離散程度的指標,,,,,,,,,,所有數據中最大值與最小值之差,每一個地理數據與平均值的差值

9、,從總體上衡量一組地理數據與平均值的離散程度的指標,從平均概況衡量一組地理數據與平均值的離散程度的指標,極差,離差,離差平方和,方差,,,,標準差為方差的平方根,,,以樣本方差對標準差進行無偏估計,,,變異系數表示地理數據的相對變化(波動)程度,標準差,標準差無偏估計,變異系數,𝑑 𝑖,𝑑 2 = 𝑖=1 𝑛 𝑑 𝑖 2

10、,𝜎 2 = 𝑑 2 𝑛,𝜎= 𝜎 2,𝑆= 𝑑 2 𝑛?1,𝐶 𝑣 = 𝑆 𝑥 ×100%,離差,離差平方和,方差,標準差,標準差無偏估計,變異系數,例:,,離差平方和,離差,極差,,,方差,標準差,標準差無偏

11、估計,𝜎 2 = 𝑑 2 𝑛 = 5666.25 12 =472.19,𝜎= 𝜎 2 = 472.19 =21.73,𝑆= 𝑑 2 𝑛?1 = 5666.25 12?1 =21.7299,變異系數,𝐶 𝑣 = 𝑆 𝑥

12、 ×100%= 21.7299 54.25 ×100%=41.84%,,,,,,,,,,,,g1,g2,偏度系數,峰度系數,描述地理數據分布特征的參數,偏度系數,測度地理數據分布的不對稱性情況,刻畫以平均值為中心的偏向情況,計算公式為,g10,表示正偏,即均值在峰值的右邊;g1=0,表示對稱分布,峰度系數,測度了地理數據在均值附近的集中程度,其計算公式為,g2=0,表示地理數據分布的集中程度是標準正態(tài)分布;g2&g

13、t;0,表示地理數據分布的集中程度高于正態(tài)分布;g2<0,表示地理數據分布的集中程度低于正態(tài)分布,𝜎=21.73,𝑥 =54.25,偏度系數,峰度系數,=?0.3086,=?0.6796,負偏,平均值在峰值的左邊,數據分布集中程度低于正態(tài)分布,應用實例:中國大陸省份人均GDP的變異系數,我們知道變異系數測度的是地理數據分布的相對差異。 為了分析中國大陸經濟發(fā)展的省際差異及其演化過程,我

14、們首先把1978-2002年各?。ㄖ陛犑?、自治區(qū))的GDP數,按照可比價格進行折算,再除以人口數,計算出按照可比價衡量的人均GDP數據,然后再用變異系數公式,計算1978-2002每一年對應的變異系數,將計算結果繪制成散點折線圖:,這說明,在1978-1990年期間,中國大陸經濟發(fā)展的省際差異,基本上呈縮小趨勢,而1990-2002年期間則基本上呈擴大趨勢。這一變化與國家宏觀經濟政策變動的時間、趨勢大體一致。,,在1978-2002年期

15、間,人均GDP的變異系數,以1990年為轉折點,呈現出一個U形曲線。即:人均GDP的變異系數,在1978-1990年期間基本上呈現下降趨勢,而在1990-2002年期間則基本上呈現上升趨勢。,,地理數據分布的集中化與均衡度指數,洛倫茲曲線,20世紀初,意大利統(tǒng)計學家洛倫茲(M. Lorenz),首先使用累計頻率曲線研究工業(yè)化的集中化程度。后來,這種曲線就被稱之為洛倫茲曲線。,(1)將各部門的收入及其占總收入比重(百分比),從大到小重新排

16、序;(2)從大到小,逐次計算累計百分比;(3)以自然序號為橫坐標(x),累計百分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線,即洛倫茲曲線。,標準洛倫茲曲線繪制步驟,某地區(qū)農戶家庭經營性純收入水平及其構成,,,,(1)將表中2004年各產業(yè)部門的收入及其占總收入比重(百分比),從大到小重新降序排序;,,(2)從大到小,逐次計算收入比重的累計百分比;,計算累計百分比,,(3)以自然序號為橫坐標(x),累計百

17、分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線,即洛倫茲曲線。,統(tǒng)計自然序號,,,,,洛倫茲曲線什么情況下是這條橫軸平行線?,,洛倫茲曲線什么情況下是這條對角線?,1999年農戶家庭經營性純收入構成的洛倫茲曲線,2004年農戶家庭經營性純收入構成的洛倫茲曲線,洛倫茲曲線的上凸程度,表示農戶家庭經營性純收入的部門集中化程度。上凸程度越大,就表示農戶家庭經營性純收入越是集中于某些產業(yè)部門。,哪一年的農戶家庭

18、經營性純收入部門集中化程度較高?1999or2004?,集中化指數,集中化指數是一個描述地理數據分布的集中化程度的指數。,假若洛倫茲曲線的解析式為: 顯然,該曲線下方區(qū)域的面積為:,當數據均勻分布時,A就變成了對角線以下三角形的面積(R);當數據集中分布時,A就變成了整個矩形的面積(M)。,A——實際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積; M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積

19、。,,R,M,A,,顯然:集中化指數在[0, 1]區(qū)間上取值。I越大,就說明數據分布的集中化程度越高;I越小,就說明數據分布的集中化程度越低(越均衡)。,集中化指數,常采用如下近似取值方法: A——實際數據的累計百分比總和; R——均勻分布時的累計百分比總和; M——集中分布時的累計百分比總和。 集中化指數在[0,1]區(qū)間上取值。

20、 只有數據的個數相同而且橫坐標劃分一致時,才有可比性。,直接計算定積分較為麻煩,,A=∑累計百分比=7.5939,M=∑累計百分比=10,,,R=∑累計百分比=5.5,=(7.5939-5.5)/(10-5.5)=0.4653,基尼系數就是通過人口和收入兩組數據的對比分析,縱、橫坐標均以累計百分比表示,從而做出羅倫次曲線,然后再計算得出的集中化指數。 它是通過對人口和收入兩組數據進行比較分析,然后將縱、橫坐標均以累計百分比

21、表示,作出羅倫次曲線,再計算集中化指數而得到的一個判斷收入分配不平等程度的指標。,基尼系數,(Gini coefficient),與標準洛倫茲曲線有什么不同?,基尼系數洛倫茲曲線繪制原理方法:,(1)列出每一個區(qū)域(部門)的人口與收入占全區(qū)(各部門總計)的比重p與w;,,,p,w,(2)計算每一區(qū)域(部門)的比率w/p;,w/p,,基尼系數洛倫茲曲線繪制原理方法:,(3)根據w/p值,由小到大將每一地區(qū)(部門)排序;,,,由小到大升序

22、排序,w和p累積值,(4)按照上述順序分別計算p和w的累計值X和Y;,,,X,Y,(5)以X為橫坐標,以Y為縱坐標,在直角坐標系中依次連接各點,得到一條下凸的羅倫次曲線。,X,Y,Y1,Y2,Why?,,繪制散點曲線圖即得洛倫茲曲線,基尼系數洛倫茲曲線繪制原理方法:,,基尼系數洛倫茲曲線,為什么是下凸曲線?,怎么計算該洛倫茲曲線的集中化指數,A——實際洛倫茲曲線與橫軸圍成的圖形面積; R——均勻分布時洛倫茲曲線與橫軸圍成的圖形面積;

23、 M——集中分布時洛倫茲曲線與橫軸圍成的圖形面積。,此時,M=0,R=1/2。,Why?,Why?,基尼系數G就可按照如下公式計算:,𝐼= 𝑅?𝐴 𝑅?𝑀,如果用冪函數擬合,則基尼系數的近似計算公式為,式中: 可以通過最小二乘法擬合,即,近似計算基尼系數,Xi為排序后的人口累計百分比Yi為排序后的收入累計百分比,X,Y,,,∑lnXi*lnYi=11.20

24、,∑(lnxi)^2=9.11,=11.20/9.11=1.23,=(1.23-1)/(1+1.23)=0.1025,基尼系數,錫爾系數,(Theil coefficient),錫爾系數(Theil coefficient)又稱錫爾熵,有兩個錫爾系數指標,即錫爾系數T 和錫爾系數L。 兩者的不同之處在于錫爾系數T 以收入比重加權計算,而錫爾系數L則以人口比重加權計算。,如果以人口比重加權,錫爾系數 L 的計算公式為:,式中:n

25、: 區(qū)域(部門)個數; yi: i地區(qū)(部門)收入占全區(qū)(各部門總計)的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計)的份額。,如果以收入比重加權,則錫爾系數 T 的計算公式為,錫爾系數越大,就表示收入分配差異越大;反之,錫爾系數越小,就表示收入分配越均衡。,式中:n: 區(qū)域(部門)個數; yi: i地區(qū)(部門)收入占全區(qū)(各部門總計)的份額; pi: i地區(qū)(部門)的人口占全區(qū)(各部門總計)的份額。,p,w,,=∑

26、pi*log(pi/yi)=0.0103,=∑yi*log(yi/pi)=0.0099,,錫爾系數,錫爾系數,根據中國大陸1978-2002年各?。ㄖ陛犑?、自治區(qū))的人口數和按照可比價格折算的GDP數據,計算基尼系數,結果如圖??梢钥闯觯?978-1990年期間,基尼系數雖然出現過幾次上升和下降的微小波動,但基本趨勢是緩慢地下降的;而在1991-2002年期間,基本上呈現上升趨勢。這一結論,與上節(jié)計算的變異系數結果是相互印證的。,19

27、78—2002年中國大陸省際收入差異的基尼系數,應用實例:中國大陸省份收入差異的基尼系數,,根據各?。ㄖ陛犑?、自治區(qū))的人口和按照可比價格折算的GDP數據,計算1978-2002年中國大陸省際差異的錫爾系數T 值,結果如圖所示??梢钥闯?,在1978-1990年期間,錫爾系數雖然有微小波動,但基本上呈下降趨勢;而在1991-2002年期間,基本上呈現出上升趨勢。這一結論,與前面計算出的基尼系數也是相互印證的。,1978-2002年中國大陸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論