引論1信息的重要性信息高速公路計劃,nii2統(tǒng)計信息的基本概念_第1頁
已閱讀1頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、3.3 DATA步的用法 3.3.1 用在Data步的文件操作語句3.3.2 用在Data步的運行語句3.3.3 用在Data步的控制語句3.3.4 用在Data步的數(shù)組語句,3.3.1 用在Data步的文件操作語句3.3.1.1 Data語句3.3.1.2 Input語句3.3.1.3 Cards語句3.3.1.4 by語句3.3.1.5 Set語句3.3.1.6

2、 Merge語句3.3.1.7 Update語句,3.3.1.1 Data語句 Data語句表示數(shù)據(jù)步的開始,用于指定要創(chuàng)建或者修改的數(shù)據(jù)集的名字。 一般格式為:Data > >…… > 表示可選項,例: data; /* 系統(tǒng)自動規(guī)定數(shù)據(jù)集名datan */ data a; /* 創(chuàng)建臨時數(shù)據(jù)集a(work.a) */ data

3、 fdata.capital; /* 創(chuàng)建永久數(shù)據(jù)集fdata.capital */ data _null_ /* 不創(chuàng)建數(shù)據(jù)集,一般用于輸出 */,data new (drop = var1); /* 去掉數(shù)據(jù)集new中的變量var1 */data new (keep = _numeric_)

4、; /* 保留數(shù)據(jù)集new中所有數(shù)值型的變量 */,3.3.1.2 INPUT語句,作用:從原始數(shù)據(jù)輸入數(shù)據(jù)要使用INPUT語句指定輸入的變量和格式。數(shù)據(jù)行則寫在CARDS語句和空語句之間。2. 讀入外部數(shù)據(jù)文件中的數(shù)據(jù),,Input 語句有多種格式,,(1).自由格式 按順序列出每個觀測的各個變量名,中間用空格分開。字符型變量后加一個$符號。,例:data a;

5、input name$ sex$ math chinese; cards; 李明 男 92 98 張聰 女 98 100 ; run;,,一般在以下情況下可以使用自由格式:輸入的值彼此之間至少有一個空格隔開;用小數(shù)點而不是空格表示缺失值;字符型數(shù)值的最大長度為8個字節(jié),除非在LENGTH,ATTRIB,或INFORMAT語句規(guī)定了字符型變量的長度。,注意

6、:在自由格式中,變量的順序和數(shù)據(jù)值的順序應該是一致的。,,(2).列方式 在input語句變量名后,還需列出變量值所屬的列號。,例:data a; input a $ 1-5 b 7-9; cards; www3333 yyyy333333 ; run;,結(jié)果輸出:OBS A B1 www3

7、3 32 yyyy3 333,,一般在以下情況下可以使用列格式:變量值在所有的數(shù)據(jù)行上出現(xiàn)在相同的列上;輸入值是標準數(shù)值或字符型數(shù)值。,列格式的特點:輸入值可以按任何順序讀取,而不管他們在記錄中的位;字符型數(shù)據(jù)可以在中間嵌有空格;字符型數(shù)值可以從1-200字符長;數(shù)值或數(shù)值中的一部分可以再次被讀取。,,(3).格式方式 在input語句變量名后需指明輸入的格式。同時指明變量的數(shù)據(jù)類型和

8、區(qū)域?qū)挾取?例:data a; input a $ 5. b 3.1; cards; www333 www3333 www33333 yyyy33.3333 ; run;,結(jié)果輸出:OBS A B1 www33 0.3 www33 3.3 www

9、33 33.3 yyyy3 3.3,,格式方式需要注意: 在區(qū)域?qū)挾戎?,一般來說,小數(shù)點后的數(shù)字表示保留小數(shù)的位數(shù);但是如果數(shù)據(jù)行中對應的數(shù)據(jù)本來就有小數(shù)點,則區(qū)域?qū)挾戎械男?shù)位數(shù)失效。,,(4).命名式方式 在input語句變量名后加上“=”,例:data a;input id name=$15. Age=;cards;200012 name=marry age=1

10、5200015 age=16 name=john200011 age=16 name=smith and tom ;Run;,結(jié)果輸出:OBS A B1 200012 marry 15 200015 john 16 200011 smith and tom 16,,關于input語句的幾點說明:如果要在一行中輸入幾個觀測數(shù)據(jù),需要在inpu

11、t語句結(jié)尾處加上兩個@@。如果輸入的變量是連續(xù)的,如X1, X1,…X10,則可以簡單寫為X1-X10,返回,3.3.1.3 Cards語句,作用:告訴sas系統(tǒng)下面跟著的是數(shù)據(jù)行。(數(shù)據(jù)行是不以分號結(jié)尾的),,例:data; input var1 var2 var3 $; cards; 16 20 First ;,注意:若數(shù)據(jù)行中的數(shù)據(jù)含有分號,則要用cards4

12、語句,且空語句要用四個分號。,,例:data; input var1 $ var2 var3 $; cards4; ; 20 ( ;;;;,返回,3.3.1.4 Set語句,從一個或多個已經(jīng)存在的SAS數(shù)據(jù)集中讀取觀測值,并將這些觀測值組合在一個數(shù)據(jù)集中。,,一般格式 Set >… > ;,,例子:對已存在的SAS數(shù)據(jù)集進行修改

13、 data class; set class; total = chinese + maths + english; ave = total/3; run;,,2. 選取已存在的SAS數(shù)據(jù)集中的子集組成新的數(shù)據(jù)集 (1) data SEX1; set class (keep=sex); run; (2) data sex2 (keep=s

14、ex); set class; run;,,(4) data class1 ; set class; total = chinese + maths + english; if total >= 270 then output; run;,(3) data sex3; set

15、class (drop=name chinese maths english); run;,,3. 把幾個已存在的SAS數(shù)據(jù)集連接成一個新的數(shù)據(jù)集. (1) 相同變量順序連接 data hqck; set fdata.hqck101 fdata. hqck199; run;,,(2) 不同變量順序連接 data a;

16、 set fdata.class fdata.crime; run;,,(3) 按某一共同變量排序連接 data A; set A;run; proc sort; by sex;run; data A; set A;run; proc sort; by sex;r

17、un; data AC; set A C;by sex; run; proc print;run;,3.3.1.6 Merge語句,作用:把兩個或兩個以上的SAS數(shù)據(jù)集的觀測合并為新的SAS數(shù)據(jù)集中的一個觀測。 (橫向合并),,1.一般格式 MERGE data-set-name data-set-name … >;

18、,,MERGE語句的用法:,一對一合并 特征:Merge語句后面沒有跟by語句;合并過程:各數(shù)據(jù)集的觀測按順序一一對應合并。,,注意幾點:,合并后新數(shù)據(jù)集的觀測總數(shù)為參加合并的數(shù)據(jù)集中觀測的最大值.合并時,若某數(shù)據(jù)集已沒有觀測,則其對應得變量zhi以缺失值代替。合并時,若某幾個數(shù)據(jù)集有共同的變量。則合并后的新數(shù)據(jù)集僅含有一個該變量。其變量值為Merge語句中最后一個含有該變量的數(shù)據(jù)集中的該變量觀測值。,,例:,Data a

19、;Merge fdata.class fdata.fitness;Run;,,2. 匹配合并 特征:Merge語句后面跟有by語句; 每一個數(shù)據(jù)集至少有一個共同變量,而且必須要先按共同變量排序。 匹配變量:用于排序的變量。 by組:通過by語句排序后形成的每一個組。,3.3.2 DATA步中的運行語句,,一. 賦值語句和累加語句賦值語句

20、 一般格式:variable = expression 如:X = Y+Z*5注意:表達式中的變量必須已被賦值,否則作為缺失值處理。,,2. (options)選項 keep= :表示保留變量在新數(shù)據(jù)集中 drop= :表示不保留變量在新數(shù)據(jù)集中。,例:data da3;set da2(keep = name chines

21、e,maths,english );total = sum(chinese,maths,english);run;,,2. 累加語句 將表達式的計算結(jié)果累加到累加變量中,并將新的值送到數(shù)據(jù)集中。 一般格式:variable + expression 如:N+1 ;sumx+x*x注意:1. Variable表示累加變量,必須是數(shù)值型的;2. 初值默認為0;,,二. O

22、UTPUT語句和DELETE語句OUTPUT語句 輸出當前的觀測到指定的SAS數(shù)據(jù)集中。一般格式: output … ; 注意:數(shù)據(jù)集名可由多個,即可以同時輸出到多個數(shù)據(jù)集中。,,2. delete語句 功能:停止處理當前的觀測。 一般格式: delete,,三. keep語句和drop語句Keep語句

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論