

下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、以下命令均采用小寫(xiě)字母Chapter 1 stata入門打開(kāi)數(shù)據(jù)獲取幫助use D:Stata9, clear用use命令打開(kāi)數(shù)據(jù)sysuse auto , clear auto為系統(tǒng)數(shù)據(jù) sysuse 為打開(kāi)系統(tǒng)數(shù)據(jù)的命令Help summarizesummarize為需要獲取幫助對(duì)象 可以改為其他的需要幫助的對(duì)象Findit summarize, net 尋找網(wǎng)絡(luò)幫助 summarize 為需要獲取幫助對(duì)象Search summarize, net 尋找網(wǎng)絡(luò)幫助 summarize 為需要獲取幫助對(duì)象顯示結(jié)果Display5+9描述統(tǒng)計(jì)( summarize 可簡(jiǎn)寫(xiě)成 sum)Use at
2、uo , clearSummarize price 描述 price 的觀察值個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、最小值、最大值Sum weight summarize 可簡(jiǎn)寫(xiě)成 sumSum weight price 同時(shí)完成上面兩步繪圖Scatter price weight scatter為繪制散點(diǎn)圖命令Line price weight , sort line為繪制折線圖命令, sort 為排序,繪制折線圖前需要先排序生成新的數(shù)據(jù)( generate 可簡(jiǎn)寫(xiě)成 gen)ClearSet obs 1000設(shè)置觀測(cè)值的組數(shù)Gen x=_n _n為觀察值得序號(hào)Gen y=x+100控制結(jié)果輸出顯示List
3、 n設(shè)置屏幕滾動(dòng)Set more off先設(shè)置此項(xiàng) 則顯示時(shí),屏幕不停止Set more on先設(shè)置此項(xiàng) 則顯示時(shí),會(huì)使顯示停止清除內(nèi)存中原有內(nèi)容clear設(shè)置文件存取路徑( cd)Cd d:stata d:stata 為路徑如果想知道當(dāng)前路徑下有哪些文件,可以用dir命令來(lái)列示.dir假設(shè)你想在D盤的根目錄下創(chuàng)建一個(gè)新的文件夾mydata來(lái)存放數(shù)據(jù)文件, 命令為mkdir。mkdir d: mydata錯(cuò)誤提示List myvar上述命令試圖顯示變量myvar,但是結(jié)果窗口僅出現(xiàn)如下的顯示variable myvar notfoundr(111);紅色信息表明,沒(méi)有找到一個(gè)叫myvar的變量
4、,的確,我們的數(shù)據(jù)中并沒(méi)有 這個(gè)變量。List巧婦難為無(wú)米之炊。紅色信息下面還有一個(gè)天蘭色的r(111),用鼠標(biāo)點(diǎn)擊,即可彈進(jìn)一個(gè)幫助信 息框,給出錯(cuò)誤的更詳盡解釋。再比如,我們?cè)谇笪鍞?shù)概略時(shí),誤把sum寫(xiě)成了sun. sun unrecognized command: sun r(199);顯示說(shuō)不認(rèn)識(shí)sun這個(gè)命令。附錄:常見(jiàn)命令Chapter2命令語(yǔ)句掌握命令語(yǔ)句的格式by varlist : command varlist = exp if exp in range weight , options注: 表示可有可無(wú)的項(xiàng) , 顯然只有 command 是必不可少的,下面結(jié)合例子分 項(xiàng)來(lái)
5、講解命令的各個(gè)組成部分。命令 commandby varlist : command varlist = exp if exp in range weight , options. cdd:/stata9. useauto,clear summarize /* 很多命令可單獨(dú)使用,單獨(dú)使用時(shí), 一般是對(duì)所有變量進(jìn)行操作,等價(jià)于后面加上代表所有變量的 _all 。 */. summarize _all/ 注意到該命令輸出結(jié)果與上一個(gè)命令完全一樣foreign 的排序,所以出現(xiàn)了錯(cuò)誤提示。更正的辦法是: */ . sortforeignbyforeign: sumpriceweight*更簡(jiǎn)略的方
6、式是把兩個(gè)命令用一個(gè)組合命令來(lái)寫(xiě)。. by foreign , sort: sum price weight 如果不想從小到大排序,而是從大到小排序,其命令為gsort 。 .gsort- price/ 按價(jià)格從高到低排序.gsortforeign-price/*先把國(guó)產(chǎn)車都排在前,進(jìn)口車排在后面,然后在國(guó)產(chǎn)車內(nèi)再按價(jià)格從大小到排序,在進(jìn)口車內(nèi)部,也按從大到小排序賦值及運(yùn)算 =exp. sumsusu簡(jiǎn)化為 s. scd d:/stata9. use auto, clear. sum pricesu pcd d:/stata9是 summarize 的最簡(jiǎn)化略寫(xiě),不能再. use auto,
7、clear. by foreign : sum price weightsumprice weight*not sorted/* 系統(tǒng)提示沒(méi)有排序,這是因?yàn)?by varlist by 后面的變量排序的。當(dāng)我們用 sort pricesu t sum tr tusortpricebyforeign在執(zhí)行時(shí)要求內(nèi)存中的數(shù)據(jù)是按照重新排序后,就打亂了原來(lái)按照*/by varlist : command varlist = exp if exp in range weight ,options礎(chǔ)上漲10元. cd d:/stata9. use auto, clear原變量的賦值, nprice 調(diào)減
8、后與 price 變量取值相等*/ifforeign=1 & price10000* 查看價(jià)格超過(guò) 1 萬(wàn)元或者進(jìn)口車(兩個(gè)條件任滿足一個(gè)). listmake priceifforeign=1 | price10000* 分類型查看價(jià)格超過(guò) 1 萬(wàn)元的汽車的品牌和價(jià)格make priceifprice10000范圍篩選 in rangeby varlist : command varlist = exp if exp in range weight , options如果要計(jì)算較低的前 10 臺(tái)車的平均價(jià)格,則要先按價(jià)格排序,然后僅對(duì)前 10 個(gè)車的價(jià)格求平均值. cdd:/stat
9、a9. useauto, clear例:生成一個(gè)新的價(jià)格變量nprice,該變量的取值為原汽車價(jià)格變量price的基gen nprice =price+10list price npricereplacenprice=npric-1e0/* 命令 replace則直接改變. listprice npricecdd:/stata9. useauto,clear. listmake priceifforeign=0* 只查看價(jià)格超過(guò) 1萬(wàn)元的進(jìn)口車(同時(shí)滿足兩個(gè)條件) ,則. listmake price. byforeign, sort: list. sort price . sumpricei
10、n1/5注意“ 1/5 ”中,斜杠不是除號(hào),而是從1 到 5 的意思,即 1,2,3,4,5。如果要計(jì)算前 10 臺(tái)車中的國(guó)產(chǎn)車的平均價(jià)格,則可將范圍和條件篩選聯(lián)合使用。. sumpricein1/10ifforeign=0加權(quán) weightby varlist : command varlist = exp if exp in range weight , options任務(wù):下表是2005年湖北省高考640分及以上成績(jī)一分一段的人數(shù)統(tǒng)計(jì),第一列score為高考分?jǐn)?shù),第二列num為該分?jǐn)?shù)段的人數(shù)?,F(xiàn)在我們要求640分及以 上考生的平均分?jǐn)?shù)。score num650 193649 26648
11、23647 16646 21645 26644 32643 23642 38641 29640 38操作:先將上面的表格復(fù)制,然后進(jìn)入STAT A執(zhí)行如下命令然后把光標(biāo)定位在表格的第一行第一列,點(diǎn)右鍵,選擇粘貼(paste),上表數(shù)據(jù)便被復(fù)制到STATA中,退出數(shù)據(jù)編輯器sumscore sumscore weight=num / *加權(quán)計(jì)算,比較該結(jié)果與sumscore的區(qū)別,實(shí)際上,不用權(quán)重選項(xiàng)時(shí),相當(dāng)于權(quán)重相等。*/. sum score w=nsumscore, detail. sumscore, d cdd:/stata9. useauto,clear. listprice in1/
12、30, sep(10) listprice in 10/30,sep(2)listprice, nohead3.1.1ta,如果在STATA軟件當(dāng)前路徑下,直接用use命令即可打開(kāi);如果不在當(dāng)前路徑下,則可以使用sysuse命令打開(kāi)。. use auto,clear cd d:/useauto, clearfile not foundsysuse auto,clear 3.1.2usenlswork , clearfile not found此時(shí),如果確定該數(shù)據(jù)為示例數(shù)據(jù),可以直接通過(guò)網(wǎng)絡(luò)獲取,其命令為:. use webuse nlswork , clear另一個(gè)網(wǎng)絡(luò)數(shù)據(jù)較多的地方是波士登大
13、學(xué)的數(shù)據(jù)中心,伍德里奇的計(jì)量經(jīng) 濟(jì)學(xué)導(dǎo)論一書(shū)中所使用的全部數(shù)據(jù)都可以通過(guò)該數(shù)據(jù)中心獲得。比如.use即打開(kāi)教材中例 中所使用的CEO數(shù)據(jù)。use命令只能打開(kāi)后輟名為 “*.dta”格式的數(shù)據(jù),.dta格式以外的數(shù)據(jù),STATA不能直接讀取, 需要從外部讀入, 最簡(jiǎn)單而直接的辦法是復(fù)制和粘貼。 但是有時(shí) 沒(méi)有其他軟件,比如,我們有SAS格式或SPSS格式的數(shù)據(jù),但沒(méi)有SAS軟件 和SPSS軟件,此時(shí)需要用STATA提供的其他命令或者使用transfer數(shù)據(jù)格式轉(zhuǎn) 化軟件。在討論其他輸入或?qū)霐?shù)據(jù)的方法之前, 我們先來(lái)學(xué)習(xí)一點(diǎn)數(shù)據(jù)類型的 知識(shí)。. clearedit數(shù)據(jù)類型STATA通常把變量劃分
14、為三類:分別是數(shù)值型,字符型和日期型3.2.1數(shù)值變量:用0、1、29及+、-(正負(fù)號(hào))與小數(shù)點(diǎn)“(.)”來(lái)表示。在輸入數(shù)據(jù)時(shí), 逗號(hào)不能被識(shí)別,如1,024應(yīng)該直接寫(xiě)成1024.5-5+3后面兩個(gè)數(shù)據(jù)為科學(xué)計(jì)數(shù)法的數(shù)據(jù),分別表示5200和.其中的e相當(dāng) 于10,因此+3的意思是:*10=5200數(shù)值型變量按其精度區(qū)分,又有五種類型,分別是:存貯類型 最小最大0-領(lǐng)域字節(jié)byte -127100+/-11int -32,76732,740+/-12long -2,147,483,6472,147,483,620+/-14float *10A38 *10A36 +/-10A-36 4double
15、 *10A307 *10八307 +/-10八-323 8當(dāng)運(yùn)算精度要求很高的時(shí)候,需要將變量設(shè)置成浮點(diǎn)型或雙精度型。另注意1和 的精度是不同的,前者在,區(qū)間內(nèi)近似,而后者在,區(qū)間內(nèi)近似。若多次運(yùn)算反復(fù)取四舍五入,精度較低時(shí)將使計(jì)算誤差迅速變大, 然而, 精度高時(shí)占用的內(nèi)存資源較多。 下面的命令有助于理 解變量存貯類型變換。. clear. set obs 1gen a=1d命令的略寫(xiě),describ命令顯示數(shù)據(jù)集的/*d為describ屬性信息,注意觀察顯示結(jié)果中,浮點(diǎn)型為默認(rèn)類型*/a的storage type為float型,Contains dataobs: 1vars: 1size:8
16、 % ofmemostorage display valuevariable name type format label variable labela float %9.0gSorted by:Note: dataset has changed since last saved. compress dreplacea=101/*注意a的storage type現(xiàn)在自動(dòng)升為int型,因?yàn)閎yte最大只能為100*/a was byte now int (1 realchange made) . replacea=100 . compress. dreplacerecast double a
17、da=327413.2.2gen double b=1125.27”125.27”2,343.68”125.27”3.3.1 3.2.3 3.2.4. display 2/0另一種情況是,數(shù)據(jù)中含有缺失值,而STATA默認(rèn)的缺失值也用“”來(lái)表來(lái)表示,如果要將其全部替換為,或者反之,將”替換為-9996,命令為:. mvencode age,mv(-9996). mvdecode age,mv(-9996)數(shù)據(jù)類型轉(zhuǎn)化任務(wù):將destring1, destring2和tostring中的數(shù)據(jù)類型進(jìn)行相互轉(zhuǎn)化*3.3.1字符型轉(zhuǎn)化成數(shù)值型:destring*destri ng1數(shù)據(jù)中的數(shù)據(jù)全為字符
18、型,轉(zhuǎn)換為數(shù)值型.webuse destring1 , clear.des/*注意到所有的變量存貯類型(storage type)均為字符型str#,其中#號(hào)表示字符串長(zhǎng)度*/Contains data from 10vars: 5 3 Mar 2005 10:15 size: 240 % of memory free) storage display valuevariable name type format label variable labelid str3 %9snum str3 %9scode str4 %9s total str5 %9s income str5 %9s.sum
19、ennincom=incom+10 estring, replace umen nincom=income* ist nincom income ebuse destring2 , clear.des ist date 1999 12 102. 2000 07 083. 1997 03 024. 1999 09 00.destring date, replace estring date, replace ignore(“ ”)/*忽略空格,然后轉(zhuǎn)換,注意這里的” “中間有一個(gè)空格,不是”。*/ date: characters space removed; replaced aslonges
20、ist date2.3./*與date變量類似,變量price前面有美元符號(hào),變量percent后有百分號(hào), 換為數(shù)值型時(shí)需要忽略這些非數(shù)值型字符。*/.destring price percent , gen( price2 percent2 ) igno re(“$ ,%”).list$2, 34% 342. $7, 86% 86.d 3.3.2ebuse tostring , clear /*該數(shù)據(jù)中年月日的數(shù)據(jù)類型不一樣,不能直接相加生成一個(gè)反映日期的新變量*/.des ist.gen date1=month+”/”+day+”/”+year ostringyear day , rep
21、lace esen date1=month+”/”+day+”/”+year ist endate2=date(date1,”mdy”)/* date()為日期函數(shù),它以1960年1月1日為第0天,計(jì)算從那天起直到括號(hào)中指定的某天date1一共過(guò)了多少天?!眒dV指定datel的排列順序,這里是 按照月日年的順序來(lái)表示日期。*/.list1975年12月2i date (“1975/12/27”,”ymd)數(shù)據(jù)顯示格式 :format/*format只控制數(shù)據(jù)的顯示格式,并不改變內(nèi)存中數(shù)據(jù)的大小。*/.webuse census10,clear esAlabama South 38938882
22、. Alaska West 4018513. Arizona West 27182154. Arkansas South 2286435.format state % -14s ist in 1/4 Alabama South 38938882. Alaska West 4018513. Arizona West 27182154. Arkansas South 2286435.format region %-8.0g / *region變量看起來(lái)是字符型變量,但實(shí)際上為 數(shù)據(jù)型,它也可以左對(duì)齊,同樣是加一個(gè)負(fù)號(hào).list in 1/4ormatpop % /*pop的顯示格式為11.0g,后
23、面加上c,則每三位數(shù)間用逗號(hào)分開(kāi),c為comma的意思.*/.list in 1/4Alabama South 3,893,8882. Alaska West 401,8513. Arizona West 2,718,2154. Arkansas South 2,286,4355. California West*因?yàn)檫@個(gè)數(shù)太大,加逗號(hào)將超過(guò)11位數(shù),我們可以先把總的位數(shù)增加.format pop %ist in 5California West23,667,902.format medage %8.1fist in 1/4state region pop medage1. Alabama S
24、outh 3,893,8888.0g11.0g9.0g ist in 1/42. Alaska West 401,8513. Arizo na West 2,718,2154. Arka nsas South 2,286,435.gen id=_neplace id=9842 in 3 ist in 1/3state regi on pop medage id1. Alabama South 3893888 12. Alaska West 401851 23. Arizo na West 2718215 9842.format id %05.0f ist in 1/3Alabama South
25、 3893888 000012. Alaska West 401851 000023. Arizo na West 2718215 09842在 STATA 中直接錄入數(shù)據(jù):in put3.5.1菜單式操作任務(wù):按學(xué)號(hào)錄入五個(gè)學(xué)生的經(jīng)濟(jì)學(xué)成績(jī)id economy1 402 803 904 705 53操作:(1)點(diǎn)擊圖標(biāo)口在打開(kāi)的數(shù)據(jù)表格第一列中錄入五個(gè)姓名在第二列中錄入另五個(gè)成績(jī)雙擊 varl 彈出對(duì)話框 將變量改名為 id在 label 中寫(xiě)入學(xué)號(hào) 退出彈出窗口;雙擊 var2 彈出對(duì)話框 將變量改名為 name:在 label 中寫(xiě)入姓名 關(guān)閉數(shù)據(jù)編輯器(2)點(diǎn)擊圖標(biāo)保存數(shù)據(jù)給數(shù)據(jù)命令為
26、student 退出 Editor.區(qū)J W .郵口口o上込電11COAHuun d在建立數(shù)據(jù)文件后,如果沒(méi)有存盤,這個(gè)文件即是一個(gè)“臨時(shí)的”數(shù)據(jù)文件,它將隨著退出 STATA 系統(tǒng)時(shí)而消失。當(dāng)數(shù)據(jù)文件被存儲(chǔ)在后,它將成為一個(gè)“永久性”的數(shù)據(jù)文件,用 戶可以在以后經(jīng)常使用它而不必重新建立之。3.5.2命令操作任務(wù):按學(xué)號(hào)錄入五個(gè)學(xué)生的學(xué)號(hào)和姓名id n ame economy1 John 402 Chris 803 Jack 904 Huang 435 Tom 70操作:在comma nd窗口中鍵入(注:前面的點(diǎn)號(hào)不必健入,每完成一行按回車鍵 黑體為命令,斜體為變量名或文件名):對(duì)于字符型變量
27、,需要指明其為字符型 并指明最大的字符長(zhǎng)度。? clear ? 1John403.5.3 1John40-3.6.1insheet using , clear也可以先將“”數(shù)據(jù)打開(kāi)并另存為“”,然后用下面的命令導(dǎo)入.in sheet using , clear當(dāng)數(shù)據(jù)中某個(gè)變量的位數(shù)特別長(zhǎng)或者對(duì)導(dǎo)入數(shù)據(jù)的精度要求很高的時(shí)候,需 要在該命令后面加double選項(xiàng)。.in sheet using , double clear3.6.2 in file命令對(duì)于“”或“”,還可用infile命令導(dǎo)入STATA此時(shí)需要先指出變量名。尤其要注意,當(dāng)變量為字符型時(shí),要先指明。in fileid str10 n ame gen der mi nority economy math using , clear或者infile id str10 name gender minority economy math using , clear3.6.3 infix命令 還有一種標(biāo)準(zhǔn)化的數(shù)據(jù),每個(gè)變量的位數(shù)是確定的,不足時(shí),前面用0補(bǔ)齊, 以origin.數(shù)據(jù)的后面四個(gè)變量為例,其數(shù)據(jù)格式為114068128052029076024390037096115385028536129565如果遇到這種數(shù)據(jù)格式,需要對(duì)照數(shù)據(jù)說(shuō)明導(dǎo)入數(shù)據(jù),相應(yīng)的命令為:infi
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房地產(chǎn)項(xiàng)目增資入股投資協(xié)議
- 二零二五年度辦公室文員聘用與企業(yè)文化融合協(xié)議
- 二零二五年度新能源汽車碰撞責(zé)任免除合同
- 2025年度現(xiàn)代農(nóng)業(yè)病蟲(chóng)害防治藥害賠償協(xié)議書(shū)
- 二零二五年度勞動(dòng)局標(biāo)準(zhǔn)合同:養(yǎng)老服務(wù)業(yè)員工就業(yè)保障協(xié)議范本
- 2025年度賬戶變更補(bǔ)充服務(wù)協(xié)議
- 高性能計(jì)算中心設(shè)備采購(gòu)及安裝合同
- 企業(yè)辦公室裝飾設(shè)計(jì)與施工服務(wù)合同
- 教育培訓(xùn)行業(yè)線上課程開(kāi)發(fā)與運(yùn)營(yíng)計(jì)劃書(shū)
- 電氣設(shè)備安裝工程施工合同新
- DB5101-T 71-2020 成都市電動(dòng)汽車充電設(shè)施 安全管理規(guī)范
- 2025年七臺(tái)河職業(yè)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 監(jiān)理人員安全培訓(xùn)考試試卷(答案)
- 2025年北京電子科技職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 【MOOC】數(shù)據(jù)庫(kù)系統(tǒng)(上):模型與語(yǔ)言-哈爾濱工業(yè)大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 高教版2023年中職教科書(shū)《語(yǔ)文》(基礎(chǔ)模塊)下冊(cè)教案全冊(cè)
- HCCDP 云遷移認(rèn)證理論題庫(kù)
- 譯林英語(yǔ)五年級(jí)下冊(cè)單詞表(孩子自己默寫(xiě)不用提)
- DLT 1055-2021 火力發(fā)電廠汽輪機(jī)技術(shù)監(jiān)督導(dǎo)則
- 杭州房建工程監(jiān)理大綱范本
- 現(xiàn)代交換原理與技術(shù)課件:第5章 分組交換技術(shù)
評(píng)論
0/150
提交評(píng)論