stata初級入門2-數(shù)據(jù)篇.ppt_第1頁
stata初級入門2-數(shù)據(jù)篇.ppt_第2頁
stata初級入門2-數(shù)據(jù)篇.ppt_第3頁
stata初級入門2-數(shù)據(jù)篇.ppt_第4頁
stata初級入門2-數(shù)據(jù)篇.ppt_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Stata 入門2 數(shù)據(jù)篇,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,1,一、數(shù)據(jù)錄入,直接錄入 打開dta數(shù)據(jù)文件 導(dǎo)入其它格式的數(shù)據(jù)文件 其它方式,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,2,1直接錄入,(1)直接在stata中錄入(適用于小樣本少變量數(shù)據(jù)):打開程序,調(diào)用數(shù)據(jù)編輯窗口,直接錄入數(shù)據(jù),如excel中操作。 調(diào)用數(shù)據(jù)窗口方式:(a)在command窗口中輸入edit命令;(b)點工具欄上的 (2)在excel中錄入后,直接復(fù)制到stata數(shù)據(jù)編輯窗口中。 (3)鍵盤直接輸入:在command窗口,用input命令。劃線部分輸入,. drop _all . input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,3,2.數(shù)據(jù)文件的讀取,(1)Stata數(shù)據(jù)文件,后綴.dta 直接雙擊 菜單操作:在工具欄上直接點擊 或File Open:,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,4,use 命令,語法格式: use filename , clear nolabel,讀取整個數(shù)據(jù)文件 use varlist if in using filename , clear nolabel,從數(shù)據(jù)文件中僅讀取幾個變量 范例: use “C:Program Files (x86)Stata12auto.dta“, clear use “C:Program Files (x86)Stata12auto.dta“, clear nolabel use make price using “C:Program Files (x86)Stata12auto.dta“, clear,(2)其它格式的數(shù)據(jù)文件,Excel數(shù)據(jù):*.xls, *xlsx。這是stata12新增的功能。 用spreadsheet建立的ASCII(txt)數(shù)據(jù):*.raw, *.txt, *.csv,用insheet命令。 固定列寬的ASCII(txt)數(shù)據(jù):*.dct,用infix命令 以dictionary格式建的ASCII(txt)數(shù)據(jù):*.dct, *.raw,用infile命令。 無格式的ASCII(txt)數(shù)據(jù): *.txt, *.raw,用infile命令。 SAS XPORT數(shù)據(jù):*.xpt,用fdause命令。 ODBC數(shù)據(jù)源:包括access數(shù)據(jù)源,*.mdb,dBase數(shù)據(jù)源,*.dbf xml數(shù)據(jù):*.xml,菜單操作:fileimport,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,7,3.其它方式,(1)用StatTransfer 軟件轉(zhuǎn)換 可以用statTranser 9軟件將各種格式的數(shù)據(jù)轉(zhuǎn)換成dta格式數(shù)據(jù) 前提是你安裝了這個軟件 (2)安裝外掛命令程序包,如usespss.ado程序包就是一個用于讀取spss生成的格式數(shù)據(jù)的程序包。 在search all中敲入搜索關(guān)鍵詞:找到可能你需要的程序包,而后安裝即可。 這個方法安裝的外掛命令,不會在菜單中出現(xiàn),需要你記住命令名。,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,8,二、數(shù)據(jù)的保存或?qū)С?1保存用save/save as 2導(dǎo)出 從file菜單中export選項下選擇你想保存的格式; 用outfile,outsheet,fdasave,xmlsave命令,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,9,三、數(shù)據(jù)操作,變量名、標(biāo)簽等屬性 變量屬性顯示和修改 變量的數(shù)據(jù)類型和長度 變量生成和變量值修改 缺失值的處理 變量的剔除和保留 數(shù)據(jù)的排序 字符變量和數(shù)值變量的相互轉(zhuǎn)換,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,10,1.變量屬性,如名稱、標(biāo)簽、值標(biāo)簽,變量名:由英文字符、數(shù)字、中文字符組成。 字母大小寫表示的含義不同! 標(biāo)簽:對變量含義的解釋 值標(biāo)簽:用于對分類變量值的含義進(jìn)行解釋 如foreign有domestic和foreign,在數(shù)據(jù)量化上,可用0代表domestic,1代表foreign。,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,11,2.變量屬性的顯示,菜單操作:DataDescribe Data in Memory Describe命令,語法格式:describe var1 var2 用于,可顯示1個,或多個。 如describe foreign,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,12,3.變量屬性的修改,變量名更改:rename命令,常用語法格式:rename old_var new_var,如rename income inc. 變量標(biāo)簽(label)的定義:label命令,語法:label var varname “#”,如label var foreign “car type”。除用于定義變量的標(biāo)簽外,其還可用于定義數(shù)據(jù)的標(biāo)簽,如label data “auto in American” 分類(或指示)變量的值標(biāo)簽定義:亦l(xiāng)abel命令,要完成分類變量值的標(biāo)簽定義有兩步,如把變量foreign取值為0,定義為domestic,取值為1,定義為foreign,并用origin表示該變量值標(biāo)簽定義結(jié)果: label define origin 0 “domestic” 1 “foreign” label values foreign origin,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,13,4.變量的數(shù)據(jù)類型和長度,整數(shù)數(shù)值型: (1)byte,(2)int, (3)long。 小數(shù)數(shù)值型: (1)float,(2)double。 數(shù)值型數(shù)據(jù)一般定義為float型,除非你有特別定義。 字符串型:string,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,14,數(shù)值型數(shù)據(jù),字符型數(shù)據(jù),數(shù)值變量和字符變量的轉(zhuǎn)換,encode命令:將字符變量轉(zhuǎn)換為數(shù)值變量。 格式:encode varname if in, generate(newvar) label (name) noextend 菜單: Data Create or change data Other variable-transformation commands Convert variables from string to numeric 范例:encode make, generate(make2) decode命令:將數(shù)值變量轉(zhuǎn)換為字符變量 格式:decode varname if in, generate(newvar) maxlength(#) 菜單: Data Create or change data Other variable-transformation commands Convert variables from numeric to string 范例:deocde price, genrate(price2),包括數(shù)值數(shù)據(jù)的字符轉(zhuǎn)換,destring命令: 將字符變量轉(zhuǎn)換為數(shù)值變量 語法:destring varlist, generate (newvarlist) | replace options options:ignore (“chars”) 刪除字符變量中的非數(shù)值字符,force將非數(shù)值字符轉(zhuǎn)換為缺失值 tostring命令: 將字符變量轉(zhuǎn)換為數(shù)值變量 語法:tostring varlist, generate (newvarlist) | replace,5.新變量生成,generate/egen命令: gen命令格式:generate type newvar=exp if in 范例:gen id=. egen命令格式:它是gen的更高級應(yīng)用, egen type newvar=fcn(arguments) if in , options 范例:egen mmpg=mean(mpg),2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,18,菜單操作: Data Create or change data Create new variable Data Create or change data Create new variable (extended),6.變量值的修改,replace命令 格式:replace oldvar=exp if in , nopromote 范例:如replace id=1,7.缺失值的處理,在現(xiàn)有的調(diào)查中,經(jīng)常用88, 99,888,999,.等來表示不知道或不清楚。 在stata中如何一般用”.”來表示該變量的觀測缺失值。 將變量缺失值轉(zhuǎn)化為數(shù)值,用mvencode命令 格式:mvencode varlist if in, mv(#|mvc=# mvc=#. else=#) override 范例: mvencode rep78 if foreign = 0, mv(998) 將變量的某些數(shù)值轉(zhuǎn)化為缺失值,用mvdecode命令 格式: mvdecode varlist if in, mv(numlist | numlist=mvc numlist=mvc.) 范例: mvdecode rep78, mv(998=. 999=.a),2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,21,菜單操作: Data Create or change data Other variable-transformation commands Change missing values to numeric或Change numeric values to missing,8.變量(觀測值)的剔除,保留,顯示,drop/keep命令: 格式:(1)變量:drop/keep varlist;(2)觀測值:drop/keep if exp 范例:drop pop*,drop if medage 32 菜單操作:(1)變量:Data Variables Manager;(2)觀測值:Data Create or change data Keep or drop observations Clear命令 list命令: 格式:list varlist if in ,options,9.數(shù)據(jù)的排序,Sort命令 語法: 升序sort varlist in ,stable。 選項stable指如果兩個觀測值相同,則保持其順序不變。 降序gsort - varname - varname , generate (newvar) mfirst。 選項mfirst表示將缺失值放在前面。,菜單操作: (1)只完成升序:Data Sort Ascending sort (2)升、降序皆可:Data Sort Ascending and descending sort 范例:,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,25,四、分類數(shù)據(jù)的處理,變量:連續(xù)變量、分類變量 將連續(xù)變量轉(zhuǎn)化為指示變量 如generate priceg=(price=6000) 將連續(xù)變量轉(zhuǎn)化為分類變量 語法:generate newvar=recode(varname, num1,num2, num3, ., numk) 將分類變量轉(zhuǎn)化為指示變量 語法:xi i.varname,五、數(shù)據(jù)集的合并和附加,1.數(shù)據(jù)集的合并:merge命令 語法: (1)按指定的關(guān)鍵變量進(jìn)行1對1匹配合并(One-to-one merge on specified key variables) merge 1:1 varlist using filename , options (2)按指定的關(guān)鍵變量進(jìn)行多對一匹配合并(Many-to-one merge on specified key variables)(外部數(shù)據(jù)文件的關(guān)鍵變量值唯一值) merge m:1 varlist using filename , options,菜單操作: Data Combine datasets Merge two datasets 范例: use c:program files stata12auto1.dta merge 1:1 id using c:program files stata12auto2.dta,2019年6月30日星期日,計量經(jīng)濟學(xué)軟件應(yīng)用課程講義,28,2.數(shù)據(jù)集的附加:append命令 語法: append using filename filename . , options 菜單操作: Data Combin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論