SPSS中隨機抽樣的精確實現(xiàn)_第1頁
SPSS中隨機抽樣的精確實現(xiàn)_第2頁
SPSS中隨機抽樣的精確實現(xiàn)_第3頁
SPSS中隨機抽樣的精確實現(xiàn)_第4頁
SPSS中隨機抽樣的精確實現(xiàn)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計算機應用SPSS中隨機抽樣的精確實現(xiàn)南方醫(yī)科大學珠江醫(yī)院信息科(510282中山大學公共衛(wèi)生學院統(tǒng)計與流行病學系(510080顏杰謝薇方積乾SPSS在菜單中僅提供了兩種從數(shù)據(jù)表中隨機抽取記錄的功能。一種是近似法,即由用戶指定抽取比例,系統(tǒng)按該比例在全部記錄中進行無返回的抽樣。此時系統(tǒng)對于每條記錄都是用獨立的偽隨機數(shù)發(fā)生器進行抽樣,故抽樣結果只能近似符合指定的比例。根據(jù)大樣本代表性好的原理,數(shù)據(jù)文件中的記錄條數(shù)越多,比例越接近50%,結果就會越接近。另外一種方法是精確法,由用戶指定需抽取的記錄條數(shù)和從前面多少條記錄中抽取,系統(tǒng)就從指定的范圍內抽取相應條記錄。以上兩種方法的局限就是無法根據(jù)用戶的

2、需要,在任意指定抽取范圍進行精確抽樣。前者只能進行近似抽樣,而后一種方法又不能任意指定抽取范圍,應用起來不方便。我們在實際應用過程中,發(fā)現(xiàn)借助SPSS對話框中的Paste按鈕,利用SPSS的程序編輯窗口對抽樣程序作一些修改就可以實現(xiàn)任意指定范圍的抽樣。具體方法如下:假定當前數(shù)據(jù)文件中有2000條記錄,分為2個組,11000條為A組,10012000條為B組?,F(xiàn)分別要從2組中各隨機抽取50條記錄。首先實現(xiàn)從第1組中抽樣,此時直接利用SPSS 就可實現(xiàn)。在菜單中選擇DataSelect Cases,在彈出的Select Cases對話框中選擇Random Sample of cases 選項,又彈

3、出Select Cases:Random Sample對話框,其中第1選項是按比例近似抽樣,第2選項就是指定范圍精確抽樣。選中第2選項,在相應的框中分別填入50和1000(見圖1。圖1Select Cases:Random Sample對話框然后點擊Continue按鈕返回Select Cases對話框,再點擊框中的Paste按鈕,系統(tǒng)自動打開程序編輯窗口,并將上述過程翻譯為相應SPSS程序。程序語句內容如下:01USE ALL.02do if$casenum= 1.03compute#s-$-1=50.04compute#s-$-2=1000.05end if.06do if#s-$-2&g

4、t;0.07compute filter-$=uniform(13#s-$-2<#s-$-1.08compute#s-$-1=#s-$-1-filter-$.09compute#s-$-2=#s-$-2- 1.10else.11compute filter-$=0.12end if.13VARIABL E LABEL filter-$.50from the first1000cases (SAMPL E14FORMAT filter-$(f110.15FIL TER B Y filter-$.16EXECU TE.上段程序中使用了臨時變量(scratch variable# s-$-1和

5、#s-$-2,這種變量常被用作循環(huán)指針。這里也是利用它們實現(xiàn)條件循環(huán)。程序的基本流程是,首先指定需要抽取的初始記錄條數(shù)#s-$-1和初始可抽取范圍內記錄條數(shù)#s-$-2(1#s-$-2,這就決定了抽樣比例(#s-$-1/#s-$-2,即每條記錄被抽中的可能性為#s-$-1/#s-$-2。然后通過控制#s-$-1和#s-$-2的變化來實現(xiàn)抽樣。具體抽樣由07行語句compute filter-$=uniform (13#s-$-2<#s-$-1完成,其中uniform(1是SPSS中提供的偽隨機數(shù)函數(shù),它可產生一個服從0 1均勻分布的隨機數(shù),統(tǒng)計中常用此函數(shù)模擬隨機抽樣。將該語句變換成co

6、mpute filter-$=uniform (13<#s-$-1/#s-$-2,就很容易理解了,它就是按#s-$-1/#s-$-2的可能性隨機決定當前記錄是否被抽中。若抽中則篩選指示變量filter-$賦值為1,同時#s-$-1減1表示剩下還需抽取記錄數(shù);否則為0。此后#s-$-2減1表示剩下的可抽取記錄數(shù)。這樣反復直到#s-$-2=0表示所有范圍內的記錄都判定完了。程序的巧妙之處是利用可變的# s-$-1/#s-$-2實現(xiàn)精確抽樣,其作用類似于一個杠桿,當抽滿時,#s-$-1=0,compute filter-$=552中國衛(wèi)生統(tǒng)計2005年8月第22卷第4期uniform(13&l

7、t;0就控制剩下的記錄都不會被抽中;若#s-$-1=#s-$-2,則表示還需抽取的記錄數(shù)就是剩下的記錄數(shù),compute filter-$=uniform(1 3<1就控制剩下的記錄都被抽中。明白了程序的原理后就很容易修改了?,F(xiàn)在我們來實現(xiàn)從10012000條中抽取50條,這時只需要對程序作如下改動:11將02行語句中的臨時變量$casenum賦值為1001,即指定抽取范圍的起始值;21在02行語句后增加一條語句:compute#s-$-3=$casenum1,新增加臨時變量#s-$-3來控制范圍起始值的變化,而用臨時變量#s-$-2表示范圍結束值,則抽取范圍內記錄條數(shù)變?yōu)?s-$-2-

8、# s-$-3+1;31將07行和08行語句中#s-$-2改為#s-$-2-#s-$-3+1。整個修改后程序如下: USE ALL.do if$casenum=1001.compute#s-$-1=50.compute#s-$-2=2000.compute#s-$-3=$casenum.end if.do if#s-$-2-#s-$-3+1>0.compute filter-$=uniform(13(#s-$-2-#s-$-3+1 <#s-$-1.compute#s-$-1=#s-$-1-filter-$compute#s-$-3=#s-$-3+1.pute fil

9、ter-$=0.end if.VARIABL E LABEL filter-$50from the first1000cases(SAM2 PL E.FORMAT filter-$(f110.FIL TER B Y filter-$.EXECU TE.運行上述程序就可以實現(xiàn)在10012000條記錄中抽取50條記錄了。具體操作方法是:在程序編輯窗口的菜單中選擇RunAll,程序就會運行,系統(tǒng)會在數(shù)據(jù)集中生成篩選指示變量filter-$,并且在相應的記錄號上加斜杠表示未選中。在實際應用中,可根據(jù)需要重新定義變量$casenum(起始記錄值、#s-$-1(需抽取記錄條數(shù)和#s-$-2(結束記錄值,就

10、可以實現(xiàn)任意范圍內的精確抽樣了。該算法具有普適性,如果將其寫成SAS語言,也就可以在SAS中實現(xiàn)任意范圍的精確抽樣。SPSS是國際通用的統(tǒng)計軟件包,一般應用時都強調它的菜單式的操作界面友好,因此被譽為“非統(tǒng)計專業(yè)人士的首選軟件”。其實它的編程功能也很強大,對菜單功能是一個極好的補充。尤其是系統(tǒng)在對話框中都提供Paste按鈕,大大簡化了編程工作,在此基礎上對程序作一些改動,就可以根據(jù)自己的需要實現(xiàn)許多菜單方式完成不了的功能。(上接第244頁V2=-01150y1-01026y2-01038y3+01311y4+ 01309y5+01351y6+01046y7+01306y8W2=01120x1+

11、01201x2-01194x3+ 01256x4-01018x5-01079x6-01507x7+01542x8+01082x9+01317x10可利用典則變量這一綜合指標代替原來的多變量信息。從標準化指標線性組合的系數(shù)可了解各指標對典則變量的影響大小,系數(shù)絕對值越大,影響越大,對應的變量即為該典則變量的的主要變量,以此可找出各指標組中的主要指標。標準系數(shù)的正、負符號不同,表明影響的方向不同。分析表明反映生命質量的第一典則變量V1主要反映活力(y6、社會功能(y4及精神健康(y5,第二典則變量V2主要反映活力(y6、社會功能(y4、精神健康(y5及總體健康(y8。反映健康觀的第一典則變量W1主

12、要反映睡眠質量(x6、煩惱事件(x7及生活態(tài)度(x3,第二典則變量W2主要反映解壓能力(x8、煩惱事件(x7及飲食習慣(x10。討論本研究分析結果表明,生命質量和健康觀兩者之間存在正相關關系。生命質量的高低主要由活力、社會功能及精神健康來體現(xiàn),而健康觀主要由睡眠質量及解壓能力來反映。生命質量和健康觀的相關主要是第一對典則變量V1和W1的相關,而V1主要由y6、y4及y5決定,W1主要由x6決定,所以主要是活力、社會功能及精神健康和睡眠的正相關,即良好的睡眠使人充滿活力并有良好的社會交往能力及精神健康。第二對典則變量主要是活力、社會功能、精神健康及總體健康和解壓能力的正相關,即良好的解壓能力使人充滿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論