市場調(diào)查:第二講 抽樣技術_第1頁
市場調(diào)查:第二講 抽樣技術_第2頁
市場調(diào)查:第二講 抽樣技術_第3頁
市場調(diào)查:第二講 抽樣技術_第4頁
市場調(diào)查:第二講 抽樣技術_第5頁
已閱讀5頁,還剩184頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第二篇:抽樣調(diào)查調(diào)研方式分為普查與抽樣調(diào)查。普查是指對與市場有關總體的每一個單位進行逐一的、普遍的、全面的調(diào)查。雖然市場普查可以獲得全面的、準確的信息資料。但有調(diào)查耗時、資料時效性差、費用昂貴的局限性,企業(yè)一般不采用普查方式,而采用市場抽樣調(diào)查方式。抽樣調(diào)查是按照一定的規(guī)則從總體中抽取一部分個體單位作為樣本,通過對樣本的調(diào)查研究所獲得的信息資料,來推斷總體的信息資料的方法;因而抽樣調(diào)查也稱作抽樣推斷。抽樣調(diào)查與普查比較樣本調(diào)查總體研究總體抽樣調(diào)查:u費用少u時間快u非抽樣誤差少u存在理論上的抽樣誤差普查抽樣方案的設計抽樣方案的設計 所謂抽樣方案的設計,就是指在保證抽樣能滿足所謂抽樣方案的設計,

2、就是指在保證抽樣能滿足調(diào)查精度要求下,力求調(diào)查結果最經(jīng)濟、最有效。抽調(diào)查精度要求下,力求調(diào)查結果最經(jīng)濟、最有效。抽樣方案設計程序如下:樣方案設計程序如下: 明確調(diào)查的目的,確定所要估計的目標量。明確調(diào)查的目的,確定所要估計的目標量。 明確調(diào)查對象及樣本單位。明確調(diào)查對象及樣本單位。 確定或構置抽樣框。確定或構置抽樣框。 對主要調(diào)查指標的精度提出要求。對主要調(diào)查指標的精度提出要求。 選擇抽樣方法。選擇抽樣方法。 確定樣本含量,給出指標的估計式和抽樣誤差的估算式。確定樣本含量,給出指標的估計式和抽樣誤差的估算式。 制定實施方案的具體辦法和步驟。制定實施方案的具體辦法和步驟。 調(diào)查誤差來源調(diào)查誤差來

3、源 抽樣誤差抽樣誤差是出于設計時有意識地只研究總體中是出于設計時有意識地只研究總體中的一部分,從而在結果中出現(xiàn)的誤差。抽樣誤的一部分,從而在結果中出現(xiàn)的誤差。抽樣誤差本身并不是錯誤的結果,盡管在抽樣設計時,差本身并不是錯誤的結果,盡管在抽樣設計時,判斷上的錯誤可能導致更大的不必要的誤差。判斷上的錯誤可能導致更大的不必要的誤差。 非抽樣誤差非抽樣誤差包括引起了調(diào)查誤差的其他所有因包括引起了調(diào)查誤差的其他所有因素。非抽樣誤差的發(fā)生完全是由于調(diào)查程序設素。非抽樣誤差的發(fā)生完全是由于調(diào)查程序設計和執(zhí)行上的錯誤和不足。非抽樣誤差被認為計和執(zhí)行上的錯誤和不足。非抽樣誤差被認為產(chǎn)生于錯誤的定義、制表計劃中的

4、不完善、從產(chǎn)生于錯誤的定義、制表計劃中的不完善、從所有樣本成員獲得問答的失敗、等等。所有樣本成員獲得問答的失敗、等等。 誤差與精度一次抽樣誤差:(隨機變量)平均實際誤差:E(不能反映誤差大?。┚秸`: 2 EMSE 22EEEEMSE方差: 2EEV偏倚: E誤差限與置信度絕對誤差限:dP相對誤差限:rP無回答現(xiàn)象無回答現(xiàn)象 122221111YYWYWYWYY例舉二個糾正無回答現(xiàn)象的方法:例舉二個糾正無回答現(xiàn)象的方法: 對某些問題回答的數(shù)據(jù)以該問題回答數(shù)據(jù)的平均值代替;從對某問題己回答的數(shù)據(jù)中,隨機地抽取,以此填補無回答的數(shù)據(jù)。 避免“無回答”現(xiàn)象方法提高問卷的回收率。提高問卷的回收率。調(diào)整

5、數(shù)據(jù)分析方法。調(diào)整數(shù)據(jù)分析方法。多次訪問多次訪問Polize-SimmonsPolize-Simmons校正校正 Polize-SimmonsPolize-Simmons校正方法校正方法 假設所有的訪問是在除星期六、日之外的五個晚上進假設所有的訪問是在除星期六、日之外的五個晚上進行,只要我們在調(diào)查問卷中附帶一個問題:行,只要我們在調(diào)查問卷中附帶一個問題:“除星期六、除星期六、日之外,您在今晚之前四個晚上有幾天在家日之外,您在今晚之前四個晚上有幾天在家? ?”通過這個通過這個問題的回答,實際上了解被調(diào)查者晚上在家的頻率問題的回答,實際上了解被調(diào)查者晚上在家的頻率( () )的大致估計:的大致估計

6、: 51 t40404040111515ttttttttttpstntyntntyny概率抽樣方法概率抽樣方法 l簡單隨機抽樣 l分層抽樣 l分群隨機抽樣 l機械抽樣 l樣本容量的確定 簡單隨機抽樣從總體的從總體的N N個單位中,以同等概率地個單位中,以同等概率地隨機抽取隨機抽取n n個單位,組成樣本進行觀測,個單位,組成樣本進行觀測,以推斷總體參數(shù)的抽樣方法,稱為以推斷總體參數(shù)的抽樣方法,稱為簡單簡單隨機抽樣隨機抽樣。l 簡單估計及其無偏性YEy無偏性:NYYNii/1待估量:n/yyn1ii估計量:YNYYNii1待估量:n/yYn1iiNyN估計量:YYE無偏性:估計量的無偏性證明:估計

7、量的無偏性證明:YYnnNnNnyynNyEiNin1111111方差估計量:方差估計量: 2211YnYYYnNyVarniii njnkjiiinYYYYnYYnNkjj122221NiiYYNNnNn12111nSfnNnN/)1 (122方差的無偏估計量方差的無偏估計量niiyyns12211 niiYyYyn121121211YynYynnii221SnNnNYyEZnzEnYyEi22Yyzi令2121SNNnYYNnNii確定樣本容量221)()(uuVardVarnnnnccct10假設費用函數(shù)為:1dn設d是調(diào)查絕對精度,即)(21nVarud1rn)()(2121nnCVu

8、Varur設r調(diào)查相對精度逆抽樣 (希缺項目抽樣調(diào)查) 事先確定一個大于事先確定一個大于1 1的整數(shù)的整數(shù)m m,從總體中隨機,從總體中隨機地逐次抽取樣本,直到出現(xiàn)第地逐次抽取樣本,直到出現(xiàn)第m m個個“廢品廢品”(或(或具某特性的單元)為止。此時我們實際抽取得樣具某特性的單元)為止。此時我們實際抽取得樣本容量本容量n n是一個隨機變量。是一個隨機變量。 11nmp212211YynEYyEnEsnii211111SNNnNnnNNnn2S估計量方差的估計及區(qū)間估計snfNuyNsnfNuyNsnfuysnfuysnfNYvVarsnfyvyVar1,1Y1,1y1)()Y(1)()(222的

9、區(qū)間估計:的區(qū)間估計:的估計:的估計:總體比例的估計l 對總體的描述PNANYY0i, 1NAPPA1于是:則有:,否則性個抽樣單元具有某種特若總體中第有:元在總體中所占比例為具有某種特性抽樣單抽樣單元的總數(shù)為總體中具有某種特性記AYYYNiiil 對總體的描述P1Q1)1(11-N11-N1Y-Y1-N121222N1ii2其中:)(PQNNPPNNNPNPYNYSNii估計量及性質(zhì)pqpqnnyynsynapnii1:1)(11:212其中樣本方差為樣本比例為:)()(E11111)()(111)()(Var:PYEE22yVarpvpqnfpqnnnfsnfyvpvPQNNnfSnfyV

10、arpyp方差估計的期望:方差的估計:方差期望:置信區(qū)間1)1 (,1)1 (npqfupnpqfup:總體比例的區(qū)間估計為樣本量的確定l樣本量確定的原則與主要考慮因素l 費用 + 精度 n的增函數(shù)n的減函數(shù)cnc0TC 費用函數(shù)為:)(d Su系為:絕對誤差與標準差的關)()()()(Cvr 無偏時關系為:相對誤差與變異系數(shù)的SuESuu估計總體均值或總和時的確定方法l 設方差上限為V,則:NnnnVSnNVSVSSNVNSnnNVSnNVSnNnN/1 /)/(1/ )( 0020222222則:令:l 給定絕對誤差d時,將:2)(udV 代入有:20)(dSunl 給定相對誤差r時,將:

11、Yrd 代入有:為總體變異系數(shù)為估計量變異系數(shù),其中,YSCYSCYrSun22201)( 總體方差和總體變異系數(shù)均需要估計總體方差和總體變異系數(shù)均需要估計估計總體比例時樣本量的確定l 當待估計參數(shù)是P時,估計量是p。l 第一種情形給定p絕對誤差限d,則:)1(11)1()1(1222222222222dPQuNPQdudNPQuPQNunPQnuPQNudNnNnNnPQud1)/N-(n1nn00220則:若令:PQdun1)/N-(n1nnPrrPdr00220同樣有:代入,有:,用誤差第二種情形:給定相對Qunl 第三種情形,給定方差上限V1)/N-(n1nn000同樣有:VPQnl

12、第四種情形,給定變異系數(shù)上限C1)/N-(n1nn0020同樣有:PCQnl 特征單元比例很小時可采用逆抽樣逆抽樣方法樣本含量為n的概率是: mnmQPmnmn!1!1求出所需樣本的平均含量? 11nmp是P的無偏估計分層抽樣 分層抽樣分層抽樣是對所要認識的總體,利用已知總體是對所要認識的總體,利用已知總體有關調(diào)查指標的信息,先依據(jù)某種標準把總體劃分有關調(diào)查指標的信息,先依據(jù)某種標準把總體劃分若干層,然后在每一層中隨機抽出一部分樣本單位若干層,然后在每一層中隨機抽出一部分樣本單位構成樣本的一種抽樣方法。構成樣本的一種抽樣方法。 分層抽樣的特點和適用場合:v可以得到層的數(shù)據(jù)v便于組織,方便實施管

13、理v樣本更具代表性v提高精度l 什么是分層抽樣和分層隨機抽樣簡單估計量及其性質(zhì)Lsthhhh=1Lsthhh=11.YW Y ,Yh2.YY ,Yh總體均值的估計: 為 層的均值估計。總體總和的估計: 為 層的總和估計。對總體均值或總量的估計估計hhLLsthhhhsth=1h=1hhLLsthhsth=1h=11.YYEYWEYWYY,YY2.YYEYEYYY,YY若 為 的無偏估計,則: 故為 的無偏估計。若 為 的無偏估計,則: 為 的無偏估計。對總體均值或總量的估計無偏性L2sthhh=1Lsthh=11.Var(Y )W Var(Y )2.Var(Y )Var(Y )因為層間抽樣獨立

14、,則: 對總和而言,則: 對總體均值或總量的估計方差hhL2sthhh=1Lsthh=11.v(Y )Var(Y )v(Y )W v(Y )2.v(Y )v(Y )設為的估計,則: 對總和而言,則: 對總體均值或總量的估計方差估計Lsthhhh=1Lsthhhhh=11.yW y ,yh2.YN y ,N yh總體均值的估計: 為 層的樣本均值??傮w總和的估計: 為 層的總和估計。對總體均值或總量的估計分層隨機抽樣的估計hhLLsthhhhsth=1h=1LLsthhhsth=1h=11.yYEyWEyWYY,yY2.EYN EyYY,YY因為 為 的無偏估計,所以: 故 為 的無偏估計。同理

15、對總體總和估計有: 故為 的無偏估計。對總體均值或總量的估計分層隨機抽樣估計的無偏性L22hsthhh=1hL22hsthhh=1h1.1fVar(Y )WSn2.1fVar(Y )NSn對分層隨機抽樣而言: 對總和而言,則有: 對總體均值或總量的估計分層隨機抽樣的方差L22hsthhh=1hL22hsthhh=1h1.1fv(Y )Wsn2.1fv(Y )Nsn均值估計的方差估計為: 對總和而言,有: 對總體均值或總量的估計分層隨機抽樣的方差估計Lsth hhh=1Lsth hh hh=11.pWp ,ph2.AN p ,N ph總體比例的估計: 為 層的樣本比例。具有某種特征個體總和的估計

16、: 為 層的具有某種特征個體總和的估計。對總體比例的估計估計hhLLsthhhhsth=1h=1LLsthhhhsth=1h=11.pPEpWEpWPP,pP2.EAN EpN PA,AA因為 為 的無偏估計,所以: 故 為 的無偏估計。同理對總和估計有: 故為 的無偏估計。對總體比例的估計無偏性L2hhsthhhh=1hhL2hhsthhhh=1hh1.1 fNVar(p )WPQnN12.1 fNVar(A )NPQnN1對分層隨機抽樣的比例估計而言: 對總和而言,則有: 對總體比例的估計方差L2hsthhhh=1hL2hsthhhh=1h1.1fv(p )Wp qn -12.1fv(A

17、)Np qn1均值估計的方差估計為: 對總和而言,有: 對總體比例的估計方差估計分層抽樣與簡單隨機抽樣比較khkhhhhhkhkhhhhihihhkhihikhihiNiiYYNYNNYYNYNSNYNYYYYYYYShhh112211221211211212)() 1()()()()()() 1(WNNNhhhhNNN111khhhkhhhYNnyVarYWSW1212)()11()(0)()11()()(21khhhstYNnVaryVarYWy若若 Wnhkn如果不考慮近似的因素 011111)()(1212khhhkhhhstSNYNyNNYNNnVaryVar各層樣本量的分配l 比例

18、分配分配hhhhnNWnN比例分配:hhhnnffNN比例分配時有:l 比例分配自加權樣本hnLLhprophhhih=1h=1i 1hn1yW yyyn n比例分配時有:此時稱為自加權樣本.l 比例分配方差及估計L22prophhh=1L22hhh=1L2prophhh=111y)W SW S.1y)W swwffSnnSfn比例分配時方差表達式有: Var(其中為加權方差此時的方差估計為: v(l 比例分配估計總體比例時的情形Lprophh=12LLhhhprophhhh 1h 1h2LLhhhprophhhh 1h 1h1aN P Q1 f1 fVar(p)W P QnNN1n1 f1

19、f(p)WqnN1npnn p qpn比例估計為:p方差為:方差估計為:vl 最優(yōu)分配分配T01222hhh11hCccW SW SV=nNLhhhLLhhhn費用函數(shù):方差函數(shù):hhhhhhhhhhLLhhh 1h 1Lhhhh 1c nncK(K),V CW SW S / nWnK,1,2,WhnnK:WWn /nhhhhhhhhShLcScSScc h=當:為常數(shù) 時達到極小值.上式等價于:對 求和 =于是l 最優(yōu)分配Neyman分配hhLhh 12LL2minsthhhhh 1h 1Wn nWNeyman11V(y )W SW SnNhhSS=當各層的費用相等時:稱為分配,此時方差最小

20、為: l 最優(yōu)分配總體比例時的情形hhhhLhhhh1hhhLhhh1WP Q/ cn nWP Q/ cN e y m a nWP Qn nWP Qhhhh=最 優(yōu) 分 配 :分 配 為 : 子總體的估計問題的提出l 抽樣單元可以按某種屬性劃分,例如:人可以按性別、職業(yè)、年齡劃分;企業(yè)按行業(yè)、規(guī)模等,感興趣的類別稱為子總體。l 子總體均值的估計)()(n1i(j)ij)(N1i(j)ij)(jjyn1:jYN1jjjjjYyyY估計個子總體的樣本均值第個子總體的總體均值:第2)()()(1)(EjjjjjjSnfyVarYy方差:期望:22jj()2()()()1E()()NVar()11()

21、1jjjjjjnjjjiijjsSnNnnEEfnNNyfv yyynn 改 寫 為由 此 可 構 造 :的 估 計l 子總體總量的估計jnijiNiiiiynNUNUYU1)(n1ii(j)(j)1(j)un1NuNYYY0ji,的估計:于是我們可以構造則子總體總和:,否則。個子總體。個單元屬于第第入如下變量:為了估計總體總量,引2)(212)(2j2)(12i222(j)(j)(111)()(11U-U1-N1)1 ()YVar(YEjjjjjNijjiNiuujYQPNNSNNYNPYNSSnfNYj其中:方差:期望:2)(21)()(2)()(2)(212i22)() 1()1 ()(

22、)()(111u-u1-n1:jjjnijjijjjjjjjniuuyqnpyynnfNYvYVaryqpnnsnnsSj的估計:因此估計可以用樣本方差估計4.4樣本總量的確定l4.4.1影響樣本總量的因素l目標量精度要求l樣本分配l總費用要求l分層精度要求樣本總量的確定l 估計總體均值的情形222hhhhhhhhh222hhhhhhh22hhhh2hhh220hh02hhhhhVW SW SV=nN nnh=1 2LW SW S1V=nNW S / n1V+W SVnW S1nn1V1+W SNV設方差上限為, 則有:,對某種確定的樣本量分配有:, ,則有:由此可以解出: 令: 則:hh20

23、hhh00W1 nWSVn n1+n /N特別,對于比例分配,則hhhhhh20hhh02hhhW SNeymanW S1nW SVnn11+W SNV對分配,有 令: 則:hhhhhhhhhhhhhhhh2hhhWS / CWS / CWSCWS / C n=1V+WSN對一般最優(yōu)分配,hst2222hhhh22hh2hyddV=uW S /nd1+W SuN對任意配,給定的絕對誤差 , 則,于是: hst2222hhhh22hh2hyrrYV=uW S /nrY1+W SuN對任意配,給定的相對誤差 , 則,于是: l 估計總體總量的情形stst2YVyVV=N給定 的方差上限 ,則 的方

24、差上限為 則,將該式代入上節(jié)的結果既可得到相應的內(nèi)容l 估計總體比例的情形2hhhhhNPSPQN1442若估計總體比例 ,則 =,將該式代入 .節(jié)的結果既可得到相應的內(nèi)容l 給定費用時樣本總量的確定方法T0hhhhT0hhhCcc nC -cnc Neyman對簡單線性費用函數(shù):對任何樣本分配有: 將比例分配、分配、一般最優(yōu)分配代入上式既可得到相應的結果。若干進一步問題多指標情形樣本量的分配l 最優(yōu)分配法khjhj 1jh1nnh 1 2Lknj, ,為第個指標所得的最優(yōu)分配。l 查吉特法hhjh2hjhjstjminstjhjminsthjnh2jhjh2jhhjnjnnnVyVy1RVV

25、ynn1 M inRVknnnn ,設實際樣本分配為,第 個指標的最優(yōu)分配為定義:極小化: 得:與平均法相近。l 耶茨法 2kLk2hTjjstjjh0j1h1j1hT0hhh2Lk2hT0T0hhjjhhh1j1hhhhhhhhhhkW La V a rya SLnCccnW LLCccna Snn WA/c nWA/cA,考 慮個 指 標 的 方 差 函 數(shù) 作 為 損 失 :()線 性 費 用 函 數(shù) : 極 小 化由 柯 西 - 許 瓦 茲 不 等 式 得 :其 中 :k2jjhj1a Sl 事后分層psthhhhst22sthhhh2hh2prophh2hyW yn0n1.E(y )

26、Y1f12.E Var(y )W S1-WSnn1 V1-WSn總體均值估計:固定且大于 ,且 充分大時有:不等概率抽樣必要性和優(yōu)點:l總體中個體對總體貢獻的“不平等”要求樣本抽取時,也應該“不平等”。l在多階抽樣中,初級單元所含的次級單元個數(shù)差異大,要求我們區(qū)別對待。l提高精度,要求知道所有輔助變量。主要分類放回不等概率抽樣l 多項抽樣與PPS抽樣Niii=1NiZi=1NZ 1nn 設總體大小為 ,對其進行放回抽樣,在每次抽樣中,抽中第個單元的概率為 , ,= ,獨立進行 次抽樣,抽到 個單元(可重復),稱這種方法為多項抽樣。N12iNiiiiii=1ttt12N12Ntit0tntntt

27、nZ ZZttt 記 為第個單元在樣本中出現(xiàn)的次數(shù),顯然對每個有:, 為隨機變量,且所有 的聯(lián)合分布為如下的多項分布:! ! !這就是多項抽樣的術語來源。iii0N0ii=1MMZMMMPPS 但每個單位具有一個度量其大小或規(guī)模的變量 時可?。?=其中:=,此時每個單元在每次抽樣中時的入樣概率與單元大小成比例,稱這種特殊的多項抽樣為與大小成比例有放回的不等概率抽樣,簡稱抽樣。l多項抽樣的實施i0i0ii1112i-1iN-1Njjjj0j=1j=1j=1j=101.Hansen-HurwitzZi=1NMM =M Zi=1NMi1M1M +1MM2M +1MiM +1MMN1Mm代碼法(法)對

28、于給定的一組 , , ,總可以找到使得每個, , 為整數(shù),然后對進行累計賦予第個單元,即賦予單元 ,+賦予單元 ,賦予單元 , ,=賦予單元 。每次抽樣時產(chǎn)生的隨機數(shù),設隨機數(shù)為 ,則對應代碼包mnn含 的單元入樣,如此重復 次即可得到 個樣本單元。l 多項抽樣的實施1100047325163在 , 范 圍 內(nèi) 產(chǎn) 生隨 機 數(shù) :, 則對 應 單 元、 、 入 樣 。表7.1代碼法進行PPS抽樣iZiMi累計Mi代碼10.08 88 1820.10 1018 91830.17 1735 193540.06 641 364150.24 2465 426560.09 974 667470.05

29、579 757980.07 786 808690.04 490 8790100.10 10100 911001.00 M0=100i1 i Ni422.LahiriM MaxM1 N1 Mi mm Mi49M6 9,28M10 8,2mm *法設=,在和之間產(chǎn)生隨機數(shù)對(, ),若則對應的第個單元入樣,否則重新抽取隨機數(shù)對。例如,在上例中,如產(chǎn)生隨機數(shù)對為:(, ),則因為故需要重抽,重新產(chǎn)生隨機數(shù)對為:( , ),則因為故單元 入樣。l 漢森-赫維茨估計量及其性質(zhì)0112Ni1-111. EY (7.4)1Y2. VarZY (7.5)Z VarnniiiiiiiiiyyMnznmnHHHH

30、HH漢森(Hansen)赫維茨(Hurwitz)估計量: Y有如下性質(zhì):無偏性Y方差Y2Nij1Y1YZ Z (7.12)ZZjiiijijnHHYl 漢森-赫維茨估計量及其性質(zhì) 2n113. v (7.6)(1) E vVariiiyn nzHHHHHHHH方差估計YY方差估計是無偏的,即:YY不放回不等概率抽樣l包含概率與PS抽樣l霍維茨-湯普森估計量及其性質(zhì)ln=2的嚴格PS抽樣ln2的嚴格PS抽樣ln2的兩種非嚴格PS抽樣l 包含概率與PS抽樣ii jNii = 1Ni jiijNNi ji = 1ijP r () P r (j)1 .= n2 .=n - 113 .=nn - 1 2

31、ii 單元被包含到樣本的概率: 任意兩個單元被包含到樣本的概率,滿足以下性質(zhì):iiNii00ii=1iiPPSMZM /M MM nZ 7.16PS與抽樣類似,我們期望 與單元大小成比例,仍記(=),則有滿足上式的不放回抽樣稱為不放回與大小成比例的不等概率抽樣,簡稱抽樣。l霍維茨-湯普森估計量及其性質(zhì)1()( hom) 7.171.EY 7.18AiHTiiHTHorvitzTpsonyYYn霍維茨湯普森估計的定義:霍維茨 湯普森估計具有以下性質(zhì):無偏性:iNijij2iij1i=1iij2Njiijiji=1ijiiji2.0,1,1Var+2 7.18Var 7.193.0,0, ,1,1

32、 NNHTiij iNHTj iHTiNYYYYYYYi jN ijv Y 方差表達式有兩個,此時假定 方差估計,此時假定nnijij2ij21i=1ijij2nijijjiYGSi=1ijijy +2 7.20 7.217.21niij iinHTj iy yyyvY 定義的方差估計由耶茨(Yates)-格倫迪(Grundy)-森(Sen)給出的。ln=2的嚴格PS抽樣iiiij1.(Brewer)Z0,1,Z 1 ZA.1 2ZiB.N-1ZiN布魯爾方法1設抽取步驟為:2第一個單元抽取按與成比例的概率抽取 假定抽取的單元為總體中的第 個單元。 第二個單元則在剩下的個單元中按與 成比例 的

33、概率抽取。l例:iii0iii115i22MZM / M ,Z1Z1.28570 112Zr0.6711.2857r0.97842ZZ0.8520 1r0.4980.852r0.4244 此時為城市市區(qū)人口數(shù),的累計總值是。在,內(nèi)產(chǎn)生均勻分布隨機數(shù),乘以得=,于是第二個城市入樣。第 個單元抽取要先去除后,重新累計,總值為,在,內(nèi)產(chǎn)生均勻分布隨機數(shù),乘以得=,于是第個城市入樣。iii1212HTB121222121212HT121222121212n22ZnZ 7.16yyyy1YY2zz11 v(Y)=yy2y y 時,可以證明: 此時Horvitz-Thompson估計為: 而方差估計為:Y

34、ates-Grund2121212HT1212yy v(Y)= y-Sen方差估計此時只有一項:l n2的嚴格PS抽樣i*iiii1.(Midzuno)1Z,1,(1)PSZA.ZB.n-1N-1nZniNn NNn水野方法設則水野的方法是嚴格的抽樣,抽取步驟為:n(N-1)n-1第一個單元抽取按與=-成N-n 比例的概率抽取。剩下的個樣本單元在剩下的個總體單 元中按無放回等概率的方式抽取??梢宰C明:l n2的嚴格PS抽樣iiiiiiiiij2.(Brewer)n 2Z 1 ZA.1ZZ 1 ZB.r11 ZnZ ,nnr 布魯爾方法是 = 時推廣,抽取步驟為:第一個樣本單元抽取按與成比例的概

35、率抽取。第 個樣本單元抽取按與成比例的概率抽取。可以證明:該方法的缺點是難計算,有遞推公式可以利用。iiiiiij3.(Rao)-(Sampford)A.ZiZB.n11ZnZ ,n2n=2n拉奧桑福特方法該方法為重抽法,抽取步驟為:第一個樣本單元抽取按與成比例的概率抽取,設 第 個單元被抽中。剩下的個樣本單元按與成比例的概率有 放回地抽取,若有重復,則放棄重抽,直到樣本中 無重復單元出現(xiàn)為止。可以證明:可以看出在時,與時的布魯爾方法等價。該方法的缺點是難計算,有遞推公式可以利用。iijijiii2.(Durbin)Z0,1,A.ZiB.N-111Z12Z12ZnZ2ZiN德賓方法1設抽取步驟

36、為:2第一個單元抽取按與成比例的概率抽取, 設抽取到的為第 個單元。第二個單元則在剩下的個單元中按與 成比例的概率抽取。同樣可以證明,此時同樣有。l n2的兩種非嚴格PS抽樣ijikijiii1.(Murthy)A.ZiZB.1-ZjZC.1-ZZkD.nnZ莫蒂方法該方法的實現(xiàn)方便、自然,抽取步驟為:第一個樣本單元抽取按與成比例的概率抽取,設 第 個單元被抽中。第二個樣本單元抽取按與成比例的概率抽取, 設第 個單元被抽中。第三個樣本單元抽取按與成比例的概率 抽取,設第 個單元被抽中。以此類推可以抽出所有 個樣本單元。該方法是非嚴格的,因為,且計算復雜,此時估計也不使用Horvitz-Thom

37、pson估計。1nigggingRHCgg 1g2.(Rao)-(Hartley)-(Cochran)nNNZggyZzZgZy YZ z*拉奧哈特利柯克倫方法 將總體隨機分為 個組,每組單元數(shù)為,在每組內(nèi)按與 成比例的概率抽取一個單元組成樣本,設第 組抽取的單元為 ,指標值記為 ,相應的 值為 ,為第 組的 值的和,則總體總和的估計為: 7.50分群隨機抽樣 分群隨機抽樣分群隨機抽樣是把調(diào)查總體區(qū)分為若干群體,然是把調(diào)查總體區(qū)分為若干群體,然后以單純隨機抽樣法從中抽取某些群體并對這些后以單純隨機抽樣法從中抽取某些群體并對這些群體進行普查的方法。群體進行普查的方法。 群體劃分的基礎主要是區(qū)域或

38、團體,調(diào)查整個群體群體劃分的基礎主要是區(qū)域或團體,調(diào)查整個群體比較方便,費用也低,因此,能降低整個調(diào)查費用。比較方便,費用也低,因此,能降低整個調(diào)查費用。由于調(diào)查前可能缺少詳細的總體名冊,如果使用分由于調(diào)查前可能缺少詳細的總體名冊,如果使用分群抽樣,抽樣就容易實施。群抽樣,抽樣就容易實施。群大小相等時的分群抽樣群大小相等時的分群抽樣 群大小不同分群抽樣群大小不同分群抽樣 l記號ijijY i 1,Nj 1,Mijy i 1,nj 1,MijnfN記:=, =為總體中第 個群中第 個基本單元的指標值,記:=, =為樣本中第 個群中第 個基本單元的指標值為抽樣比iiiiiiiiiiNniiNnii

39、 Y,Yi YY / M,M Yi Y/ N,/ n Y/ N,/ nyyyyyyyMMijijj=1j=1ii=1=1ii=1=1=Y=y=分別為總體和樣本中第 個群的指標和,簡稱群和;=/=分別為總體和樣本中第 個群指標按基本單元的均值;=Y=y分別為總體和樣本按基本單元的均值;=Y=y分別為總體和樣本按群的均值;iiii1.Yii 2.Yii3.Y4.Yyyyy例如:在云大校內(nèi)對學生進行生活費支出調(diào)查,班級為群,學生為基本單元。、 分別為校內(nèi)第 個班級和抽到樣本第 個班級的生活費支出之和;、 分別為校內(nèi)第 個班級和抽到樣本第 個班級的生活費按學生的平均值;、 分別為全校內(nèi)和所有樣本按學生

40、的平均生活費支出;、 分別為總體和樣本按群的平均生活費支出;NMnM2222jjij 1ij 12Nn222bbiiNMnM2222wjiwjiij 1ij 111 SY ,syNM-1nM-1 MM SY ,syN-1n 111 SY,syN M-1n M 1ii=1=1ii=1=1ii=1=1=Y=y 分別為總體和樣本按基本單元的總方差;=Y=y- 分別為總體和樣本的群間方差;=Y=y- 分別為總體和樣本的群內(nèi)方差;l 估計量及其性質(zhì)nmnijii= 1j= 1i= 1NMNijii= 1j= 1i= 121 11 y=yyn mn 11 Y =YYN MN1 . E yY (8 .1 )

41、 (8 .2 )1 -f12 . V a r(y)= (8 .3 )n1 NiiYYN 樣 本 按 基 本 單 元 的 均 值作 為 總 體 均 值 的 估 計的 估 計 , 有 如 下 性 質(zhì) :,21 -f = (8 .4 )n MbS 21221-f12. Var(y)= (8.3)n11-f = (8.4)nM1-f3. v(y) = (8.10)nMNiibbY YNSs 22211122222222: NM-1 S 111: S11NM-1111nM-1NNMiijiiijbwbwbwMYYYYNSN MSNSN MSsnsn Ms因為所以同理: 22bi1N2i122wiji1j

42、=121j=122221 s /M=y -yn-11S / MY -YN-111 s =y -yn111SN1S:1 S11 8.8NM-1niinMiNMijiibwMYYMNsNMs2b2w顯然: 是的無偏估計同理: 是的無偏估計故可構造的無偏估計l 例:月人均食品消費調(diào)查12120.058.1 N=510n=12,M=8,f=0.023441y= =2620.5/12=218.375 121-fv(y) =nM(y) = v(y)yv(y)iibys例解:,=144.3089s =12.013= 194.83,241.92 l 群內(nèi)相關系數(shù)與設計效應ijikc2ijNMijiki=1jk

43、NM2iji=1j=1NMijiki=1jk2EY -YY-Y 8.11EY -YY -YY-Y/ NM (M1) / 2 Y -Y/ NM2Y -YY-Y M -1NM -1 S 整 群 設 計 的 效 應 與 群 內(nèi) 單 元 的 相 似 性 有 關 系 ,所 以 我 們 首 先 引 入 群 內(nèi) 相 關 系 數(shù) 的 概 念 : 8.12 cN2i22i=12c2ranranYy11 f1Var yVar yY-YMnM N-11 f S1M-1 8.20nM1 fVyS nM:Var y deff= 1MVy利用群內(nèi)相關系數(shù) ,總體均值 的估計 的方差為:同樣樣本量時,簡單隨機樣本的方差為:

44、 故整群抽樣的設計效益為c-1 8.21l 群內(nèi)相關系數(shù)與設計效應N22bii=12NNM2iiji=1i=1j=1NMM2ijijiki=1j=1jk222b1SY -YMN-1Y -YY -Y Y -YY -YY -Y (1)(1)(1)MN-1 S1(1)(ccNMSNMMSMN 注 意 到 :而 : 于 是 : 222bc222b222wwc221)MN-1 S(1) 8.15(1)(1)S 8.16(1)NMSS 11 (1)MSNMSMNMSSMSNMSS 同 理 : 8.17估計總體比例的整群抽樣l 群大小相等簡單隨機抽樣簡單估計l 群大小不等簡單隨機抽樣比估計群大小相等情形 1

45、12211 1-fVarn11-fn(n-1)nniiiiinippannMPPpNpppNi=1i=1總體比例的估計為:其方差為: 方差的無偏估計為: v群大小相等情形 2ranranM (8.26)VNPQNM-nM1-fV (8.25)NM-1nNiPPpPQPQpnMMi=1估計總體比例時整群抽樣的設計效應為:Var(p)deff=其中簡單隨機抽樣的方差為: 群大小相等情形電話擁有情況調(diào)查112N=5102M=8f n N 0.0223441152.08%nnM1-f( )=0.0020445n(n-1)( )nniiiinipav pppv pi=1解:,n= , = / =小區(qū)電話

46、擁有率為:p=4.52% 群大小不相等情形ii11ima 8.27mmpRniiniiapiii仍然簡單隨機抽群,記抽到群的大小為 (M ),群中具有某種特征的個體數(shù)為 (A ),于是總體比例的估計為:視 (M )為輔助變量,則 為比率估計 。22222222n1. E8.281-f2. VarnM11-f 8.29nM11-f18.31nm1iiiiniiAPMpNMPPNpmppnNi=1Ni=1i=1于是 大時有:(p)P 3.方差的估計為: v 群大小不相等情形性別比例情況調(diào)查nnniiii=1i=1i=111nniii=1i=1222256m=196a =101b =95, m=3.

47、5ab1019551.53%,48.47%196196mm1-f()()2=0.0004838nm()() 220nniiiiamamv pv psssv pv p(男)(女)(男)(女)(男)(男)(男)(女)解:n=,p=p=pp= . % rancc0.5X0.5 V0.0012761960.0004838 Deff=0.38=1+(M-1)0.0012760.381 0.2482.5 解:同樣樣本量下簡單隨機抽樣的方差為:l記號ijiiji1Y i 1,Nj 1,Mijy i 1,nj 1,mijNiiM0記:=, =為總體中第 個群中第 個基本單元的指標值,記:=, =為樣本中第 個

48、群中第 個基本單元的指標值 M是總體中所有基本單元的總數(shù)。記號imiiiiiiiiiiiimnNniij0ni1iiji Y, Yi Y Y /M , m Yi Y/M , /nmYijyyyyyyyiiiMijijj=1j=1ijM=1 j=1=1=1=1=Y=y=分別為總體和樣本中第 個群的指標和,簡稱群和;=/=分別為總體和樣本中第 個群指標按基本單元的均值;y=Y=為總體按基本單元的均值,Nnii Y/N, /nyyii=1=1而 不是樣本按基本單元的均值;=Y=y分別為總體和樣本按群的均值;l 按簡單隨機抽樣抽群 nii2N2i2n2i N YyNy 8.33n1.EY=YYN (1

49、-f)2. Var Y 8.34nN1N (1-f)3. v Y n1yyn=1i=1i=1一、總體總和的簡單估計為:=無偏性: Y方差: =方差估計:= 8.35l 按簡單隨機抽樣抽群 niiR00RniiR2N222iii y Y MM Y 8.38m1.EYYYMMN (1-f)N (1-f)2. Var YnN 1n=1=1ii=1二、總體總和的比估計為:=近似無偏: YY近似方差:= 2Ni2nnn2RRiiiY 8.41N 1N (1-f) 13. v Y Y2Y 8.43n1iiymymn=122ii=1=1=1方差估計:=l 按簡單隨機抽樣抽群月獎金00RRRRN=790,n=

50、20,1-f=0.9747,M3372081. Y=42,603,357 Y=Y/M126.34 v(Y)=1035.3166 s(Y)= v(Y)=32.18 2. Y v(Y )=13.2422 s(Y )= v(Y )=3.64 解:簡單估計比估計=105.55 l 按PPS抽群ii00HH01111HH2NHH12nHHHH1MZPPSM1M Y 8.44nn11nn1.EYY12.Var Y8.46n13.YYn(n-1)nniiiiiinniiiiiiiiiiiiyyM yzmyyymYZYZyz設:,抽群,則:其中:無偏: 方差: 方差估計:v 8.48l 按PPS抽群季運輸量0

51、HHHH0HHHH0N=48,n=10,M186 Y=495392.4 y=Y/M2663.4 v(y)=2740.18 s(y)= v(y)=52.3468 s(Y)= v(Y)=M v(y)=9736.5解:機械抽樣 機械抽樣機械抽樣是將總體單位看成有秩序的隊列,然后按相等是將總體單位看成有秩序的隊列,然后按相等的距離或間隔抽取樣本單位的抽樣方式。的距離或間隔抽取樣本單位的抽樣方式。 假定總體大小為N,樣本量為n,為方便起見設N=nk,在1k之間產(chǎn)生隨機數(shù)r,以r為起始單元,每個k個單元抽取一個單元作為樣本單元,k成為樣本間距,若Nnk時,則樣本量可能為N/k或N/k+1起點rr+kr+2

52、kr+3k系統(tǒng)抽樣定義及實施方法 為克服直線性系統(tǒng)抽樣的缺點,拉希里(Lahiri)提出一種替代方法,稱為圓形系統(tǒng)抽樣法。如:N=55 ,n=9,就取k=6,在1到55之間取一個隨機起點。例如r=42,則被抽中的單元是42,48,54,5,11,17,23,29和35 。當單元按平面排列時,可采用二維系統(tǒng)抽樣,設N=nk,k=lm,共有n格子,每個格子有k個單元,隨機抽取隨機數(shù)對(i,j),il,jm,則每個格子中對應坐標(i,j)的單元入樣。系統(tǒng)抽樣的特點及其局限性u實施簡單。u易為非專業(yè)人員接受。u系統(tǒng)抽樣受單元排列順序的影響。u直線抽取法時,若Nnk,則樣本均值不是總體均值的無偏估計。u

53、抽樣誤差估計有困難等概率系統(tǒng)抽樣等距抽樣l 估計量及其性質(zhì)表10.1N=nk時k個系統(tǒng)樣本的組成樣本號12rk1Y1Y2YrYk2Yk+1Yk+2Yk+rY2knY(n-1)k+1Y(n-1)k+2Y(n-1)k+rYnk均值y1y2yryk1111EYEYnnsyrrjrjjjsysysyyyyYnnNnkyNnkyy總體均值的估計記為:時,有:時,故 是有偏的。3114710258369N=101EE31 111YYYYYYYYYY3 433syrrryyy例如:,則sy nNnysyyN改造為無偏估計的方法:(1)圓形抽樣法組可能的樣本,每組樣本量為 ,每個單元在所有 個可能的樣本中出現(xiàn)

54、 次,故 是總體均值的無偏估計。147102583691 Nk1EYYYY431 YYY 331 +YYY3 =Ysyysy改造為無偏估計的方法:(2)改進的線性系統(tǒng)抽樣 在之間產(chǎn)生隨機數(shù)r,每 個抽取一個樣本單元,當下標超N時,使用N的余數(shù)。4 (y )=101010n*1n*11kN1kNrrsysyrjjksyrjrjyyyE yyYk改 造 為 無 偏 估 計 的 方 法 :(3)使 用 改 進 估 計2w sy221122111221221122w sy2w sy1S(1) 1V ar()=E()11 11 S1S(knrjrjkknrrjrjrjksysyrjknrjrrjNSyY

55、nyYyyyyYyYkNSyyNNknNSNNk n ( )使 用 樣 本 內(nèi) 方 差來 表 示其 中 :2111)knrjrrjyy 是 樣 本 內(nèi) 方 差 。22211Var()=1 (1)2(1)(1)wsysywsyrjruwsyrjknrjrurj uNSynNnE yYyYE yYyYyYnNS()使用樣本內(nèi)相關系數(shù)來表示其中:是樣本內(nèi)相關系數(shù)。2.2.2122.11.Var()=1(1)32(1)(1)1(1)1 wstsywstrjjruuwstrjjknrjjruurj uwstnkwstrjjjrjrjSNnynNNE yyyyE yyyyyyn nkSSyyn kyyk(

56、3)使用層的相關系數(shù)來表示 10.14其中: 10.1層內(nèi)相關系數(shù)。層內(nèi)方差。為層均值1kr。l 估計量的方差與總體單元排列順序的關系1. 隨機排列總體與簡單隨機抽樣相差不多。i222.Yi 15.151ar()=(1) 15.18121(1) 15.1912n1(11)(1) 15.1712systranransystVykVkVkNVVV線性趨勢總體3.周 期 性 趨 勢 總 體抽 樣 間 距 避 開 周 期 時 效 果 最 好 。線性趨勢總體抽樣方法的改進l 中心位置樣本法與首尾校正法i112r- -1, 12(1)1, 2112r- -1, 2(1)10.2215.15Ynrjrjjr

57、kinnkinnkinnnkyyy耶 茨 (Yates)的 首 尾 加 權 法 , 取為 權 , 定 義 : ()則 當 () 滿 足 時 , 有。l 中心位置樣本法與首尾校正法1Y1 3 5 7 9 11 13 15 17 19 21 23 25 27 29n 3YN 15r 11 11 211y1 112111313(251)3(251)y11112113225225ysy例:設總體為: , , , , , , , , , , 抽取 = 的系統(tǒng)樣本,用耶茨估計總體均值 。解:=,n=3,k=5。不妨設 = ,則觀測值為: , , 于是: 而耶茨加權估計為: 1 0.41133.6153l

58、對稱系統(tǒng)抽樣塞蒂對稱等距抽樣辛對稱等距抽樣起點對稱點起點對稱點等概率系統(tǒng)抽樣的方差估計l 方差估計的形式21211.1 f vsnN-n 1 10.27 nN1nisyiyyn視系統(tǒng)樣本為簡單隨機樣本, 定義方差估計:/2222211/22221212.n1 f 11 vnn/22N-n 10.28 n Nniiiniiiyyyy設 為偶數(shù),將樣本順序分為兩組, 定義方差估計:1231112113.1 f1 vn 2 n-1N-n 10.29 2n(n-1)Nniiiniiiyyyy從第二個樣本單元開始,與上一個組成一組, 定義方差估計:10.4等概率系統(tǒng)抽樣的方差估計l 10.4.2各種方差

59、估計的適用場合1233241.2.3.4.vvvvvv適用排列順序隨機的情形。適用多種情形(周期、線性、隨機排列), 需要樣本量較 大。適用多種情形(周期、線性、隨機排列), 需要樣本量較 小。適用多種情形(周期、線性、隨機排列), 需要樣本量最大。固定樣本調(diào)查技術固定樣本調(diào)查技術 l固定樣本調(diào)查方法l固定樣本調(diào)查的特點固定樣本調(diào)查的特點 l樣本輪換技術 24114. n mnmm1 v 10.27m(m-1)1 mmmyYyYYy將 =系統(tǒng)樣本分為 個子系統(tǒng)樣本,分 次獨立抽取, 定義方差估計:其中 為第 個子樣本的均值, 為:此方法稱為隨機分組法。二階及多階抽樣定義及與其他抽樣的關系9.1

60、概述9.1.1定義及與其他抽樣的關系特點與作用l保留整群抽樣的特點,克服整群抽樣的缺點l解決抽樣框困難l可以用于散料抽樣初級單元大小相等時的二階抽樣記號本節(jié)假定:總體中有N個初級單元,每個初級單元含有相同個數(shù)的次級單元數(shù)M,簡單隨機抽取n個初級單元,在每個抽到的初級單元內(nèi),簡單隨機抽取m個次級單元,初級單元內(nèi)抽樣是獨立的。ijij12Yi 1,Nj 1,Mijy i 1,nj 1,mijnmffNM記:=,=為總體中第個初級單元中第個次級單元的指標值,記:=,=為樣本中第個初級單元中第個次級單元的指標值,為一、二階抽樣比iiiiiiNniiNnii Y,i YY / M,mi Y/ N,/ n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論