




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第2章數(shù)據(jù)類型和數(shù)據(jù)收集課程類別:專業(yè)必修課授課對象:經管類本科生12.3抽樣技術-概率抽樣為什么“大數(shù)據(jù)”也會跑偏?《文學摘要》在1936年之前連續(xù)五屆準確地預測了美國總統(tǒng)大選.1936年,以電話簿上的地址和汽車車主的登記資料地址發(fā)放1000萬份問卷,回收237萬份.調查結果:認為蘭登獲勝.結局:羅斯福以62%對38%的巨大優(yōu)勢獲勝,連任總統(tǒng).富蘭克林·羅斯福艾爾弗·蘭登《文學摘要》1936年的美國大選預測2概率抽樣(probabilitysampling)特點:按一定的概率以隨機原則抽取樣本.每個單位被抽中的概率是已知的,或是可以計算的.作用:可以計算估計量誤差,能夠用于對總體參數(shù)進行估計.
概率抽樣也稱隨機抽樣樣本總體推斷概率抽樣抽樣框:企業(yè)名錄、學生名單等
3簡單隨機抽樣(simplerandomsampling)局限性抽出單位分散,實施調查困難.
123465789367總體樣本優(yōu)點(1)簡單、直觀.(2)抽取概率相等,估計方便.4問題1某高校有在校生25000人,其中女生23000人,男生2000人.某機構為了解該校學生的網購消費水平和消費偏好,要從該校學生中抽取1%的學生進行調查.你認為應當怎樣抽取樣本?(1)不同性別的網購消費水平和偏好可能存在明顯差異.(2)兩個類別的人數(shù)相差較大,需要考慮各自的情況.樣本量樣本中的男生2500可以用簡單隨機抽樣?5問題1某高校有在校生25000人,其中女生23000人,男生2000人,抽取1%樣本.男生2000人女生23000人總體男生20人女生230人樣本男女生各抽取1%6分層抽樣(stratifiedsampling)將抽樣單位劃分為不同的層.從不同的層中獨立、隨機地抽取樣本.567911108121059總體樣本21343412優(yōu)點保證樣本的結構與總體的結構比較相近,提高估計精度.可對總體參數(shù)進行估計,也可對各層的目標量進行估計.局限性抽出單位分散,調查困難.適用情形:總體在“層”間差異較大,“層”內差異較小.7問題2問題分析:(1)班級之間差異較小,專業(yè)背景相似.(2)班級內部差異較大,男女生消費水平和消費偏好可能存在較大差異.某高校商學院有在校生5000人,共50個班級,每個班男女生共100人.某機構為了解該學院學生的網購消費水平和消費偏好,要從該學院學生中抽取10%的學生進行調查.你認為應當怎樣抽取樣本?8問題2班級1總體班級2班級3······班級49班級50班級40班級13班級18班級46班級6樣本某高校商學院有在校生5000人,共50個班級,每個班男女生共100人.某機構為了解該學院學生的網購消費水平和消費偏好,要從該學院學生中抽取10%的學生進行調查.你認為應當怎樣抽取樣本?9整群抽樣(clustersampling)將總體中若干個單位合并為群,直接抽取群.對群中的所有單位全部實施調查.5679111081211910總體樣本21341256優(yōu)點只要群的抽樣框,簡化工作量.調查的地點相對集中.局限性抽樣誤差較大適用情形:總體在“群”間差異較小,“群”內差異較大10系統(tǒng)抽樣(systematicsampling)
567911108126總體樣本2134210
11系統(tǒng)抽樣的理解
123456789101112理解1:將總體均分為若干個層,每個層中隨機抽取1個單位(分層抽樣)群1群2群3群4123456789101112理解2:抽樣框轉換為二維表,隨機抽取1列(整群抽樣)12系統(tǒng)抽樣的理解優(yōu)點(1)簡便.
(2)一般情況下在總體中分布均勻,抽樣誤差小于簡單隨機抽樣.局限性(1)總體中觀察單位按順序有周期趨勢時,可能產生明顯的系統(tǒng)誤差.(2)抽出單位分散,實施調查困難.學號成績k2k3k4kr13總結簡單隨機抽樣分層抽樣系統(tǒng)抽樣整群抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 通信網絡技術LTE知識點試題及答案
- 學校2025年年終工作總結(5篇)
- 農村住宅環(huán)境改善施工合同書
- 我與考試的信息系統(tǒng)監(jiān)理師備考試題及答案
- 防火墻的基本配置與管理試題及答案
- 協(xié)議書與合同的法律效益
- 行政組織的社會網絡分析與管理試題及答案
- 行政組織中利益協(xié)調的試題及答案
- 網絡技術面臨的挑戰(zhàn)與機遇試題及答案
- 重要網絡術語的定義與考察試題及答案
- 進氣歧管工藝編制與典型工序夾具設計
- GB/T 5224-2003預應力混凝土用鋼絞線
- GB 439-1990航空噴氣機潤滑油
- 全文圖解“新時代十年的偉大成就”PPT
- 汽輪機課程設計(中壓缸)
- 清洗劑安全技術說明書(MSDS)報告
- 大酒店員工離職交接表
- 2022年廣東省深圳市中考化學真題試卷
- 國際財務管理教學ppt課件(完整版)
- 2022年江西省南昌市中考一模物理試卷
- 光引發(fā)劑的性能與應用
評論
0/150
提交評論