




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第5章參數估計總體樣本抽取部分觀察單位 統計量 參 數 統計推斷統計推斷 statistical inference如:樣本均數 樣本標準差S 樣本率 P如:總體均數 總體標準差 總體率內容:參數估計(estimation of parameters) 包括:點估計與區(qū)間估計2. 假設檢驗(test of hypothesis)總體樣本抽取部分觀察單位 統計量 參 數 統計推斷第一節(jié)樣本均數的標準誤如:樣本均數 樣本標準差S 樣本率 P如:總體均數 總體標準差 總體率 抽樣誤差 (sampling error) :由于個體差異導致的樣本統計量與總體參數間的差別。一、抽樣試驗 從正態(tài)分布總體N(
2、5.00,0.502)中,每次隨機抽取樣本含量n5,并計算其均數與標準差;重復抽取1000次,獲得1000份樣本;計算1000份樣本的均數與標準差,并對1000份樣本的均數作直方圖。 按上述方法再做樣本含量n10、樣本含量n30的抽樣實驗;比較計算結果。抽樣試驗(n=5)抽樣試驗(n=10)抽樣試驗(n=30)1000份樣本抽樣計算結果總體的均數總體標準差s均數的均數均數標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個抽樣實驗結果圖示由表可見,從同一總體中隨機抽取樣本
3、含量n=10的若干樣本,各樣本算得的樣本均數并不等于相應的總體均數,且各樣本均數也不完全相同。這種由于隨機抽樣而造成的來自同一總體的樣本均數之間及樣本均數與相應的總體均數之間的差異,稱之為均數的抽樣誤差。 由于樣本均數與相應的總體均數之間存在著差異,由數理統計推理可知:從正態(tài)總體中隨機抽取樣本含量為n的樣本,每抽取一個樣本可計算一個樣本均數,重復1000次抽樣可得到1000個樣本均數。 這些樣本均數服從均數為 ,方差為 的正態(tài)分布.其中 為樣本均數的總體標準差,計算公式為: 為了與反映個體差異的標準差(或)相區(qū)別,樣本均數的標準差用 表示。 統計上通常將統計量(如樣本均數、樣本率p等)的標準差
4、稱為標準誤(standard error,SE)。所以,樣本均數的標準差 又稱為樣本均數的標準誤,是反映樣本均數抽樣誤差大小的指標。 特點: 的大小與總體標準差成正比,與樣本含量的平方根成反比。即當樣本含量n一定時,標準差越大,即樣本的個體差異越大,標準誤就越大,樣本均數的抽樣誤差就越大;標準差越小,標準誤就越小,即樣本均數抽樣誤差就越小。 當 一定時,n越大,總體標準誤就越?。籲越小,總體標準誤就越大。故影響抽樣誤差大小的主要因素是樣本含量。作為總體參數(常數)通常是未知的,因而,在實際工作中常用樣本標準差S來估計。二、總體均數的估計 (一) 總體均數的點估計(point estimatio
5、n)與區(qū)間估計參數的估計點估計:由樣本統計量 直接估計 總體參數區(qū)間估計:在一定可信度(Confidence level) 下,同時考慮抽樣誤差 統計學中的統計推斷包括兩個重要的方面:一是利用樣本統計量的信息對相應總體參數值做出推斷,如用樣本均數估計總體均數,用樣本標準差S估計總體標準差等,稱之為點估計。另一個是利用樣本統計量來推斷我們是否接受一個事先的假設,稱之為假設檢驗。本章只討論參數估計,假設檢驗將在下一章中討論。而參數估計又分為點估計與區(qū)間估計。 1.點估計 總體均數的點估計(point estimation)就是用樣本均數來直接地估計總體均數,這種方法比較簡單,由于沒有考慮到抽樣誤差
6、,只適合大樣本資料的統計推斷。 按預先給定的概率(1)所確定的包含未知總體參數的一個范圍。 總體均數的區(qū)間估計:按預先給定的概率(1)所確定的包含未知總體均數的一個范圍。 如給定=0.05,該范圍稱為參數的95%可信區(qū)間或置信區(qū)間; 如給定=0.01,該范圍稱為參數的99%可信區(qū)間或置信區(qū)間。2區(qū)間估計(interval estimation):總體均數可信區(qū)間的計算 總體均數可信區(qū)間的計算需考慮:(1)總體標準差是否已知, (2)樣本含量n的大小通常有兩類方法:(1)t分布法 (2)u分布法 1. 單一總體均數的可信區(qū)間 例 某地抽取正常成年人200名,測得其血清膽固醇的均數為3.64 mm
7、ol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數的95%可信區(qū)間。 故該地正常成年人血清膽固醇均數的雙側95%可信區(qū)間為(3.47, 3.81)mmolL。 例 為了解氨甲喋呤(MTX)對外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機分為兩組。其中對照組29例( ),采用安慰劑;實驗組32例( ),采用小劑量氨甲喋呤(MTX)進行治療。測得對照組治療前IL-2的均數為20.10 IU/ml ( ),標準差為7.02 IU/ml ( );試驗組治療前IL-2的均數為16.89 IU/ml ( ),標準差為8.46 IU/ml ( )。問兩組治療前基線的IL-2總體均
8、數相差有多大? 第一步: 可信區(qū)間的確切涵義 1. 95%的可信區(qū)間的理解:(1)所要估計的總體參數有95%的可能在我們所估計的可信區(qū)間內。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數和標準差,也可算得100個均數的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數 。 2.可信區(qū)間的兩個要素(1)準確度:用可信度(1)表示:即區(qū)間包含總體均數的理論概率大小 。當然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好 。(2)精確度:即區(qū)間的寬度 區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好 。 當n確定時,上述兩者互相矛盾。提高準確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應用價值,故不能籠統認為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實際應用中,95%可信區(qū)間更為常用。 在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。 第二節(jié) 率的標準誤一、率的抽樣誤差與標準誤 由于抽樣造成的樣本率之間及樣本率與總體率之間的差別稱為率的抽樣誤差。 率的抽樣誤差大小可由率的標準誤來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 店鋪禮儀培訓
- 原發(fā)性巨球蛋白血癥腎損害的臨床護理
- 關于雙減政策的心得體會模版
- 1《小蝌蚪找媽媽》課件
- 新質生產力農業(yè)例子
- 醫(yī)學文獻翻譯核心要點解析
- 翡翠知識培訓
- 玉林消防考試題及答案大全
- 幼兒教師資格證考試試題及答案
- 馬克思主義哲學心得體會模版
- GB/T 14140-2009硅片直徑測量方法
- 尾礦庫重大風險及管控措施
- 國家義務教育質量監(jiān)測科學模擬測試題附答案
- 康復訓練類輔助器具課件
- PUMA560機器人運動學分析
- UI界面設計交互設計教學
- 2021版檢定和校準實驗室程序文件
- 鋼箱梁計算分析與案例詳解
- 人工挖孔安全檢查記錄表
- NPM網絡性能監(jiān)控平臺測試方案
- 生物化學期末考試題庫與答案
評論
0/150
提交評論