




已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
勤學(xué)好問(wèn)必有所獲,第五章 數(shù)理統(tǒng)計(jì)的概念,數(shù)理統(tǒng)計(jì),數(shù)理統(tǒng)計(jì),一、數(shù)理統(tǒng)計(jì)及其任務(wù),數(shù)理統(tǒng)計(jì)是一門(mén)以概率論為基礎(chǔ)的應(yīng)用學(xué)科。 它是研究如何有效地收集、 整理、分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出推斷和預(yù)測(cè),從而為決策提供依據(jù)。,數(shù)理統(tǒng)計(jì)的任務(wù)就是研究有效地收集數(shù)據(jù),科學(xué)地整理與分析所獲得的有限的資料,對(duì)所研究的問(wèn)題, 盡可能地作出精確而可靠的結(jié)論。,數(shù)理統(tǒng)計(jì)研究問(wèn)題的方式,不是對(duì)所研究對(duì)象的全體 ( 稱(chēng)為總體)進(jìn)行觀察,而是抽取其中的部分(稱(chēng)為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過(guò)這些數(shù)據(jù)對(duì)總體進(jìn)行推斷。,數(shù)理統(tǒng)計(jì)方法具有“部分推斷整體”的特征。,二、數(shù)理統(tǒng)計(jì)研究問(wèn)題的一般流程,我們這門(mén)課所學(xué)的數(shù)理 統(tǒng)計(jì)實(shí)際上是統(tǒng)計(jì)推斷 及其應(yīng)用(方差分析與 回歸分析)的一部分內(nèi) 容。,為什么要用數(shù)理統(tǒng)計(jì)方法研究問(wèn)題?隨機(jī)現(xiàn)象有它的規(guī)律性,隨機(jī)現(xiàn)象的特點(diǎn)注定了進(jìn)行足夠多次觀察,其規(guī)律性才能清楚地呈現(xiàn)出來(lái)。但是,客觀上只允許對(duì)隨機(jī)現(xiàn)象進(jìn)行有限次觀察試驗(yàn),只能獲得局部觀察資料.,總體與總體特征數(shù),一、總體與總體標(biāo)志,總體(Population),Def 在數(shù)理統(tǒng)計(jì)中,把研究對(duì)象的全體稱(chēng)為總體或母體,而把組成總體的每個(gè)單元稱(chēng)為總體單元。,總體中所包含的個(gè)體的個(gè)數(shù)稱(chēng)為總體的容量。,研究某批燈泡的質(zhì)量,總體,個(gè)體,描述總體單元在某方面特性的名稱(chēng)稱(chēng)為總體指標(biāo); 每個(gè)總體單元對(duì)總體指標(biāo)的響應(yīng)稱(chēng)為指標(biāo)值。,在數(shù)理統(tǒng)計(jì)中,人們往往研究有關(guān)總體總是關(guān)注總體某一項(xiàng)或幾項(xiàng)指標(biāo),為此,對(duì)這些指標(biāo)進(jìn)行隨機(jī)的試驗(yàn)或觀測(cè),試驗(yàn)或觀測(cè)結(jié)果獲得這些指標(biāo)的一部分或全部指標(biāo)值,從而考察該數(shù)量指標(biāo)的分布情況。這時(shí),指標(biāo)值的全體就象是總體。每個(gè)指標(biāo)值就象是總體單元。,總體,指標(biāo)值全集,指標(biāo),隨機(jī)變量,總體可以用隨機(jī)變量及其分布來(lái)表示,研究總體等價(jià)于研究表達(dá)總體的隨機(jī)變量概率分布;在理論上可以把總體與概率分布等同起來(lái),總體分布就是表達(dá)總體的隨機(jī)變量的分布。,例如:研究某批燈泡的壽命時(shí),關(guān)心的指標(biāo)是壽命,那么,該總體就可以用隨機(jī)變量X和其概率分布表示。,總體特征數(shù),樣本與統(tǒng)計(jì)量,一、樣本,樣本(Sample),Def 按一定規(guī)則從總體中抽取一部分總體單元進(jìn)行觀測(cè)或試驗(yàn),這一抽取過(guò)程稱(chēng)為“抽樣”,所抽取的部分總體單元的整體稱(chēng)為總體的一個(gè)樣本(子樣)。 樣本中所包含的總體單元稱(chēng)為樣本單元,樣本中樣本單元的數(shù)目稱(chēng)為樣本容量。,樣本,樣本實(shí)現(xiàn),抽定,樣本應(yīng)滿(mǎn)足的性質(zhì),(1) 代表性;(2) 隨機(jī)性。,簡(jiǎn)單隨機(jī)樣本(Independence identical distribution),Def,例如:要通過(guò)隨機(jī)抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測(cè)后放回原來(lái)的總量中再抽第二件產(chǎn)品,則這樣獲得一個(gè)簡(jiǎn)單隨機(jī)抽樣。,實(shí)際抽樣中,往往是不再放回產(chǎn)品,則這不是一個(gè)簡(jiǎn)單隨機(jī)抽樣。但當(dāng)總量N很大時(shí),可近似看成是簡(jiǎn)單隨機(jī)抽樣。,樣本分布,Def,注意:樣本分布反映樣本取不同實(shí)現(xiàn)的概率規(guī)律,其與總 體分布相聯(lián)系,一般求算比較麻煩,但對(duì)于iid樣本有下列 結(jié)果。,總體、樣本、樣本實(shí)現(xiàn)的關(guān)系,總體,樣本實(shí)現(xiàn),樣本,推斷,例5.1,例5.2,二、統(tǒng)計(jì)量,統(tǒng)計(jì)量(Statistic),下列那些量是統(tǒng)計(jì)量,它反映了總體k 階矩的信息,幾個(gè)常用的統(tǒng)計(jì)量,樣本平均值,它反映了總體 均值的信息,樣本方差,它反映了總體 方差的信息,樣本標(biāo)準(zhǔn)差,樣本k階原點(diǎn)矩,樣本k階中心矩,統(tǒng)計(jì)三大分布,分布,這個(gè)分布是由Helmet于1875年提出,K.Pearson于1900年重新提出。理論推導(dǎo)可得概率密度函數(shù)為,(用中心極限定理證明),其概率密度函數(shù)的圖像如圖所示,t分布(學(xué)生氏t分布),這個(gè)分布是由W.S.Gosset于1908年提出,該分布的提 出為小樣本方法的建立奠定了概率基礎(chǔ)。理論推導(dǎo)可 得概率密度函數(shù)為,F分布,這個(gè)分布是由R.A.Fisher于1918年提出,該分布的提出 為方差分析的建立奠定了概率基礎(chǔ)。Snedcor于1934年 給出概率密度函數(shù)。,例5.4,抽樣分布,抽樣分布(Sampling Distribution ),確定抽樣分布是數(shù)理統(tǒng)計(jì)的有一個(gè)基本問(wèn)題,確定相應(yīng) 統(tǒng)計(jì)量的分布是建立統(tǒng)計(jì)方法的基礎(chǔ)。以統(tǒng)計(jì)量的精確 分布為基礎(chǔ)的統(tǒng)計(jì)方法稱(chēng)為小樣本方法;而以統(tǒng)計(jì)量的 極限分布為基礎(chǔ)的統(tǒng)計(jì)方法稱(chēng)為大樣本方法。,而由性質(zhì)3知 與 相互獨(dú)立,例5.7,解:,為了研究隨機(jī)現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過(guò)抽樣調(diào)查或試驗(yàn)得到的數(shù)據(jù)往往是雜亂無(wú)章的,需要通過(guò)整理后才能顯示出它們的分布狀況。 數(shù)據(jù)的簡(jiǎn)單處理是以一種直觀明了方式加工數(shù)據(jù),它包括兩個(gè)方面:數(shù)據(jù)整理;計(jì)算樣本特征值。,數(shù)據(jù)的整理與加工,數(shù)據(jù)整理:將數(shù)據(jù)分組 計(jì)算各組頻數(shù) 作頻率分布表 作頻率直方圖,計(jì)算樣本特征值:樣本均值、樣本方差等。,例5.8 為對(duì)某小麥雜交組合F2代的株高X進(jìn)行研究,抽取 容量為100的樣本,測(cè)試的原始數(shù)據(jù)記錄如下(單位:厘米), 試根據(jù)以上數(shù)據(jù),畫(huà)出它的頻率直方圖,并以此說(shuō)明隨機(jī) 變量X的分布狀況。,87 88 111 91 73 70 92 98 105 94 99 91 98 110 98 97 90 83 92 88 86 94 102 99 89 104 94 94 92 96 87 94 92 86 102 88 75 90 90 80 84 91 82 94 99 102 91 96 94 94 85 88 80 83 81 69 95 80 97 92 96 109 91 80 80 94 102 80 86 91 90 83 84 91 87 95 76 90 91 77 103 89 88 85 95 92 104 92 95 83 86 81 86 91 89 83 96 86 75 92,整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫(huà)直方圖,提取樣本分布特征的信息。步驟如下:,1.找數(shù)據(jù)最小值m=69,最大值M=111,極差為Mm=42; 2.數(shù)據(jù)分組,根據(jù)樣本容量n的大小,決定分組數(shù)k; 3.確定組限和組中點(diǎn)值; 4.將數(shù)據(jù)分組,計(jì)算出各組頻數(shù),作頻數(shù)、頻率分布表;,5.作出頻率直方圖。 注意:分組的一般原則為 30n40 5k6 40n60 6k8 60n100 8k10 100n500 10k20 本例取k=9,一般采取等距分組(也可以不等距分組),組距等于比極差除以組數(shù)略大的測(cè)量單位的整數(shù)倍。本例測(cè)量單位為1厘米,組距為,一般根據(jù)算式: 各組中點(diǎn)值加減1/2組距=組的上限或下限,組的上限與下限應(yīng)比數(shù)據(jù)多一位小數(shù)。本例取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:,67.5,72.5) 72.5,77.5) 77.5,82.5) 82.5,87.5) 87.5,92.5) 92.5,97.5) 97.5,102.5) 102.5,107.5) 107.5,112.5) 組中值分別為:70,75,80,85,90,95,100,105,110,以樣本值為橫坐標(biāo),頻率/組距為縱坐標(biāo);
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 主臥衛(wèi)浴采購(gòu)方案
- 地產(chǎn)客戶(hù)采購(gòu)方案
- 防水企業(yè)降薪方案
- 科技小院管理辦法通知
- 科技項(xiàng)目計(jì)劃管理辦法
- 科研設(shè)備維修管理辦法
- 租賃資產(chǎn)損毀管理辦法
- 積分考核管理辦法范本
- 筆跡鑒定機(jī)構(gòu)管理辦法
- 管理人才梯隊(duì)管理辦法
- 國(guó)家開(kāi)放大學(xué)專(zhuān)科《法理學(xué)》期末紙質(zhì)考試第四大題名詞解釋題庫(kù)2025珍藏版
- 網(wǎng)絡(luò)安全攻防演練護(hù)網(wǎng)工作報(bào)告
- 商貿(mào)公司保障服務(wù)方案
- 形勢(shì)與政策臺(tái)灣政治生態(tài)分析
- 市場(chǎng)營(yíng)銷(xiāo)人員勞動(dòng)合同指南
- 2024年北京市西城區(qū)中考生物真題(含解析)
- 藥物色譜分離技術(shù)-凝膠色譜(制藥技術(shù)課件)
- DZ∕T 0033-2020 固體礦產(chǎn)地質(zhì)勘查報(bào)告編寫(xiě)規(guī)范(正式版)
- 《抽水蓄能電站豎井式泄洪洞設(shè)計(jì)導(dǎo)則》
- MOOC 數(shù)字電子技術(shù)基礎(chǔ)-華中科技大學(xué) 中國(guó)大學(xué)慕課答案
- 小學(xué)道德與法治培訓(xùn)感悟
評(píng)論
0/150
提交評(píng)論