第三章次數分布和平均數、變異數_第1頁
第三章次數分布和平均數、變異數_第2頁
第三章次數分布和平均數、變異數_第3頁
第三章次數分布和平均數、變異數_第4頁
第三章次數分布和平均數、變異數_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章次數分布和平均數、變異數試驗資料的性質次數分布資料的特征數第一節(jié)總體及其樣本一、幾個常用的統(tǒng)計術語1、總體與樣本由試驗研究的目的而確定的同類事物或現象的全體稱為總體(population)。從總體中抽取一部分個體作為總體的代表來研究。被抽取的這些個體稱為樣本(sample).

樣本容量;非隨機樣本(non-randomsample)。隨機樣本(randomsample);大樣本與小樣本;總體與樣本的關系

由樣本推斷總體雖然有很大可靠性,也有一定錯誤率。俗語說“不可不信,不可全信”,這是我們對待統(tǒng)計推斷的正確態(tài)度。2、參數與統(tǒng)計數如:總體平均數----總體方差----μ用總體的全體觀察值計算的、描述總體的特征數稱為參數(parameter)。如:樣本平均數----樣本均方----

由樣本的全體觀察值計算的、描述樣本的特征數稱為統(tǒng)計數(statistics)。統(tǒng)計上,通常由樣本統(tǒng)計數估計或推斷總體相應參數。第二節(jié)次數分布當觀測值不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數分布表,即可看到資料的集中和變異情況。一、試驗資料的分類1、數量性狀資料

凡是能夠以量測或計數的方法表示其特征的性狀統(tǒng)稱為數量性狀。

觀察測定數量性狀而獲得的數據就是數量性狀資料。

它的各個觀察值須以整數表示,兩個相鄰整數間不容許任何帶有小數的值存在。因此,該類資料也稱非連續(xù)性或間斷性變數資料。(1)計數資料

指用計數方式得到的數據資料.

各個觀察值不一定是整數,兩個相鄰的整數間可有帶小數的任何數值出現;計量資料也稱之為連續(xù)性變數資料.(2)計量資料凡用稱量、測量等量測手段得到的數量性狀資料。

質量性狀是指只能觀察而不能測量的性狀。如花藥、莖、種子、果實、葉片的顏色、籽粒的飽滿度、芒的有無等。

2、質量性狀資料質量性狀本身不能用數值表示,要獲得這類性狀的資料,須對其觀察結果作數量化處理。數量化方法可分為以下兩種:

在一個樣本內,分別統(tǒng)計具有某種性狀、不具有該性狀的個體數,這種數量化的資料又叫次數資料。

(1)統(tǒng)計次數法先根據性狀的變異情況分級,給每級分別賦予一個適當的數值作代表值,然后統(tǒng)計樣本中屬于各個級別的個體數。(2)分級法(給分法)二、次數分布(一)計量資料次數分布表制作1.求極差RR=max{yi}-min{yi}本例:R=73.7-47.9=25.8(kg)極差(range)為資料中的最大觀察值與最小觀察值的差數,它表示了整個樣本的變異幅度.2.確定組數與組距確定適當的組數,應考慮:觀察值個數的多少;極差(R)的大?。槐阌谟嬎?;能反映出資料的真實面貌。

組距是每個組區(qū)間的上限與下限之差,常用i表示。組距、組數、極差有如下關系:i=R/組數為了便于計算,組距一般取整數。本例R=25.8,分為9組,故組距:(i)=25.8/9=2.9≈3.0(kg)3.確定組中值與組限組中值是各組區(qū)間的中點值,它可作為各組的代表值,最好取整數或與觀察值位數一致。一般先確定第一組的組中值,通常選接近資料中最小觀察值為宜。例2.1九個組中值分別為:48.5,51.5,54.5,57.5,…,72.5組限即各組的界限,常用L表示,同一組中數值小者稱為下限,數值大者稱為上限。47.01---50.0050.01---53.0053.01---56.00|71.01---74.00例2.1的組限分別為:4.數據歸組

組限的小數位數比觀察值多取一位;為避免歸組時出現差錯,組限一定要明確,不能有重疊、交叉。(二)計數資料的次數分布表【例如】某小麥品種的每穗小穗數的次數分布。變異較小的資料,可按觀察值分組.

每穗小穗數記數符號次數151617181920正一正正正正正正正正正T正正正正正正正正T正6153225175【例如】研究水稻品種的每穗粒數,共測115個穗,每穗粒數的變幅在20-139,極差達119.變異較大的計數資料,可用處理計量資料的方法制作次數分布表。分組20-2930-3940-4950-5960-6970-7980-8990-99100-109110-119120-129130-139次數14914151822147731(三)質量性狀資料的次數分布表

例如,用某微肥處理后,紅星蘋果果實著色情況調查,見下表。果實著色分級代表值果實數全紅>2/3果面紅色1/3-2/3果面紅色<1/3果面紅色全綠54321143697537二、次數分布圖

(一)柱形圖(直方圖)

100株湘菊梨單株產量方柱形圖47.050.053.056.059.062.065.068.071.074.020151050適用于表示連續(xù)性變異資料的次數分布。100株湘菊梨單株產量折線圖48.551.554.557.560.563.566.569.572.5

20151050·········次數f(二)折線圖適用于計量資料的次數分布圖,且在同一圖上可比較兩組以上資料。100個麥穗每穗小穗數條形圖151617181920302520151050次數f適用于計數資料和質量性狀資料。(三)條形圖用來描述總體或樣本特征的數,稱為

特征數。

第三節(jié)試驗資料的特征數反應其離散性的特征數是變異數。反應資料集中性的特征數是平均數;平均數是數量資料的代表數,用來表明資料中各觀測值相對集中的中心位置。一、平均數平均數是統(tǒng)計學中最常用的統(tǒng)計量,常用來進行資料間的比較。

資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數(arithmeticmean),簡稱平均數。通常用μ表示總體平均數,表示樣本平均數。

1.算術平均數設有一個含N個觀察值的有限總體,其觀察值為y1,y2,…,yN,則該總體的算術平均數μ定義為:

因為總體內的個體數很多,總體平均數往往無從計算,所以,一般用樣本平均數作為總體平均數μ的估計值。

設有一個容量為n的樣本,其觀察值為,則該樣本的算術平均數可定義為:從總體中抽出的隨機樣本平均數是該總體平均數μ的無偏估計值。(1)離均差之和等于零。記為:(2)離均差平方和為最小。簡記為:平均數的基本性質:計算方法對于(n<30)未歸組的資料可以直接利用公式:【例2.2】在一水稻品種比較試驗中,某品種的5個小區(qū)產量分別為20.0,19.0,21.0,17.5,18.5(kg),求該品種的小區(qū)產量平均數。=(20.0+19.0+21.0+17.5+18.5)/5=19.2(kg)對已歸組的資料,其計算公式為:其中:yi—各組組中值;k—組數;n—資料中所有觀察值的個數;

fi—各組次數;

【例2.3】利用加權法求100株湘菊梨單株產量的算術平均數。

=(48.5×3+51.5×6+…+69.5×7+72.5×4)/100=60.92(kg)(二)中數(M)

將觀察值按大小依次排列,當觀察值數目為奇數時,最中間的觀察值就是中數;當觀察值數目為偶數時,最中間的兩個觀察值的算術平均數為中數。如2,2,3,4,7,8,9,11,14;5,7,8,9,10,11;(三)眾數(Mo)

在資料中出現次數最多的數或組中值。(四)幾何平均數(Mg)設有n個觀察值,其乘積開n次方所得的值,即為幾何平均數,即如某一調查結果為:3,4,3,3,5,6,4,3,2,2二、變異數

它由兩個極端觀察值決定,受資料中不正常的極端值的影響大,沒有充分利用資料的全部信息,不能精確表示資料的變異度。(一)極差(二)方差每個觀察值與平均數之差即離均差;表示觀察值偏離平均數的距離。離均差的平方再求和簡稱平方和(sumofsquare)。記為SS。即

對樣本:對總體:將SS除以觀察值的個數得到平均平方和,稱之為方差(variance)。總體方差等于總體平方和除以總體觀察值個數N,用表示,即:總體方差通常無法得到,而由樣本方差估計,樣本方差稱為均方(meansquare)記為或MS:

上式中的(n-1)稱為自由度(degreeoffreedom),簡記為df。它是指樣本內能獨立自由變動觀察值的個數?!纠?.4】

有5個觀察值,其中4個觀察值的離均差為3,-2,3,5,那么第5個觀察值的離均差必為-9,才能滿足:

在估計其他統(tǒng)計數時,如該統(tǒng)計數受k個條件限制,則自由度等于樣本觀察值個數減去約束條件數k,即樣本自由度為n-k(三)標準差統(tǒng)計學上把方差或均方的平方根取正值稱為標準差。

樣本標準差:總體標準差:例2.5表2.7某水稻品種小區(qū)產量的方差和標準差的計算項目總和20.019.021.017.518.596.020.0-19.2=0.819.0-19.2=-0.221.0-19.2=1.817.5-19.2=-1.718.5-19.2=-0.70.640.043.242.890.49400.0361.0441.0306.25342.2507.301850.50

若比較兩個樣本的變異度,則因單位不同或平均數不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論