




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第十六章 非限制性假定統(tǒng)計分析【教學基本要求】通過教學,使學生明確各種非參數(shù)統(tǒng)計技術(shù)的分析運用?!窘虒W重點與難點】本章要求重點掌握2-檢驗、符號檢驗、等級檢驗、多樣本檢驗等方法的分析運用。2-檢驗、多樣本檢驗是本章的難點。第一節(jié) 基本理論迄今為止,我們討論的各種統(tǒng)計推斷方法有2個共同的特點:(1)它們都與總體參數(shù)有關(guān);(2)它們的正確性依賴于一組嚴格的假定。近年來,統(tǒng)計學中發(fā)展了一些不需對總體分布作限制性假定的有用技術(shù)。這些方法稱為非參數(shù)檢驗或自由分布檢驗或稱無分布檢驗。這類方法,由于不涉及總體參數(shù)或不依賴于對總體分布的限制性假定,因而被稱為非參數(shù)統(tǒng)計方法。一、非參數(shù)統(tǒng)計的適用范圍非參數(shù)統(tǒng)計最
2、常用于具備下述特征的情況:1.待分析數(shù)據(jù)不滿足參數(shù)檢驗所要求的假定,因而無法應(yīng)用參數(shù)檢驗。例如,我們曾遇到過的非正態(tài)總體小樣本,在t-檢驗法也不適用時,作為替代方法,就可以采用非參數(shù)檢驗。 2.僅由一些等級構(gòu)成的數(shù)據(jù),不能應(yīng)用參數(shù)檢驗。例如,消費者可能被問及對幾種不同商標的飲料的喜歡程度,雖然,他們不能對每種商標都指定一個數(shù)字來表示他們對該商標的喜歡程度,卻能將幾種商標按喜歡的順序分成等級。這種情形也宜采用非參數(shù)檢驗。 3.所提的問題中并不包含參數(shù),也不能用參數(shù)檢驗。例如,我們想判斷一個樣本是否為隨機樣本,采用非參數(shù)檢驗法就是適當?shù)摹?4.當我們需要迅速得出結(jié)果時,也可以不用參數(shù)統(tǒng)計方法而用非
3、參數(shù)統(tǒng)計方法來達到目的。一般說來,非參數(shù)統(tǒng)計方法所要求的計算與參數(shù)統(tǒng)計方法相比,完成起來既快且易。有些非參數(shù)統(tǒng)計方法的計算,就算對統(tǒng)計學知識不熟練的人,也能在收集數(shù)據(jù)時及時予以完成。 二、非參數(shù)統(tǒng)計的優(yōu)缺點非參數(shù)統(tǒng)計與傳統(tǒng)的參數(shù)統(tǒng)計相比,有以下優(yōu)點:1.非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛; 2.多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結(jié)果,因而比較節(jié)約時間; 3.大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要太多的數(shù)學基礎(chǔ)知識和統(tǒng)計學知識; 4.大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計量水準較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用
4、; 5.當推論多達3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。但非參數(shù)統(tǒng)計方法也有以下缺點:1.由于方法簡單,用的計量水準較低,因此,如果能與參數(shù)統(tǒng)計方法同時使用時,就不如參數(shù)統(tǒng)計方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進行檢驗時,非參數(shù)統(tǒng)計方法與參數(shù)統(tǒng)計方法相比,第類錯誤的概率要大些。 2.對于大樣本,如不采用適當?shù)慕?計算可能變得十分復雜。第二節(jié) (卡方)-檢驗在非參數(shù)統(tǒng)計中,應(yīng)用最廣泛的方法之一是利用-分布進行獨立性、一致性和吻合性的檢驗。一、(分布的數(shù)學性質(zhì))統(tǒng)計量我們在第八、第九等章的有關(guān)部分為了構(gòu)造總體方差的置信區(qū)間,曾介紹過-分布
5、。數(shù)學上可將這一分布表示為: , (16.1)其中 , 稱為自由度。所有彼此獨立,且均服從平均值為,標準差為的正態(tài)分布。和的下標表示每個觀察值可能取自不同的總體。當我們從同一總體抽取所有觀察值時,和的下標就可以取消。這一分布的平均值和方差分別為和2。分布本身通常用希臘字母來表示。-分布是一種抽樣分布。當我們對正態(tài)隨機變量X隨機地重復地抽取個數(shù)值,將每一個值變換成標準正態(tài)變量,并對這個新的變量分別取平方再求和之后,便得到一個服從-分布的變量,即有: (16.2)如果我們將的各種不同數(shù)值連同相應(yīng)的相對出現(xiàn)的頻數(shù)列出,就得到的抽樣分布,這就是自由度為的-分布。圖8.1給出了若干不同自由度的-分布。在
6、實踐中,經(jīng)常要對一些觀察值出現(xiàn)的實際頻數(shù)與理論頻數(shù)進行比較,以了解實際發(fā)生的結(jié)果與理論之間是否一致。設(shè)觀察頻數(shù)為,理論頻數(shù)為,則可定義統(tǒng)計量: (16.3)二、的獨立性檢驗在研究問題時,經(jīng)常會遇到要求2個變量之間是否有聯(lián)系的問題。其檢驗方法是將研究的對象按2個變量分別進行分類,編制一張交錯分類的表,通常叫做列聯(lián)表。我們以一個具體的實例來研究。例16.1 在對某城市家庭社會經(jīng)濟特性的調(diào)查中,一個市場研究公司想確定電話擁有數(shù)與汽車擁有數(shù)是否獨立。這個公司從一個由住有該城市的10000戶家庭組成的簡單隨機樣本中獲得了這種占有狀況的信息,列于表16.1。表16.1 按電話擁有量和汽車擁有量分組的列聯(lián)表
7、汽車擁有量 (輛)合 計012電話擁有 量(臺)01000900100200011500260050046002以上50025004003400合 計30006000100010000要求:依上列數(shù)據(jù)檢驗電話擁有量與汽車擁有量是否有聯(lián)系。檢驗有2個步驟:(1)根據(jù)獨立性的假設(shè)計算期望頻數(shù);(2)將觀測頻數(shù)與期望頻數(shù)進行比較。本題中待檢驗的2個假設(shè)可表述為:電話擁有量與汽車擁有量是獨立的電話擁有量與汽車擁有量之間不獨立計算統(tǒng)計量:在計算之前,首先要算出每一格的理論值,利用(16.3)式,有: 余類推,計算結(jié)果列示于表16.2。表16.2 電話擁有量和汽車擁有量之間關(guān)系問題的期望頻數(shù)汽車擁有量(輛
8、)合 計012電話擁有 量(臺)06001200200200011380276046046002以上102020403403400合 計30006000100010000由此有: 若規(guī)定顯著性水平,本例自由度,查附表C得。,因此,否定,即2個變量之間不是獨立的。在利用檢驗時,應(yīng)注意:(1)要求試驗的頻數(shù)比較多;(2)每一格中期望的理論頻數(shù)不能太小。雖然,在統(tǒng)計學界沒有統(tǒng)一結(jié)論,但美國統(tǒng)計學家科克蘭提出的一條原則值得借鑒,即要求,且理論值小于5的格不能超過20%。在必要時,可將鄰近的格加以合并(在不影響分類原則的條件下)。當2個變量的分類都分成2類時,就形成22列聯(lián)表。如表16.3,便是一個22
9、列聯(lián)表,其中a、b、c、d分別表示觀察頻數(shù)。表16.3 22列聯(lián)表12合 計1aba+b2cdc+d合 計a+cb+dn這時的值可依簡便公式(16.4)式計算: (16.4)這個公式所給出的數(shù)值結(jié)果與(16.3)式相同。例16.2 屬于同一公司的2家工廠所生產(chǎn)的165件有缺陷的產(chǎn)品構(gòu)成一個樣本,按照工藝不佳或原材料質(zhì)量低劣這2個準則對這些有缺陷的產(chǎn)品進行分類,有關(guān)數(shù)據(jù)列示于表16.4。要求:以0.05的顯著性水平檢驗關(guān)于產(chǎn)生缺陷的原因與生產(chǎn)這些產(chǎn)品的工廠無關(guān)的零假設(shè)。表16.4 產(chǎn)品產(chǎn)生缺陷的原因與生產(chǎn)工廠的有關(guān)資料工 廠合 計AB產(chǎn)生缺陷的原因工藝不佳217293材料質(zhì)量低劣462672合
10、計6798165解:該例的假設(shè)可陳述為: 產(chǎn)品產(chǎn)生缺陷與生產(chǎn)工廠之間沒有聯(lián)系 產(chǎn)品產(chǎn)生缺陷與生產(chǎn)工廠之間有聯(lián)系計算統(tǒng)計量: 依(16.4)式,可以算出: 由,自由度,查附表C得。,因此,否定,即產(chǎn)品產(chǎn)生缺陷與生產(chǎn)工廠之間有聯(lián)系。由于-分布是一個連續(xù)變量,而在22列聯(lián)表中用的是離散型變量,因此,美國統(tǒng)計學家耶茨于1934年提出了一個具有適用價值的修正公式: (16.5)按例16.2,我們有: 。三、的一致性檢驗在用參數(shù)統(tǒng)計方法檢驗兩個比例是否相等時,曾介紹到用正態(tài)分布的近似方法來檢驗?,F(xiàn)在,我們也可將從每一個總體中抽取的樣本分成兩類,把結(jié)果寫成22列聯(lián)表,然后,用的一致性檢驗。從表面上看來,列聯(lián)
11、表的形式及計算值的公式與獨立性的檢驗是相同的,但是,其抽樣方法和對期望頻數(shù)的計算規(guī)則是不同的。(1)在獨立性檢驗時,是從研究的總體中抽取一個容量為的樣本,然后,根據(jù)樣本的觀察值進行雙向分類;一致性檢驗則是從比較的總體中分別抽取獨立的隨機樣本,然后,把抽到的單位劃分成兩類中的一個類別。(2)對理論頻數(shù)的計算,在獨立性檢驗時,假設(shè)按兩個單獨概率的乘積,而在一致性檢驗時,假定比較的幾個總體中具有某種特征的單位數(shù)的比例相同,當假設(shè)成立時,各類的期望頻數(shù)應(yīng)該根據(jù)樣本的總數(shù)的比例來計算。例16.3 某廠生產(chǎn)一種新型自行車,希望了解消費者喜歡這種型號的人數(shù)比例,分別從青年人和40歲以上的人中各抽100人進行
12、調(diào)查。調(diào)查結(jié)果顯示,青年人中有80人表示喜歡,40歲以上的人中有70人表示喜歡。要求:以0.05的顯著性水平檢驗這兩組人喜歡這種新型車的比例是否一致。解: 該例的假設(shè)可陳述為: 青年人與40歲以上的人喜愛的比例是一致的 喜愛的比例是不一致的 將調(diào)查結(jié)果寫成22列聯(lián)表16.5。表16.5 22列聯(lián)表 單位:人喜愛不喜愛2合 計青年人802010040歲以上7030100合 計15050200計算統(tǒng)計量:依(16.4)式,有: 由,自由度,查附表C得。,因此,不否定,即不能說兩組消費者對新型車的愛好有顯著差別。利用進行一致性檢驗還可以推廣到幾個總體的比例是否一致,分類也可推廣到兩類以上,若是個總體
13、,每個總體分成類,就形成列聯(lián)表。例16.4 市場研究人員進行一項研究,其內(nèi)容為檢查某大城市地區(qū)4家主要百貨商店的顧客的特征。他們從每家商店的主要顧客中各選取一個獨立隨機樣本。4個樣本中顧客的年齡分布及有關(guān)數(shù)據(jù)列示于表16.6。要求:以0.05的顯著性水平檢驗這幾個被抽總體就顧客的年齡而言是否一致。解: 該例假設(shè)可陳述如下: 4家商店的顧客年齡是一致的 4家商店的顧客年齡是不一致的表16.6 某大城市4家主要百貨商店顧客的年齡特征調(diào)查表 單位:人商 店合 計ABCD年 齡分 組258040905026025-356060804024035-453050457520045以上30503585200
14、合 計200200250250900首先計算各格的理論值: 余類推,計算結(jié)果列示于表16.7。表16.7 某大城市4家主要百貨商店顧客年齡的理論頻數(shù)商 店合 計ABCD年 齡分 組2557.7857,7872.2272.2226025-3553.3353.3366.6766.6724035-4544.4444.4455.5655.5620045以上44.4444.4455.5655.56200合 計200200250250900計算統(tǒng)計量:依(16.3)式,有:由,自由度,查附表C得。,因此,否定,即4家商店的顧客年齡不一致。四、的吻合性檢驗在實際工作中,有時需要對變量是否遵從某一理論分布進行
15、檢驗, -分布用于這一方面的檢驗稱為吻合性檢驗,或稱擬合優(yōu)度檢驗。這類檢驗要求所抽取的樣本是隨機樣本,變量的計量水準至少是列名的。若被檢驗的總體其真實的分布函數(shù)為,但它是未知的,只能從這一分布中抽取一個隨機樣本,要求通過對這一樣本的檢驗來認識這一總體的分布是否與規(guī)定的理論分布相一致。因此,其假設(shè)可陳述為: 檢驗統(tǒng)計量的計算方法與前面相同,其理論頻數(shù),其中為按理論分布計算的概率。例16.5 一個汽車制造商想檢驗顧客對5種新式樣汽車的喜好程度。用簡單隨機抽樣方式抽選了500位顧客,喜歡各種式樣汽車的顧客數(shù)如表16.8。表16.8 喜歡5種新式汽車的顧客數(shù)據(jù)資料汽 車 式 樣ABCDE合 計喜歡該式
16、樣的顧客人數(shù)(人)2251852301871731008試用檢驗來確定是否應(yīng)否定零假設(shè)“這個概率分布是均勻分布”解: 假設(shè)的陳述: 這個概率分布是均勻分布 這個概率分布不服從均勻分布計算統(tǒng)計量:因每類型是一樣的,其理論頻數(shù)為所以,有: 由,自由度,查附表C得。,因此,應(yīng)否定,即這個概率分布不服從均勻分布。由,自由度,查附表C得。,因此,不能否定,即這個概率分布有可能服從均勻分布。例16.6 一家鐘表廠把檢驗鐘表的精確度作為質(zhì)量控制計劃的一部分。該廠將700只手表校準后讓其走24小時,然后,對這些表進行檢查,并記下每一只表走快或走慢的秒數(shù)列示于表16.9。試確定,這些表是否提供了充分證據(jù),說明觀
17、察值并非來自正態(tài)總體。設(shè)。表16.9 700只表時間誤差的頻數(shù)資料24小時內(nèi)走快或走慢的秒數(shù)表 的 數(shù) 目(只)01038102051203062304074405083506091607081708072809061901005210011035合 計700解: 假設(shè)的陳述: 樣本數(shù)據(jù)來自正態(tài)分布總體 樣本數(shù)據(jù)并非來自正態(tài)分布總體由(16.3)式,確定的計算過程及結(jié)果列于表16.10。表16.10 例16.6中的理論頻數(shù)計算表變量值頻數(shù)各組限處正態(tài)曲線下的面積理論頻數(shù)0-1038-0.052636.82102051-1.620.051235.84203062-1.260.082958.033
18、04074-0.890.111477.98405083-0.530.134494.08506091-0.170.142899.966070810.190.133593.457080720.550.112478.688090610.920.078554.9590100521.280.049834.86100110351.640.050535.35合 計700-1.000700.00于是,有: 由,自由度,查附表C得。,因此,應(yīng)否定,即可得出樣本數(shù)據(jù)并非來自正態(tài)分布總體的結(jié)論。例16.7 一家旅游區(qū)旅館的管理人員研究在為期90天的時間內(nèi)預定和注銷房間的格局,他將所觀察到的注銷結(jié)果列于表16.11。
19、這些數(shù)據(jù)是否同“每日注銷的房間數(shù)服從泊松分布”這一假設(shè)相容。設(shè)。解: 泊松參數(shù)并未給出,利用表16.11的數(shù)據(jù)估計: 表16.11 旅游區(qū)旅館注銷房間的數(shù)據(jù)注銷房間數(shù)觀察到這一注銷數(shù)的天數(shù)091172253154115762728290合 計90利用的估計值2.6,再假定一個泊松分布,計算檢驗所需的有關(guān)數(shù)據(jù)列示于表16.12。我們可以得出在0.05顯著性水平下不能否定“數(shù)據(jù)來自泊松分布”的零假設(shè)。表16.12 例16.6中的理論頻數(shù)計算表注銷房間數(shù)天數(shù)泊松分布預期頻數(shù)090.0746.661170.19317.372250.25122.593150.21819.624110.14112.695
20、70.0746.66620.0322.88720.0121.08820.0040.36900.0010.09合 計901.000- 例16.8 一個市場分析員進行關(guān)于食品店的顧客對待某種存款方式的態(tài)度的研究。這項研究包括對100家超級市場各抽選25名經(jīng)常性顧客作隨機樣本,并對其中每一個人進行訪問以確定此人是否喜歡除這種存款方式以外的別的存款方式。調(diào)查結(jié)果列示于表16.13。設(shè)顯著性水平為0.05。表16.13 例16.8的抽樣結(jié)果喜歡另外一種存款方式的顧客數(shù)商店數(shù)(個)04152831041451561271681096100合 計100解: 假設(shè)的陳述:設(shè)分析員假定表16.14 例16.8中
21、的觀察頻數(shù)、相對預期頻數(shù)和預期頻數(shù)喜歡另外某種存款方式的顧客數(shù)商店數(shù)二項分布預期頻數(shù)040.00380.38150.02362.36280.07087.083100.135813.584140.186718.675150.196019.606120.163316.337160.110911.098100.06236.23960.02952.951000.01731.73合 計1001.0000100.00 在這些容量為25的樣本中,喜歡另外某種存款方式的顧客數(shù)服從二項分布在這些容量為25的樣本中,喜歡另外某種存款方式的顧客數(shù)不服從二項分布由于二項分布的參數(shù)沒有指定,以樣本數(shù)據(jù)估計: 利用的估計
22、值0.20,再假定一個二項分布, 計算檢驗所需的有關(guān)數(shù)據(jù)列示于表16.14。我們可以在0.05顯著性水平下否定“數(shù)據(jù)來自二項分布總體”的零假設(shè)。第三節(jié) 正負符號檢驗我們知道,參數(shù)假設(shè)檢驗大都建立在一定假定基礎(chǔ)上,當這些假定得不到滿足時,就要用不需要嚴格假定的方法。正負符號檢驗是一種比較簡單的方法。正負符號檢驗既可用于單一樣本、也可用于兩個樣本的比較檢驗;既可用于獨立樣本的檢驗,也可用于兩個有聯(lián)系的樣本的檢驗?,F(xiàn)在分別加以討論。一、單一樣本中位數(shù)的符號檢驗反映一個總體分布位置的參數(shù)主要有平均數(shù)和中位數(shù)。平均數(shù)反映的是分布重心的位置,而中位數(shù)該數(shù)上下出現(xiàn)的概率均為處。當分布對稱時,二者一致,分布不
23、對稱時,二者就有差別。在很多場合,需要對中位數(shù)的位置進行檢驗,可采用正負符號檢驗。例16.9 某鋼廠生產(chǎn)的鋼材,在正常情況下,中位數(shù)的長度為10米。現(xiàn)隨機地從生產(chǎn)線上抽取10根,測得長度(單位:米)如下:9.8 10.1 9.7 9.9 10 10 9.8 9.7 9.8 9.9試問:生產(chǎn)過程中對長度的控制是否需要適當調(diào)整。表16.15 中位數(shù)符號檢驗計算表長度符號9.8-0.2-10.10.1+9.7-0.3-9.9-0.1-1001009.8-0.2-9.7-0.3-9.8-0.2-9.9-0.1-解: 該例要解決的問題是:在生產(chǎn)過程中鋼材的程度在中位數(shù)10米上下各占一半的情形下,就不需要
24、調(diào)整生產(chǎn)過程。否則,多數(shù)過長或多數(shù)過短均需要調(diào)整。因而,假設(shè)可陳述為: 進行正負符號檢驗時,可以將樣本中每根的長度減去中位數(shù),大者為正號(+),小者為負號(-),計算結(jié)果如表16.15。從表16.15可以看出:10個樣本單位中,除有兩個與中位數(shù)相同外,余下的8個為1正7負。如果進一步用精確的測量儀器進行測量,則與中位數(shù)相同的2個單位也可以區(qū)分為正號或負號?,F(xiàn)假定為1個正號1個負號。這樣,10個樣本單位中就有2正8負。如果總體的中位數(shù)為10,那么,理論上出現(xiàn)正號和負號應(yīng)該各占一半?,F(xiàn)在,我們的問題是:出現(xiàn)2個或2個以下正號的概率是多少?我們用二項分布來計算: 由于是一個雙尾檢驗,因此,也應(yīng)包括負
25、號在2個或2個以下的概率,因此,。這就是說,當中位數(shù)為10時,出現(xiàn)上述結(jié)果的概率為0.1094,當時,不能否定。決策人員可以據(jù)此,結(jié)合其他因素作出是否需要調(diào)整生產(chǎn)過程的決策。在大樣本情況下,用二項分布計算概率比較復雜,也可以用正態(tài)近似計算: , (16.6)其中:代表正號的數(shù)目,表示在條件下正號或負號的平均數(shù)目(理論數(shù)目),0.5稱作校正項,分母為,樣本容量為時的標準差。當時否定。假如上例樣本容量為36的大樣本,各樣本單元觀察值與中位數(shù)之離差為正號有10個,此時,我們可以計算得到: 取絕對值為,否定。 數(shù)值,同樣否定。二、兩獨立樣本的符號檢驗假設(shè)和為抽自兩個總體的獨立樣本,X和Y的計量水準至少
26、是順序的,研究的變量為連續(xù)變量,要求檢驗這兩個總體的中位數(shù)是否相同。假設(shè)可陳述為: 兩個總體中位數(shù)相同 兩個總體中位數(shù)不同檢驗的方法是將兩個樣本按照統(tǒng)一順序排列,找出中位數(shù)。從直觀看,如果為真,則在樣本和中,超過中位數(shù)或低于中位數(shù)的數(shù)目應(yīng)該接近相等,亦即正、負符號各占一半左右。因此,可以把兩個樣本分別按照超過中位數(shù)的數(shù)目和低于中位數(shù)的數(shù)目整理成列聯(lián)表的形式,應(yīng)用檢驗或正態(tài)近似檢驗。例16.10 設(shè)有兩獨立樣本的觀察值如下:樣本1: 10 10 10 12 15 17 17 19 20 22 25 26樣本2: 6 7 8 8 12 16 19 19 22試檢驗這兩個總體的中位數(shù)是否相同。解:
27、先將兩組樣本的觀察值按統(tǒng)一順序排列,找出其中位數(shù)為16,然后,將每個觀察值和它比較,大于中位數(shù)用正號表示,小于中位數(shù)用負號表示,于是得到:樣本1: - - - - - + + + + + + +樣本2: - - - - - + + + +上述資料可以寫成表16.16的22列聯(lián)表形式。表16.16 例16.10中的22列聯(lián)表形式+-合 計樣本17512樣本2459合 計111021 依(16.4)式,可以算出: 若,自由度,查附表C得。,因此,不能否定,即不能說兩個總體中位數(shù)有顯著差別。三、兩個有聯(lián)系樣本的符號檢驗關(guān)于兩個有聯(lián)系的樣本的數(shù)據(jù)有各種各樣的情形,最常見的是對樣本中同一個單位經(jīng)過某種處
28、理前后的比較。例如,同一樣本的工人在實行獎金制度前后產(chǎn)量的比較;同一樣本的下蛋雞在使用某種飼料前后下蛋數(shù)量的比較等等。另一種情形是對成對的單位,其中一個給以某種處理,另外一個給以另一種處理或不加處理。在進行這種比較時,配對的單位應(yīng)盡可能一致。例如,在研究某種藥物的效果時,配對試驗的人必須在年齡、性別、體質(zhì)等方面盡可能一致,不至于有其他因素影響試驗的結(jié)果。在兩個有關(guān)樣本分析中,所研究的變量是這些成對樣本兩個觀察值之差。如果差別比較大,說明這種處理具有效應(yīng),反之,則沒有效應(yīng)。 兩個有關(guān)樣本的符號檢驗是要求有對成對樣本觀察值 , 這對觀察值是獨立的* 此處獨立之意義是指:(1)各之間相互獨立,各之間
29、相互獨立;(2)各之間不獨立。,觀察值的計量水準在每對之間至少是順序的,即可以比較其大小。研究的變量一般是連續(xù)的。其假設(shè)可陳述為: 兩個變量之差這一總體中位數(shù)為0 兩個變量之差這一總體中位數(shù)不為0這是雙尾檢驗,也可為單尾檢驗。在雙尾檢驗中,如果為真,則的正負號數(shù)目應(yīng)該比較接近,當正負號的數(shù)目差達到一定界限時,就否定。因此,上述假設(shè)也可陳述為: 兩個有關(guān)樣本的符號檢驗也是二項式檢驗的特殊情況。例16.11某城市為克服噪音污染,在全市展開了宣傳活動。現(xiàn)從全市抽取18個路口測試了宣傳前后的噪音(單位:分貝)記錄如下:宣傳前557468807769577263宣傳后416461707560535961
30、宣傳前528566714883785167宣傳后487965704781695062試以0.01的顯著性水平說明經(jīng)過宣傳之后,城市的噪音已下降了5分貝。解: 計算觀察值之差為: 14,10,7,10,2,9,4,13,2,4,6,1,1,1,2,9,1,5。分別減去5可得到,。根據(jù)二項式檢驗,要使的否定區(qū)概率小于0.01,則要求在13個以上,現(xiàn)在只有8個正號,因此,不能否定,即不能得出噪音已下降了5分貝的結(jié)論。第四節(jié) 兩樣本的等級檢驗第三節(jié)正負符號檢驗只是利用樣本觀察值之間的大小,用符號來表示,沒有充分利用數(shù)據(jù)所提供的信息,從而損失了部分統(tǒng)計功效。建立在等級基礎(chǔ)上的非參數(shù)統(tǒng)計方法彌補了這方面的
31、不足。一、威爾科克森配對符號秩檢驗正負符號檢驗和威爾科克森配對符號秩檢驗,都可看作是就成對觀察值而進行的參數(shù)方式的t-檢驗的代用品,非參數(shù)檢驗具有無需對總體分布作假定的優(yōu)點,而就成對觀察值作的參數(shù)方式的t-檢驗,必須假定有關(guān)的差別總體服從正態(tài)分布。例16.12 隨機地抽取10名學生的記分冊中某門課程期中和期末考試分數(shù)如表16.17第(2)和第(3)欄數(shù)據(jù)。試在0.05顯著性水平下作威爾科克森符號秩檢驗。表16.17 威爾科克森配對等級計算表* 表16.17的說明: 在威氏檢驗中,要用絕對值,把它們放在一起,按從1至n的順序排列秩次,差別最小者,其秩次為1。 以原值的符號(+或-)給這些秩加上相
32、應(yīng)符號。 若排秩時出現(xiàn)秩次相同,采用平均秩次。 若值為0,就去掉該項。學 生期中考試成績期末考試成績成績之差標 出 符 號 的 秩的秩秩(+)秩(-)17572-33328794+76.56.537292+209946567+22259386-76.56.568585075958-11187379+65596469+544107182+1188合 計-34.510.5解: 計算步驟如下:第1步:列出和的觀察值; 第2步:計算; 第3步:把等級恢復原正負符號。計算過程見表16.17。由表16.17,秩和分別按正差和負差計算,用秩(+)和秩(-)表示,以此為基礎(chǔ),形成零假設(shè)秩(+)=秩(-),即總
33、體分布相同。更具體地說,該假設(shè)表明該總體中的正差和負差是在均值0的兩端對稱分布的。兩個秩和中較小者,我們稱為威爾科克森T-統(tǒng)計量。該檢驗統(tǒng)計量:T=秩(-)=10.5。查威爾科克森T值的臨界值表(附表I),當n=10-1=9, 時,雙尾檢驗的臨界值。由于,因此不能否定,即兩次成績沒有顯著差別。在大樣本情形下,T是近似正態(tài)分布的,其均值和方差分別為: (16.7) (16.8)因此,我們可以計算: (16.9)二、曼-惠特尼U檢驗(秩和檢驗)這種方法通常用于兩獨立樣本的比較。秩和檢驗可以看作是對兩均值之差的參數(shù)檢驗方式的t-檢驗或相應(yīng)的大樣本正態(tài)檢驗的代用品。由于秩和檢驗明確地考慮了每一個樣本中
34、各測定值所排的秩,它比符號檢驗法使用了更多的信息。例16.13 某工廠欲測定在裝配線上男工和女工的機械技能有無差別。隨機地抽取了15組,每一個人都給以機械技能測試并給以評分,結(jié)果如表16.18。表16.18 男女工人機械技能測試分數(shù)男女男女507071875176738853777492568078935781899663829098648395996586-試以0.05顯著性水平檢驗?zāi)泄ず团さ臋C械技能是否相同。解: 假設(shè)的陳述: 男女性別之間的機械技能沒有差別 男女性別之間的機械技能存在差別在秩和檢驗中,首先是合并兩個樣本,按秩的順序排列每個人的得分,如表16.19。然后,按任一樣本觀察值
35、的秩和進行這一檢驗。表16.19 男女工人的機械技能測試分類陳列秩得 分性 別秩得 分性 別秩得 分性 別150男1173男2187女251男1274男2288女353男1376女2389男456男1477女2490男557男1578男2592女663男1680女2693女764男1781女2795男865男1882女2896女970女1983女2998女1071男2086女3099女我們引入下列符號: 一號樣本觀察值的項數(shù) 二號樣本觀察值的項數(shù) 一號樣本中各項秩和 二號樣本中各項秩和以男性工人的數(shù)據(jù)作為第1號樣本,找到是1,2,3,4,5,6,7,8,10,11,12,15,23,24與27
36、各秩和,即158。相應(yīng)地, 307。為進行這一檢驗,需要計算一個新的統(tǒng)計量U。其計算如(16.10)式: (16.10)根據(jù),這是一個雙尾檢驗。因此, 當時,雙尾檢驗,可查附表 得。因,不能否定,即在裝配線上的男工和女工在機械技能方面沒有顯著差別。在大樣本情形下,U的抽樣分布也接近正態(tài)分布,其均值和方差分別為: (16.11) (16.12)因此,我們可以計算: (16.13)第五節(jié) 多個樣本的檢驗 一、克魯斯卡-沃利斯檢驗我們曾在第十章介紹過方差分析,是通過個樣本來檢驗這些總體的平均數(shù)是否相等。但是,方差分析要求總體是正態(tài)分布的,而且要假定各個總體方差相等。若這些條件不滿足,其結(jié)論就會受到影
37、響。而克魯斯卡-沃利斯單因素方差分析這種非參數(shù)檢驗法,不依賴于上述嚴格的假定,它建立在等級基礎(chǔ)上,如果只考慮兩個樣本,則可發(fā)現(xiàn)是上一節(jié)曼-惠特尼U秩和檢驗法的推廣??唆斔箍?沃利斯檢驗所用的統(tǒng)計量,是把個獨立的簡單隨機樣本的觀察值放在一起,排列秩次后算出的。其假設(shè)可陳述為: 個總體是同分布的 個總體的分布并不完全相同例16.14 把某行業(yè)的公司分為大、中、小3類,并從這些公司的財務(wù)經(jīng)理中個抽取一個簡單隨機樣本。請他們對上半年國家的利率調(diào)動政策的效果進行評價,最后加成總分進行比較,評分結(jié)果如表16.20。試在0.05顯著性水平下檢驗3種評分是否一致。解: 陳述假設(shè)如下: 3種總評分一致表16.2
38、0 例16.14中按公司大小分組的評分和秩大 型 公 司中 型 公 司小 型 公 司評 分秩評 分秩評 分秩78126868214952077116558516841550187176139319751062470790187286028013-739 3種總評分不完全一致克魯斯卡-沃利斯檢驗統(tǒng)計量為: (16.14)其中: 第j個樣本中的觀察值個數(shù); 個樣本觀察值的總個數(shù); 第j個樣本的秩和。的分布近似于自由度的-分布。因此,可以利用-分布進行檢驗。依表16.20的有關(guān)數(shù)據(jù)及(16.14)式,計算得到: 若顯著性水平,則。因此,否定,即3種總評分不完全一致。我們可以得出結(jié)論:根據(jù)公司規(guī)模分組
39、,由財務(wù)經(jīng)理組成的3個樣本中評定的分數(shù)有顯著差別。由表16.20可以發(fā)現(xiàn),與中小公司經(jīng)理相比,大公司的經(jīng)理評定的分數(shù)較高。二、弗利德曼檢驗這種方法適用于個有關(guān)樣本。但是,確定秩的方法與克魯斯卡-沃利斯檢驗方法不同。弗利德曼檢驗是抽取個樣本單位,每個單位給予種不同的處理形成個觀察值。對每一個樣本單位中的不同處理的觀察值給以等級,即每個樣本單位由小到大有個等級(秩)。如果所有的處理具有同樣的效果,那么,每一列中的秩應(yīng)該是隨機分布的,若不是隨機的,就是說明各種處理有差別。弗利德曼檢驗的統(tǒng)計量是建立在各列秩和的基礎(chǔ)上,按(16.15)式計算。 (16.15)其中: 第j個樣本的秩和; 的自由度,采用檢
40、驗。例16.15 假設(shè)有一個新的訓練計劃分成4個單元,每個單元采用一不同方法,參加這一訓練的有14個隨機抽選的工人,在每個單元結(jié)束時,對這14人進行考試并給予成績。有關(guān)數(shù)據(jù)列示于表16.21。試在0.05顯著性水平下檢驗這4種方法總的效果之間有無顯著差別。解: 假設(shè)可陳述如下: 這4種方法總的效果之間并沒有差別 這4種方法總的效果之間存在差別這里是4個有關(guān)的樣本,因為,這是同樣14個人的考試成果,成績可以按順序加以排列,因此,適合用弗利德曼檢驗。在用這種方法時先要對每一個工人的成績的4種考試成績進行順序排列,以確定各樣本單位的秩,結(jié)果如表16.21。然后,計算檢驗統(tǒng)計量:表16.21 14名工
41、人的考試分數(shù)和秩樣本方 法1方 法2方 法3方 法4分 數(shù)秩分 數(shù)秩分 數(shù)秩分 數(shù)秩120(4)6(1)9(2)15(3)25(1)12(3)19(4)10(2)311(2)21(4)8(1)16(3)421(3)18(2)30(4)15(1)58(1)12(2)20(4)16(3)69(2)7(1)10(3)12(4)721(4)20(3)16(2)10(1)818(3)27(4)9(1)12(2)930(4)16(1)22(3)21(2)1022(3)27(4)19(2)18(1)1110(3)8(2)4(1)12(4)126(1)12(3)7(2)14(4)1310(1)12(2)21(
42、4)20(3)1414(2)11(1)23(3)27(4) 在顯著性水平時,有。因此,不能否定,即4種方法總的效果沒有顯著差別。第六節(jié) 其它非參數(shù)統(tǒng)計方法 一、關(guān)于聯(lián)系的非參數(shù)統(tǒng)計量關(guān)于研究兩組變量之間相互關(guān)系的密切程度這一問題,我們曾在第十一章中介紹過相關(guān)系數(shù)。但是,相關(guān)系數(shù)反映的是兩組變量之間線性相關(guān)的程度,若兩組變量之間存在非線性的聯(lián)系,相關(guān)系數(shù)就受到限制;另外,相關(guān)系數(shù)要求變量必須是用數(shù)字來計量的,而實際資料有時又缺乏數(shù)字計量,因而需要用非參數(shù)方法。1.斯皮爾曼秩相關(guān)系數(shù)斯皮爾曼秩相關(guān)系數(shù)反映的是兩組變量之間聯(lián)系的密切程度,它和相關(guān)系數(shù)一樣,取值在-1到+1之間,所不同的是建立在等級(秩)的基礎(chǔ)上計算的。我們用表示秩相關(guān)系數(shù),采用(16.16)式計算。 (16.16)例16.16 某工廠對工人的業(yè)務(wù)進行了一次考試,欲研究考試成績與每月產(chǎn)量之間的關(guān)系。若隨機地抽取一個簡單隨機樣本,有關(guān)數(shù)據(jù)列示于表16.22。表16.22 6個工人的考試成績、產(chǎn)量及相應(yīng)的秩工 人考試成績產(chǎn) 量秩成 績產(chǎn) 量1505006602605105503705304404805803305905902206951000110從表中數(shù)字可以看出,工人的考試成績越高,則產(chǎn)量也越高,二者之間的聯(lián)系程度是一致的。但是,相關(guān)系數(shù)并不算太高,這是由于它們之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教科版科學四年級上冊課堂管理教學計劃
- 教師探索“雙減”政策下教學模式心得體會
- 2025年年度醫(yī)藥行業(yè)工會工作計劃范文
- 城市綠地水土保持體系措施
- 風電場電力施工安全管理措施
- 食品加工HSE保證措施
- 兒童全麻患者復蘇管理措施及流程
- 以小見大:探尋中小學課堂道德細節(jié)的育人密碼
- 以復旦大學BBS論壇為鑒:網(wǎng)絡(luò)民主參與高校事務(wù)管理的現(xiàn)狀與突破
- 部編本四年級語文習作教學計劃
- 中藥飲片標簽管理規(guī)定
- 防臺風防雷安全
- 服飾2個人合伙人協(xié)議書范文
- 企業(yè)信息化建設(shè)與管理咨詢合同
- 國家開放大學電大《基礎(chǔ)寫作》期末題庫及答案
- 2025年中考作文試題預測及范文
- 中間人介紹工作合同模板
- 第3章-機床夾具
- 侵入性操作相關(guān)感染防控
- 江蘇省鎮(zhèn)江市近五年中考作文題目及2024年中考作文指導及例文
- 2024年譯林英語三年級上冊Unit1 第1課時 (教學課件)Cartoon time
評論
0/150
提交評論