數(shù)理統(tǒng)計(jì)方差與標(biāo)準(zhǔn)差_第1頁(yè)
數(shù)理統(tǒng)計(jì)方差與標(biāo)準(zhǔn)差_第2頁(yè)
數(shù)理統(tǒng)計(jì)方差與標(biāo)準(zhǔn)差_第3頁(yè)
數(shù)理統(tǒng)計(jì)方差與標(biāo)準(zhǔn)差_第4頁(yè)
數(shù)理統(tǒng)計(jì)方差與標(biāo)準(zhǔn)差_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心理和教育方面的實(shí)驗(yàn)或調(diào)查所得到的數(shù)據(jù),大都具有隨機(jī)變量的性質(zhì)。而對(duì)這些隨機(jī)變量的描述,僅有前一章所講集中趨勢(shì)的度量是不夠的。集中量數(shù)只描述數(shù)據(jù)的集中趨勢(shì)和典型情況,它還不能說(shuō)明一組數(shù)據(jù)的全貌。數(shù)據(jù)除典型情況之外,還有變異性的特點(diǎn)。對(duì)于數(shù)據(jù)變異性即離中趨勢(shì)進(jìn)行度量的一組統(tǒng)計(jì)量,稱作差異量數(shù),這些差異量數(shù)有標(biāo)準(zhǔn)差或方差,全距,平均差,四分差及各種百分差等等。第一節(jié)    方差與標(biāo)準(zhǔn)差      方差(Variance)也稱變異數(shù)、均方。作為統(tǒng)計(jì)量,常用符號(hào)S2表示,作為總體參數(shù),常用符號(hào)2表示。它是每個(gè)數(shù)據(jù)

2、與該組數(shù)據(jù)平均數(shù)之差乘方后的均值,即離均差平方后的平均數(shù)。方差,在數(shù)理統(tǒng)計(jì)中又常稱之為二階中心矩或二級(jí)動(dòng)差。它是度量數(shù)據(jù)分散程度的一個(gè)很重要的統(tǒng)計(jì)特征數(shù)。標(biāo)準(zhǔn)差(Standard deviation)即方差的平方根,常用S或SD表示。若用表示,則是指總體的標(biāo)準(zhǔn)差,本章只討論對(duì)一組數(shù)據(jù)的描述,尚未涉及總體問(wèn)題,故本章方差的符號(hào)用S2,標(biāo)準(zhǔn)差的符號(hào)用S。符號(hào)不同,其含義不完全一樣,這一點(diǎn)望讀者能夠給予充分的注意。一、方差與標(biāo)準(zhǔn)差的計(jì)算(一)未分組的數(shù)據(jù)求方差與標(biāo)準(zhǔn)差基本公式是: (3l a) (31b)表31說(shuō)明公式31a與31b的計(jì)算步驟表31 未分組的數(shù)據(jù)求方差與標(biāo)準(zhǔn)差Xi XiXx x2(X

3、iX)2 Xi2 6 5 7 4 6 8 0 -1 l -2 0 2 0 l 1 4 0 4 36 25 49 16 36 64 N6 Xi36 x0 x210 Xi2226   應(yīng)用31公式的具體步驟:先求平均數(shù)X36/66;計(jì)算Xi -X;求(Xi - X)2即離均差x2;將各離均差的平方求和 (x2);代入公式31a與31b求方差與標(biāo)準(zhǔn)差。具體結(jié)果如下: S2=10/6=1.67 (二)已分組的數(shù)據(jù)求標(biāo)準(zhǔn)差與方差數(shù)據(jù)分組后,便以次數(shù)分布表的形式出現(xiàn),這時(shí)原始數(shù)據(jù)不見(jiàn)了,若計(jì)算方差與標(biāo)準(zhǔn)差可用下式: (33a) (33b)式中d(Xc - AM) / i,AM為估計(jì)平均數(shù)Xc為各

4、分組區(qū)間的組中值f為各組區(qū)間的次數(shù)N=f 為總次數(shù)或各組次數(shù)和i為組距。下面以表18數(shù)據(jù)為例,說(shuō)明分組數(shù)據(jù)求方差與標(biāo)準(zhǔn)差的步驟:表32 次數(shù)分布表求方差與標(biāo)準(zhǔn)差   分組區(qū)間 Xc f d fd fd2 計(jì) 算 96- 93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 63- 60- 97 94 91 88 85 82 79 76 73 70 67 64 61 2 3 4 8 11 17 19 14 10 7 3 l 1 6 5 4 3 2 1 0 1 2 3 4 5 6 12 15 16 24 22 17 0 14 20 21 12 5 6 72 75

5、 64 72 44 17 0 14 40 63 48 25 36   S2=32* (570/100 -(28/100)2)=50.5944   S7113     i=3   f100   fd=28 fd2=570       具體步驟: 設(shè)估計(jì)平均數(shù)AM,任選一區(qū)間的Xc充任; 求d 用f乘d,并計(jì)算fd; 用d與fd相乘得fd2,并求fd2; 代入公式計(jì)算。二、方差與標(biāo)準(zhǔn)差的意義 方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好的指標(biāo)。其值越大,說(shuō)明離散程度大,其值小說(shuō)明數(shù)據(jù)比較集中,它是統(tǒng)計(jì)描

6、述與統(tǒng)計(jì)分析中最常應(yīng)用的差異量數(shù)。它基本具備一個(gè)良好的差異量數(shù)應(yīng)具備的條件:反應(yīng)靈敏,每個(gè)數(shù)據(jù)取值的變化,方差或標(biāo)準(zhǔn)差都隨之變化;有一定的計(jì)算公式嚴(yán)密確定;容易計(jì)算;適合代數(shù)運(yùn)算;受抽樣變動(dòng)的影響小,即不同樣本的標(biāo)準(zhǔn)差或方差比較穩(wěn)定;簡(jiǎn)單明了,這一點(diǎn)與其他差異量數(shù)比較稍有不足,但其意義還是較明白的。除上述之外,方差還具有可加性特點(diǎn),它是對(duì)一組數(shù)據(jù)中造成各種變異的總和的測(cè)量,能利用其可加性分解并確定出屬于不同來(lái)源的變異性(如組間、組內(nèi)等)并可進(jìn)一步說(shuō)明每種變異對(duì)總結(jié)果的影響,是以后統(tǒng)計(jì)推論部分常用的統(tǒng)計(jì)特征數(shù)。在描述統(tǒng)計(jì)部分,只需要標(biāo)準(zhǔn)差就足以表明一組數(shù)據(jù)的離中趨勢(shì)了。標(biāo)準(zhǔn)差比其他各種差異量數(shù)具

7、有數(shù)學(xué)上的優(yōu)越性,特別是當(dāng)已知一組數(shù)據(jù)的平均數(shù)與標(biāo)準(zhǔn)差后,便可知占一定百分比的數(shù)據(jù)落在平均數(shù)上下各兩個(gè)標(biāo)準(zhǔn)差,或三個(gè)標(biāo)準(zhǔn)差之內(nèi)。對(duì)于任何一個(gè)數(shù)據(jù)集合,至少有1一1/h2的數(shù)據(jù)落在平均數(shù)的h(大于1的實(shí)數(shù))個(gè)標(biāo)準(zhǔn)差之內(nèi)。(切比雪夫定理)。例如某組數(shù)據(jù)的平均數(shù)為50,標(biāo)準(zhǔn)差是5,則至少有75(1一1/22)的數(shù)據(jù)落在50-2*5至50+2*5即40至60之間,至少有889(1一1/32)的數(shù)據(jù)落在50-3*5至50+3*53565之間 (h=2,1-1/h2=1-1/22=3/4=75%,h=3, -1/h2=1-1/32=8/9=88.9%)。如果數(shù)據(jù)是呈正態(tài)分布,則數(shù)據(jù)將以更大的百分?jǐn)?shù)落在平均

8、數(shù)上下兩個(gè)標(biāo)準(zhǔn)差之內(nèi)(95)或三個(gè)標(biāo)準(zhǔn)差之內(nèi) (99.)。三、由各小組的標(biāo)準(zhǔn)差求總標(biāo)準(zhǔn)差 由于方差具有可加性特點(diǎn),在已知幾個(gè)小組的方差或標(biāo)準(zhǔn)差的情況下,可以計(jì)算出幾個(gè)小組聯(lián)合在一起的總的方差或標(biāo)準(zhǔn)差。這種計(jì)算常在科研協(xié)作中應(yīng)用,例如先了解各班學(xué)生情況,再了解全年級(jí)情況;或先了解各年級(jí)情況,再了解全??偟那闆r。但這種方差或標(biāo)準(zhǔn)差的合成,只有在應(yīng)用同一種觀測(cè)手段,測(cè)量的是同一個(gè)特質(zhì),只是樣本不同時(shí),才能應(yīng)用。計(jì)算總方差或總標(biāo)準(zhǔn)差的公式如下; (34a) (34b) 式中 為總方差 為總標(biāo)準(zhǔn)差 N1Nn為各小組數(shù)據(jù)個(gè)數(shù) 為總平均數(shù) 為各小組的平均數(shù)四、標(biāo)準(zhǔn)差的應(yīng)用 (一)差異系數(shù)(Coefficie

9、nt of variation)當(dāng)所觀測(cè)的樣本水平比較接近,而且是對(duì)同一個(gè)特質(zhì)使用同一種測(cè)量工具進(jìn)行測(cè)量時(shí),要比較不同樣本之間離散程度的大小,一般可直接比較標(biāo)準(zhǔn)差或方差的大小-標(biāo)準(zhǔn)差的值大說(shuō)明該組數(shù)據(jù)較分散,若標(biāo)準(zhǔn)差小,則說(shuō)明該組數(shù)據(jù)較集中。標(biāo)準(zhǔn)差的單位與原數(shù)據(jù)的單位相同,因而有時(shí)稱它為絕對(duì)差異量。在對(duì)不同樣本的觀測(cè)結(jié)果的離散程度進(jìn)行比較時(shí),常會(huì)遇到下述情況:兩個(gè)或多個(gè)樣本所測(cè)的特質(zhì)不同,即所使用的觀測(cè)工具不同,如何比較其離散程度?即使使用的是同+種觀測(cè)工具,但樣本的水平相差較大時(shí),如何比較它們的離散程度?在第一種情況下,標(biāo)準(zhǔn)差的單位不同,顯然不能直接比較標(biāo)準(zhǔn)差的大小。第二種情況雖然標(biāo)準(zhǔn)差的單

10、位相同,但兩樣本的水平不同,這可從平均數(shù)的大小明顯不同確定。通常情況下,平均數(shù)的值較大,其標(biāo)準(zhǔn)差的值一般也較大,平均數(shù)的值較小,其標(biāo)準(zhǔn)差的值也較小。這種情況下,若直接比較標(biāo)準(zhǔn)差取值的大小,借以比較不同樣本的分散情況是無(wú)意義的??梢?jiàn),上述兩種情況下,若用絕對(duì)差異量進(jìn)行直接比較以確定其分散程度的大小是不行的,這時(shí)可用相對(duì)差異量進(jìn)行比較。最常用的相對(duì)差異量就是差異系數(shù)。差異系數(shù),又稱變異系數(shù)、相對(duì)標(biāo)準(zhǔn)差等,通常用符號(hào)CV表示,其計(jì)算如下,CV=S / M * 100 (35) 式中S為某樣本的標(biāo)準(zhǔn)差M為該樣本的平均數(shù)。差異系數(shù)在心理與教育研究中常用于:同一團(tuán)體不同觀測(cè)值離散程度的比較,對(duì)于水平相差較

11、大,但進(jìn)行的是同一種觀測(cè)的各種團(tuán)體,進(jìn)行觀測(cè)值離散程度的比較。例2 已知某小學(xué)一年級(jí)學(xué)生的平均體重為25公斤,體重的標(biāo)準(zhǔn)差是3.7公斤,平均身高110厘米,標(biāo)準(zhǔn)差為6.2厘米,問(wèn)體重與身高的離散程度哪個(gè)大?解: CV體重3.7 / 25 * 10014.8 CV身高6.2 / 110 * 1005.64通過(guò)比較差異系數(shù)可知,體重的分散程度比身高的分散程度大(14.8>5.64)。例3 通過(guò)同一個(gè)測(cè)驗(yàn),一年級(jí)(7歲)學(xué)生的平均分?jǐn)?shù)為60分,標(biāo)準(zhǔn)差為4.02分,五年級(jí)(14歲)學(xué)生的平均分?jǐn)?shù)為 80分,標(biāo)準(zhǔn)差為6.04分,問(wèn)這兩個(gè)年級(jí)的測(cè)驗(yàn)分?jǐn)?shù)中哪一個(gè)分散程度大?解: CV一年級(jí)4.02 /

12、 60 * 100= 6.7 CV五年級(jí)6.04 /80 * 100= 7.55答;五年級(jí)的測(cè)驗(yàn)分?jǐn)?shù)分散程度大。在應(yīng)用差異系數(shù)比較相對(duì)差異大小時(shí),一般應(yīng)注意測(cè)量的數(shù)據(jù)要保證具有等距的尺度,這時(shí)計(jì)算的平均數(shù)和標(biāo)準(zhǔn)差才有意義,應(yīng)用差異系數(shù)進(jìn)行比較也才有意義。另外,觀測(cè)工具應(yīng)具備絕對(duì)零,這時(shí)應(yīng)用差異系數(shù)去比較分散程度效果才更好。因此,差異系數(shù)常用于重量、長(zhǎng)度、時(shí)間,編制得好的測(cè)驗(yàn)量表范圍內(nèi)。第三,差異系數(shù)只能用于一般的相對(duì)差異量的描述上,至今尚無(wú)有效的假設(shè)檢驗(yàn)方法,因此對(duì)差異系數(shù)不能進(jìn)行統(tǒng)計(jì)推論。(二)標(biāo)準(zhǔn)分?jǐn)?shù)(standard score)標(biāo)準(zhǔn)分?jǐn)?shù)又稱基分?jǐn)?shù)或z分?jǐn)?shù),是以標(biāo)準(zhǔn)差為單位表示一個(gè)分?jǐn)?shù)在

13、團(tuán)體中所處位置的相對(duì)位置量數(shù)。1計(jì)算公式; Z = (X )/ S (36)式中X代表原始數(shù)據(jù),X為一組數(shù)據(jù)的平均數(shù),S為標(biāo)準(zhǔn)差。從公式36可以明了,Z分?jǐn)?shù)的意義,它是一個(gè)數(shù)與平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商數(shù),它無(wú)實(shí)際單位。如果了個(gè)數(shù)小于平均數(shù),其值為負(fù)數(shù),如果一個(gè)數(shù)的值大于平均數(shù),其值為正數(shù),如果一個(gè)數(shù)的值等于平均數(shù),其值為零??梢?jiàn)Z分?jǐn)?shù)可以表明原數(shù)目在該組數(shù)據(jù)分布中的位置,故稱為相對(duì)位置量數(shù)。例4 某班平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為3分,甲生得942分,乙生得891分,求甲乙'學(xué)生的Z分?jǐn)?shù)各是多少?解:根據(jù)公式36Z甲=(94.290) / 3 = 1.4Z乙=(89.190) / 3

14、= -0.3Z分?jǐn)?shù)表示其原分?jǐn)?shù)在以平均數(shù)為中心時(shí)的相對(duì)位置,這比使用平均數(shù)和原分?jǐn)?shù)表達(dá)了更多的信息。 2Z分?jǐn)?shù)的性質(zhì) 在一組數(shù)據(jù)中所有由原分?jǐn)?shù)轉(zhuǎn)換得出的z分?jǐn)?shù)之和為零,其Z分?jǐn)?shù)的平均數(shù)亦為零。一組數(shù)據(jù)中各z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1。3Z分?jǐn)?shù)的應(yīng)用Z分?jǐn)?shù)可用于比較分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低。因?yàn)閦分?jǐn)?shù)可以表明各原數(shù)目在該組數(shù)據(jù)分布中的相對(duì)位置,它無(wú)實(shí)際單位。這樣不同觀測(cè)值的比較便可進(jìn)行。這里所說(shuō)的數(shù)據(jù)分布中相對(duì)位置包括兩個(gè)意思,一個(gè)是表示某原數(shù)目以平均數(shù)為中心以標(biāo)準(zhǔn)差為單位所處距離的遠(yuǎn)近與方向;另一個(gè)意思是表示某原數(shù)目在該組數(shù)據(jù)分布中的位置,即在該數(shù)目以下或以上的數(shù)據(jù)各有多少,如

15、果在一個(gè)正態(tài)分布(或至少是一個(gè)對(duì)稱分布)中,這兩個(gè)意思可合二為一。但在一個(gè)偏態(tài)分布中,這兩個(gè)意思就不能統(tǒng)一。這一點(diǎn)在應(yīng)用z分?jǐn)?shù)時(shí)要特別注意。例如有一人的身高是170厘米,體重是65公斤(也可以是另一人的體重),究竟身高還是體重在各自的分布中較高?這是屬于兩種不同質(zhì)的觀測(cè),不能直接比較。但若我們知道各自數(shù)據(jù)分布的平均數(shù)與標(biāo)準(zhǔn)差,這樣我們可分別求出z分?jǐn)?shù)進(jìn)行比較。設(shè)Z身高1.700.5,Z體重65=1.2,則可得出該人的體重離平均數(shù)的距離要比身高離平均數(shù)的距離遠(yuǎn),即該人在某團(tuán)體中身高稍偏高,而體重更偏重些。如果該團(tuán)體,身高與體重的次數(shù)分布為正態(tài),我們還可更確切地知道該人的身高與體重在次數(shù)分布的相對(duì)

16、位置是多少,從而進(jìn)行更確切(或更數(shù)量化)的比較。 、當(dāng)已知各不同質(zhì)的觀測(cè)值的次數(shù)分布為正態(tài)時(shí),可用z分?jǐn)?shù)求不同的觀測(cè)值的總和或平均值,以示在團(tuán)體中的相對(duì)位置。在算術(shù)平均數(shù)一節(jié)中講到,在計(jì)算平均數(shù)時(shí),要求數(shù)據(jù)必須同質(zhì),否則會(huì)使平均數(shù)沒(méi)有意義,但有時(shí)需要將不同質(zhì)的數(shù)據(jù)合成,這時(shí)可采用Z分?jǐn)?shù)。例如已知高考的各科成績(jī)分布是正態(tài)分布,但是由于各科的難易度不同,因此,各科成績(jī)就屬于不同質(zhì)的數(shù)據(jù)。以前常采取總和分?jǐn)?shù)或求平均分?jǐn)?shù)的方法,這是不科學(xué)的。如果應(yīng)用Z分?jǐn)?shù)求總和或平均數(shù)則更有意義。類似這種情況有期末成績(jī)總和等。舉例如下表3-3 利用Z分?jǐn)?shù)求總和  科目 原始分?jǐn)?shù) 甲 乙 全體考生 平均數(shù) 標(biāo)

17、準(zhǔn)差 Z分?jǐn)?shù) 甲 乙 語(yǔ)文 政治 外語(yǔ) 數(shù)學(xué) 理化 85 89 70 62 68 72 53 40 72 87 70 lO 65 5 69 8 50 6 75 8 1.500 1.900 1.000 -0.600 0.125 0.375 0.500 -1.667 0.315 1.500 總計(jì) 348 350   2.500 1.505 假設(shè)二例是高等學(xué)校入學(xué)考試兩名考生甲與乙的成績(jī)分?jǐn)?shù)。如果按總分錄取則取乙生,若按標(biāo)準(zhǔn)分?jǐn)?shù)錄取則應(yīng)取甲生;為何會(huì)出現(xiàn)如此懸殊的差別?這是由于不恰當(dāng)?shù)赜?jì)算總和分?jǐn)?shù)造成的,因?yàn)楦骺瞥煽?jī)難易度不同,分散程度也不同;:各門學(xué)科的成績(jī)分?jǐn)?shù)是不等價(jià)的,亦即數(shù)據(jù)是不同

18、質(zhì)的,這時(shí)應(yīng)用總和分?jǐn)?shù)不夠科學(xué),故此出現(xiàn)這類問(wèn)題,科學(xué)的方法應(yīng)當(dāng)用Z分?jǐn)?shù)合成。從Z分?jǐn)?shù)可知甲生多數(shù)成績(jī)是在平均數(shù)以上,即使有兩種成績(jī)低于平均數(shù),差別也小??傊煽?jī)較穩(wěn)定且在分布較高處,而乙生則不然??梢?jiàn)應(yīng)用Z分?jǐn)?shù)更趨合理。表示標(biāo)準(zhǔn)測(cè)驗(yàn)分?jǐn)?shù) 經(jīng)過(guò)標(biāo)準(zhǔn)化的心理與教育測(cè)驗(yàn),如果其常模分?jǐn)?shù)分布接近正態(tài)分布,常常轉(zhuǎn)換成正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)。轉(zhuǎn)換公式為 Z= aZ + b (37)式中Z為正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù),Z(X )/,a、b為常數(shù),為測(cè)驗(yàn)常模的標(biāo)準(zhǔn)差。例如早期的智力測(cè)驗(yàn)所測(cè)的智力指標(biāo)為智商(IQ) 這種表示智力的方法有一定局限性,因?yàn)槿说匠赡暌院笾橇Σ辉匐S年齡而增長(zhǎng),到了老年甚至智力有衰退。要用上面的公式表示,則不好。因此,韋克斯勒(DWechsler)制定新的智力量表時(shí)則用離差智商的概念表示一個(gè)人在同齡團(tuán)體中的相對(duì)智力。 IQ=15Z+100(WAIS)韋氏成人智力量表,其中Z = (X )/ S ,X為原分?jǐn)?shù), 為某團(tuán)體(或年齡組)的平均數(shù),S為該年齡組的標(biāo)準(zhǔn)差。離差智商的常數(shù)100與15實(shí)際為總平均數(shù)與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論