03第三章樣本數(shù)據(jù)特征的初步分析_第1頁
03第三章樣本數(shù)據(jù)特征的初步分析_第2頁
03第三章樣本數(shù)據(jù)特征的初步分析_第3頁
03第三章樣本數(shù)據(jù)特征的初步分析_第4頁
03第三章樣本數(shù)據(jù)特征的初步分析_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章 樣本數(shù)據(jù)特征的初步分析主講:宇LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建本章要點樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次和頻率?3.1?3.2?3.3?3.4?3.5觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述樣本數(shù)據(jù)的離散特征樣本數(shù)據(jù)特征的綜合表達:箱型圖LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 3.1.1 頻次與頻率的基本概念v 頻次:在一個數(shù)據(jù)集合中,同一個數(shù)據(jù)值(樣本值)出現(xiàn)的次數(shù)。v 頻率:某樣本值的頻率=該樣

2、本值出現(xiàn)的頻次/n(該數(shù)據(jù)集合的數(shù)據(jù)總個數(shù))該樣本值出現(xiàn)的頻次某樣本值的頻率=該數(shù)據(jù)集合的數(shù)據(jù)總個數(shù)(n)LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 基于排序,能夠簡單統(tǒng)計頻次:故意增加了“9.94”這個刻度排成一行,看清楚了頻率結(jié)構(gòu)特征。以后的統(tǒng)計頻率、頻次,都由計算機完成。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建價格9.939.949.959.969.979.989.99次數(shù)1011234頻率%3.3303.333.336.6710.013.33

3、價格10.0010.0110.0210.0310.0410.0510.06次數(shù)4423221頻率%13.3313.336.6710.06.676.673.333.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 例3.1.2 抽樣后,得到客戶家具的基色調(diào)的數(shù)據(jù):(這是名義級數(shù)據(jù)案例)v R,Y,R,G,Y,Y,W,Y,G,G,R,Y,Y,R,W,v G,Y,R,W,Y,G,G,B,R,Y,Y,W,R,R,W,v R,Y,R,G,Y,Y,W,Y,G,G,R,Y,Y,R,W,v G,Y,R,W,Y,G,G,B,R,Y,Y,W,R,R,W,v 其中,R表示暗紅色,Y表示黃褐色,G表示淺綠色,W表示白表示黑色

4、v 統(tǒng)計出各個顏色出現(xiàn)的頻率如下:LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率當然,也可以統(tǒng)計出順序級數(shù)據(jù)集合的頻次與頻率結(jié)構(gòu)LOGOPDF 文件使用 "pdfFactory Pro"試用版本創(chuàng)建家具基色BGRWY合計基色頻次16851030基色頻率3.3320.026.716.733.31003.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 3.1.2 觀察樣本數(shù)據(jù)基本特征(頻次與頻率)的圖形方法v 1、表示頻次與頻率的餅圖v 每個不同的樣本值所占據(jù)的圓心角的大小又下式計算:v 在圓圈中

5、,給每個不同的樣本值一個與其頻次(或頻率)相當?shù)膱A心角:v 某樣本值對應(yīng)的圓心角=該樣本值的頻率×360°LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率家具基色調(diào)(名義級數(shù)據(jù))3. 33%淺綠色20. 00%黃褐色33. 33%暗紅色26. 67%白色16. 67%LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率某員工程度的結(jié)構(gòu)(順序級數(shù)據(jù))小學, 6. 25%初中, 12. 50%高中,12. 50%

6、,12. 50%大學,56. 25%LOGOPDF 文件使用 "pdfFactoryPro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 2、表示頻次與頻率的條形圖v (1)橫坐標:樣本數(shù)據(jù)的不同值。排序級以上,橫坐標上的樣本數(shù)據(jù)應(yīng)從小到大排列。若是刻度級的,則在排序中,要注意長度的刻度,保持一致的比例。v (2)縱坐標:相應(yīng)樣本值出現(xiàn)的頻次或頻率。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率某商品在30個商店的價格(注意間距)LOGOPDF 文件使用 "pdf

7、Factory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率某科室員工程度例(有順序,無間距)56. 25%60. 00%50. 00%40. 00%30. 00%20. 00%10. 00%0. 00%12. 50%12. 50%12. 50%6. 25%小學初中高中受教育程度大學LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建百分比3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率家具基色調(diào)例(橫坐標的色彩無順序關(guān)系)35. 00%30. 00%25. 00%20. 00%15. 00%10. 00%5. 00%0. 00%

8、33. 33%26. 67%20. 00%頻率16. 67%3. 33%黑色淺綠色暗紅色某色調(diào)白色黃褐色LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 3.1.3 樣本數(shù)據(jù)集合的基本特征的延伸:累計頻率v 1、累計頻率的概念v設(shè)m,是樣本數(shù)據(jù)集合中的不重復(fù)的樣本值(mn樣本個數(shù))。v 若把樣本 值小于等于某個樣本數(shù)據(jù) Xi 的頻率值,都累加起來,就得到“小于等于Xi”的累積頻率。v 2、表格法表示累積頻率(以價格問題為例)LOGOPDF 文件使用 "pdfFactory Pro" 試用

9、版本創(chuàng)建3.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率價格案例v 順序級數(shù)據(jù)能夠計算累積頻率嗎?v 名義級數(shù)據(jù)能夠計算累積頻率嗎?LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建價格9.939.949.959.969.979.989.99次數(shù)1011234頻率%3.3303.333.336.6710.013.33價格10.0010.0110.0210.0310.0410.0510.06次數(shù)4423221頻率%13.3313.336.6710.06.676.673.333.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率v 3. 累積頻率的條形圖表示v 把條形圖的縱

10、坐標改成累積頻率即可。100 . 00% 90 . 00% 80 . 00% 70 . 00% 60 . 00% 50 . 00% 40 . 00% 30 . 00% 20 . 00% 10 . 00% 0 . 00% 累積頻率9 . 93 9 . 95 9 . 97 9 . 99 10 . 01 10 . 03 10 . 05 商品價格XLOGOPDF 文件使用 "pdfFactoryPro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 3.2.1 莖葉圖的概念與作法v 1、概念v “莖葉”的含義:按照某規(guī)則,那所有的樣本值分成“莖節(jié)”和“葉”兩個部分。

11、表達為“莖節(jié)·葉”的形式。v “莖節(jié)”末位上的1所代表的實際值,就是“莖節(jié)”的寬度。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 例如,可用莖葉法,把123表示為1.23(此時, 莖節(jié)寬=100)v 此時,123(樣本值)=1.23(莖葉表達)×100(莖節(jié)寬)v 問:若莖節(jié)寬度為10,如何表達123?LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 2.例題和莖葉圖的作法v 例3.2.1

12、 某班級男生身高數(shù)據(jù)(CM)v 問:以100cm為莖節(jié)寬?LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建1711821751771781811851681701751771801761721651601781861901761631833.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 結(jié)論:樣本數(shù)據(jù)集合中的“莖節(jié)”必須是有變化的v 莖節(jié)寬應(yīng)為10cmv 把所有的數(shù)據(jù)都表達為“莖節(jié)·葉”形式后,把相同莖節(jié)的數(shù)據(jù)合并為“莖節(jié)·葉1葉2”形式(葉,要從小到大排列),再把不同的莖節(jié)從小到大縱向排列,就得到莖葉圖:LOGOPDF 文件使用

13、 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v莖葉v 16 · 0,3,5,8v 17 · 0,1,2,5,5,6,6,7,7,8,8v 18 · 0,1,2,3,5,6v 19 · 0v 可進一步簡化(注明頻次)LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 頻次v 4v 11v 6v 1莖葉16 · 035817 · 0125566778818 · 01235

14、619 · 0v 這就是身高數(shù)據(jù)的莖葉圖v 如果有的莖葉的葉子太多了,怎么辦?v 可以把莖葉砍短一點v 例如,把每個莖葉分成兩斷(L、H),可得到LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 頻次v 2v 2v 3v 8v 4v 2v 1莖16L葉· 0316H · 5817L · 01217H · 5566778818L · 012318H · 5619L · 0LOGOPDF 文件使用 "pdfFactor

15、yPro"試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v “莖節(jié)長度”的概念:莖節(jié)長度=覆蓋最大覆蓋最小值1值v 上例中的莖節(jié)長度為5(cm):04,59v 上例中的L、H可以省略。v 事實,上例的莖節(jié)是不必砍短的,因葉并不多v 注意:莖節(jié)砍短時,要注意莖節(jié)等長的原則LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 3.2.2 直方圖的概念與作法v 條形圖的弱點,當刻度級的數(shù)據(jù)的精度相對高,使得不重復(fù)的數(shù)據(jù)量非常大時,反而讓人看不清楚數(shù)據(jù)集合的結(jié)構(gòu)。如身高問題看不出規(guī)律LOGOP

16、DF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 1.直方圖的基本概念和適用范圍v 可以通過作法理解概念v 按照樣本值的大小,選擇恰當?shù)膮^(qū)間長度(通常要求區(qū)間是等長的),對所有的樣本值分組;v 統(tǒng)計所有組(區(qū)間)內(nèi)的樣本值的個數(shù)(頻次),或各個組內(nèi)的樣本值的個數(shù)占全部樣本值總個數(shù)的比例(頻率);v 用橫坐標,按照順序表示不同的區(qū)間(組),用豎立于區(qū)間上的矩形條的高度,表示相應(yīng)區(qū)間的樣本值的頻次或頻率。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本

17、數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 直方圖與條形圖的本質(zhì)差異在于:v 直方圖要對數(shù)據(jù)分組(或者說,按照一定的刻度范圍,把相鄰的數(shù)據(jù)并為一組);v 而條形圖不對數(shù)據(jù)分組,直接統(tǒng)計不同樣本值的重復(fù)次數(shù)(或者,也可以理解為只把相同的數(shù)據(jù)作為一組)v 直方圖的適用范圍:當刻度級樣本數(shù)據(jù)很多或者精度相對較高,使得數(shù)據(jù)集合中重復(fù)出現(xiàn)的樣本值過少時,就需要對數(shù)據(jù)分組,用直方圖觀察不同組數(shù)據(jù)的頻次與頻率LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖v 2.數(shù)據(jù)分組(不講)3. 繪制直方圖v 以身高為例,對數(shù)據(jù)適當分組,可看到清

18、楚的分布規(guī)律。各區(qū)間長度時5cm,起點是157.5cm,終點是192.5cm。OPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 3.3.1 樣本眾數(shù)v 1.樣本眾數(shù)定義1:樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的那個樣本值,稱為樣本眾數(shù)。在一般情況下, “樣本眾數(shù)”被簡稱為“眾數(shù)”。v 單一眾數(shù)v 復(fù)眾數(shù)v 無眾數(shù)v 可從條形圖,頻率表或者頻次表來表示。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 2.不同數(shù)據(jù)類型的區(qū)別v (1)對于

19、順序級的樣本數(shù)據(jù)集合而言,眾數(shù)的確定是最容易的;56. 25%60. 00%50. 00%40. 00%30. 00%20. 00%10. 00%0. 00%12. 50%12. 50%12. 50%6. 25%小學初中高中受教育程度大學LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建百分比3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v (2)對于名義級的樣本數(shù)據(jù)集合而言,可以有眾數(shù),但是沒什么實際意義,因為名義級的數(shù)據(jù)沒有順序位置的卻別(換言之,其不同樣本值的位置是可以任意排列的。)35. 00%30. 00%25. 00%20. 00%15. 00

20、%10. 00%5. 00%0. 00%33. 33%26. 67%20. 00%頻率16. 67%3. 33%黑色淺綠色暗紅色某色調(diào)白色黃褐色LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v (3)對于刻度級的樣本數(shù)據(jù)集合而言,情況會比較復(fù)雜,要具體對待。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 3. 樣本眾數(shù)定義2:對于刻度級的樣本數(shù)據(jù)集合而言,在對數(shù)據(jù)的等區(qū)間分組的直方圖中,把最高的矩形(即圖中的峰,Pea

21、k)所表示的數(shù)據(jù)區(qū)間稱該數(shù)據(jù)集合的眾數(shù)區(qū)間,簡稱眾數(shù)。該數(shù)據(jù)集合的眾數(shù)區(qū)間是:175±2.5PDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 3.3.2 樣本中位數(shù)v 設(shè),樣本數(shù)據(jù)集合中的所有數(shù)據(jù)的排列結(jié)果為,nn為樣本容量。樣本中位數(shù),就是上述序列中,處于“正中間位置”上的數(shù)據(jù)。v 兩個要素:位與數(shù)v 正中間位置“號碼”=(n+1)×0.5LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 比較嚴謹?shù)亩x是:

22、ìxn+1當n為奇數(shù)時,ï2Me = í x+ xnn +1ï 22ï當n為偶數(shù)時,î2LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.3樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述v 3.3.3 樣本均值v 樣本均值僅適用于刻度級的數(shù)據(jù)。v 樣本數(shù)據(jù)集合的樣本均值定義為:1nåx =Xini=1v 式中,xi為樣本觀察值。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v 3.4.1 對樣本數(shù)據(jù)離散特征的點狀描述:

23、極值、四分點與百分位點v 1.極大值與極小值v 極大值是數(shù)據(jù)集合中的最大值;v 極小值是數(shù)據(jù)集合中的最小值。v 極大值與極小值,從一定視角反映了樣本數(shù)據(jù)集合中樣本值的離散情況。v 適用于順序級以上的數(shù)據(jù)。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v 2. 下四分點與上四分點v (1)上、下四分點的概念v 下四分點把排序后的樣本數(shù)據(jù)集合分成了左右兩部分,使左邊部分包括25%的樣本總個數(shù),右邊部分包含75%的樣本總個數(shù)。v 上四分點把排序后的樣本數(shù)據(jù)集合分成了左右兩部分,使左邊部分包括75%的樣本總個數(shù),右邊部分包含25%

24、的樣本總個數(shù)。v 上、下四分點在一定意義上反映了樣本數(shù)據(jù)的離散程度。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v (2)上、下四分點(及中位數(shù))的位置v Q1:下四分點;Q2 =Me:中位數(shù);Q3:上四分點v n:該數(shù)據(jù)集合的數(shù)據(jù)總個數(shù)下四分點Q1的位置 =(n+1)´ 0.25正中間Q2的位置 =(n+1)´ 0.5上四分點Q3的位置 =(n+1)´ 0.75LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v (3)上

25、、下四分點的值v 當Q1、Q2 、Q3的位置為整數(shù)時,相對應(yīng)整數(shù)位置上的樣本值,就是Q1、Q2 、Q3的值。v 當其不為整數(shù)時:Q1位置左邊的樣本值+(Q1位置右邊的樣本值- Q1位置左邊的樣本值)´ Q1位置的小數(shù)部分= Q3位置左邊的樣本值+(Q3位置右邊的樣本值- Q3位置左邊的樣本值)´ Q3位置的小數(shù)部分LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v 3.4.2 對樣本數(shù)據(jù)離散特征的區(qū)間描述:極差、四分位距與離差v “區(qū)間描述”,必須要做加減運算,因此,區(qū)間描述僅適用于刻度級的數(shù)據(jù)。v 1.

26、極差v 極差=極大值極小值v 它反映了樣本數(shù)據(jù)在數(shù)軸上的分布范圍。v 2.四分位距v 四分位距(Iqr)=Q3Q1v 它反映了樣本數(shù)據(jù)集合中樣本值處于中間大小的1/2的數(shù)據(jù)的分布范圍。LOGOPDF 文件使用 "pdfFactory Pro" 試用版本創(chuàng)建3.4 樣本數(shù)據(jù)的離散特征v 3. 樣本離差與離差平方和v 樣本離差被定義為每個樣本與樣本均值之差:xi - x ,i = 1, 2,×× ×, nv 樣本離差又稱為樣本中心化數(shù)據(jù)。v 例3.4.1 的樣本數(shù)據(jù)為:99.8, 99.9, 100.1,v 100.2,均值為100.0,于是,樣本離差(中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論