




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第二章第二章 統(tǒng)計資料的收集與整理統(tǒng)計資料的收集與整理主要內(nèi)容第一節(jié) 統(tǒng)計數(shù)據(jù)的收集第二節(jié) 統(tǒng)計數(shù)據(jù)的整理第三節(jié) 頻數(shù)分布第四節(jié) 統(tǒng)計表和統(tǒng)計圖一、統(tǒng)計調查的重要性(一)統(tǒng)計調查的概念統(tǒng)計調查就是根據(jù)統(tǒng)計研究的目的、要求和任務,運用各種科學的調查方法,有計劃、有組織地收集有關現(xiàn)象的各個單位的資料,對客觀事實進行登記,取得真實可靠的原始資料的工作過程。(二)統(tǒng)計調查的地位統(tǒng)計調查是整個統(tǒng)計工作的基礎環(huán)節(jié)。統(tǒng)計設計統(tǒng)計設計統(tǒng)計調查統(tǒng)計調查統(tǒng)計整理統(tǒng)計整理統(tǒng)計分析統(tǒng)計分析等等(三)統(tǒng)計調查的要求1、準確性準確性:如實反映客觀實際。2、及時性及時性:就是時效性,要求按統(tǒng)計調查方案中規(guī)定的時間,如期提供
2、資料。3、完整性完整性:不重復、不遺漏所列調查項目的資料。二、數(shù)據(jù)二、數(shù)據(jù)收集的種類和方法收集的種類和方法(一)統(tǒng)計數(shù)據(jù)的來源(一)統(tǒng)計數(shù)據(jù)的來源直接來源:直接來源: 專門組織的調查(主要用來取得社會經(jīng)濟數(shù)據(jù)) 科學試(實)驗(主要用來取得自然科學數(shù)據(jù))間接來源:間接來源: 相關的年鑒、期刊、廣播、電視傳媒和有關出版物等 有關網(wǎng)站搜尋(二)數(shù)據(jù)的搜集方法(二)數(shù)據(jù)的搜集方法1 1、訪問調查(派員調查):、訪問調查(派員調查):調查者與被調查者通過面對面的交談獲取調查資料;2 2、郵寄調查:、郵寄調查:通過郵寄或其他方式將問卷送至被調查者,由被調查者填寫問卷并寄回或投放到指定收集點;愛輪滑愛輪滑
3、 兒童輪滑鞋兒童輪滑鞋3 3、電話調查:、電話調查:調查者利用電話同受訪者進行語言交流以獲取信息; 4 4、座談會(集體訪談):、座談會(集體訪談):將受訪者集中在調查現(xiàn)場,使其對調查主題發(fā)表意見以獲取調查資料; 5 5、個別深度訪問:、個別深度訪問:一次只有一名受訪者參加的特殊的定性研究。 注意:注意:座談會與個別深度訪問主要是定性方法,目的是獲取有關特定主題的定性資料,以研究問題的性質和未來趨勢,不對研究總體數(shù)量特征進行推斷。三、數(shù)據(jù)收集的主要組織形式三、數(shù)據(jù)收集的主要組織形式(一)普查(一)普查 為某一特定目的而專門組織的一次性全面調查。 如:如:人口普查、工業(yè)普查等普查的特點普查的特點
4、: (1)通常是周期性的或一次性的,涉及面廣、耗時、費力,一般需間隔較長時間; (2)一般需要規(guī)定統(tǒng)一的標準調查時間,以避免調查數(shù)據(jù)的重復或遺漏; (3)準確性一般較高,較規(guī)范; (4)適用的對象較窄,只能調查一些最基本、最一般的現(xiàn)象。(二)抽樣調查(二)抽樣調查 從調查對象的總體中隨機抽取一部分單位作為樣本進行調查,并根據(jù)樣本調查結果推斷總體數(shù)量特征。 抽樣調查的特點抽樣調查的特點(1 1)按照隨機原則抽取調查單位。)按照隨機原則抽取調查單位。(2 2)根據(jù)部分來推斷總體。)根據(jù)部分來推斷總體。(3 3)產(chǎn)生的誤差是可以控制的。)產(chǎn)生的誤差是可以控制的。優(yōu)越性優(yōu)越性(1)經(jīng)濟性強經(jīng)濟性強:工
5、作量小、可節(jié)省人、財、物力;(2)時效性高時效性高:可迅速、及時地獲得所需要的信息;(3)適應面廣適應面廣:可獲得更廣泛的信息,適用于各個領域、各種問題的調查;(4)準確性高準確性高:工用量小,從而工作可做得更細,誤差往往很小作用作用(1)抽樣調查可以承擔全面調查無法或很難承擔的調查任務;愛輪滑愛輪滑 兒童輪滑鞋兒童輪滑鞋(2)抽樣調查和全面調查相結合,可以發(fā)揮相互補充和核對的作用;(3)利用抽樣方法進行生產(chǎn)過程的質量控制;(4)抽樣方法可以用來檢驗總體特征的某些假設。 3 3、統(tǒng)計報表、統(tǒng)計報表 按國家有關法規(guī)規(guī)定,自上而下地統(tǒng)一布置,自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)。 特點特點: 統(tǒng)一的表式
6、、統(tǒng)一的指標、統(tǒng)一的報送時間、統(tǒng)一的報送程序。 (1)按報送調查范圍調查范圍分: 全面報表全面報表:調查對象中的每一個單位都填報 非全面報表非全面報表:只要求調查對象中的一部分單位填報 (2)按報送時間間隔時間間隔分:日報、月報、季日報、月報、季報、年報報、年報(3)按報送地域報送地域(機構)范圍分: 國家報表、地方報表、部門報表國家報表、地方報表、部門報表類型類型:4 4、重點調查、重點調查 從調查對象的全部單位中選擇少數(shù)重點單位進行調查(適用于“同類”中的“大戶”)。 重點單位重點單位是這些單位的標志值之和占總體全部單位標志值總量的絕大部分。5 5、典型調查、典型調查 從調查對象的全部單位
7、中有意識地選擇一個或幾個有代表性的單位進行調查。(不一定針對“大戶”) 注意:注意:重點調查、典型調查與抽樣調查的重點調查、典型調查與抽樣調查的不同不同處處在于:在于: 1 1、抽樣調查是隨機抽取調查單位,不存在對調查對象選擇的主觀性,因此可以根據(jù)抽樣結果推斷總體的數(shù)量特征; 2、重點調查和典型調查不是隨機取樣,具有一定的主觀性,因此調查結果不能推斷總體。四、統(tǒng)計調查方案的設計四、統(tǒng)計調查方案的設計調查方案是指導整個調查過程的綱領性文件,大調查方案是指導整個調查過程的綱領性文件,大體包括調查目的、調查對象、調查項目和調查體包括調查目的、調查對象、調查項目和調查表等內(nèi)容,具體:表等內(nèi)容,具體:確
8、定調查內(nèi)容確定調查內(nèi)容確定調查對象和調查單位確定調查對象和調查單位確定調查項目,擬定調查標式確定調查項目,擬定調查標式確定調查時間和方法確定調查時間和方法制定調查工作的組織實施計劃。制定調查工作的組織實施計劃。 統(tǒng)計數(shù)據(jù)的整理(統(tǒng)計數(shù)據(jù)的整理(summarizing data)summarizing data)是指對所搜集是指對所搜集的數(shù)據(jù)進行加工整理、使之系統(tǒng)化、條理化,以符合分的數(shù)據(jù)進行加工整理、使之系統(tǒng)化、條理化,以符合分析的需要。析的需要。包括對包括對原始資料的整理原始資料的整理和和次級資料的整理次級資料的整理 一、統(tǒng)計整理的意義一、統(tǒng)計整理的意義 統(tǒng)計資料的整理統(tǒng)計資料的整理是實現(xiàn)從
9、個體單位標志是實現(xiàn)從個體單位標志值過渡到總體數(shù)量特征值的必經(jīng)階段,是值過渡到總體數(shù)量特征值的必經(jīng)階段,是統(tǒng)計分析的前提。統(tǒng)計分析的前提。二、統(tǒng)計整理的內(nèi)容和步驟二、統(tǒng)計整理的內(nèi)容和步驟數(shù)據(jù)與處理統(tǒng)計分組與匯總編制統(tǒng)計圖表資料積累與保管設計統(tǒng)計整理方案三、統(tǒng)計分組三、統(tǒng)計分組(一)統(tǒng)計分組的概念與種類1、統(tǒng)計分組的概念統(tǒng)計分組統(tǒng)計分組是將預處理過的數(shù)據(jù)按照某種標志(特征或標準)分成不同性質的組。統(tǒng)計分組標志:統(tǒng)計分組標志:分組時所依據(jù)的特征或標準,有品質標志品質標志和數(shù)量標志數(shù)量標志。統(tǒng)計分組對總體總體而言是分分,對于單位單位而言是合。合。由此可見,選擇一種分組方法,突出一種差異,顯示了一種矛盾
10、,同時必然掩蓋了其他差異。不同的分組方法,可能得出不同的結論。、統(tǒng)計分組的原則、統(tǒng)計分組的原則窮盡性原則窮盡性原則互斥性原則互斥性原則、統(tǒng)計分組的種類、統(tǒng)計分組的種類(1)按分組標志的多少多少,分為簡單分組簡單分組和復合分組。復合分組。(2)按分組標志的性質性質不同,分為品質標品質標志分組志分組(或稱屬性分組)和數(shù)量標志分數(shù)量標志分組組(或稱變量分組)(3)按分組的作用和任務作用和任務的不同,分為類類型分組型分組、結構分組結構分組和分析分組。分析分組。(二)統(tǒng)計分組的方法(二)統(tǒng)計分組的方法 1、品質標志的分組方法、品質標志的分組方法 關鍵是確定分組標志確定分組標志。一般比較簡單,主要采用統(tǒng)一
11、的分類標準。品質標志劃分各組界限一般取決于統(tǒng)計分析對各組粗細的要求。但也要注意變異間的過度形態(tài),是組限不易劃分。例城鄉(xiāng)劃分。 2、數(shù)量標志的分組方法數(shù)量標志的分組方法 關鍵是確定分組標志確定分組標志和確定分組界限。確定分組界限。 (1)單項式分組與組距式分組 單項式分組單項式分組適用于離散型變量離散型變量且變量變動范圍不大的場合。比如育齡婦女按其生育子女存活數(shù)分組。 組距式分組組距式分組適合于連續(xù)型變量連續(xù)型變量或者變動范圍較大的離散型變量。(2)間斷組距式分組和連續(xù)組距式)間斷組距式分組和連續(xù)組距式分組分組 如果變量值只是在整數(shù)整數(shù)間變動,可采用間間斷組距式分組斷組距式分組,也可采用連續(xù)組距
12、式分組連續(xù)組距式分組。比如企業(yè)數(shù)、職工人數(shù)等。 如果變量值在一定范圍內(nèi)的表現(xiàn)既可以是整數(shù)整數(shù),也可以是小數(shù)小數(shù),只能采用連續(xù)組距式分連續(xù)組距式分組組。比如產(chǎn)值、身高、體重。 注意:“上限不在內(nèi)上限不在內(nèi)”原則的應用。(3)等距分組與異距分組)等距分組與異距分組 等距分組等距分組適用: 標志值變動比較均勻均勻的情況。 異距分組異距分組適用: 標志值分布很不均勻很不均勻的場合; 標志值相等的量具有不同意義不同意義的場合; 標志值按一定的比例發(fā)展變化比例發(fā)展變化的場合。(4)組距、組數(shù)、組限與組中值的計算)組距、組數(shù)、組限與組中值的計算 組距組距=上限-下限= 本組上限-前組上限 =本組下限-前組下
13、限 組數(shù)組數(shù)的確定: 經(jīng)驗上經(jīng)驗上以520之間為好,尤其注意不要確定太多的組數(shù),使得每組包含的數(shù)據(jù)太少。 組數(shù)組數(shù)的確定:實際分組實際分組時常按斯特格斯(Sturges)提出的經(jīng)驗公式來確定組數(shù)K:組中值組中值計算:組中值=(上限+下限)/2N210N10lg322. 31 loglog1K或一、分配數(shù)列的概念 在統(tǒng)計分組的基礎上,列出各組對應的單位數(shù),形成總體單位數(shù)在各個組的分布,稱統(tǒng)計分布,又稱分配數(shù)列或次數(shù)分布或頻數(shù)分布。 分配數(shù)列包括兩個要素:總體按某標志所分的組組和各組對應的單位數(shù)單位數(shù)(頻數(shù))或頻率。頻數(shù)的表示百分數(shù)頻數(shù)百分數(shù)頻數(shù)(Percentage frequency):is
14、the relative frequency multiplied by 100.相對頻數(shù)相對頻數(shù)(Relative frequency)/頻率頻率/ /比重比重各組頻數(shù)與全部頻數(shù)之和的比重。 The relative frequency of a class is the proportion of the total number of data items belonging to the class.(=Frequency of the class/n)二二、 分配數(shù)列的編制分配數(shù)列的編制(一)品質數(shù)據(jù)的分組與頻數(shù)分布(一)品質數(shù)據(jù)的分組與頻數(shù)分布例例1 1購買的不同品牌的機型數(shù)據(jù)購買
15、的不同品牌的機型數(shù)據(jù)Table, Data from a sample of 50 computer purchases(11/15,1994)IBMIBMPackard BellCompaqIBMPackard BellGateway200Packard BellCompaqCompaqGateway200Packard BellIBMAppleCompaqIBMPackard BellAppleAppleCompaqGateway2000CompaqPackard BellCompaqCompaqApplePackard BellPackard BellAppleIBMIBMAppleAp
16、pleGateway2000Packard BellAppleAppleIBMAppleIBMPackard BellAppleCompaqAppleCompaqPackard BellGateway200CompaqAppleCompaq 分組與求頻數(shù)分組與求頻數(shù) :Table, Frequency Distribution/Relative and Percentage Frequency of Computer Purchases Company Frequency Relative Percentage Frequency Frequency Apple 13 0.26 26 Comp
17、aq 12 0.24 24 Gatewy2000 5 0.10 10 IBM 9 0.18 18 Packard Bell 11 0.22 22 Total 50 1.00 100The objective in developing a frequency distribution is to provide insights about the data that cannot be quickly obtained by looking only at the original data.(二)(二)數(shù)值數(shù)據(jù)的分組與頻數(shù)分布數(shù)值數(shù)據(jù)的分組與頻數(shù)分布 對數(shù)值數(shù)據(jù)(或按數(shù)值標志)分組時,可先
18、先將數(shù)據(jù)進行排序排序,然后后根據(jù)需要分組分組;對較少的數(shù)據(jù)也可不排序直接根據(jù)需要分組。 分組計頻基本步驟分組計頻基本步驟: 確定組數(shù)確定組數(shù) 確定組距確定組距 (按組)整理成分布頻數(shù)表整理成分布頻數(shù)表 賬目審計賬目審計一會計事務所對其20家客戶(clients)年底帳目審計(audits)時間(天)統(tǒng)計如下表:Table Year-End Audit Times(in days) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13例例2 2 第一步第一步,確定組數(shù)確定組數(shù)(Number of classes)。組數(shù)的確定一般視
19、數(shù)據(jù)本身的特點及數(shù)據(jù)的多少而定。 按照前面所提,可采用斯特格斯(Sturges)提出的經(jīng)驗公式來確定組數(shù)K:其中N為數(shù)據(jù)的個數(shù)(總體單位數(shù)或樣本數(shù)),一般對結果取整數(shù)。例2中K=5。 N210N10lg322. 31 loglog1K或 第二步第二步,確定組距確定組距(Width of classes):組距是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定: 組距=(最大值 - 最小值)/組數(shù)例2中,組距=(33-12)/5=4.2,可取整數(shù)5為最后選定的組距。 第三步,確定各組組限第三步,確定各組組限(Class limits)并據(jù)此整理頻數(shù)分布表并據(jù)此整理頻數(shù)分布
20、表。1、分組所遵循的主要原則主要原則是“不重不不重不漏漏”(each data value belongs to one class and only one class)。因此, 首先,最低組限最低組限(The lower class limit)應等于或小于數(shù)據(jù)的最小值,最大組限最大組限(The upper class limit)應等于或大于數(shù)據(jù)的最大值; 其次,對數(shù)據(jù)在每組中的歸屬習慣上采用“上組限不在內(nèi)上組限不在內(nèi)”。注 意最后,確定組限應遵循的原則原則:一一是各組組限應將總體中事物質的差異區(qū)分開來。 二二是按所確定的組限編制的變量數(shù)列應能真實地反映總體內(nèi)部分布的特征。注 意2 2、
21、對離散型數(shù)據(jù)離散型數(shù)據(jù),可采用相鄰兩組組限間斷的辦法解決“不重”的問題(如610,1115,1620等); 對連續(xù)型數(shù)據(jù)連續(xù)型數(shù)據(jù),往往采用相鄰兩組組限重疊,根據(jù)“上限不在內(nèi)原則”解決“不重”問題(如510,1015,1520等)。注 意 例2是離散型數(shù)據(jù)(天),采用組限間斷方法,因此可得頻數(shù)分布表如下: TableTable, Frequency distribution, relative Frequency distribution, relative frequency and percent frequency distribution frequency and percent f
22、requency distribution for the audit-time data for the audit-time data Audit Frequency Relative Percent Audit Frequency Relative Percent Time(days) Frequency FrequencyTime(days) Frequency Frequency 1014 4 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.10 10 3034 1 0.05 5 Total 20 1.00 100 在最大值與最小值與其他
23、數(shù)據(jù)相差懸殊,為避免空白組出現(xiàn),可以采用開開口組口組,即,即“XX以下”及“XX以上” ; 組距分組有等距分組等距分組和異距分組異距分組。異距分組各組的頻數(shù)受組距大小不同的影響,需要計算頻數(shù)密度頻數(shù)密度(=頻數(shù)/組距),才能準確反映頻數(shù)分布實際; 有時為了統(tǒng)計需要,需進一步計算累累積頻數(shù)積頻數(shù)(某數(shù)值以上或以下的頻之數(shù)和)。注 意三、累計頻數(shù)和累計頻率三、累計頻數(shù)和累計頻率累計頻數(shù)(頻率)有向上累計向上累計和向下累計向下累計。 例3 某班學生統(tǒng)計學考試成績考分 頻數(shù) 頻率 向上累計 向下累計 頻數(shù) 頻率% 頻數(shù) 頻率 % 5060 2 5.0 2 50 40 10006070 7 17.5 9
24、 225 38 950 7080 11 27.5 20 500 31 7758090 12 30.0 32 800 20 50090100 8 20.0 40 1000 8 200例例3 3洛倫茨曲線是洛倫茨曲線是20世紀初美國經(jīng)濟學家、統(tǒng)計學家洛倫茲世紀初美國經(jīng)濟學家、統(tǒng)計學家洛倫茲(M.E.Lorentz)繪制成的描述收入和財富分配性質的曲線,)繪制成的描述收入和財富分配性質的曲線,洛倫茲曲線如圖所示。洛倫茲曲線如圖所示。 累計頻率應用:洛倫茨曲線累計頻率應用:洛倫茨曲線例例4 4一、統(tǒng)計圖表的概念及作用一、統(tǒng)計圖表的概念及作用 概念:概念:將一系列說明總體特征的統(tǒng)計資料統(tǒng)計資料,按一定的
25、次序和格式列在一份表上就是統(tǒng)計表作用作用: 1閱讀方便,一目了然,比較直觀,可在短時間內(nèi)給人以明確的概念;2通過合理、科學地排列統(tǒng)計資料,便于讀者進行對照比較,從而發(fā)現(xiàn)現(xiàn)象之間的規(guī)律;3便于匯總和審查;4便于計算和分析。(二)統(tǒng)計圖定義和作用 概念:概念:統(tǒng)計圖是用點的位置、線升降、直條的長短或面積的大小等幾何圖形直觀地表達統(tǒng)計指標的大小、對比關系以及變化趨勢作用:作用:具有形象直觀的優(yōu)點。主要用途有:表示現(xiàn)象間的對比關系;揭露總體結構;檢查計劃的執(zhí)行情況;揭示現(xiàn)象間的依存關系,反映總體單位的分配情況;說明現(xiàn)象在空間上的分布情況。 二二.統(tǒng)計表統(tǒng)計表(一)統(tǒng)計表的結構與種類(一)統(tǒng)計表的結構與
26、種類1.統(tǒng)計表結構統(tǒng)計表結構從表的形式形式上看,由總標題總標題、橫行標題橫行標題、縱欄標題縱欄標題和數(shù)字資料數(shù)字資料構成??倶祟}總標題:是統(tǒng)計表的名稱,它扼要地說明該表的基本內(nèi)容基本內(nèi)容,并指明時間和范圍。放在表的上方。上方。橫行標題橫行標題:是橫行的名稱,主要是所研究問題的類別名稱類別名稱,一般放在表格的左方左方??v欄標題縱欄標題:是縱欄的名稱,主要是所研究問題的指標名稱,指標名稱,一般放在表格的上方上方。指標數(shù)值指標數(shù)值:說明總體特征的各項指標值指標值,它是統(tǒng)計表的核心內(nèi)容。 從內(nèi)容上內(nèi)容上看,統(tǒng)計表由主詞欄主詞欄和賓詞賓詞欄欄兩個部分組成。 主詞:主詞:是指被研究的總體總體及其分組分組。
27、結合表的形式,也就是說主詞實際就是橫橫行標題行標題。 賓詞:賓詞:是說明總體特征的統(tǒng)計指標,統(tǒng)計指標,既包括統(tǒng)計指標的名稱,名稱,也包括統(tǒng)計指標的數(shù)值。數(shù)值。 結合表的形式,賓詞賓詞包括縱欄標題縱欄標題和數(shù)字資料數(shù)字資料。某市某市2001、2002年國內(nèi)生產(chǎn)總值年國內(nèi)生產(chǎn)總值 指標 單位 2001年 2002年 2002年比 2001年增長% GDP 萬元 622051 505774 18.7第一產(chǎn)業(yè) 萬元 64385 60782 6.9第二產(chǎn)業(yè) 萬元 334301 258651 23.7第三產(chǎn)業(yè) 萬元 223365 186331 15.3人均GDP 元 5411 4426 16.8總標題總標
28、題主詞欄主詞欄賓詞欄賓詞欄縱欄標題縱欄標題橫行標題橫行標題 統(tǒng)計表統(tǒng)計表例例5 5指標數(shù)值指標數(shù)值2.統(tǒng)計表的分類統(tǒng)計表的分類 調查表 整理表 分析表 簡單表 分組表 復合分組表(1)按用途用途分類分為 (2)按主詞的是否分是否分組組和分組的程度分組的程度分為(二)統(tǒng)計表的設計(二)統(tǒng)計表的設計 統(tǒng)計表的設計要求要求:簡練簡練、明確明確、實用實用、美觀美觀,便以比較。1、標題的設計統(tǒng)計表的總標題、橫行標題、縱欄標題應簡明扼要,以簡練而有準確的文字表述統(tǒng)計資料的內(nèi)容、資料所屬的時間和空間范圍。2、統(tǒng)計表的形狀的設計。統(tǒng)計表應設計成縱橫交叉線條組成的長方形表格長寬保持適當?shù)谋壤淼淖笥覂啥瞬环挚凇?/p>
29、 3、線條的繪制、線條的繪制 表的上下兩端應以粗線繪制,表內(nèi)縱橫線以細線繪制。表的左右兩端一般不劃線,采用“開口式”。 4、合計欄的設計、合計欄的設計各縱列合計時,一般應將合計列放在最后一行,各橫行須要合計時,可將合計列放在最前一欄或最后一欄。 5、表內(nèi)數(shù)值的填寫。、表內(nèi)數(shù)值的填寫。 數(shù)字應該填寫整齊,對準位數(shù),不能空缺。數(shù)字小,可填寫“0”;數(shù)字暫缺,可填寫“”;不應有數(shù)字時用符號“”,不能出現(xiàn)“同上”、“同下”、“同左”、“同右的字眼 6、計量單位的設置。、計量單位的設置。 只有一個計量單位時可放在表的右上方計量單位不同可在橫行標題后面列一單位欄 7、注解和資料來源。、注解和資料來源。三、
30、統(tǒng)計圖品質數(shù)據(jù)品質數(shù)據(jù)往往使用條形圖條形圖(Bar graphs)和餅餅狀圖狀圖(Pie Charts);數(shù)值數(shù)據(jù)數(shù)值數(shù)據(jù)往往使用直方圖直方圖(Histograms)、折折線圖線圖(Polygon)、莖葉圖莖葉圖(Stem-and-leaf display) 。( (一一) )直方圖和折線圖直方圖和折線圖 1、直方圖直方圖是用距形的寬度和高度來表示頻數(shù)分布的圖形(以橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率)。 注意:注意:愛輪滑愛輪滑 兒童輪滑鞋兒童輪滑鞋 1) 1)、對于等距分組等距分組的數(shù)據(jù),可用距形的高度高度直接表示頻數(shù)的分布;對于不等距不等距分組分組的數(shù)據(jù),用距形的面積面積(而不是高度)表
31、示各組的頻數(shù)分布。 2 2)從本質上說,直方圖應用頻數(shù)密度頻數(shù)密度來繪制,這樣可使直方圖總面積為1。Fig 2, Histogram for the Audit-Time DataFig 2, Histogram for the Audit-Time Data 10 8 6 4 2 10 15 20 25 30 352 2、折線圖:、折線圖:也稱頻數(shù)多邊形圖頻數(shù)多邊形圖(polygon),它是將直方圖頂部的中點(即組中值)用直線連接起來而成的圖形。Fig 3, Frequency Polygon for the Audit-Time DataFig 3, Frequency Polygon f
32、or the Audit-Time Data 108 6 4 2 10 15 20 25 30 35 注意:注意: 1)、折線圖的兩個終點要與橫軸相折線圖的兩個終點要與橫軸相交交(將第一個矩形頂部中點通過左豎邊中點連接到橫軸;將最后一個矩形頂部中點與其右豎邊中點連接到橫軸)。 2)、折線圖下所圍成的面積與直方折線圖下所圍成的面積與直方圖面積相等圖面積相等(為1),從而使二者表示的頻率分布是一致的。折線圖折線圖也可用于表示累計頻數(shù)分布累計頻數(shù)分布,稱為累計頻數(shù)分布折線圖累計頻數(shù)分布折線圖。它是根據(jù)累計頻數(shù)繪制而成的,有向上累計向上累計和向下累計向下累計兩種圖形。100100(二 )莖葉圖莖葉圖
33、莖葉圖莖葉圖是一種既給出數(shù)據(jù)的分布狀況,又能顯示每一個原始數(shù)值的圖形。 A stem-and-leaf displaystem-and-leaf display can be used to rank order data and provide an idea of the shape of the distribution of a set of quantitative data. 莖葉圖由兩部分組成莖葉圖由兩部分組成: 莖(莖(stemstem)與葉(葉(leafleaf)莖:莖:通常由每組數(shù)的高位數(shù)值(leading digits)形成,按組豎立在左邊;葉:葉:通常由每組數(shù)的低位數(shù)值
34、(last digits)形成,按組橫排在“莖”的右邊。Fig4Fig4是上述例中會計公司對其20個客戶年終財務審計所用時間的莖葉圖,可知其對大多數(shù)客戶的審計時間在1020天之間。Fig 4, Stem-and-leaf display for the Fig 4, Stem-and-leaf display for the Audit-Time DataAudit-Time Data 1 2 3 4 4 5 5 6 7 8 8 8 9 2 0 1 2 2 3 7 8 3 3 上面莖葉顯得過于擁擠,尤其是第一行有太多數(shù),可將期擴展為Fig5的形式。 Fig 5, Stem-and-leaf d
35、isplay Fig 5, Stem-and-leaf display for the Audit-Time Data for the Audit-Time Data 1 2 3 4 4 1 5 5 6 7 8 8 8 9 2 0 1 2 2 3 2 7 8 3 3 可以看出,F(xiàn)ig5所表現(xiàn)的數(shù)據(jù)分布特征與Fig3的直方圖十分相似。但莖葉圖有明明顯優(yōu)勢顯優(yōu)勢: 1. The stem-and-leaf display is easier to construct; 2. The stem-and-leaf display provides more information because it
36、 shows the actual data values.(三)頻數(shù)分布的類型(三)頻數(shù)分布的類型 日常經(jīng)濟生活中,常見的頻數(shù)分布曲線主要有正態(tài)分布正態(tài)分布、偏態(tài)分布、偏態(tài)分布、J J型分布、型分布、U U型分布型分布等幾種類型等幾種類型(見下圖)。其次還有雙峰型雙峰型、孤孤島型島型及鋸齒型鋸齒型等其他類型。()正態(tài)分布()正態(tài)分布()偏態(tài)分布()偏態(tài)分布正偏(右偏)負偏(左偏)正正J型分布型分布反反J型分布型分布()()U型分布型分布()() J型分布型分布(e)孤島型 (f)雙峰型(g)鋸齒型練習練習1 40個學生的高等數(shù)學測驗成績?nèi)缦拢▎挝唬悍郑?42 54 58 65 68 78 63 84 75 91 72 45 73 81 84 64 78 69 70
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CGMA 022001-2019屋頂通風裝置防雨性能試驗方法
- T/CCT 016-2024分散吸附集中再生VOCs治理用柱狀活性炭
- T/CCS 072-2023智能化煤礦網(wǎng)絡運維管理規(guī)范
- T/CCPITCSC 096-2022名表真假鑒定規(guī)范
- T/CCMA 0141-2022液壓挖掘機排氣污染物車載測量方法
- T/CCAS 014.5-2022水泥企業(yè)安全管理導則第5部分:水泥工廠化驗室安全管理
- T/CATCM 001.1-2017保健類眼貼第1部分:通用要求
- T/CAPEB 00001.3-2022制藥裝備容器和管道第3部分:設計
- T/CAPE 10101-2021設備潤滑管理導則
- 鄭州工程師面試題及答案
- 2024年四川西華師范大學招聘輔導員筆試真題
- 2025年市政工程地下管網(wǎng)試題及答案
- 2025年武漢鐵路局集團招聘(180人)筆試參考題庫附帶答案詳解
- PHPstorm激活碼2025年5月13日親測有效
- 2025屆云南省曲靖市高三第二次教學質量檢測生物試卷(有答案)
- 農(nóng)產(chǎn)品供應鏈應急保障措施
- 《ISO 37001-2025 反賄賂管理體系要求及使用指南》專業(yè)解讀和應用培訓指導材料之4:6策劃(雷澤佳編制-2025A0)
- 2024年中國農(nóng)業(yè)銀行安徽蚌埠支行春季校招筆試題帶答案
- 2025年2月21日四川省公務員面試真題及答案解析(行政執(zhí)法崗)
- 國家開放大學漢語言文學本科《中國現(xiàn)代文學專題》期末紙質考試第一大題選擇題庫2025春期版
- 數(shù)字修約考試題及答案
評論
0/150
提交評論