




已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
精品文檔第一章 總 論第一節(jié) 統(tǒng)計學概述一、什么是統(tǒng)計學1、統(tǒng)計學的定義: 統(tǒng)計學是一門關于數據的科學,是一門關于數據的收集、整理、分析、解釋和推斷的科學。2、統(tǒng)計的三種含義:統(tǒng)計工作對現象的數量進行搜集、整理和分析的活動過程統(tǒng)計資料通過統(tǒng)計實踐活動取得的說明對象某種數量特征的數據統(tǒng)計學是關于數據的一門科學三者之間的關系:統(tǒng)計工作與統(tǒng)計資料是工作與工作成果關系,三者之間是實踐與理論關系3、統(tǒng)計學的研究對象: 一切自然與社會現象總體的數量特征及其相互關系特點:數量性、總體性、變異性4、統(tǒng)計學的研究方法大量觀察法、統(tǒng)計指標法、統(tǒng)計推斷法二、統(tǒng)計學的產生與發(fā)展1、古典統(tǒng)計學(17世紀中18世紀中):記述學派和政治算術學派2、近代統(tǒng)計學(18世紀末19世紀末):數量統(tǒng)計學派和社會統(tǒng)計學派3、現代統(tǒng)計學(20世紀至今)三、統(tǒng)計學的分類1、理論統(tǒng)計學:研究的內容是統(tǒng)計的一般理論和方法v 描述統(tǒng)計學 用圖形、表格和數值方法來匯總數據的統(tǒng)計學。v 推斷統(tǒng)計學 用樣本數據對總體的某些特征進行估計和假設檢驗的統(tǒng)計學。2、應用統(tǒng)計學:研究的內容是運用于某一特定領域的統(tǒng)計問題第二節(jié) 統(tǒng)計學的基本概念一、統(tǒng)計總體與總體單位1、統(tǒng)計總體:由客觀存在的、在同一性質基礎上結合起來的許多個別單位所形成的集合。具有大量性、同質性和變異性等特點2、總體單位:指構成總體的個體即每一個單位??傮w由總體單位構成,要認識總體必須從總體單位開始,總體是統(tǒng)計認識的對象??傮w或總體單位的區(qū)分不是固定的:同一個研究對象,在一種情況下是總體,在另一種情況下可能成了總體單位。3、統(tǒng)計總體的種類(1)有限總體:指所包含的單位數目有限的總體無限總體:指所包含的單位數目無限的總體(2)大總體小總體:指大總體的各組成部分(3)可加總體:指總體單位可以合計的總體不可加總體:指總體單位不能合計的總體二、標志與變量1、標志:指總體單位所具有的屬性和特征,標志的具體表現稱為標志值。(1)品質標志:是表明事物“質” 的特性的標志數量標志:是表明事物“量” 的特性的標志其中,可變的數量標志又被叫作變量統(tǒng)計研究是從登記標志開始,并通過對標志的綜合來反映總體的數量特征,因此標志是統(tǒng)計研究的起點。(2)總體單位標志分為不變標志(標志表現無差異)和變異標志(標志表現有差異)2、變量的種類確定性變量:指受確定性因素影響的變量隨機變量:指受隨機因素影響的變量連續(xù)型變量:在一個區(qū)間內可以連續(xù)不斷取值的變量離散型變量:其一切可能取值都以整數形式出現,并可以一一列舉的變量三、指標與指標體系1、統(tǒng)計指標:反映社會經濟現象總體數量特征的概念及其具體數值構成要素:時間限制、空間限制、指標名稱、具體數值、計量單位性質:數量性、具體性、綜合性2、標志與指標的聯系與區(qū)別:聯系:(1)標志是總體指標的來源和基礎,指標則是標志的綜合。(2)數量標志與指標之間存在著變換關系。區(qū)別:(1)標志是說明總體單位特征的,指標則是說明統(tǒng)計總體數量特征的。(2)有的標志用數值表示,有的標志用文字表示,而指標都是用數值表示的。3、統(tǒng)計指標的分類()按表現形式分:總量指標、相對指標、平均指標()按內容特征分:數量指標、質量指標v 數量指標: 反映的是所研究總體的規(guī)模和水平,其大小取決于總體單位數目的多少及其標志水平的高低。v 質量指標: 反映的是與總體單位數相對應的標志的平均水平或其它數量對比關系。()按計量單位分:實物指標、價值指標、勞動指標()按時間特征分:時期指標、時點指標、統(tǒng)計指標體系:具有某種內在聯系的一系列統(tǒng)計指標所構成的整體作用:全面、綜合地對客觀事物進行描述、分析。、樣本:由總體的部分單位組成的集合第二章統(tǒng)計數據的收集2.1 統(tǒng)計測量尺度一、統(tǒng)計測量尺度的概念與種類分類、標識、統(tǒng)計測量:運用某種方法使自然或社會經濟現象量化。測量結果:形成變量或指標2、統(tǒng)計測量尺度的種類()定類尺度按現象性質差異進行的辨別與區(qū)分。測量結果形成定類變量或定類指標。定類變量或指標確切的值是以文字表述的,可以用數值標識,但僅起標簽作用。定類變量或指標的各類別間是平等的,沒有高低、大小、優(yōu)劣之分。()定類尺度對現象順序差異進行的辨別與區(qū)分。測量結果形成定序變量或定序指標。定序變量或指標確切的值是以文字表述的,也可以用數值標識,也僅起標簽作用。定序變量或指標各類別間有高低優(yōu)劣之分,不能隨意排列,但差異無法準確計量。()定距尺度按現象絕對數量差異進行的辨別與區(qū)分。測量結果形成定距變量或定距指標。定距變量或指標的值以數字表述,有計量單位,可以進行加減運算。定距變量或指標各類別間自然有大小之分,但沒有絕對的零點,不能進行乘除運算。()定比尺度對現象絕對差異與相對差異進行的辨別與區(qū)分。測量結果形成定比變量或定比指標。定比變量或指標確切的值也以數字表述,有計量單位 ,可以進行加減運算。定比變量或指標有絕對意義上的零點,既可以加減運算,也可以乘除運算。3、數據度量尺度(1)定類尺度:無等級次序排列 例如:男-女從事工作的行業(yè)(2)定序尺度: 可作等級次序排列 例如:公司職位產品滿意度(3)定距尺度: 沒有真正的零點 例如,溫度(4)定比尺度:存在真正的零點倍數有意義例,身高、體重4、數據度量與信息含量()度量尺度的信息含量由弱到強排列:定類尺度定序尺度定距尺度定比尺度() 定類尺度和定序尺度用于屬性數據:信息量低() 定距尺度和定比尺度用于數值數據:信息量高二、統(tǒng)計測量尺度的作用第一,決定數據的整理、顯示方法第二,決定數據的分析方法第三,決定計算機的處理方法注意:在自然或社會經濟領域里,單純的定距變量是很少的,絕大多數定距變量同時也是定比變量。定距測量與定比測量的區(qū)別只在理論上有意義,在實際工作中常將二者歸為一類。三、測量層次與測量尺度的正確應用、對測量尺度層次的判斷較低層次的測量尺度較高層次的測量尺度小 信息數量 大少 計算方法 多低 測量精度 高 定類尺度、定序尺度、定距尺度、定比尺度的層次:由高至低2、測量尺度的正確應用對于不同的現象,要注意準確性;對數量差異的度量,要注意層次2.2 原始數據的收集方法一、統(tǒng)計調查概述1、統(tǒng)計調查:收集原始數據資料 的統(tǒng)計活動過程要求:準確、及時、全面、系統(tǒng)統(tǒng)計調查是整個統(tǒng)計認識活動的基礎,決定著統(tǒng)計認識過程及其結果的成敗 2、統(tǒng)計調查的種類按調查單位的范圍大小分為非全面調查、全面調查按調查時間是否連續(xù)分為連續(xù)性調查、一次性調查按調查的組織方式不同分為統(tǒng)計報表、專門調查(普查、重點調查、典型調查、抽樣調查)3、統(tǒng)計調查的組織方式()統(tǒng)計報表:指按照國家統(tǒng)一規(guī)定的各項要求,自下而上地定期向國家和主管部門報送基本統(tǒng)計資料的一種報告制度優(yōu)點:能保證統(tǒng)計資料的全面性和連續(xù)性;能保證統(tǒng)計資料的統(tǒng)一性和及時性;能滿足各級部門對統(tǒng)計資料的需要局限:統(tǒng)計報表過多會增加基層負擔;有可能由于虛報瞞報而影響統(tǒng)計資料質量()普查:指國家為詳盡了解某項重要的國情國力而專門組織的一次性全面調查作用:可以為抽樣調查提供抽樣框;可以收集統(tǒng)計報表所不能提供的反映重大國情國力的基本統(tǒng)計信息局限:由于需要大量的人力、物力和財力,不宜經常進行()重點調查:為了解總體基本情況,在調查對象中只選擇一部分重點單位 進行調查的一種非全面調查組織方式作用:能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料局限:只適用于客觀存在著重點單位的情況()典型調查:在對調查對象有一定了解的基礎上,有意識地選擇少數典型單位 進行調查的一種非全面調查組織方式作用:一定條件下能估計總體指標數值;可以補充全面調查的不足;可以用來研究新生事物局限:不能確定推斷的把握程度,無法計算和控制推斷誤差()抽樣調查:按照隨機原則 從調查對象中抽取一部分樣本單位進行調查,再用樣本資料推斷把握總體的數量特征的一種非全面調查組織方式特點:按隨機原則抽取樣本單位;目的是推斷總體的數量特征;抽樣誤差可以事先計算并控制優(yōu)點:能用較少的人力、物力和時間達到全面調查的目的;調查資料的準確性較高、受人為干擾的可能性較小、統(tǒng)計調查的主要技術方法觀察記錄法、報告法、訪問調查法二、統(tǒng)計調查方案、統(tǒng)計調查方案:用來指導整個調查工作的綱領性文件,是統(tǒng)計設計在統(tǒng)計調查階段的具體化、基本內容:調查目的;調查對象與調查單位;調查項目與調查表;調查時間;制定調查工作的組織實施計劃。三、問卷設計、問卷調查:主要指非政府性統(tǒng)計機構或個人所從事的對人的主觀意見的調查工作,也稱作民意調查或民意測驗調查問卷的基本格式:表頭(說明詞:解釋調查意義、表達感激之情等);表體(主題問句:被調查者基本情況、調查項目);表腳(作業(yè)記錄:時間、操作者等)2、調查對象:被調查現象的物質承擔者指,是總體在調查階段的具體化調查單位:指構成調查對象的每一個總體單位3、調查問卷的問題類型:封閉式問題、開放式問題4、問卷調查的基本要求主題明確、提問科學、邏輯性強、容量適度2.3 次級資料的收集一、次級資料指已經被收集、加工整理成型的數據信息二、次級資料的主要收集渠道:查閱公開出版物;向政府統(tǒng)計機構咨詢;向其他機構咨詢;網上查詢。2.4 統(tǒng)計調查誤差一、調查誤差指收集來的數據資料與真實情況間的差異二、調查誤差的種類、登記誤差:由于人的主觀故意或失誤而產生的誤差,理論上它可以用某種方法加以消除、代表性誤差(隨機誤差):由部分單位數值來推斷總體數值所產生的誤差,它不可以消除,但可以加以控制第三章 統(tǒng)計數據的整理與顯示3.1 統(tǒng)計整理與統(tǒng)計分組一、統(tǒng)計整理的意義和步驟、統(tǒng)計整理:將統(tǒng)計調查得到的原始資料進行科學的分組和匯總形成綜合統(tǒng)計資料的工作過程、統(tǒng)計整理的內容統(tǒng)計數據的處理: 統(tǒng)計資料的分組、匯總及制表統(tǒng)計數據的管理: 數據的傳輸、貯存、更新及輸出、統(tǒng)計整理的步驟制定統(tǒng)計整理方案、對原始資料進行審核、數據處理、制作統(tǒng)計表和統(tǒng)計圖二、統(tǒng)計整理的基本方法(一)統(tǒng)計分組:將總體中所有單位按一定的標志分為性質不同但又有聯系的若干部分的過程、統(tǒng)計分組的作用q 劃分社會經濟現象的類型q 反映社會經濟現象的內部結構和比例關系q 揭示社會經濟現象之間的相互依存關系、統(tǒng)計分組的程序選擇分組標志、確定分組體系、總體單位歸類、統(tǒng)計分組的原則科學性、完備性、互斥性(二)分組體系:指同時使用兩個以上標志分組時,分組標志的組合形式。平行分組體系、交叉分組體系3.2 分布數列的編制一、分布數列的定義及種類、分布數列:將總體各單位按某個標志分成若干組,列出各組的總體單位數或各組在總體中所占的比重而形成的數列構成要素:分組標志的具體表現、各組的次數或頻率分類:變量數列品質數列異距數列等距數列組距數列單值數列二、變量數列的編制、單值數列:指每個組值只用一個具體的變量值表現的數列編制條件:變量是離散變量;變量的不同取值個數較少、組距數列:指每個組的變量值用一個區(qū)間來表現的變量數列編制條件:變量是連續(xù)變量;或:總體單位數較多,變量不同取值個數也較多的離散變量。分類:等距數列、異距數列、相關概念組限:指每組兩端表示各組界限的變量值,各組的最小值為下限,最大值為上限組距:每組變量值變動區(qū)間的長度,為上下限之差組中值:每組變量取值范圍的中點數值 組中值=開口式組距數列組中值的計算: 、編制等距數列步驟()求變異全距()確定組距及組數: R組距(d) 組數(m) 確定組距的原則:q 要能區(qū)分各組的性質差異q 要能反映總體資料的分布特征q 為方便計算,盡可能為5或10的整數倍 計算組數(組數不宜過多,也不宜太少) (當 的結果為整數時)(當 的結果為小數時)(3)確定組限q 對于離散變量,相鄰組組限可以間斷,也可重疊;q 對于連續(xù)變量,相鄰組組限必須重疊;q 符合“上組限不計入”原則;q 首末兩組可使用“以下”及“以上”的開口組。() 計算次數三、累計次數與累計頻率1、頻率:各組單位數占總體單位總數的比重2、累計次數(頻率) 向上累計:從變量值高的組開始,將各組次數(頻率)逐次向變量值低的組累計 向下累計:從變量值低的組開始,將各組次數(頻率)逐次向變量值高的組累計3.3 統(tǒng)計圖表一、統(tǒng)計圖 以點、線條、面積等方法描述、顯示統(tǒng)計數據的形式組成:坐標系、圖形、圖例二、統(tǒng)計表 以縱橫交叉的線條所形成的表格來表現統(tǒng)計資料的形式1、 常用結構:總標題、主詞欄、賓詞欄、數據欄2、 統(tǒng)計表的編制規(guī)則選擇合適的總標題;主詞欄與賓詞欄要各歸其位,相互對應;表的上、下端用粗線或雙線封口,左右兩端一般不封口;可在各列的文字標題下面設置編號加以標識;數據欄不能有空白。第四章 變量數列分析4.1 集中趨勢的測定一、集中趨勢的涵義 指總體中各單位的次數分布從兩邊向中間集中的趨勢,用平均指標來反映。測定集中趨勢的意義:q 可以反映現象總體的客觀規(guī)定性;q 可以對比同類現象在不同的時間、地點和條件下的一般水平;q 可以分析現象之間的依存關系。二、平均指標的種類及計算方法(一)算術平均數1、簡單算術平均數:適用于總體資料未經分組整理、尚為原始資料的情況 2、加權算術平均數:適用于總體資料經過分組整理形成變量數列的情況 (說明若資料為組距數列,則應取各組的組中值作為該組的代表值用于計算)(1)權數:指變量數列中各組標志值出現的次數,是變量值的承擔者,反映了各組的標志值對平均數的影響程度 表現為次數、頻數、單位數;即公式 中的 絕對權數:表現為次數、頻數、單位數 相對權數:表現為頻率、比重算術平均數的計算取決于變量值和權數的共同作用:變量值決定平均數的范圍;權數則決定平均數的位置3、 算術平均數的數學性質變量值與其算術平均數的離差之和衡等于零;變量值與其算術平均數的離差平方和為最小,(二)調和平均數 是總體各單位標志值倒數的算術平均數的倒數,又叫倒數平均數1、簡單調和平均數:適用于總體資料未經分組整理、尚為原始資料的情況 2、加權調和平均數:適用于總體資料經過分組整理形成變量數列的情況3、調和平均數的應用:當已知各組變量值和標志總量時,作為算術平均數的變形使用。(三)幾何平均數 是N項變量值連乘積的開N次方根1、應用:用于計算現象的平均比率或平均速度2、應用的前提條件q 各個比率或速度的連乘積等于總比率或總速度;q 相乘的各個比率或速度不為零或負值。3、簡單幾何平均數:適用于總體資料未經分組整理尚為原始資料的情況 4、加權幾何平均數:適用于總體資料經過分組整理形成變量數列的情況 同一資料, (四)中位數 將總體各單位標志值按大小順序排列后,指處于數列中間位置的標志值。不受極端數值的影響,在總體標志值差異很大時,具有較強的代表性。1、未分組數據:首先排序,再按數據n為奇數和偶數進行計算中位數2、單值數據:首先排序,然后根據中位數的位次對照累積計數確定中位數所在組,該組的標志值即為中位數3、組距數據(五)眾數 指總體中出現次數最多的變量值,它不受極端數值的影響,用來說明總體中大多數單位所達到的一般水平。1、 單值數據2、 組距數據(六)數據分布 表明數據是如何分布的 偏態(tài)與 對稱左偏: 均值中位數對稱(零偏度) :均值 = 中位數(七)百分位數 第p個百分位數是這樣的數值:至少有p%個數值跟它一樣大或比它??;至少有(100p)%個數值跟它一樣大或比它大。 四分位數:通常將數據分成四個部分是合乎需要的,每一部分大約包括1/4或25%的數據,分位點稱為四分位數。4.2 離中趨勢的測定一、離中趨勢的涵義 指總體中各單位標志值背離分布中心的規(guī)?;虺潭?,用標志變異指標來反映。1、變異指標值越大,平均指標的代表性越??;反之,平均指標的代表性越大2、測定離中趨勢的意義q 用來衡量和比較平均數代表性的大??;q 用來反映社會經濟活動過程的均衡性和節(jié)奏性;q 用來測定變量數列次數分布較正態(tài)分布的偏離程度。 二、標志變異指標的種類及計算(一)全距 指所研究的數據中,最大值與最小值之差1、 計算公式2、全距的特點q 優(yōu)點:計算方法簡單、易懂;q 缺點:易受極端數值的影響,不能全面反映所有標志值差異大小及分布狀況,準確程度差(二)平均差:是各個數據與其算術平均數的離差絕對值的算術平均數1、簡單平均差:適用于未分組資料2、加權平均差:適用于分組資料3、平均差的特點q 優(yōu)點:不易受極端數值的影響,能綜合反映全部單位標志值的實際差異程度;q 缺點:用絕對值的形式消除各標志值與算術平均數離差的正負值問題,不便于作數學處理和參與統(tǒng)計分析運算。(三)標準差:是各個數據與其算術平均數的離差平方的算術平均數的開平方根;標準差的平方又叫作方差 1、簡單標準差:適用于未分組資料2、加權標準差:適用于分組資料3、標準差的特點q 不易受極端數值的影響,能綜合反映全部單位標志值的實際差異程度;q 用平方的方法消除各標志值與算術平均數離差的正負值問題,可方便地用于數學處理和統(tǒng)計分析運算.(四)變異系數1、平均差系數 標準差系數 2、應用 用來對比不同水平的同類現象; 標準差系數小的總體,其平均數的代表性大;反之,亦然。三、是非標志的標準差及方差1、是非標志:指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現形式的標志,又叫交替標志分組單位數變量值具有某一屬性不具有某一屬性10合計2、成數:指是非標志總體中具有某種表現或不具有某種表現的單位數占全部總體單位總數的比重具有某種標志表現的單位數所占的成數:不具有某種標志表現的單位數所占的成數:3、是非標志總體的指標 均值:;標準差:;方差:;標準差系數:第五章 抽樣推斷5.1 抽樣方案的設計一、抽樣估計的意義和一般步驟(一)抽樣估計的定義 按照隨機原則 從調查對象中抽取一部分單位進行調查,并以調查結果對總體數量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法。(二)抽樣估計的特點q 按隨機原則抽取樣本單位q 目的是推斷總體的數量特征q 抽樣推斷的結果具有一定的可靠程度,抽樣誤差可以事先計算并控制(三)抽樣估計的應用q 不可能進行全面調查時q 不必要進行全面調查時q 來不及進行全面調查時q 對全面調查資料進行補充修正時(四)抽樣估計的步驟 設計抽樣方案、抽取樣本單位、收集樣本數據、計算樣本統(tǒng)計量、推斷總體參數(五)抽樣估計的基本概念1、樣本容量:從總體中抽出的部分單位的集合(n)2、樣本個數:從一個總體中可能抽取多少個樣本 3、總體參數:指被估計的總體指標(1)總體平均數(總體均值) (2)總體單位標志值的標準差 (3)總體單位標志值的方差 (4)總體成數 (5)總體是非標志的標準差 (6)總體是非標志的方差 4、樣本指標:指根據樣本單位的標志值計算的用以估計和推斷相應總體指標的綜合指標,又被稱為估計量或統(tǒng)計量。 (1)樣本平均數(樣本均值) (2)樣本單位標志值的標準差 (3)樣本單位標志值的方差 (4)樣本成數 (5)樣本單位是非標志的標準差(6)樣本單位是非標志的方差二、抽樣方案設計的基本準則 隨機原則、抽樣誤差最小、費用最少三、抽樣方案設計的主要內容(一)編制抽樣框 抽樣框:指包括全部抽樣單位的名單框架,僅對有限總體而言 主要形式:名單抽樣框、區(qū)域抽樣框、時間表抽樣框(二)確定抽樣方法 1、重復抽樣 抽出個體登記特征放回總體繼續(xù)抽取 2、不重復抽樣 抽出個體登記特征繼續(xù)抽取 (三)確定抽樣組織方式 1、簡單隨機抽樣 對總體單位逐一編號,然后按隨機原則則直接從總體中抽出若干單位構成樣本。 應用:僅適用于規(guī)模不大、內部各單位標志值差異較小的總體 2、類型抽樣 將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。 3、等距抽樣 將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。 4、整群抽樣 將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構成樣本。 確定抽樣組織方式需考慮:調查對象的性質特點;對調查對象的了解程度(抽樣框的特點);抽樣誤差的大??;人力、財力和物力等條件的限制 (四)確定樣本容量 1、n30,為大樣本;n 30,為小樣本 2、確定適當樣本容量的意義:若n過大,調查工作量增大,體現不出抽樣調查的優(yōu)越性;若n 過小,抽樣誤差會增大,抽樣推斷就會失去價值。 3、樣本的可能數目:在考慮順序的抽樣條件下,從總體N中隨機抽取n個樣本單位共有多少種可能的抽選結果 (1)重復抽樣的可能樣本數目 (2)不重復抽樣的可能樣本數目5.2 抽樣分布一、 抽樣分布 樣本統(tǒng)計量所有可能值的概率分布(一) 平均數的抽樣分布全部可能樣本平均數的均值等于總體均值,即: 從非正態(tài)總體中抽取的樣本平均數當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。(二) 比率的抽樣分布全部可能樣本比率的均值等于總體比率,即: 從非正態(tài)總體中抽取的樣本比率,當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準差的。二、 抽樣估計量的優(yōu)良標準 設為待估計的總體參數,為樣本統(tǒng)計量,則的優(yōu)良標準為: 1、無偏性:指樣本指標的均值應等于被估計的總體指標 若,則稱為的無偏性估計量 2、有效性:作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應比較小 若,則稱為比更有效的估計量 3、一致性:指隨著樣本單位數n的增大,樣本估計量將在概率意義下越來越接近于總體真實值 若對于任意,有 4、抽樣估計量的優(yōu)良標準 為的無偏、有效、一致估計量 為的無偏、有效、一致估計量 為的無偏、有效、一致估計量三、 抽樣誤差的概念 指樣本估計量與總體參數之間數量上的差異,僅指由于按照隨機原則抽取樣本而產生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差說明:對于任何一個樣本,其抽樣誤差都不可能測量出來;抽樣誤差的大小可以依據概率分布理論加以說明。四、 抽樣平均誤差 指每一個可能樣本的估計值與總體指標值之間離差的平均數,即樣本估計量的標準差 式中:為樣本平均數的抽樣平均誤差;M為可能的樣本數目;為第i個可能樣本的平均數;為總體平均數1、 樣本平均數的抽樣平均誤差重復抽樣:不重復抽樣: 2、 樣本成數的抽樣平均誤差重復抽樣:不重復抽樣:3、 關于總體方差的估計方法用過去同類問題全面調查或抽樣調查的經驗數據代替;用樣本標準差s代替總體標準差,用代替。4、 影響抽樣誤差的因素總體各單位的差異程度;樣本單位數的多少;抽樣方法;抽樣組織方式五、 抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差。5.3 參數估計一、點估計指直接以樣本指標來估計總體指標優(yōu)點:簡單,具體明確缺點:無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況二、區(qū)間估計(一)區(qū)間估計的定義和原理 指根據樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。(二)總體平均數的區(qū)間估計1、表達式 ,其中2、步驟(1)計算樣本平均數(2)搜集總體方差的經驗數據,或計算樣本標準差,即 (3)計算抽樣平均誤差 重復抽樣時: 不重復抽樣時:(4)計算抽樣極限誤差 (5)確定總體平均數的置信區(qū)間(三)總體成數的區(qū)間估計 1、表達式 ,其中 2、步驟(1)計算樣本成數(2)搜集總體方差的經驗數據(3)計算抽樣平均誤差 重復抽樣: 不重復抽樣:(4)計算抽樣極限誤差 (5)確定總體成數的置信區(qū)間 三、樣本數目的確定 確定樣本容量的意義 考慮調查誤差和調查費用兩方面,確定樣本容量 推斷總體平均數所需的樣本容量1、 重復抽樣 2、不重復抽樣 推斷總體成數所需的樣本容量1、 重復抽樣2、 不重復抽樣 必要樣本容量的影響因素q 總體方差的大?。籷 允許誤差范圍的大?。籷 概率保證程度;q 抽樣方法;q 抽樣的組織方式。第六章 假設檢驗6.1 假設檢驗的一般問題一、假設檢驗的概念概念 事先對總體參數或分布形式作出某種假設 然后利用樣本信息來判斷原假設是否成立類型 參數假設檢驗 非參數假設檢驗特點 采用邏輯上的反證法 依據統(tǒng)計上的小概率原理二、假設檢驗的步驟(一)提出原假設和備擇假設1、什么是原假設?v 研究者想收集證據予以反對的假設v 有等號 =, 或 v 表示為 H02、什么是備擇假設?v 研究者想收集證據予以支持的假設v 有不等號: , v 表示為 H1(二)確定適當的檢驗統(tǒng)計量1、用于假設檢驗問題的統(tǒng)計量2、選擇統(tǒng)計量的方法與參數估計相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知(三)規(guī)定顯著性水平a1、是一個概率值2、原假設為真時,拒絕原假設的概率 被稱為抽樣分布的拒絕域3、表示為 av 常用的 a值有0.01, 0.05, 0.104、由研究者事先確定(四)計算檢驗統(tǒng)計量的值,作出統(tǒng)計決策1. 計算檢驗的統(tǒng)計量2. 根據給定的顯著性水平a,查表得出相應的臨界值Za或Z/2a3. 將檢驗統(tǒng)計量的值與a 水平的臨界值進行比較4. 得出接受或拒絕原假設的結論三、假設檢驗中的兩類錯誤1、第一類錯誤(棄真錯誤) 原假設為真時拒絕原假設 會產生一系列后果 第一類錯誤的概率為av 被稱為顯著性水平2、第二類錯誤(取偽錯誤) 原假設為假時接受原假設 第二類錯誤的概率為 b(Beta) H0 檢驗決策實際情況H0為真H0為假接受H0正確第二類錯誤(b)拒絕H0第一類錯誤(a)正確 3、a 錯誤和 b 錯誤的關系 a和b的關系就像翹翹板,a小b就大, a大b就小四、雙側檢驗和單側檢驗(一)雙側檢驗與單側檢驗 (假設的形式)(課本P152)(二)雙側檢驗(原假設與備擇假設的確定)1. 雙側檢驗屬于決策中的假設檢驗。也就是說,不論是拒絕H0還是接受H0,我們都必需采取相應的行動措施2. 例如,某種零件的尺寸,要求其平均長度為10厘米,大于或小于10厘米均屬于不合格3. 建立的原假設與備擇假設應為v H0: m = 10 H1: m 10(三)雙側檢驗(顯著性水平與拒絕域 ) (課本P155)(四)單側檢驗(原假設與備擇假設的確定)v 檢驗研究中的假設1. 將所研究的假設作為備擇假設H12. 將認為研究結果是無效的說法或理論作為原假設H0?;蛘哒f,把希望(想要)證明的假設作為備擇假設3. 先確立備擇假設H1v 檢驗某項聲明的有效性1. 將所作出的說明(聲明)作為原假設2. 對該說明的質疑作為備擇假設3. 先確立原假設H0 除非我們有證據表明“聲明”無效,否則就應認為該“聲明”是有效的(五)單側檢驗(顯著性水平與拒絕域 ) (課本P155)6.2 一個正態(tài)總體的參數檢驗檢驗的步驟v 陳述原假設 H0v 陳述備擇假設 H1v 選擇顯著性水平 av 選擇檢驗統(tǒng)計量v 選擇nv 給出臨界值v 搜集數據v 計算檢驗統(tǒng)計量v 進行統(tǒng)計決策v 表述決策結果一、大樣本的均值檢驗二、小樣本的均值檢驗三、總體比率的假設檢驗方差分析一、方差分析的基本問題1、檢驗多個總體均值是否相等通過對各觀察數據誤差來源的分析來判斷多個總體均值是否相等2、變量 一個定類尺度的自變量v 2個或多個 (k 個) 處理水平或分類 一個定距或比例尺度的因變量二、方差分析的基本思想和原理(一)基本概念1、因素或因子:所要檢驗的對象稱為因子2、水平:因素的具體表現稱為水平3、觀察值:在每個因素水平下得到的樣本值4、試驗5、總體:因素的每一個水平可以看作是一個總體6、樣本數據(二)兩類誤差1. 隨機誤差 在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異 不同超市銷售量的差異可以看成是隨機因素的影響,或者說是由于抽樣的隨機性所造成的,稱為隨機誤差 2. 系統(tǒng)誤差 在因素的不同水平(不同總體)下,各觀察值之間的差異 這種差異可能是由于抽樣的隨機性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差(三)兩類方差組內方差 因素的同一水平(同一個總體)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市度嘉定區(qū)2024-2025學年高中畢業(yè)班第二次模擬(語文試題文)試卷含解析
- 外科疾病護理課件
- 濟寧職業(yè)面試真題及答案
- 吉利汽車面試真題及答案
- 《白酒品鑒中文版》課件
- 《紫外調制與調制盤》課件
- 《城市社會學課件:都市生活方式與社區(qū)發(fā)展》
- 《工作的電路原理》課件
- 國際貿易實務課件:東北大學出版社
- 平方差公式因式分解課件:從理論到實踐的深度教學
- 第二章中國體育產業(yè)的發(fā)展與現狀
- 靜脈炎的護理 課件
- DB3303T078-2024規(guī)模以上工業(yè)企業(yè)健康評價指標體系
- 特種作業(yè)合同協(xié)議
- 社工證考試試題及答案
- 2025年云南專升本招生計劃
- 汽車營銷專業(yè)畢業(yè)論文
- 2025年中國VOC治理市場深度評估研究報告
- 2025年寬帶網絡拓展合作協(xié)議書
- 教學主管競聘培訓機構
- 【9語期末】黃山市歙縣2024-2025學年九年級上學期期末語文試題
評論
0/150
提交評論