




已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第第 3 3 章章 多元正態(tài)總體的假設(shè)檢驗(yàn)與方差分析多元正態(tài)總體的假設(shè)檢驗(yàn)與方差分析 從本章開始 我們開始轉(zhuǎn)入多元統(tǒng)計(jì)方法和統(tǒng)計(jì)模型的學(xué)習(xí) 統(tǒng)計(jì)學(xué)分析處理的對(duì)象是帶 有隨機(jī)性的數(shù)據(jù) 按照隨機(jī)排列 重復(fù) 局部控制 正交等原則設(shè)計(jì)一個(gè)試驗(yàn) 通過試驗(yàn)結(jié)果 形成樣本信息 通常以數(shù)據(jù)的形式 再根據(jù)樣本進(jìn)行統(tǒng)計(jì)推斷 是自然科學(xué)和工程技術(shù)領(lǐng)域 常用的一種研究方法 由于試驗(yàn)指標(biāo)常為多個(gè)數(shù)量指標(biāo) 故常設(shè)試驗(yàn)結(jié)果所形成的總體為多元 正態(tài)總體 這是本章理論方法研究的出發(fā)點(diǎn) 所謂統(tǒng)計(jì)推斷就是根據(jù)從總體中觀測(cè)到的部分?jǐn)?shù)據(jù)對(duì)總體中我們感興趣的未知部分作出推 測(cè) 這種推測(cè)必然伴有某種程度的不確定性 需要用概率來表明其可靠程度 統(tǒng)計(jì)推斷的任務(wù) 是 觀察現(xiàn)象 提取信息 建立模型 作出推斷 統(tǒng)計(jì)推斷有參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類問題 其統(tǒng)計(jì)推斷目的不同 參數(shù)估計(jì)問題回答諸 如 未知參數(shù)的值有多大 之類的問題 而假設(shè)檢驗(yàn)回答諸如 未知參數(shù)的值是嗎 之類的問題 本章主要討論多元正態(tài)總體的假設(shè)檢驗(yàn)方法及其實(shí)際應(yīng)用 我們將對(duì)一元正態(tài)總 體情形作一簡(jiǎn)單回顧 然后將介紹單個(gè)總體均值的推斷 兩個(gè)總體均值的比較推斷 多個(gè)總 體均值的比較檢驗(yàn)和協(xié)方差陣的推斷等 3 13 1 一元正態(tài)總體情形的回顧一元正態(tài)總體情形的回顧 一 假設(shè)檢驗(yàn) 在假設(shè)檢驗(yàn)問題中通常有兩個(gè)統(tǒng)計(jì)假設(shè) 簡(jiǎn)稱假設(shè) 一個(gè)作為原假設(shè) 或稱零假設(shè) 另一個(gè)作為備擇假設(shè) 或稱對(duì)立假設(shè) 分別記為和 1 顯著性檢驗(yàn) 為便于表述 假定考慮假設(shè)檢驗(yàn)問題 設(shè) 來自總體的樣本 我們要檢驗(yàn)假設(shè) 3 1 原假設(shè)與備擇假設(shè)應(yīng)相互排斥 兩者有且只有一個(gè)正確 備擇假設(shè)的意思是 一 旦否定原假設(shè) 我們就選擇已準(zhǔn)備的假設(shè) 當(dāng)已知時(shí) 用統(tǒng)計(jì)量 在原假設(shè)成立下 統(tǒng)計(jì)量服從正態(tài)分布 通過查表 查得的上 分位點(diǎn) 對(duì)于檢驗(yàn)問題 3 1 1 我們制定這樣一個(gè)檢驗(yàn)規(guī)則 簡(jiǎn)稱檢驗(yàn) 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 3 2 我們稱為臨界值 是的上分位點(diǎn) 不同的臨界值代表不同的檢驗(yàn) 稱拒絕原 假設(shè)的統(tǒng)計(jì)量的范圍為拒絕域 稱接受的統(tǒng)計(jì)量的范圍為接受域 因此給出一個(gè) 檢驗(yàn) 就是給出一個(gè)拒絕域 2 兩類錯(cuò)誤 由于樣本具有隨機(jī)性 因此在根據(jù)樣本進(jìn)行判斷時(shí) 有可能犯兩種類型的錯(cuò)誤 一類錯(cuò)誤 是 原假設(shè)本來正確 但按檢驗(yàn)規(guī)則卻作出了拒絕的判斷 這類錯(cuò)誤稱為第一類錯(cuò)誤 棄真錯(cuò)誤 其發(fā)生的概率稱為犯第一類錯(cuò)誤的概率 另一類錯(cuò)誤時(shí) 原 假設(shè)本來不正確 但按檢驗(yàn)規(guī)則卻作出了接收的判斷 這類錯(cuò)誤稱為第二類錯(cuò)誤 存 偽錯(cuò)誤 其發(fā)生的概率稱為犯第二類錯(cuò)誤的概率 記為 同時(shí)控制這兩類錯(cuò)誤是困難的 當(dāng)時(shí)在樣本容量固定的條件下 要使和同時(shí)減小 通常是不可能的 在假設(shè)檢驗(yàn)的應(yīng)用中 由奈曼 NEYMAN 與皮爾遜 PEARSON 提出了一個(gè)原則 即在控制犯第一類錯(cuò)誤的概率條件下 盡量使犯第二類錯(cuò)誤的概率小 這種檢驗(yàn)問題 稱為顯著性檢驗(yàn)問題 根據(jù)這一原則 原假設(shè)受到保護(hù) 不至于被輕易拒絕 一旦檢驗(yàn)結(jié)果拒 絕了原假設(shè) 則表明拒絕的理由是充分的 如果接受了原假設(shè) 則只是表明拒絕的理由還不充 分 未必意味著原假設(shè)就是正確的 所以 在實(shí)際問題中 為了通過樣本觀測(cè)值對(duì)某一猜測(cè)取 得強(qiáng)有力的支持 通稱我們把這一猜測(cè)的否定作為原假設(shè) 而把猜測(cè)本身作為備擇假設(shè) 3 關(guān)于檢驗(yàn)的值 下面 我們?cè)俳榻B進(jìn)行檢驗(yàn)的另一種方式 值 我們就以 3 1 1 的檢驗(yàn)問題為例來 加以說明 對(duì)于樣本 我們通過統(tǒng)計(jì)量 計(jì)算出 是一確定值 這里的是 樣本觀測(cè)值的均值 再由統(tǒng)計(jì)量服從正態(tài)分布 計(jì)算為檢驗(yàn)的值 由于等價(jià)于 所以檢驗(yàn)規(guī)則可以表述為 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 接受 3 3 上述值的檢驗(yàn)規(guī)則與 3 1 2 的檢驗(yàn)結(jié)果相比含有更豐富的信息 值越小 拒絕原 假設(shè)的理由就充分 通常 SAS 等軟件的計(jì)算機(jī)輸出一般只給出值 由你自己給定的值來 判斷檢驗(yàn)結(jié)果 二 單一變量假設(shè)檢驗(yàn)的回顧 1 單個(gè)正態(tài)總體均值的檢驗(yàn) 考慮假設(shè)檢驗(yàn)問題 設(shè) 來自總體的樣本 我們要檢驗(yàn) 假設(shè) 1 總體方差已知 構(gòu)造統(tǒng)計(jì)量 在原假設(shè)成立下 服從正態(tài)分布 可得這樣一個(gè)檢驗(yàn)規(guī)則 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 2 總體方差未知 構(gòu)造統(tǒng)計(jì)量 在原假設(shè)成立下 服從自由度為的 分布可得這樣一個(gè)檢驗(yàn)規(guī) 則 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 3 1 4 2 兩個(gè)正態(tài)總體均值的比較檢驗(yàn) 考慮假設(shè)檢驗(yàn)問題 3 1 5 設(shè)是取自總體的容量為的樣本 是取自 的容量為的樣本 給定顯著性水平 1 兩個(gè)總體方差和已知 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 3 1 6 在原假設(shè)成立下 服從正態(tài)分布 檢驗(yàn)規(guī)則為 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 2 兩個(gè)總體方差和都未知 但 用樣本方差代替 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 在原假設(shè)成立下 服從正態(tài)分布 檢驗(yàn)規(guī)則為 當(dāng)時(shí) 拒絕 當(dāng)時(shí) 接受 3 多個(gè)正態(tài)總體均值的比較檢驗(yàn) 方差分析 設(shè)個(gè)正態(tài)總體分別為 從個(gè)總體取 個(gè)獨(dú)立樣本如下 考慮假設(shè)檢驗(yàn)問題 假設(shè)成立條件下 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為 這里稱為組間平方和 稱為組內(nèi)平方和 稱為總平方和 其中 給定檢驗(yàn)水平 查分布表 使 可確定出臨界值 再利用樣本值計(jì)算出值 若 則拒絕 否則不能拒絕 附注 多元假設(shè)檢驗(yàn)與附注 多元假設(shè)檢驗(yàn)與 SASSAS 過程過程 本章的主要內(nèi)容是多元假設(shè)檢驗(yàn)和方差分析 其中的計(jì)算一般都很復(fù)雜 可用國際上著名 的專業(yè)軟件 SAS 軟件計(jì)算 SAS 中有 GLM ANOVA 和 NESTED 等過程可用方差分析 其中 GLM 過程最常用 SAS 的 GLM 過程采用了一般線性模型 在方差分析問題中 變量 是示性變量 即只取 0 或 1 的變量 GLM 過程對(duì)每一因 子的每一水平 通過 CLASS 語句產(chǎn)生 1 個(gè)示性變量 也稱分類變量 GLM 過程主要有四個(gè)語句 PROC GLM CLASS MODEL 和 LSMEANS 語句 PROC GLM 語句語句 用以調(diào)用 GLM 過程 有許多選項(xiàng) 一般形式是 Proc glm data 數(shù)據(jù)集名稱 outstat 輸出的統(tǒng)計(jì)量 order formatted freq data internal CLASS 語句語句 說明哪些變量是分類變量 方差分析中的因素都是分類變量 如 Class V1 V2 V3 此語句指示計(jì)算機(jī)把因子 V1 V2 V3 作為分類變量 可以是字符型變量或數(shù)字型變量 如果是字符型變量 長(zhǎng)度限于 10 個(gè)字符以內(nèi) MODEL 語句語句 語句中等號(hào)前是響應(yīng)變量 如 Model Y A 單因子 ANOVA Model Y A B C 主效應(yīng)模型 Model Y A B A B 含交互效應(yīng)的因子模型 Model Y1 Y2 A B 多因子方差模型 MANOVA LSMEANS 語句語句 用以求待估參數(shù)的最小二乘估計(jì) Lsmeans A B A B MANOVA 語句語句 用以說明是做多元方差分析 3 23 2 均值等于常數(shù)向量的檢驗(yàn)均值等于常數(shù)向量的檢驗(yàn) 在經(jīng)濟(jì)生產(chǎn) 管理決策中的很多實(shí)際問題 通常要選取多個(gè)指標(biāo)進(jìn)行考察 根據(jù)歷史數(shù)據(jù) 將項(xiàng)指標(biāo)的歷史平均水平記作 考慮新的項(xiàng)指標(biāo)平均值是否與歷史數(shù)據(jù)記載的平均值 有明顯差異 若有差異 進(jìn)一步分析差異主要在哪些指標(biāo)上 先看下面的實(shí)例 例 3 1 測(cè)量 20 名健康女性排汗量 鈉含量 鉀含量得表 3 1 問健康女性 的均值是不是 4 50 10 表 3 1 20 名健康女性排汗量 鈉含量 鉀含量數(shù)據(jù) 排汗量鈉含量鉀含量 3 748 59 3 5 765 18 0 3 847 210 9 3 253 212 0 3 155 59 7 4 636 17 9 2 424 814 0 7 233 17 6 6 747 48 5 5 454 111 3 3 936 912 7 4 558 812 3 3 527 89 8 4 540 28 4 1 513 510 1 8 556 47 1 4 571 68 2 6 552 810 9 4 144 111 2 5 540 99 4 例 3 1 的數(shù)學(xué)模型就是 服從要根據(jù) 20 個(gè)樣品做復(fù)合檢驗(yàn) 一般的 我們考慮維正態(tài)分布均值等于常數(shù)的檢驗(yàn)問題 為取自維 正態(tài)總體的一個(gè)樣本 要檢驗(yàn) 3 4 其中為已知維向量 對(duì)于這樣一個(gè)檢驗(yàn)問題 分為以下兩種情形 一 協(xié)方差陣已知條件下 均值的檢驗(yàn) 作出假設(shè)后 需要構(gòu)造一個(gè)合適的統(tǒng)計(jì)量 要檢驗(yàn)的假設(shè)在形式上同一維情形是一樣的 在一維時(shí)構(gòu)造的統(tǒng)計(jì)量為且在成立時(shí) 服從正態(tài)分布 依照一維情形 由于成立時(shí)服從維正態(tài)分布 若記 為非奇異對(duì)稱陣 則有 服從但用來確定拒絕域不方便 因此 改選用統(tǒng)計(jì)量 3 5 當(dāng)成立時(shí) 服從 分布 對(duì)給定的 從 求出 當(dāng)時(shí) 要先求 這需要大量的計(jì)算 實(shí)際計(jì)算時(shí) 可以不必求 出 只要令 即 3 6 求解方程組 3 2 3 求出Y后 則 二 協(xié)方差陣未知條件下均值的檢驗(yàn) 假設(shè)檢驗(yàn)問題仍然是 其中為已知維向量 在 回顧一元情況 在原假設(shè)成立下 服從自由度為的 分布 在維正態(tài)情況下 當(dāng)協(xié)方差已知時(shí) 選用時(shí)統(tǒng)計(jì)量為 現(xiàn)用樣本協(xié)方差代替總體協(xié)方差陣 令 統(tǒng)計(jì)量的分布是一元統(tǒng)計(jì)中 分布的推廣 最早由 HOTELLING 導(dǎo)出 在上一章中 我 們已經(jīng)給出了這個(gè)定義 可以直接用它作為檢驗(yàn)的統(tǒng)計(jì)量 分布已被仔細(xì)研究過 1 及 5 的分位點(diǎn)已經(jīng)列成專表 讀者可在 3 中找到這個(gè)表 也可以利用 HOTELLING 分布的 性質(zhì) 證明參見朱道元 P210 當(dāng)不成立時(shí) 有變大的趨勢(shì) 對(duì)給定的 從 求出 當(dāng)時(shí) 拒絕 否則接受 例 3 1 測(cè)量 20 名健康女性排汗量 鈉含量 鉀含量得表 3 1 問健康女性 的均值是不是 4 50 10 解 建立 用 SAS MATEMATICA MATLAB 等軟件都可算出 所以否定原假設(shè) 即在 0 10 顯著水平下拒絕 例 3 1 也可用下列 SAS 程序計(jì)算 data hanye input x1 x3 y1 x1 4 y2 x2 50 y3 x3 10 a 1 cards 3 7 48 59 3 5 7 65 18 0 3 8 47 210 9 3 2 53 212 0 3 1 55 59 7 4 6 36 17 9 2 4 24 814 0 7 2 33 17 6 6 7 47 48 5 5 4 54 111 3 3 9 36 912 7 4 5 58 812 3 3 5 27 89 8 4 5 40 28 4 1 5 13 510 1 8 5 56 47 1 4 5 71 68 2 6 5 52 810 9 4 1 44 111 2 5 5 40 99 4 proc glm model y1 y3 a noint manova h a printe printh run 執(zhí)行此程序后得到的輸出中主要的是最后一個(gè)表 H Type III SSCP Matrix for a E Error SSCP Matrix S 1 M 0 5 N 7 5 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0 66112774 2 90 3 17 0 0649 Pillai s Trace 0 33887226 2 90 3 17 0 0649 Hotelling Lawley Trace 0 51256699 2 90 3 17 0 0649 Roy s Greatest Root 0 51256699 2 90 3 17 0 0649 可見 P 值為 0 0649 所以否定原假設(shè) 即在 0 10 顯著水平下拒絕 在實(shí)際工作中 一元檢驗(yàn)與多元檢驗(yàn)可以聯(lián)合使用 多元的檢驗(yàn)具有概括和全面的優(yōu)點(diǎn) 而一 元的檢驗(yàn)容易發(fā)現(xiàn)各指標(biāo)之間的關(guān)系和差異 兩者的結(jié)合能給統(tǒng)計(jì)人員提供更多的統(tǒng)計(jì)分析信 息 3 33 3 兩總體均值的比較檢驗(yàn)兩總體均值的比較檢驗(yàn) 例 3 2 為了研究日美兩國在華企業(yè)對(duì)中國經(jīng)營環(huán)境的評(píng)價(jià)是否存在差異 從兩國在華企 業(yè)對(duì)中國的政治 經(jīng)濟(jì) 法律 文化等環(huán)境打分 得表 3 2 試分析日美兩國在華企業(yè)對(duì)中國 經(jīng)營環(huán)境的評(píng)價(jià)是否存在差異 表 3 2 日美兩國在華企業(yè)對(duì)中國經(jīng)營環(huán)境的評(píng)價(jià) 美國企業(yè)號(hào)政治環(huán)境 X1經(jīng)濟(jì)環(huán)境 X2法律環(huán)境 X3文化環(huán)境 X4 美 1 65352560 美 2 75502055 美 3 60453565 美 4 75404070 美 5 70303050 美 6 55403565 美 7 60453060 美 8 65402560 美 9 60503070 美 10 55553575 日本企業(yè)號(hào)政治環(huán)境 Y1經(jīng)濟(jì)環(huán)境 Y2法律環(huán)境 Y3文化環(huán)境 Y4 日 1 55554065 日 2 50604570 日 3 45453575 日 4 50505070 日 5 55503075 日 6 60404560 日 7 65554575 日 8 50653580 日 9 40453065 日 10 45504570 假設(shè)服從 服從 下 且有 10 對(duì)樣品 要做復(fù)合檢驗(yàn) 一般情況下 我們考慮為取自維正態(tài)總體的一個(gè)樣本 為取自維正態(tài)總體的一個(gè)樣本 假定兩組樣本相互獨(dú)立 且 一 有共同已知的協(xié)差陣時(shí) 對(duì)于例 3 2 提出的問題 可歸類為假設(shè)檢驗(yàn)問題 其中為已知維向量 在一維情形下 用了統(tǒng)計(jì)量 與前面相似的思路 在維時(shí) 選用 統(tǒng)計(jì)量 當(dāng)成立時(shí) 服從 分布 對(duì)給定的顯著性水平 從 求出 當(dāng)時(shí) 拒絕 當(dāng)0 但未知 要檢驗(yàn)的假設(shè) 為 其中為已知維向量 記 采用統(tǒng)計(jì)量為 定理 3 2 若 成立 則 證明參見朱道元 P217 定理 3 2 可用于用做兩總體復(fù)合檢驗(yàn) 根據(jù)定理 3 2 當(dāng)成立時(shí) 統(tǒng)計(jì)量 當(dāng)不成立時(shí) 有變大的趨勢(shì) 對(duì)給定的 從 求出 當(dāng)時(shí) 拒絕 否則接受 以上有關(guān)的統(tǒng)計(jì)量在成立時(shí)所服從的分布的相應(yīng)證明都比較復(fù)雜 這里我們只敘述了 有關(guān)結(jié)論 沒有給出證明 可參看第二章的相關(guān)內(nèi)容 這些統(tǒng)計(jì)量同一維相應(yīng)的統(tǒng)計(jì)量均有相 似之處 對(duì)比兩者的形式有助于理解和應(yīng)用 例 3 2 的解 作假設(shè) 所以日美兩國在華企業(yè)對(duì)中國經(jīng)營環(huán)境的評(píng)價(jià)存在顯著差異 例 3 2 可用如下 SAS 程序?qū)崿F(xiàn) data wu1 input no pol ecn leg cul cou cards 美1 65352560 a 美2 75502055 a 美3 60453565 a 美4 75404070 a 美5 70303050 a 美6 55403565 a 美7 60453060 a 美8 65402560 a 美9 60503070 a 美10 55 55 3575 a 日1 55554065 j 日2 50604570 j 日3 45453575 j 日4 50505070 j 日5 55503075 j 日6 60404560 j 日7 65554575 j 日8 50603580 j 日9 40453065 j 日10 45 50 4570 j proc glm class cou model pol ecn leg cul cou ss3 manova h cou printe printh run 執(zhí)行此程序后得到的輸出中主要的是最后一個(gè)表 H Type III SSCP Matrix for cou E Error SSCP Matrix S 1 M 1 N 6 5 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0 37607734 6 22 4 15 0 0037 Pillai s Trace 0 62392266 6 22 4 15 0 0037 Hotelling Lawley Trace 1 65902752 6 22 4 15 0 0037 Roy s Greatest Root 1 65902752 6 22 4 15 0 0037 由此可見 p 值是 0 0037 因而日美兩國在華企業(yè)對(duì)中國經(jīng)營環(huán)境的評(píng)價(jià)存在顯著差異 3 43 4 多個(gè)總體均值向量的比較檢驗(yàn)多個(gè)總體均值向量的比較檢驗(yàn) 在研究作物栽培時(shí) 要考慮播種期 品種 土質(zhì) 施肥方式 灌溉方式對(duì)產(chǎn)量的影響 在 化學(xué)反應(yīng)中要觀察原料成分 劑量 催化劑 溫度 壓力 攪拌速度等對(duì)得率的影響 在很多 應(yīng)用領(lǐng)域尤其是科學(xué)研究中 都遇到過類似的問題 常涉及許多因素 這類問題要分析出影響 最 大 的因素 就是比較各種因素對(duì)試驗(yàn)結(jié)果所起的作用問題 作為影響試驗(yàn)結(jié)果的每一因 素或因素的某一水平或某一方案 且試驗(yàn)結(jié)果都形成一個(gè)隨機(jī)總體 這樣 比較各種因素對(duì)試 驗(yàn)結(jié)果所起的作用問題就變成對(duì)各種因素的試驗(yàn)結(jié)果所形成的總體的比較問題 由于試驗(yàn)指標(biāo)常為多元指標(biāo) 故常設(shè)試驗(yàn)結(jié)果所形成的總體為多元正態(tài)總體 此外 我們 按照隨機(jī)排列 重復(fù) 局部控制 正交等原則設(shè)計(jì)一個(gè)試驗(yàn) 除要考察的因素外 其他試驗(yàn)條 件均要求一致 即要考察的試驗(yàn)因素的試驗(yàn)結(jié)果都是同協(xié)方差陣的且相互獨(dú)立的多元正態(tài)總體 因而 各因素對(duì)試驗(yàn)結(jié)果影響的結(jié)果的比較 就變成了多個(gè)同協(xié)方差陣的多元正態(tài)總體均值向 量的比較 統(tǒng)計(jì)上解決兩個(gè)以上同協(xié)方差陣多元正態(tài)總體均值向量比較的方法叫做多元方差分 析 多個(gè)總體均值向量的比較檢驗(yàn) 特別是多元方差分析正是本節(jié)的內(nèi)容 這類方法在經(jīng)濟(jì)管 理 系統(tǒng)控制 生物醫(yī)藥等許多領(lǐng)域有著廣泛的應(yīng)用 這里先看一個(gè)具體實(shí)例 3 4 1 提出問題 例 3 3 為了研究某種疾病 對(duì)三組人測(cè)量 第 1 組是 20 至 35 歲女性 第 2 組是 20 至 25 歲 男性 第 3 組是 30 至 55 歲男性 每組取 20 個(gè)人 測(cè)量第 I 組的第 J 人 4 個(gè)指標(biāo)是 脂蛋 白 甘油三脂 脂蛋白 前脂蛋白 測(cè)量結(jié)果見表 3 3 問三組人的指標(biāo)間有沒有顯著差別 表 3 3 脂蛋白 甘油三脂 脂蛋白 前脂蛋白數(shù)據(jù) 2607540183101223021320643917 200723417310603518260593711 240874518190402715360882826 1706539172256534162951003612 2701103924170653716270653221 20513034232108231173801143621 190692715280673718240554210 200464515210383617260553420 25011721202806530232601102920 2001072820200764017295733321 22513036112007639202401143818 21012526172809426113101033218 1706431141906033173301122111 2707633132955530163451272420 1906034162701252421250622216 2808120182801203218260592119 31011925152406232202251003430 270573182806929203451203618 2506731143707030203601072523 26013539292804037172501173616 問題中的 3 組人的測(cè)量值 每個(gè)隨機(jī)向量有 4 個(gè)指標(biāo) 即 4 維隨機(jī) 向量 例 3 3 要從每個(gè)總體 20 個(gè)樣品值出發(fā) 檢驗(yàn)是否成立 3 4 2單因素方差分析的數(shù)學(xué)模型 方差分析的目的在于找出自變量與因變量之間的線性關(guān)系 或自變量對(duì)因變量的實(shí)驗(yàn)效果 方差分析是一種處理實(shí)驗(yàn)數(shù)據(jù)的方法 考察一個(gè)被稱為因變量或相依變量 dependent variable 的連續(xù)響應(yīng)變量 又稱反應(yīng)變量 Response Variable 其數(shù)值則是連續(xù)的 它在由分 類變量識(shí)別的幾種試驗(yàn)條件下被測(cè)量 這些分類變量被稱為自變量 獨(dú)立變量 independent variable 定性變量 Qualitative Variable 或分類變量 Classification Variable 其數(shù)值多半 是不連續(xù)的 這些分類變量的水平組合形成試驗(yàn)設(shè)計(jì)的單元 例如 某個(gè)試驗(yàn)要測(cè)量男人和女 人的重量變化 因變量 他們采取了三種不同的減肥方法 這個(gè)設(shè)計(jì)的 6 個(gè)單元由性別 男 女 和減肥方法 A B C 6 種組合形成 一項(xiàng)試驗(yàn)有多個(gè)影響因素 因素也可以看成是一種變量 其取值不是數(shù) 而是水平 例如 產(chǎn)地 是一個(gè)變量 它取的值是 北京 上海 南京 等 這種變量稱為屬性變量 定 性變量或分類變量 如果只有一個(gè)因素在發(fā)生變化 其他因素保持不變 則稱為單因素試驗(yàn) 與之對(duì)應(yīng)的方差分析 稱為單因素方差分析 我們所考察的 影響產(chǎn)品指標(biāo)的因素 如產(chǎn)地 溫度 也稱為因子 用大寫字母 A B C 表示 因素所能處的狀況 如甲 乙 丙 60 65 70 75 稱為因素的水平 簡(jiǎn)稱為水平 水平常以表示 一般地 假設(shè)因素 A 有 k 個(gè)水平 對(duì)第 個(gè)水平進(jìn)行試驗(yàn) 獨(dú)立觀察次 整個(gè)試驗(yàn)共作了次 且完全隨機(jī)排列 設(shè)的第次觀察的試驗(yàn)指標(biāo)為維向量 假設(shè) 1 同一個(gè)水平下得到的觀測(cè)值 由于實(shí) 驗(yàn)過程中各種偶然因素的干擾及測(cè)量誤差所致 每次實(shí)驗(yàn)中這些偶然因素的總和 稱為實(shí)驗(yàn)誤差 它們是方差相同的零均值正態(tài)隨機(jī)變量 2 所有誤差相互獨(dú)立 3 由于水平的不同 可能會(huì)給一個(gè)定量的確定性的影響 其大小是未知的 假定 令 于是有模型 其中稱為總體均值向量 為的主效應(yīng)向量 為的第次觀察的隨機(jī)誤差向量 根據(jù)假設(shè)相互獨(dú)立且均服從 判斷這個(gè)因素的影響是否顯著就是要檢驗(yàn)假設(shè) 不全為 0 3 7 設(shè)第 I 組樣本均值 總均值 樣本組內(nèi)差 樣本組間差 對(duì)于該檢驗(yàn)問題的統(tǒng)計(jì)量 取 WILKS 統(tǒng)計(jì)量 定理 3 3 若 則服從 WILKS 分布 證明參見朱道元第 177 頁 例 3 3 為了研究某種疾病 對(duì)三組人測(cè)量 第 1 組是 20 至 35 歲女性 第 2 組是 20 至 25 歲男 性 第 3 組是 30 至 55 歲男性 每組取 20 個(gè)人 測(cè)量第 I 組的第 J 人 4 個(gè)指標(biāo)是 脂蛋白 甘油三脂 脂蛋白 前脂蛋白 測(cè)量結(jié)果見表 3 3 問三組人的指標(biāo)間有沒有顯著差別 解 這兒有 3 個(gè)總體 建立假設(shè) 計(jì)算三總體樣本均值 計(jì)算組內(nèi)差 計(jì)算組間差 計(jì)算總方差 計(jì)算統(tǒng)計(jì)量 查得 0 6621 所以高度顯著否定 故三組人身體指標(biāo)有顯著差異 3 53 5 總體協(xié)差陣相等的檢驗(yàn)總體協(xié)差陣相等的檢驗(yàn) 本章第三節(jié)和第四節(jié)中 總假定不同總體的方差是相同的 這一假定是否合理 在一些 問題中應(yīng)當(dāng)加以證明 3 5 1 一個(gè)正態(tài)總體協(xié)方差陣的檢驗(yàn) 設(shè)為取自維正態(tài)總體的一個(gè)樣本 未知 且 首先 我們考慮假設(shè)檢驗(yàn)問題 所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為 其中 然后 我們考慮假設(shè)檢驗(yàn)問題 因?yàn)?所以存在非奇異矩陣 使得 令 則 因此檢驗(yàn)等價(jià)于 此時(shí)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為 其中 給定檢驗(yàn)水平 因?yàn)橹苯佑械姆植加?jì)算臨界值很困難 所以通常采用的近似分布 在成立時(shí) 的極限分布是 因此當(dāng) 由樣本值計(jì)算出 值 若 即 則拒絕 否則不能拒絕 3 5 2 多個(gè)協(xié)方差陣相等檢驗(yàn) 剛才討論的檢驗(yàn)是一個(gè)正態(tài)總體協(xié)方差陣的檢驗(yàn) 是檢驗(yàn)當(dāng)前協(xié)方差陣與過去是 否一樣 在一些實(shí)際問題中 可能會(huì)遇到多個(gè)正態(tài)總體的協(xié)方差陣是否相等的問題 設(shè)有個(gè)正態(tài)總體分別為 且未知 從第 個(gè)總體中取個(gè)樣本 這里為總樣本容量 我們考慮假設(shè)檢驗(yàn)問題為 不全相等 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為 其中 按照 Bartlett 的建議 記 得到修正的檢驗(yàn)統(tǒng)計(jì)量 則在成立時(shí) 的極限分布是 其中 例 3 4有甲 乙兩品種 取得如表 3 4 所示的兩個(gè)二元正態(tài)樣本 試檢驗(yàn) 表 3 4 方差陣檢驗(yàn)數(shù)據(jù) 觀察值和 甲 300 23 232 5 217 25 100 43 286 10 320 17 1455 123 385109 3417 26085 乙 200 50 150 43 333 83 150 41 283 73 383 80 350 86 300 100 2149 556 635167 42044 161638 解 由于 故 由于 故應(yīng)拒絕 即認(rèn)為有顯著差異 3 63 6 獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn) 一個(gè)隨機(jī)向量 若其中兩子向量相互獨(dú)立 則可化為兩個(gè)低維隨即向量 處理 給統(tǒng)計(jì)分析帶來極大的便利 因此檢驗(yàn)一個(gè)隨機(jī)向量的子向量之間是否獨(dú)立是參數(shù)假設(shè) 檢驗(yàn)中的重大課題 而當(dāng) 時(shí) 相互獨(dú)立 互不 相關(guān) 這時(shí) 的獨(dú)立性檢驗(yàn)可歸結(jié)為參數(shù)假設(shè)檢驗(yàn) 一般情況下 設(shè) 正定 將分割成個(gè)子向量 其中的維數(shù)為 將與也作相應(yīng)的剖分 檢驗(yàn)子向量之間的相互獨(dú)立
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 茶藝師崗位面試問題及答案
- 用戶行為分析師崗位面試問題及答案
- 浙江省溫州市環(huán)大羅山聯(lián)盟2025屆高二化學(xué)第二學(xué)期期末達(dá)標(biāo)檢測(cè)模擬試題含解析
- 智慧農(nóng)業(yè)項(xiàng)目管理辦法
- 楊梅大板養(yǎng)護(hù)管理辦法
- 券商股權(quán)質(zhì)押管理辦法
- 河南電梯使用管理辦法
- 新疆消防午餐管理辦法
- 數(shù)字人文背景下跨文化交流挑戰(zhàn)與應(yīng)對(duì)策略研究
- 旅游行業(yè)突發(fā)事件應(yīng)對(duì)預(yù)案研究
- 貴州省黔東南苗族侗族自治州(2024年-2025年小學(xué)二年級(jí)語文)人教版綜合練習(xí)試卷(含答案)
- 黑龍江省牡丹江市第十六中學(xué)2023-2024學(xué)年八年級(jí)下學(xué)期期末數(shù)學(xué)試題(原卷版)
- JB∕T 13026-2017 熱處理用油基淬火介質(zhì)
- 道路工程石材檢測(cè)報(bào)告及石材單軸抗壓強(qiáng)度檢測(cè)原始記錄
- HG-T20678-2023《化工設(shè)備襯里鋼殼設(shè)計(jì)標(biāo)準(zhǔn)》
- 初中數(shù)學(xué)分層作業(yè)設(shè)計(jì)論文
- 中小學(xué)校長(zhǎng)管理案例
- 《電力設(shè)施治安安全風(fēng)險(xiǎn)等級(jí)和安全防護(hù)要求》
- 光伏驗(yàn)收?qǐng)?bào)告
- 職業(yè)倦怠量表MBI-HSS
- 學(xué)校桌椅采購?fù)稑?biāo)方案
評(píng)論
0/150
提交評(píng)論