復(fù)習(xí)spss非參數(shù)檢驗(yàn)PPT課件.pptx_第1頁(yè)
復(fù)習(xí)spss非參數(shù)檢驗(yàn)PPT課件.pptx_第2頁(yè)
復(fù)習(xí)spss非參數(shù)檢驗(yàn)PPT課件.pptx_第3頁(yè)
復(fù)習(xí)spss非參數(shù)檢驗(yàn)PPT課件.pptx_第4頁(yè)
復(fù)習(xí)spss非參數(shù)檢驗(yàn)PPT課件.pptx_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

判別分析是判別觀測(cè)值所屬類型的一種統(tǒng)計(jì)分析方法 它是解決分類問(wèn)題的 判別分析和前面的聚類分析有什么不同呢 主要不同點(diǎn)就是 在聚類分析中一般人們事先并不知道或并不一定明確應(yīng)該分成幾類 完全根據(jù)數(shù)據(jù)來(lái)確定 而在判別分析中 至少有一個(gè)已經(jīng)明確知道類別的 訓(xùn)練樣本 利用這個(gè)數(shù)據(jù) 就可以建立判別準(zhǔn)則 并通過(guò)預(yù)測(cè)變量來(lái)為未知類別的觀測(cè)值進(jìn)行判別了 2020 2 4 1 也就是說(shuō) 已經(jīng)有一批樣本的觀測(cè)值數(shù)據(jù) 知道它們被分成了多少類 也知道了它們所屬的類別 在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別方程 這些方程能夠使上述樣本的分類出錯(cuò)率最低 然后應(yīng)用這些判別方程對(duì)未知類型的樣本進(jìn)行判別分類 而對(duì)于聚類分析來(lái)說(shuō) 一批給定樣本要?jiǎng)澐值念愋褪孪炔⒉恢?正需要通過(guò)聚類分析來(lái)確定類型 2020 2 4 2 在SPSS中分為一般判別和逐步判別兩種 一般判別 是指不對(duì)自變量做任何篩選 直接使用所有指定的自變量進(jìn)行判別函數(shù)的構(gòu)建和分析 逐步判別 法的基本思想與逐步回歸法類似 即把最重要的自變量逐個(gè)引入判別函數(shù) 同時(shí)對(duì)判別函數(shù)中已經(jīng)存在的舊變量進(jìn)行檢驗(yàn) 如果它們的判別能力隨著新變量的引入而變得不那么顯著了 那么就將它們從判別函數(shù)中剔除 直至沒(méi)有新變量引入 也沒(méi)有舊變量需要剔除為止 這個(gè)過(guò)程使用F檢驗(yàn) 原假設(shè)為 該自變量對(duì)判別的貢獻(xiàn)為零 若P值 0 05 則拒絕原假設(shè) 接受備擇假設(shè) 認(rèn)為該變量的判別能力是顯著的 2020 2 4 3 總體理論分布未知 有極端值等情況下 不能使用t檢驗(yàn)和方差分析 而要用非參數(shù)檢驗(yàn)方法 非參數(shù)檢驗(yàn)方法大多要用到 秩 rank 秩 就是排隊(duì)以后的順序值 利用它進(jìn)行秩和檢驗(yàn) ranktest 要求樣本含量必須大于5 秩的應(yīng)用降低了分布的重要性 減少了樣本中極端值的影響 即減少了其權(quán)重 對(duì)于小樣本資料來(lái)說(shuō) t檢驗(yàn)和F檢驗(yàn) 方差分析 適用的條件是 各樣本都來(lái)自正態(tài)總體或近似正態(tài)總體 只有符合這個(gè)條件 才能用它們來(lái)檢驗(yàn)各樣本所屬的總體參數(shù)的差異顯著性 2020 2 4 4 非參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn)對(duì)總體分布不做假定 直接從樣本發(fā)掘總體信息 推斷總體分布 它在推斷總體分布時(shí)沒(méi)有涉及總體分布的參數(shù) 所以稱為非參數(shù)檢驗(yàn)或自由分布檢驗(yàn) 與傳統(tǒng)的參數(shù)檢驗(yàn)相比 非參數(shù)檢驗(yàn)具有以下優(yōu)點(diǎn) 由于非參數(shù)檢驗(yàn)對(duì)總體的假定比較少 因而具有廣泛的適應(yīng)性 同時(shí)具有較好的穩(wěn)健性 可以在較少樣本的情況下進(jìn)行 在一定程度上彌補(bǔ)了有些情況下樣本資料不足的缺陷 對(duì)連續(xù)性變量和間斷性變量同樣適用 計(jì)算方法比較簡(jiǎn)單 非參數(shù)檢驗(yàn)也有不足之處 最大缺點(diǎn)是它常會(huì)導(dǎo)致部分信息損失 降低檢驗(yàn)效能 2020 2 4 5 參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)的區(qū)別 參數(shù)檢驗(yàn)需要假定總體的分布 而非參數(shù)不需要 非參數(shù)方法應(yīng)用范圍大于參數(shù)方法 因?yàn)樗恍枰俣傮w分布 所以任何分布都可以用非參數(shù)的方法進(jìn)行研究 研究的對(duì)象目標(biāo)不同 參數(shù)方法假定了總體分布 所以研究目標(biāo)就是總體的參數(shù) 而非參數(shù)方法直接從樣本推導(dǎo)總體的分布 所以它的目標(biāo)是總體的分布或兩個(gè)目標(biāo)的分布是否相同 2020 2 4 6 研究的統(tǒng)計(jì)量不同 非參數(shù)方法常用符號(hào) 秩 秩和等構(gòu)造統(tǒng)計(jì)量 大小樣本都可 而參數(shù)檢驗(yàn)雖不用秩 但如果是小樣本 要求服從正態(tài)分布 兩者的效率有差距 當(dāng)總體的真實(shí)分布大體是假定的分布時(shí) 參數(shù)方法的準(zhǔn)確性好 效率高 但假定的分布不是總體的真實(shí)分布時(shí) 非參數(shù)方法的效率高 例如 對(duì)非配對(duì)資料的秩和檢驗(yàn) 其效率僅為t檢驗(yàn)的86 換句話說(shuō) 以相同概率判斷出顯著差異 t檢驗(yàn)所需樣本含量要比秩和檢驗(yàn)少14 2020 2 4 7 卡方檢驗(yàn) 卡方檢驗(yàn)又稱為卡方擬合優(yōu)度檢驗(yàn)或適應(yīng)性檢驗(yàn) 它是判斷屬性各類別的實(shí)際出現(xiàn)次數(shù)是否與理論次數(shù)相符合的一種非參數(shù)檢驗(yàn)方法 它分析的目的是檢驗(yàn)分類數(shù)據(jù)樣本所在的總體分布是否與已知分布相同 卡方構(gòu)造公式如下 卡方檢驗(yàn)的無(wú)效假設(shè)是 樣本來(lái)自的總體分布與某一理論分布或期望分布沒(méi)有顯著差異 2020 2 4 8 二項(xiàng)分布檢驗(yàn) 有些個(gè)體的某種性狀 只能產(chǎn)生非此即彼的兩種結(jié)果 即其取值只能是二值的 如 種子的發(fā)芽與不發(fā)芽 施藥后害蟲的死亡與存活 產(chǎn)品的合格與不合格 硬幣投擲的正面與背面 這種由非此即彼的結(jié)果構(gòu)成的總體叫做二項(xiàng)總體 而其頻數(shù)的分布稱為二項(xiàng)分布 SPSS中二項(xiàng)分布檢驗(yàn)是通過(guò)樣本數(shù)據(jù) 二值變量 檢驗(yàn)其來(lái)自的總體是否服從指定頻率為P的二項(xiàng)分布 其無(wú)效假設(shè)為 樣本來(lái)自的總體與指定的某個(gè)頻率為P的二項(xiàng)分布不存在顯著差異 2020 2 4 9 游程檢驗(yàn) 許多時(shí)候 研究者關(guān)心的不僅僅是分布的位置或者形狀 也希望考察樣本的隨機(jī)性如何 因?yàn)槿绻麡颖静皇菑目傮w中隨機(jī)抽取的 那么所做的任何推斷都將變得沒(méi)有價(jià)值 而游程檢驗(yàn)就是滿足此類分析需求的一種基本的檢驗(yàn)方法 游程檢驗(yàn)又稱為連貫檢驗(yàn)或串檢驗(yàn) 可用來(lái)檢驗(yàn)樣本的隨機(jī)性 這對(duì)于統(tǒng)計(jì)推斷是很重要的 可用來(lái)檢驗(yàn)任何序列的隨機(jī)性 而不管這個(gè)序列是如何產(chǎn)生的 可用來(lái)判斷兩個(gè)總體的分布是否相同 從而檢驗(yàn)出它們的位置中心有無(wú)顯著差異 2020 2 4 10 2020 2 4 11 游程檢驗(yàn) 在一串二元序列中 一個(gè)由0或1連續(xù)構(gòu)成的串稱為一個(gè)游程 一個(gè)游程中數(shù)據(jù)的個(gè)數(shù)稱為游程的長(zhǎng)度 00011100000110001111100 有4個(gè)0游程和3個(gè)1游程 共7個(gè)游程 即游程數(shù)R 7 一個(gè)有太多或太少游程的樣本暗示著該樣本不是隨機(jī)的游程檢驗(yàn)根據(jù)游程數(shù)來(lái)檢驗(yàn)變量的兩個(gè)值或符號(hào)出現(xiàn)的順序是否是隨機(jī)的 對(duì)一個(gè)序列 可定義一個(gè)分界點(diǎn)來(lái)兩分?jǐn)?shù)據(jù) 如指定一個(gè)特點(diǎn)的數(shù) 或計(jì)算得到的統(tǒng)計(jì)量 如樣本均值 中位數(shù) 眾數(shù) 游程檢驗(yàn)的無(wú)效假設(shè)為 兩分類變量值的出現(xiàn)是隨機(jī)的 2020 2 4 12 單樣本K S檢驗(yàn) K S檢驗(yàn)是Kolmogorov Smirnov檢驗(yàn)的簡(jiǎn)稱 K S檢驗(yàn)是用來(lái)考察觀測(cè)值的分布和指定的理論分布符合程度的一種方法 SPSS提供的理論分布有正態(tài)分布 常規(guī) 均勻分布 相等 泊松分布 泊松 指數(shù)分布 指數(shù)分布 K S檢驗(yàn)不僅可以用于檢驗(yàn)間斷性變量的分布形態(tài) 也可以用于檢驗(yàn)連續(xù)性變量的分布形態(tài) 其原假設(shè)是 假設(shè)樣本來(lái)自的總體的分布與指定的理論分布沒(méi)有顯著差異 2020 2 4 13 多個(gè)獨(dú)立樣本檢驗(yàn) 多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)是通過(guò)分析多個(gè)獨(dú)立樣本數(shù)據(jù) 推斷樣本來(lái)自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異 它是單因素方差分析對(duì)應(yīng)的非參數(shù)檢驗(yàn)方法 原假設(shè)是 多獨(dú)立總體分布無(wú)顯著差異 PASW提供了三種檢驗(yàn)法 Kruskal WallisH檢驗(yàn) 中位數(shù)檢驗(yàn) Jonckheere Terpstra檢驗(yàn) 在進(jìn)行完全隨機(jī)設(shè)計(jì)的多組均值比較時(shí) 試驗(yàn)觀測(cè)結(jié)果有時(shí)會(huì)嚴(yán)重偏離正態(tài)分布 或組間方差不齊 或觀測(cè)結(jié)果是有序的 這時(shí)就只好用多個(gè)樣本比較的非參數(shù)檢驗(yàn)了 2020 2 4 14 多個(gè)獨(dú)立樣本檢驗(yàn) Kruskal WallisH方法 系統(tǒng)默認(rèn)的方法 是Mann WhitneyU檢驗(yàn)法的擴(kuò)展 類似單方向 因素 方差分析 該法的前提是假設(shè)抽樣總體是連續(xù)的和相同的 利用各樣本的秩和來(lái)推斷它們所代表的總體在分布位置上的差異顯著性 其基本思路是 首先把所有樣本合并升序排列 得出每個(gè)數(shù)據(jù)的秩 然后對(duì)各組樣本求平均秩 如果平均秩相差很大 則認(rèn)為兩組樣本所屬的總體有顯著差異 適用于 順序數(shù)據(jù) 總體非正態(tài)分布數(shù)據(jù) 方差不齊數(shù)據(jù) 有序分類變量等 即方差分析不適用的數(shù)據(jù) 該檢驗(yàn)法的適用范圍是 每組樣本量 5 2020 2 4 15 中位數(shù)檢驗(yàn) 探討多總體的中位數(shù)是否有差異 適用于數(shù)值變量資料 基本思路是 將所有樣本混合升序排列 并計(jì)算中位數(shù) 然后計(jì)算各組樣本中大于和小于這個(gè)中位數(shù)的樣本的個(gè)數(shù) 如果這些數(shù)據(jù)差距過(guò)大 則認(rèn)為兩組樣本所屬的總體有顯著差異 多個(gè)獨(dú)立樣本檢驗(yàn) 2020 2 4 16 兩個(gè)相關(guān) 配對(duì) 關(guān)聯(lián) 樣本檢驗(yàn) 主要用于同一研究對(duì)象 或兩個(gè)配對(duì)對(duì)象 分別給予兩種不同處理的效果比較以及同一研究對(duì)象 或兩個(gè)配對(duì)對(duì)象 處理前后的效果比較 前者推斷兩種效果有無(wú)差異 后者推斷某種處理是否有效 如同一批運(yùn)動(dòng)員在使用新訓(xùn)練方法前后的成績(jī)比較此時(shí)的樣本間不是獨(dú)立的 而是彼此相關(guān) 此時(shí)檢驗(yàn)樣本的總體間是否分布相同 而參數(shù)t檢驗(yàn)是檢驗(yàn)均值是否相等 零假設(shè)是兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異 2020 2 4 17 兩個(gè)相關(guān)樣本檢驗(yàn) Wilcoxon檢驗(yàn)也叫符號(hào)秩檢驗(yàn) 是一種改進(jìn)的符號(hào)檢驗(yàn) 其效能高于符號(hào)檢驗(yàn) 其基本思路是 如果兩樣本來(lái)自的兩相關(guān)配對(duì)總體沒(méi)有顯著差異的話 不但差值中正數(shù)的個(gè)數(shù)和負(fù)數(shù)的個(gè)數(shù)應(yīng)大致相等 而且正值和負(fù)值的秩和也大致相等 當(dāng)然 它的效率大約是t檢驗(yàn)的95 符號(hào)檢驗(yàn)是對(duì)配對(duì)樣本值計(jì)算其差值 觀測(cè)所得的差值的符號(hào) 如果差值中正數(shù)的個(gè)數(shù)和負(fù)數(shù)的個(gè)數(shù)差距較大 則認(rèn)為兩樣本差異顯著 它們來(lái)自兩個(gè)不同的總體 兩個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)方法有4種 根據(jù)數(shù)據(jù)類型確定 如果數(shù)據(jù)是連續(xù)的 使用符號(hào)檢驗(yàn)和Wilcoxon檢驗(yàn) 2020 2 4 18 多個(gè)相關(guān) 配對(duì)樣本檢驗(yàn) 多個(gè)相關(guān)樣本的檢驗(yàn)是判斷它們是否來(lái)自同一個(gè)總體 有三種檢驗(yàn)方法 Friedman Kendall的W Cochran的Q原假設(shè)都是 多個(gè)配對(duì)樣本的總體分布無(wú)顯著差異 Friedman檢驗(yàn)為雙向方差分析 也是把所有樣本值排列后利用秩及秩和構(gòu)造統(tǒng)計(jì)量來(lái)判斷 Kendall的W協(xié)同系數(shù)檢驗(yàn) 適用于幾個(gè)分類變量均為有序分類的情況 考察多次評(píng)價(jià) 評(píng)判 的排列是否隨機(jī) Cochran的Q檢驗(yàn) 是兩相關(guān)樣本McNemar檢驗(yàn)的多樣本推廣 適用于定性變量和二分類變量 2020 2 4 19 在進(jìn)行單個(gè)觀測(cè)值正交試驗(yàn)資料的方差分析時(shí) 其誤差是由 空列 來(lái)估計(jì)的 實(shí)際上 空列 并不是 空 的 它是留給試驗(yàn)因素間的交互作用的 所以上述誤差既包含試驗(yàn)誤差 也包含試驗(yàn)因素之間的交互作用 稱之為模型誤差 如果試驗(yàn)因素間不存在交互作用 用模型誤差估計(jì)試驗(yàn)誤差是可行的 如果因素間存在交互作用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論