正交檢驗的極差分析和方差分析.ppt_第1頁
正交檢驗的極差分析和方差分析.ppt_第2頁
正交檢驗的極差分析和方差分析.ppt_第3頁
正交檢驗的極差分析和方差分析.ppt_第4頁
正交檢驗的極差分析和方差分析.ppt_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

方差分析解決的主要問題是什么? 單因素方差分析與雙因素方差分析 原理的相同點與不同點? 正交實驗設計的基本原理是什么?,例題 某公司計劃引進一條生產(chǎn)線.為了選擇一條質量優(yōu)良的生產(chǎn)線以減少日后的維修問題,他們對6種型號的生產(chǎn)線作了初步調查,每種型號調查4條,結果列于表8-1。這些結果表示每個型號的生產(chǎn)線上個月維修的小時數(shù)。試問由此結果能否判定由于生產(chǎn)線型號不同而造成它們在維修時間方面有顯著差異?,4.1 方差分析的基本概念和原理,表 41 對6種型號生產(chǎn)線維修時數(shù)的調查結果,4.1 方差分析的基本概念和原理,研究的指標:維修時間記作Y, 控制因素是生產(chǎn)線的型號,分為6個水平即A,B,C,D,E,F,每個水平對應一個總體Yi(i=1,2,6)。,4.1 方差分析的基本概念和原理,現(xiàn)在的試驗就是進行調查,每種型號調查4臺,相當于每個總體中抽取一個容量為4的樣本,得到的數(shù)據(jù)記作yij(i=1,2,6;j=1,2,3,4),即為下表數(shù)據(jù)。 計算各樣本平均數(shù) 如下:,表 82,4.1 方差分析的基本概念和原理,兩個總體平均值比較的檢驗法 把樣本平均數(shù)兩兩組成對: 與 , 與 , 與 , 與 , 與 ,共有( 15)對。,4.1 方差分析的基本概念和原理,即使每對都進行了比較,并且都以0.95的置信度得出每對均值都相等的結論,但是由此要得出這6個型號的維修時間的均值都相等。這一結論的置信度僅是,上述方法存在的問題,工作量大,置信度低,將這15對平均數(shù)一一進行比較檢驗,4.1 方差分析的基本概念和原理,方差分析的基本原理 : (1)將數(shù)據(jù)總的偏差平方和按照產(chǎn)生的原因分解成: (總的偏差平方和)= (由因素水平引起的偏差平方和)+(試驗誤差平方和) (2)上式右邊兩個平方和的相對大小可以說明因素的不同水平是否使得各型號的平均維修時間產(chǎn)生顯著性差異,為此需要進行適當?shù)慕y(tǒng)計假設檢驗.,4.1 方差分析的基本概念和原理,數(shù)學模型和數(shù)據(jù)結構 參數(shù)點估計 分解定理 自由度 顯著性檢驗 多重分布與區(qū)間估計,4.2 單因素試驗的方差分析,在單因素試驗中,為了考察因素A的k個水平A1, A2,Ak對Y的影響(如k種型號對維修時間的影響),設想在固定的條件Ai下作試驗.所有可能的試驗結果組成一個總體Yi,它是一個隨機變量.可以把它分解為兩部分 (4-1),4.2.1 數(shù)學模型和數(shù)據(jù)結構,其中: 純屬Ai作用的結果,稱為在Ai條件下Yi的真值(也稱為在Ai條件下Yi的理論平均). 是實驗誤差(也稱為隨機誤差)。 (4-2) 其中, 和 都是未知參數(shù)(i=1,2,k).,4.2.1 數(shù)學模型和數(shù)據(jù)結構,假定在水平Ai下重復做m次試驗,得到觀測值,表 43,4.2.1 數(shù)學模型和數(shù)據(jù)結構,表中: (i=1,2,k) (4-3) Yij表示在Ai條件下第j次試驗的結果,用式子表示就是 (i=1,2,k j=1,2,m) (4-4) 注意: 每次試驗結果只能得到Yij,而(4-4)式中的 和 都不能直接觀測到。,4.2.1 數(shù)學模型和數(shù)據(jù)結構,為了便于比較和分析因素A的水平Ai對指標影響的大小,通常把 再分解為 (i=1,2,k) (4-5) 其中, 稱為一般平均(Grand Mean),它是比 較作用大小的一個基點;,8.2.1 數(shù)學模型和數(shù)據(jù)結構,并且稱 為第i個水平Ai的效應.它表示水平的真值比一般水平差多少。滿足約束條件 (4-6) 可得,i=1,2,k ;j=1,2,m,4.2.1 數(shù)學模型和數(shù)據(jù)結構,要解決的問題,找出參數(shù) 和 的估計量,分析觀測值的偏差,檢驗各水平效應 有無顯著差異,4.2.1 數(shù)學模型和數(shù)據(jù)結構,用最小二乘法求參數(shù) 的估計量,然后尋求 的無偏估計量. 須使參數(shù) 的估計值能使在水平Ai下求得的觀測值Yij與真值 之間的偏差盡可能小。 為滿足此要求,一般考慮用最小偏差平方和原則,也就是使觀測值與真值的偏差平方和達到最小.,4.2.2 參數(shù)點估計,由(4-4)可知,上述偏差平方和 令下列各偏導數(shù)為零,(i=1,2,k),4.2.2 參數(shù)點估計,由 解得 (4-7) 由 解得 (4-8),4.2.2 參數(shù)點估計,并由此得 的估計量 至此,求得參數(shù) 的估計量 (4-9),4.2.2 參數(shù)點估計,按照上述原則求參數(shù)估計量的方法稱為最小二乘法, 稱為最小二乘估計量. 我們還可以證明 分別是參數(shù) 的無偏估計量。 將 和 分別用它們的估計量代替,可以得到試驗誤差 的估計量 , (4-10),4.2.2 參數(shù)點估計,為了由觀測值的偏差中分析出各水平的效應,我們研究三種偏差: , 和 . 根據(jù)前面參數(shù)估計的討論,它們分別表示 , 定理 (4-11),的估計.,和,4.2.3 分解定理 自由度,證明:,4.2.3 分解定理 自由度,令 則分解定理(8-11)可寫成 (4-12),4.2.3 分解定理 自由度,上式中, 稱為總偏差平方和. 稱為誤差平方和(或組內平方和); 稱為因素A的效應平方和(或組間平方和), ST的自由度fT=km-1 SA的自由度fA=k-1 SE的自由度fE=k(m-1) 容易看出,自由度之間也有類似于分解定理的關系 (4-13),4.2.3 分解定理 自由度,參數(shù)假設檢驗的假設條件,觀測值(i=1,2,k;j=1,2,m) 相互獨立,在水平Ai條件下, Yij(j=1,2,m) 服從正態(tài)分布N,4.2.4 顯著性檢驗,要判斷在因素A的k個水平條件下真值之間是否有顯著性差異, 即檢驗假設 H0: , H1: 不全相等 相當于檢驗假設 H0 : (i=1,2,k), H1 : i不全為零,4.2.4 顯著性檢驗,可以證明當H0為真時, , , (4-16) 并且 與 相互獨立. 得 (4-17) 其中 和 稱為均方(Mean Square).,4.2.4 顯著性檢驗,利用(8-17)式來檢驗原假設H0是否成立.對于給定的顯著水平 ,可以從F分布表查出臨界值 再根據(jù)樣本觀測值算出FA的值. 當 時,拒絕H0, 當 時,接受H0。,4.2.4 顯著性檢驗,表 44 方差分析表,4.2.4 顯著性檢驗,下面繼續(xù)討論前面6種型號的生產(chǎn)線的例子。根據(jù)調查結果,在 =0.05的顯著水平時,檢驗這6種型號的生產(chǎn)線在平均維修時間方面有無顯著差異? 根據(jù)實踐經(jīng)驗,認為各種型號生產(chǎn)線的維修時間是近似服從正態(tài)分布的。 作統(tǒng)計假設:6種型號的生產(chǎn)線平均維修時數(shù)無顯著差異,即 H0: i=0(i=1,2,6),H1:i不全為零,4.2.4 顯著性檢驗,計算SA及SE,4.2.4 顯著性檢驗,表 45 計算列表,4.2.4 顯著性檢驗,再將計算結果分別代入SA與SE兩式中,得到 第一自由度 第二自由度,4.2.4 顯著性檢驗,查F分布表得 由于 ,故拒絕H0。 該結論說明,至少有一種生產(chǎn)線型號的效應不為零,這等價于至少有兩種型號的生產(chǎn)線的平均維修時數(shù)是有顯著差異的。,表 46 方差分析表,4.2.4 顯著性檢驗,q 檢驗法:,計算任意兩水平的差值 ,,當 時,判斷 與 差異顯著; 當 時,判斷 與 差異顯著。,查多重比較的q表得 (8-18),4.2.5 多重分布與區(qū)間估計,區(qū)間估計 在置信度為 的情況下, 的置信區(qū)間為 (8-19),4.2.5 多重分布與區(qū)間估計,雙因素方差分析的類型 數(shù)據(jù)結構 離差平方和的分解 應用實例,4.3 雙因素方差分析,在實際問題的研究中,有時需要考慮兩個因素對實驗結果的影響。 例如飲料銷售,除了關心飲料顏色之外,我們還想了解銷售地區(qū)是否影響銷售量,如果在不同的地區(qū),銷售量存在顯著的差異,就需要分析原因。采用不同的銷售策略,使該飲料品牌在市場占有率高的地區(qū)繼續(xù)深入人心,保持領先地位;在市場占有率低的地區(qū),進一步擴大宣傳,讓更多的消費者了解、接受該生產(chǎn)線。,4.3.1 雙因素方差分析的類型,若把飲料的顏色看作影響銷售量的因素A,飲料的銷售地區(qū)則是影響因素B。對因素A和因素B同時進行分析,就屬于雙因素方差分析。 雙因素方差分析的內容,是對影響因素進行檢驗,究竟是一個因素在起作用,還是兩個因素都起作用,或是兩個因素的影響都不顯著。,4.3.1 雙因素方差分析的類型,雙因素方差分析的類型,無交互作用的 雙因素方差分析,有交互作用的 雙因素方差分析,假定因素A和因素B的效應之間是相互獨立的,不存在相互關系,假定因素A和因素B的結合會產(chǎn)生出一種新的效應,4.3.1 雙因素方差分析的類型,例如, 若假定不同地區(qū)的消費者對某種顏色有與其他地區(qū)消費者不同的特殊偏愛,這就是兩個因素結合后產(chǎn)生的新效應,屬于有交互作用的背景; 否則,就是無交互作用的背景。有交互作用的雙因素方差分析已超出本書的范圍,這里介紹無交互作用的雙因素方差分析。,4.3.1 雙因素方差分析的類型,雙因素方差分析的數(shù)據(jù)結構如表所示: 雙因素方差分析數(shù)據(jù)結構,表 87,4.3.2 數(shù)據(jù)結構,表中,因素A位于列的位置,共有r個水平, 代表第j種水平的樣本平均數(shù);因素B位于行的位置,共有k個水平, 代表第i種水平的樣本平均數(shù)。 為樣本總平均數(shù),樣本容量n=rk。 每一個觀察值Xij看作由A因素的r個水平和B因素的k個水平所組合成的rk個總體中抽取樣本容量為1的獨立隨機樣本。這rk個總體的每一個總體均服從正態(tài)分布,且有相同的方差。這是進行雙因素方差分析的假定條件。,4.3.2 數(shù)據(jù)結構,4.3.3 離差平方和的分解,各離差平方和對應的自由度: 總離差平方和SST的自由度為rk-1=n-1; 因素A的離差平方和SSA的自由度為r-1; 因素B的離差平方和的自由度為k-1; 隨機誤差SSE的自由度為(r-1)(k-1),4.3.3 離差平方和的分解,由離差平方和與自由度可以計算均方差: 對因素A而言: 對因素B而言: 對隨機變量而言:,4.3.3 離差平方和的分解,表 48 雙因素方差分析表,4.3.3 離差平方和的分解,某商品有五種不同的包裝方式(因素A),在五個不同地區(qū)銷售(因素B),現(xiàn)從每個地區(qū)隨機抽取一個規(guī)模相同的超級市場,得到該商品不同包裝的銷售資料如下表. 表 49 現(xiàn)欲檢驗包裝方式和銷售地區(qū)對該商品銷售是否有顯著性影響。(=0.05),4.3.4 應用實例,解: 若五種包裝方式的銷售的均值相等,則表明不同的包裝方式在銷售上沒有差別。 建立假設 對因素A: H0: , 包裝方式之間無差別 H1: 不全相等, 包裝方式之間有差別 對因素B: H0: 地區(qū)之間無差別 H1: 不全相等 地區(qū)之間有差別,4.3.4 應用實例,計算F值 因素A的列均值分別為: 因素B的行均值分別為: 總均值=15.04 故: SST=(20-15.04)2 +(10-15.04)2=880.96 SSA=5(21.6-15.04)2 +5(11.6-15.04)2=335.36 SSB=5(15.2-15.04)2 +5(18.8-15.04)2=199.36 SSE=880.96-335.36-199.36=346.24,4.3.4 應用實例,接下來: 因此,4.3.4 應用實例,統(tǒng)計決策 對于因素A,因為 FA=3.87Fcrit =3.01 故拒絕H0,接受H1, 說明不同的包裝方式對該商品的銷售產(chǎn)生影響。 對于因素B,因為 FB=2.30Fcrit=3.01 故接受H0, 說明不同地區(qū)該商品的銷售沒有顯著差異。,4.3.4 應用實例,在工農(nóng)業(yè)生產(chǎn)和科學研究中,經(jīng)常會遇到多因素試驗問題,在實際中不需要進行各種水平組合的全面試驗,只需從各種不同搭配情況中,選取一小部分來進行就可以了。那么,怎樣選取以及如何分析試驗結果,才能科學的回答如下問題: 各因素對指標的影響,哪個因素重要?哪個因素次之? 每個因素中,哪個水平為好? 各個因素和水平依哪種情況搭配可使試驗結果最佳? 解決這些問題正是正交試驗設計的主要內容。,4.4 正交試驗設計,正交試驗統(tǒng)計的基本思想 正交表與直觀分析法 方差分析法,4.4 正交試驗設計,考慮進行一個三因素、每個因素有三個水平的試驗。如果作全面試驗,需作=27次。,圖8-1,4.4.1 正交試驗統(tǒng)計的基本思想,如果進行正交試驗設計,利用正交表安排試驗,對于三因素三水平的試驗來說,需要作9次試驗,用“”表示,標在圖中。 如果每個平面都表示一個水平,共有九個平面,可以看到每個平面上都有三個“”點,立方體的每條直線上都有一個“”點,并且這些“”點是均衡地分布著。,4.4.1 正交試驗統(tǒng)計的基本思想,正交表是正交試驗設計的工具。 最簡單的正交表是L4(23),此外還有L8(27) , L9(34) ,L16(45)等等。 L表示一張表,它的數(shù)字,有三層不同的含義,以L4(23)為例加以說明。,4.4.2 正交表與直觀分析法,L4(23)表的結構: 包括4行,3列,表中只出現(xiàn)1、2兩個反映水平的數(shù)字。,行數(shù),水平數(shù),列數(shù),L4(23),4.4.2 正交表與直觀分析法,Ln(rm),L4(23)表的用法 作4次試驗,可以最多安排3個二水平的因素(因子),試驗數(shù),水平數(shù),因子數(shù),L4(23),4.4.2 正交表與直觀分析法,L4(23)表的效率 全因素全水平的實驗做8次,正交實驗做4次.,理論上全部試驗的次數(shù),實際試驗次數(shù),L4(23),4.4.2 正交表與直觀分析法,表 410 L4(23),4.4.2 正交表與直觀分析法,正交表的特點,每一列中,不同的數(shù)字出現(xiàn)的次數(shù)相等, 如L4(23)表中的數(shù)1和2,它們各出現(xiàn)了兩次,任意兩列中,將同一橫行的兩個數(shù)字看成有 序數(shù)對時,每種數(shù)對出現(xiàn)的次數(shù)相等。如 L4(23)表中共有的四種有序數(shù)對(1,1), (1,2),(2,1),(2,2),它們各出現(xiàn)一次。,由此保證了用正交表安排的試驗計劃是均衡搭配的。,4.4.2 正交表與直觀分析法,例 某化工廠生產(chǎn)一種試劑,產(chǎn)率較低,希望通過試驗探索好的生產(chǎn)工藝以提高產(chǎn)率??疾斓囊蜃优c水平如下表: 表 411,4.4.2 正交表與直觀分析法,表 412 試驗計劃表,4.4.2 正交表與直觀分析法,表 813 計算表,4.4.2 正交表與直觀分析法,在A因子水平相同的三組試驗中,極差 它表示反應溫度40攝氏度與50攝氏度相比,試劑的產(chǎn)率平均提高15.6%. 用同樣的方法可以比較B因子和C因子各水平的好與差.,4.4.2 正交表與直觀分析法,結 論,反應溫度對產(chǎn)率影響最大,其次 是反應時間,再其次是攪拌速度.,反應溫度是40度好,反應時間是 1.5小時好,攪拌速度是快速好.,最好的生產(chǎn)工藝是A2B2C1: 即 反應溫度 40攝氏度; 反應時間 1.5小時; 攪拌速度 快速.,4.4.2 正交表與直觀分析法,利用方差分析法來分析試驗結果時,由于要考慮隨機因素對指標的影響,因此在選取正交表安排試驗時,要使表中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論