



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、王笑(孝)權(quán)安徽省五河縣臨北鄉(xiāng)石家村衛(wèi)生室 主成分分析又稱主分量、主軸分析,實(shí)質(zhì)就是對較多的變量在盡量保存原信息的情況下加以線性概括。在此過程前, 為消除變量量綱不同造成的影響, 首先要對各原始指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理。 迄今為止, 所見教材的主成分分析”實(shí)質(zhì)都是用求得主成分再對原始變量的回歸分析。教材的通病都是未詳細(xì)說明最后的回歸過程,往往令初學(xué)者感覺到莫名其妙。目前,由網(wǎng)上的一些所謂的主成分分析”可知,或者其資料不適用主成分分析,還有根本就不是主成分分析。有鑒于此,現(xiàn)利用網(wǎng)上獲得的數(shù)據(jù),進(jìn)行主成分分析的探討。1 資料與方法1.1 資料來源資料來源于中華人民共和國衛(wèi)生部網(wǎng)站1,我國“2006 年工
2、業(yè)部門職業(yè)病發(fā)病及死亡情況”,剔除其中的第 1、2、14 號無意義指標(biāo),以及末尾的觀測其它”,剩余 11 個(gè)指標(biāo),觀測值有缺失則用 0 補(bǔ)齊。程序分別賦這些指標(biāo)為 x1-x11,其名稱標(biāo)簽見附件 1;余詳見數(shù)據(jù) 1。數(shù)據(jù) 12006 年工業(yè)部門職業(yè)病發(fā)病及死亡情況相關(guān)數(shù)據(jù)namex1x2x3x4x5x 6x7x8x9x10 x11煤炭45672124103401301570石油2410140010140電力110110281 011161核工業(yè)冶金049406504002015900000305324110有色金屬3331193133412013884451900110293375023811
3、電子701431200 0511330兵器70402200011360船舶180101100020化工10321053622089170244醫(yī)藥5080150119810鐵道646202101041交通6116014306680建材698176051 0103200建設(shè)地質(zhì)礦產(chǎn)126253123381103405001230010水利農(nóng)業(yè)森林工業(yè)223217002000100000022500011001010000輕工1891610132941012324213紡織航空航天20121200012011140052360410商業(yè)110200312020郵電石化工業(yè)回收加工業(yè)29001101
4、52002060000010000012000001.2 方法將數(shù)據(jù)1 倒入 SAS9.1 邏輯庫sasuser 后調(diào)用,程序默認(rèn)對原始數(shù)據(jù)標(biāo)準(zhǔn)化后進(jìn)行主成分分析。根據(jù)觀察的需要對初步運(yùn)行后的輸出數(shù)據(jù)編程帶入,以了解更多內(nèi)容(見附件 1)。2 結(jié)果輸出結(jié)果表明:各個(gè)主成分貢獻(xiàn)率沒有出奇的大,本資料適用于主成分分析;且前 4 個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到 0.8112,每個(gè)的特征值都1,符合一般主成分個(gè)數(shù)選取標(biāo)準(zhǔn),可以選取 4 個(gè)主成分,見輸出 1。輸出 1 相關(guān)矩陣的前 5 個(gè)特征值、貢獻(xiàn)率EigenvaluesoftheCorrelationMatrixEigenvalueDifferencePr
5、oportionCumulative14.061904931.526008420.36930.369322.535896521.220978090.23050.599831.314918430.303976160.11950.719341.010942260.298151440.09190.81123 討論各主成分與標(biāo)準(zhǔn)化變量的相關(guān)系數(shù)說明了主成分被這些指標(biāo)影響的強(qiáng)度,由 rz1x 可見:各標(biāo)準(zhǔn)化指標(biāo)與 z1 均成正相關(guān),由于主成分 1 受 x2-x5、x7、x10 支配可以理解 z1 是產(chǎn)生急性、嚴(yán)重職業(yè)病的綜合指標(biāo),可能是毒性強(qiáng),、濃度高的有害物質(zhì)迅速導(dǎo)致工作人員發(fā)病、呼吸道損害、中毒乃至
6、死亡;z2 其實(shí)與 z1 是對立性綜合指標(biāo),反映低濃度生產(chǎn)、生活環(huán)境下的慢性損害,x1 支配 rz2x 表明隨著環(huán)境有毒物質(zhì)濃度降低,呼吸道損害下降,但是這種相對較好一點(diǎn)的有毒環(huán)境仍然避免不掉會(huì)損害人的皮膚、眼睛等防護(hù)薄弱地方;x6 與 x7 各自單獨(dú)支配主成分 z3(見 rz3x)、z4(見 rz4x),它們表達(dá)的是與 z1、z2 完全不同的信息,z3 不是環(huán)境毒害物質(zhì)造成的,實(shí)際是長期暴露在某種場合,防護(hù)不當(dāng)?shù)暮蠊?;z4 是環(huán)境有害因素慢性長期作用人體,損害人體的免疫系統(tǒng)、導(dǎo)致免疫監(jiān)視混亂,喪失殺死、清除機(jī)體內(nèi)的異變細(xì)胞功能。標(biāo)準(zhǔn)化變量與主成分的詳細(xì)關(guān)系見輸出 2。輸出 2 主成分與準(zhǔn)化指
7、標(biāo)的相關(guān)系數(shù)namerz1xrz2xrz3xrz4xx10.59571-0.71288-0.285740.03795x20.66688-0.65136-0.16550-0.13085x30.884860.38006-0.018180.09209x40.440390.405630.29572-0.25224x50.767080.215930.36782-0.19094x60.311940.008830.721940.43830 x70.64136-0.462500.212090.33249x80.505340.68292-0.254760.28210 x90.304900.60786-0.532
8、430.33055x100.75893-0.29938-0.26026 -0.04144x110.513840.329150.02268-0.62498在實(shí)際工作中,要用每個(gè)主成分對全部原始變量回歸建立起主成分回歸方程,使分析有意義。用回歸方程中的系數(shù)、截距對應(yīng)各自的自變量(原始變量)編程帶入 SAS 運(yùn)行,即能觀察各部門職業(yè)病的符合情況, 又可對新樣品的主成分歸屬進(jìn)行判讀。 事實(shí)上該過程并不需要研究者額外費(fèi)心, 因?yàn)檫@個(gè)過程就是 SAS程序自動(dòng)輸出的主成分得分(輸出 3)而已。由于各主成分包含職業(yè)病的屬性不同,觀測受某主成分的支配量最大時(shí),那么相應(yīng)工業(yè)部門工作人員職業(yè)病病種,特征信息就包含在
9、該主成分中。各觀測主成分得分及分類見輸出 3。輸出 3 根據(jù)主成分得分對觀測的判別歸類Obsnamez1z2z3z4g1煤炭4.80628-5.73054 -2.002430.6828322石油-1.12318-0.36420-0.25621-0.1573113電力-0.83878-0.28533-0.11621-0.3654214核工業(yè)-1.50940-0.25718-0.14052-0.0985915冶金2.612730.721070.19429-3.8380246有色金屬3.17963-0.813741.37801-0.5665017機(jī)械1.641830.55132-0.501730.3
10、755918電子0.391291.720520.076080.0539329兵器-0.812330.90634-1.458370.81899310船舶-1.47388-0.243140.00184-0.00501111化工3.650424.82568-2.592391.40049212醫(yī)藥-0.985830.26187-0.305470.32627113鐵道-1.22241-0.21814-0.05596-0.28756114交通-1.00402-0.084990.077750.27589115建材-0.47419-0.64732-0.624670.10248316建設(shè)0.122651.185
11、781.23910-1.02345317地質(zhì)礦產(chǎn)-1.42439-0.33828-0.17242-0.08197118水利-1.45709-0.37322-0.15203-0.13854119農(nóng)業(yè)-0.36656-0.610113.003822.38548320森林工業(yè)-1.45231-0.26919-0.068500.03247121輕工4.771121.108262.749000.68439122紡織-0.17623-0.42846-0.44198-0.19643323航空航天-1.41781-0.15992-0.20594-0.03345124商業(yè)-1.28329-0.273410.29
12、0080.30555125郵電-1.44519-0.078120.03885-0.22250126石化工業(yè)-1.39624-0.17381-0.13145-0.07545127回收加工業(yè)-1.312820.068260.17745-0.354171主成分分析是其它分析前對數(shù)據(jù)的預(yù)處理過程,例如因子分析、對應(yīng)分析、判別、聚類、秩和比、回歸等。一般的主成分分析實(shí)際是主成分回歸分析,并最終通過建立的回歸方程完成新樣品判別分析。由此可幫助人們認(rèn)識不同工業(yè)部門的職業(yè)病風(fēng)險(xiǎn)情況,有針對的采取防護(hù)措施,減少或延緩職業(yè)病的發(fā)生、發(fā)展。1 中華人民共和國衛(wèi)生部網(wǎng)站.2006 年工業(yè)部門職業(yè)病發(fā)病及死亡情況,ht
13、tp:/ 1:有關(guān)分析程序procstandarddata=sasuser.wxq163out=wmean=0std=1;/*調(diào)用邏輯庫數(shù)據(jù)*/varx1-x11;procprincompdata=sasuser.wxq163prefix=zout=wx;/*主成份分析*/varx1-x11;procprintdata=wx;datarx;setsasuser.wxq16;r1=z1*sqrt(e1);r2=z2*sqrt(e2);r3=z3*sqrt(e3);r4=z4*sqrt(e4);procprintdata=rx;varr1-r4;/*各主成分于標(biāo)準(zhǔn)化變量相關(guān)系數(shù)*/datawxq1638;mergewx(keep=z1-z4)sasuser.wxq163;a1=abs(round(z1,0.1);a2=abs(round(z2,0.1);a3=abs(round(z3,0.1);a4=abs(round(z4,0.1);maxa=MAX(OFa1-a4);ifa1=maxatheng=1;ifa2=maxatheng=2;ifa3=maxatheng=3;ifa4=maxatheng=4;/*利用主成分得分對觀測判斷分組*/keepx1-x11z1-z4g;procprintdata=wxq1638;procregdata=wxq1638;la
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司內(nèi)部事故管理制度
- 學(xué)校工會(huì)民主管理制度
- 水庫底部清淤方案(3篇)
- 樓層倉庫規(guī)劃方案(3篇)
- 企業(yè)保潔托管方案(3篇)
- 物業(yè)水管維修方案(3篇)
- 培訓(xùn)學(xué)校制度管理制度
- 涉案企業(yè)檢查方案(3篇)
- 砂石場收購方案(3篇)
- 華為交付流程管理制度
- 全球經(jīng)濟(jì)2025年全球經(jīng)濟(jì)與貿(mào)易師考試試題及答案
- 2024 - 2025學(xué)年一年級下冊道德與法治期末考試卷附答案
- 2024年湖南高中學(xué)業(yè)水平合格性考試地理試卷真題(含答案)
- 學(xué)校大型活動(dòng)組織流程
- 2025豬藍(lán)耳病防控及凈化指南(第三版)
- 【課件】Unit+8+Section+B+(1a~2b)課件人教版(2024)初中英語七年級下冊
- 浙江建筑b證試題及答案
- 2025年高考政治搶押秘籍(江蘇專用)時(shí)政熱點(diǎn)05延遲法定退休年齡改革(學(xué)生版+解析)
- 落戶咨詢服務(wù)合同協(xié)議
- 職務(wù)轉(zhuǎn)讓協(xié)議書范本
- 蘭州大學(xué)博士英語考試試題及答案
評論
0/150
提交評論