《流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)》課件_第1頁(yè)
《流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)》課件_第2頁(yè)
《流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)》課件_第3頁(yè)
《流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)》課件_第4頁(yè)
《流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)》課件_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

流行病學(xué)數(shù)據(jù)分析實(shí)習(xí)專業(yè)化培訓(xùn),掌握流行病學(xué)數(shù)據(jù)分析核心技能從理論到實(shí)踐,全面提升公共衛(wèi)生研究能力課程概述課程目標(biāo)掌握流行病學(xué)數(shù)據(jù)分析方法學(xué)習(xí)內(nèi)容統(tǒng)計(jì)方法和軟件應(yīng)用實(shí)踐考核方式案例分析和實(shí)踐報(bào)告流行病學(xué)數(shù)據(jù)分析簡(jiǎn)介定義運(yùn)用統(tǒng)計(jì)方法分析人群健康數(shù)據(jù)重要性揭示疾病分布規(guī)律和危險(xiǎn)因素應(yīng)用領(lǐng)域疾病監(jiān)測(cè)、健康政策制定數(shù)據(jù)類型時(shí)間序列數(shù)據(jù)按時(shí)間順序收集的連續(xù)觀測(cè)值定量數(shù)據(jù)可測(cè)量的數(shù)值型變量定性數(shù)據(jù)分類或名義型變量數(shù)據(jù)收集方法問(wèn)卷調(diào)查結(jié)構(gòu)化收集人群健康信息醫(yī)療記錄從醫(yī)院系統(tǒng)提取臨床數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)對(duì)照試驗(yàn)產(chǎn)生的研究數(shù)據(jù)數(shù)據(jù)質(zhì)量控制數(shù)據(jù)清理檢查并糾正錯(cuò)誤錄入和格式問(wèn)題異常值處理識(shí)別并處理極端值和離群點(diǎn)缺失值處理評(píng)估缺失模式并選擇適當(dāng)填補(bǔ)方法描述性統(tǒng)計(jì)(一)集中趨勢(shì)測(cè)量平均值中位數(shù)眾數(shù)離散趨勢(shì)測(cè)量方差標(biāo)準(zhǔn)差四分位距描述性統(tǒng)計(jì)(二)頻數(shù)分布變量值出現(xiàn)的次數(shù)統(tǒng)計(jì)百分比占總體的相對(duì)比例比率和比值不同類別間的相對(duì)關(guān)系圖表展示(一)選擇合適圖表類型展示不同數(shù)據(jù)特征圖表展示(二)散點(diǎn)圖展示兩個(gè)連續(xù)變量間關(guān)系箱線圖顯示數(shù)據(jù)分布和離群值熱圖使用顏色強(qiáng)度表示數(shù)據(jù)變化概率分布68%正態(tài)分布連續(xù)型隨機(jī)變量常見(jiàn)分布15%二項(xiàng)分布成功/失敗事件概率17%泊松分布稀有事件發(fā)生概率假設(shè)檢驗(yàn)基礎(chǔ)原假設(shè)與備擇假設(shè)檢驗(yàn)起點(diǎn):無(wú)差異vs有差異顯著性水平接受或拒絕假設(shè)的標(biāo)準(zhǔn)p值觀察到結(jié)果的概率測(cè)度t檢驗(yàn)單樣本t檢驗(yàn)樣本均值與已知值比較獨(dú)立樣本t檢驗(yàn)兩獨(dú)立組均值差異比較配對(duì)樣本t檢驗(yàn)同一組前后測(cè)量比較方差分析重復(fù)測(cè)量方差分析多時(shí)間點(diǎn)測(cè)量比較雙因素方差分析兩個(gè)因素交互作用分析3單因素方差分析三組以上均值比較卡方檢驗(yàn)檢驗(yàn)類型應(yīng)用場(chǎng)景關(guān)注重點(diǎn)擬合優(yōu)度檢驗(yàn)觀察值與理論值比較分布特征獨(dú)立性檢驗(yàn)兩分類變量關(guān)聯(lián)性相互獨(dú)立性同質(zhì)性檢驗(yàn)不同樣本分布比較分布一致性相關(guān)分析Pearson相關(guān)系數(shù)兩連續(xù)變量線性關(guān)系Spearman相關(guān)系數(shù)等級(jí)變量或非線性關(guān)系偏相關(guān)分析控制第三變量影響線性回歸(一)X變量Y預(yù)測(cè)值觀察值線性回歸(二)變量選擇前向、后向、逐步回歸法共線性診斷方差膨脹因子評(píng)估殘差分析模型適合度檢驗(yàn)Logistic回歸二分類Logistic回歸預(yù)測(cè)二元結(jié)局事件疾病發(fā)生與否預(yù)測(cè)多分類Logistic回歸多類別結(jié)局變量疾病分型預(yù)測(cè)OR值解釋優(yōu)勢(shì)比反映關(guān)聯(lián)強(qiáng)度e^β為暴露影響生存分析基礎(chǔ)生存函數(shù)存活概率隨時(shí)間變化風(fēng)險(xiǎn)函數(shù)單位時(shí)間事件發(fā)生率生存時(shí)間數(shù)據(jù)特點(diǎn)截尾數(shù)據(jù)處理Kaplan-Meier方法生存曲線繪制階梯狀展示生存概率變化中位生存時(shí)間估計(jì)生存率為50%時(shí)的時(shí)間點(diǎn)組間生存曲線比較Log-rank檢驗(yàn)差異顯著性Cox比例風(fēng)險(xiǎn)模型模型假設(shè)比例風(fēng)險(xiǎn)風(fēng)險(xiǎn)比恒定協(xié)變量線性作用變量篩選單因素初篩多因素分析交互作用評(píng)估結(jié)果解釋風(fēng)險(xiǎn)比意義可信區(qū)間臨床相關(guān)性隊(duì)列研究數(shù)據(jù)分析相對(duì)危險(xiǎn)度計(jì)算暴露組與非暴露組發(fā)病率比值2歸因危險(xiǎn)度計(jì)算可歸因于暴露的發(fā)病率暴露-反應(yīng)關(guān)系分析劑量反應(yīng)關(guān)系評(píng)估病例對(duì)照研究數(shù)據(jù)分析優(yōu)勢(shì)比計(jì)算病例組與對(duì)照組暴露比率比較匹配設(shè)計(jì)分析個(gè)體匹配或頻數(shù)匹配條件Logistic回歸匹配設(shè)計(jì)多因素分析3橫斷面研究數(shù)據(jù)分析患病率計(jì)算特定時(shí)間點(diǎn)疾病存在比例患病比計(jì)算不同人群患病率比較相關(guān)因素分析多因素回歸模型應(yīng)用診斷試驗(yàn)評(píng)價(jià)評(píng)價(jià)指標(biāo)計(jì)算方法意義敏感性真陽(yáng)性/(真陽(yáng)性+假陰性)檢出患者能力特異性真陰性/(真陰性+假陽(yáng)性)排除健康者能力預(yù)測(cè)值陽(yáng)性/陰性預(yù)測(cè)值檢測(cè)結(jié)果可靠性多水平模型模型比較和選擇似然比檢驗(yàn)和AIC隨機(jī)斜率模型允許變量效應(yīng)在組間變化隨機(jī)截距模型基線水平在組間變化主成分分析1原理和應(yīng)用降維并保留最大變異信息2因子提取特征值和載荷矩陣計(jì)算3結(jié)果解釋主成分解釋原始變量意義因子分析探索性因子分析發(fā)現(xiàn)潛在構(gòu)念結(jié)構(gòu)驗(yàn)證性因子分析檢驗(yàn)假設(shè)理論模型模型評(píng)價(jià)擬合指數(shù)評(píng)估聚類分析K-means聚類劃分樣本到預(yù)設(shè)K個(gè)類別層次聚類構(gòu)建樣本間層次關(guān)系聚類結(jié)果評(píng)價(jià)輪廓系數(shù)和類內(nèi)凝聚度判別分析1線性判別分析線性函數(shù)區(qū)分類別二次判別分析二次函數(shù)適應(yīng)復(fù)雜邊界判別函數(shù)解釋變量對(duì)分類貢獻(xiàn)評(píng)估元分析基礎(chǔ)異質(zhì)性檢驗(yàn)I2和Q統(tǒng)計(jì)量評(píng)估研究間一致性固定效應(yīng)模型假設(shè)研究間效應(yīng)相同隨機(jī)效應(yīng)模型考慮研究間效應(yīng)變異元分析進(jìn)階發(fā)表偏倚評(píng)估漏斗圖和Egger檢驗(yàn)敏感性分析評(píng)估結(jié)果穩(wěn)健性亞組分析探索異質(zhì)性來(lái)源時(shí)間序列分析揭示時(shí)間模式并做出準(zhǔn)確預(yù)測(cè)空間分析基礎(chǔ)地理信息系統(tǒng)應(yīng)用空間數(shù)據(jù)可視化空間自相關(guān)Moran'sI和LISA統(tǒng)計(jì)量熱點(diǎn)分析疾病聚集區(qū)檢測(cè)網(wǎng)絡(luò)分析機(jī)器學(xué)習(xí)在流行病學(xué)中的應(yīng)用深度學(xué)習(xí)復(fù)雜模式識(shí)別與預(yù)測(cè)監(jiān)督學(xué)習(xí)疾病風(fēng)險(xiǎn)預(yù)測(cè)分類非監(jiān)督學(xué)習(xí)疾病亞型識(shí)別數(shù)據(jù)可視化技巧選擇合適的圖表類型按數(shù)據(jù)特征選擇突出核心信息考慮受眾理解能力色彩使用原則對(duì)比度合理避免過(guò)多顏色考慮色盲友好信息傳達(dá)有效性突出關(guān)鍵模式減少認(rèn)知負(fù)擔(dān)保持簡(jiǎn)潔明了R語(yǔ)言基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)向量、矩陣、數(shù)據(jù)框基本操作數(shù)據(jù)讀取、操作、導(dǎo)出函數(shù)編寫自定義函數(shù)創(chuàng)建與應(yīng)用R語(yǔ)言數(shù)據(jù)處理dplyr包使用數(shù)據(jù)篩選、排序、分組聚合tidyr包使用寬表轉(zhuǎn)長(zhǎng)表、缺失值處理數(shù)據(jù)合并和重塑不同來(lái)源數(shù)據(jù)整合分析R語(yǔ)言統(tǒng)計(jì)分析(一)描述性統(tǒng)計(jì)summary()和describe()函數(shù)假設(shè)檢驗(yàn)t.test()和chisq.test()函數(shù)3相關(guān)與回歸cor.test()和lm()函數(shù)R語(yǔ)言統(tǒng)計(jì)分析(二)生存分析survival包和survminer包廣義線性模型glm()函數(shù)應(yīng)用多水平模型lme4包和nlme包R語(yǔ)言數(shù)據(jù)可視化ggplot2包使用分層構(gòu)建專業(yè)統(tǒng)計(jì)圖表交互式圖表制作plotly和shiny應(yīng)用地圖繪制sf包和tmap包應(yīng)用SAS軟件基礎(chǔ)宏編程入門自動(dòng)化分析流程過(guò)程語(yǔ)句使用PROC步驟數(shù)據(jù)分析數(shù)據(jù)集創(chuàng)建和管理DATA步驟數(shù)據(jù)處理SAS統(tǒng)計(jì)分析(一)描述性統(tǒng)計(jì)PROCMEANS和PROCUNIVARIATE方差分析PROCANOVA和PROCGLM回歸分析PROCREG和PROCLOGISTICSAS統(tǒng)計(jì)分析(二)Logistic回歸PROCLOGISTIC應(yīng)用生存分析PROCLIFETEST和PHREG混合線性模型PROCMIXED多水平分析SPSS軟件操作數(shù)據(jù)錄入和管理變量定義和數(shù)據(jù)編輯基本統(tǒng)計(jì)分析描述統(tǒng)計(jì)和假設(shè)檢驗(yàn)高級(jí)統(tǒng)計(jì)模型回歸、因子分析和聚類Stata軟件使用功能類別命令示例應(yīng)用場(chǎng)景數(shù)據(jù)導(dǎo)入和處理import,reshape,merge數(shù)據(jù)準(zhǔn)備階段統(tǒng)計(jì)分析命令regress,logit,stcox模型構(gòu)建結(jié)果輸出和圖形繪制graph,tabulate,margins結(jié)果展示和解釋流行病學(xué)軟件介紹專業(yè)軟件簡(jiǎn)化特定流行病學(xué)計(jì)算和分析大數(shù)據(jù)分析工具100GB+Hadoop生態(tài)系統(tǒng)分布式存儲(chǔ)和計(jì)算框架10XSpark大規(guī)模數(shù)據(jù)內(nèi)存處理80%分布式計(jì)算基礎(chǔ)MapReduce編程模型數(shù)據(jù)安全和隱私保護(hù)數(shù)據(jù)脫敏技術(shù)個(gè)人識(shí)別信息去除K-匿名化方法差分隱私技術(shù)加密存儲(chǔ)端到端加密密鑰管理數(shù)據(jù)分級(jí)保護(hù)訪問(wèn)控制策略最小權(quán)限原則多因素認(rèn)證審計(jì)跟蹤機(jī)制倫理考慮研究倫理審查倫理委員會(huì)審批流程知情同意參與者權(quán)益保障數(shù)據(jù)使用和共享原則合規(guī)與透明性要求結(jié)果報(bào)告和論文撰寫常見(jiàn)問(wèn)題和注意事項(xiàng)避免常見(jiàn)統(tǒng)計(jì)陷阱統(tǒng)計(jì)結(jié)果呈現(xiàn)表格和圖形規(guī)范科研論文結(jié)構(gòu)IMRAD格式規(guī)范實(shí)踐案例(一):傳染病暴發(fā)調(diào)查數(shù)據(jù)收集標(biāo)準(zhǔn)化問(wèn)卷設(shè)計(jì)2描述性分析三間分布特征分析病例定義和篩查確定和疑似病例標(biāo)準(zhǔn)實(shí)踐案例(二):慢性病危險(xiǎn)因素分析實(shí)踐案例(三):臨床試驗(yàn)數(shù)據(jù)分析隨機(jī)化檢驗(yàn)基線特征平衡性評(píng)估意向性分析包含所有隨機(jī)分配對(duì)象亞組分析不同人群療效差異實(shí)踐案例(四):流行病學(xué)監(jiān)測(cè)數(shù)據(jù)分析24%時(shí)間序列分析季節(jié)性和長(zhǎng)期趨勢(shì)識(shí)別35%空間分布分析疾病聚集區(qū)檢測(cè)41%預(yù)警模型構(gòu)建閾值設(shè)定和信號(hào)檢測(cè)實(shí)踐案例(五):系統(tǒng)綜述和元分析文獻(xiàn)篩選PRISMA流程圖記錄數(shù)據(jù)提取結(jié)構(gòu)化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論