




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
BasicStatistic基本統(tǒng)計學(xué)2/5/2023數(shù)據(jù)的分類2/5/2023什么是數(shù)據(jù)數(shù)據(jù)是來自觀察的,由一個過程所搜集得來的數(shù)據(jù)可讓我們描繪過程,了解過程,改善過程甚至控制過程.Data數(shù)據(jù)驅(qū)動決策和行動2/5/2023數(shù)據(jù)在過程改善中的重要性InGodwetrust我們只相信上帝所有其他人請拿出數(shù)據(jù)來2/5/2023兩種主要數(shù)據(jù)類型(類項數(shù)據(jù))(測量數(shù)據(jù))(名目型)(連續(xù)型)(順序型)(計數(shù)型)離散數(shù)據(jù)變量數(shù)據(jù)2/5/2023練習(xí)一請標(biāo)出下列數(shù)據(jù)的類型,A代表計數(shù)型數(shù)據(jù),V代表計量型數(shù)據(jù)
顧客平均消費,電話待機時間
產(chǎn)品是否合格職員-Tom,Nancy,Howard.
支出與預(yù)算相符
輸入支出費用的時間2/5/2023答案
顧客平均消費,電話待機時間
v
產(chǎn)品是否合格A
職員-Tom,Nancy,Howard.A
4)支出與預(yù)算相符A5)輸入支出費用的時間v數(shù)據(jù)類型(VorA)2/5/2023小組討論(練習(xí)二)計量型數(shù)據(jù)
計量型數(shù)據(jù)的益處?
計量型數(shù)據(jù)的缺點?計數(shù)型數(shù)據(jù)計數(shù)型數(shù)據(jù)的益處?計數(shù)型數(shù)據(jù)的缺點?2/5/2023小組討論–答案計量型數(shù)據(jù)益處:1.能夠為使用相對小范圍抽樣的過程提供詳細的信息2.適用于低缺陷率3.能夠預(yù)估發(fā)展趨勢和情況缺點:1.通常較難得到數(shù)據(jù)2.分析更為復(fù)雜2/5/2023小組討論–答案計量型數(shù)據(jù)益處:容易得到數(shù)據(jù),并且計算方法簡單2.數(shù)據(jù)容易理解3.數(shù)據(jù)隨時可得缺點:1.無法顯示缺陷怎樣發(fā)生及過程如何變化2.不適合低缺陷率(需要大量的抽樣)3.不能預(yù)測發(fā)展趨勢和情況2/5/2023數(shù)據(jù)類型比較計量型數(shù)據(jù)計數(shù)型數(shù)據(jù)連續(xù)數(shù)據(jù)計數(shù)數(shù)據(jù)通常為正態(tài)分布通常為二項式分布或泊松分布實際數(shù)值合格/不合格實際定義嚴謹數(shù)據(jù)定義較差需少量抽樣需大量抽樣2/5/2023
知識水平1.沒有數(shù)據(jù),也沒有經(jīng)驗–只有觀點2.沒有數(shù)據(jù)–只有經(jīng)驗3.收集了數(shù)據(jù)-但只是看數(shù)字有多少4.分組的數(shù)據(jù)-圖表5.描述性統(tǒng)計數(shù)據(jù)–中數(shù)、標(biāo)準(zhǔn)差等等6.推理性統(tǒng)計–預(yù)測過程績效:能力分析,回歸和實驗計劃法2/5/2023轉(zhuǎn)化計數(shù)型數(shù)據(jù)如可以,將計數(shù)型數(shù)據(jù)轉(zhuǎn)換為計量型數(shù)據(jù)能增加它的功能。計數(shù)型數(shù)據(jù)計量型數(shù)據(jù)轉(zhuǎn)換為2/5/2023VariableData計量型數(shù)據(jù)2/5/2023計量型數(shù)據(jù)–學(xué)習(xí)目的完成此階段學(xué)習(xí)后,學(xué)員能夠Ⅰ利用數(shù)據(jù)的分布形狀,中央趨勢和變異大小進行特性化Ⅱ
如果數(shù)據(jù)是正態(tài)分布的,計算z數(shù)值,利用Z數(shù)值表確定超出某一數(shù)值的比例2/5/2023離散數(shù)據(jù)與連續(xù)數(shù)據(jù)連續(xù)數(shù)據(jù)的優(yōu)點:離散=稀少的信息連續(xù)=豐富的信息2/5/2023統(tǒng)計學(xué)基本術(shù)語Population總體
想要測量對象的全部Parameter參數(shù)用總體的所有數(shù)據(jù)計算出的數(shù)值(如均值,
標(biāo)準(zhǔn)差),稱為總體的參數(shù)x參數(shù)總體平均值總體標(biāo)準(zhǔn)差總體σ2/5/2023統(tǒng)計學(xué)基本術(shù)語Sample樣本從總體抽出的部分數(shù)據(jù)Statistics統(tǒng)計量用樣本的所有數(shù)據(jù)計算出的數(shù)值(如均值,
標(biāo)準(zhǔn)差),稱為樣本的統(tǒng)計量x統(tǒng)計量樣本平均值樣本標(biāo)準(zhǔn)差s總體樣本2/5/2023統(tǒng)計學(xué)基本術(shù)語Population總體已制造或?qū)⒁圃鞂ο蟮娜w集合,用所關(guān)注的特性描述我們究竟能否知道真正的整體參數(shù)?Sample樣本
統(tǒng)計研究中實際測量的目標(biāo)組樣本通常是整體的子集Σ=整體標(biāo)準(zhǔn)差S=樣本標(biāo)準(zhǔn)差Population整體sample樣本2/5/2023描述計量型數(shù)據(jù)集“報告上司:河水深度1.6M,士兵平均高度1.7M,過河沒有問題”,但是..至于我們不能只看平均值,還需要利用其他統(tǒng)計量來分析……2/5/2023描述計量型數(shù)據(jù)集一組計量型數(shù)據(jù)能顯示以下3個特性:CentralTendency(Mean,Median,Mode)中央趨勢(均值,中值,眾數(shù))Variable(range,StandardDeviation,Variance)變異(全距,標(biāo)準(zhǔn)差,方差)Shape形狀2/5/2023參數(shù)和統(tǒng)計量符號Mean均值Variance方差StandardDeviation標(biāo)準(zhǔn)差Proportion比例總體(參數(shù))μσσπ樣本(統(tǒng)計量)
хs2sp2/5/2023位置測量(CentralTendency)中心趨勢Mean均值Median中值Mode眾數(shù)Quartiles四分值2/5/2023樣本均值若樣本(樣本量為n)的觀測值為x1,x2,…xn,則樣本均值為:
類似地,一個有著大量但限個(N個)觀測值的總體,其總體均值為:Mean均值2/5/2023Mean均值練習(xí)三10個連接線的拉拔強度為:
230240236248252278265262拉拔強度的均值是多少?10個觀測值的均值為:2/5/2023Mean均值練習(xí)四199X年一個行動中,戰(zhàn)機進行了3000次戰(zhàn)斗,總共用時6900小時。那末每次戰(zhàn)斗平均用時多少?每次戰(zhàn)斗平均用時為:注意所使用的符號2/5/2023
均值的特性均值的計算使用了每個觀測值;每個觀測值對均值都有影響。所有觀測值對均值的偏差的總和為零。均值對極端的觀測值很敏感,極端值會導(dǎo)致均值向他偏移。Xxxxxxx6351274△6△2△42/5/2023Median中值
將一組觀測值按大小順序排列,位于中心的數(shù)值即為中值
若觀測值的個數(shù)為偶數(shù),則中值為中間2個數(shù)值的平均若觀測值的個數(shù)為奇數(shù),則位于中心的數(shù)值即中值2/5/2023Median中值樣本中值
假如x(1),x(2),…,x(n))是按大小排序的樣本值,則樣本中值為:中值的優(yōu)點是不受極端大或極端小的觀測值的影響。2/5/2023Median中值練習(xí)五假設(shè)一個樣本觀測值為:
3124786
樣本均值和樣本中值是多少?這2個值是測量數(shù)據(jù)中心趨勢的合理指標(biāo)嗎?2/5/2023Median中值(b)假如最后一個數(shù)值改變?yōu)椋?/p>
3124782680
則樣本平均值和樣本中值是多少?
據(jù)此你有何結(jié)論?2/5/2023Median中值MedianvsMean中值與均值
因為中值不象均值對極端值敏感,因此,當(dāng)有極端大或極端小值時,中值比均值更能代表數(shù)據(jù)的位置典型的例子是一個城市居民的收入中位值2/5/2023中值有時會有欺騙性50%-50%Rule?一半一半準(zhǔn)則?
以下一組數(shù)據(jù)的中值是多少?
2,2,2,2,2,2,90可以用一半一半準(zhǔn)則嗎?2/5/2023Mode眾數(shù)眾數(shù)是樣本中出現(xiàn)次數(shù)最多的觀測值。眾數(shù)可以是唯一的,也可以有不止一個,有時并不存在眾數(shù)。2/5/2023Mode眾數(shù)練習(xí)六如果樣本觀測值為:(a)691358134613110136913581346131106256134372681眾數(shù)是什么?具有一個眾數(shù),兩個眾數(shù)或多于兩個眾數(shù)分布的數(shù)據(jù)分布叫什么?(單峰分布…)2/5/2023Mode眾數(shù)為何使用眾數(shù)?
當(dāng)觀測值為分類式(如名義數(shù)據(jù),序列數(shù)據(jù))時.眾數(shù)是描述數(shù)據(jù)位置的最好的指標(biāo).典型的例子是,一個公司內(nèi)員工收入的眾數(shù)眾數(shù)的重要信息當(dāng)眾數(shù)不止1個時,從中抽取樣本的總體通常是多個總體的混合2/5/2023均值、中值、眾數(shù)的比較MOMeMeMO正態(tài)分布偏上分布偏下分布MOMe≥≥MOMe==MOMe≤≤2/5/2023Quartiles四分值
將一組按大小順序排列的數(shù)據(jù)平均分為四部分,分界點即四分值.
第一四分值(低四分值),約25%的觀測值小于它.第二四分值,約50%的觀測值小于它,即中值.第三四分值(高分值),約75%的觀測值小于它.2/5/2023Quartiles四分值練習(xí)七
以下為20個電燈泡失效期間的觀測值,已按遞增順序排列.2102162523003664546247208169241216129613921488154224802856319235283710請確定三個四分值.計算方法:先確定位置再計算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/42/5/2023Quartiles四分值答案
Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75則:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.52/5/2023Quartiles四分值2/5/2023散布的測量(變異)Range極差Variance方差StandardDeviation標(biāo)準(zhǔn)差I(lǐng)nter-QuartileRange四分植極差2/5/2023Range極差樣本極差為樣本中最大和最小觀測值之間的差別,即:極差是測量數(shù)據(jù)散布或變異的最簡單的方法但它忽略了最大和最小值之間的所有信息r=xmax-xmin2/5/2023Range極差試考慮以下的2個樣本:{102050607090}and{10,40,40,40,90}具有相同的極差(r=80)但是,第二個樣本的變異只是2個極端數(shù)值的變異,而在第1個樣本,中間的數(shù)值也有相當(dāng)大的變異.當(dāng)樣本量較小(n≤10)時,極差丟失信息的問題不是很嚴重2/5/2023方差與標(biāo)準(zhǔn)差若x1,x2,…,xn是一個具有N個觀測值的樣本,則樣本方差為:樣本標(biāo)準(zhǔn)差是樣本方差的算術(shù)平方根,即:2/5/2023方差計算練習(xí)八:計算下列觀測值的方差和標(biāo)準(zhǔn)差.305070901101302/5/2023方差計算ixixi-x(xi-x)2130-502500250-30900370-101004901010051103090061305025002/5/2023方差與標(biāo)準(zhǔn)差再考慮以下2個樣本.SampleA:102050607090SampleB:104040
40
4090
SampleASampleBRange極差8080Variance方差????StandardDeviation標(biāo)準(zhǔn)差????2/5/2023方差與標(biāo)準(zhǔn)差類似于樣本方差S2,用總體的所數(shù)據(jù)計算出總體變異—總體方差(σ2)總體的標(biāo)準(zhǔn)差(σ)是總體方差的算術(shù)平方根
對于包含N個數(shù)值的有限總體,其方差為:
σ2=2/5/2023方差特性
方差計算使用了所有觀測值,每個觀測值對方差都有影響
方差對極端值很敏感,因平方的緣故,極端大的觀測值會嚴重的放大方差。2/5/2023四分值極差
四分值極差是測量散布的另一指標(biāo):IQR=Q3-Q1
四分值極差不如極差對極端值敏感當(dāng)分布顯著不對稱時,用它衡量散布會更好樣本(10,20,50,60,90)和(10,40,40,40,90)的四分值極差分別是40和0.2/5/2023TheNormalDistribution正態(tài)分布正態(tài)分布是一種具有特定的、非常有用的特性的數(shù)據(jù)分布
這些特性對我們理解所研究之過程的特性十分有用大部分自然現(xiàn)象和人造過程是正態(tài)分布或可有正態(tài)分布描述2/5/2023TheNormalDistribution正態(tài)分布特性1
:只需知道下述兩項參數(shù)就可完整描述正態(tài)分布均值標(biāo)準(zhǔn)差分布1分布2分布3此三項正態(tài)分布有何區(qū)別?2/5/2023正態(tài)曲線和概率特性2
:曲線下面的面積可用來估算某一特定事件發(fā)生的累積概率得到在兩個值之間的某個價值的累積概率99.73%95%68%離均值的標(biāo)準(zhǔn)差數(shù)目樣本值的概率40%-30%-20%-10%-0%-2/5/2023標(biāo)準(zhǔn)差的經(jīng)驗規(guī)則
當(dāng)一組數(shù)據(jù)不是最理想正態(tài)分布時,前述累積概率規(guī)則仍可應(yīng)用比較理論(理想)正態(tài)分布和經(jīng)驗(現(xiàn)實)分布NumberofStandardDeviations標(biāo)準(zhǔn)差數(shù)目TheoreticalNormal理論正態(tài)EmpiricalNormal經(jīng)驗正態(tài)+/-1σ68%60-75%+/-2σ95%90-98%+/-3σ99.7%99-100%2/5/2023正態(tài)分布特點-3σ-2σ-1σ1σ2σ3σ68%95%99.73%StandardDeviation標(biāo)準(zhǔn)差σAverage標(biāo)準(zhǔn)差2/5/2023長期和短期能力(Z-偏差)ZLT=ZST-1.5
Sigma水平短期DPMO長期DPMO1158655.3691462.52
22750.1308537.53
1350.0
66807.24
31.7
6209.75
0.3
232.76
0.0018
3.42/5/2023正態(tài)分布鑒于許多過程輸出都是呈正態(tài)分布,所以可以用正態(tài)曲線的特點預(yù)測過程對象總體.即使非正態(tài)數(shù)據(jù)也能轉(zhuǎn)化為正態(tài)數(shù)據(jù),所以正態(tài)曲線的特點仍然可以用來做預(yù)測2/5/2023正態(tài)曲線下的區(qū)域分析過程能力時,我們運用正態(tài)曲線下的區(qū)域預(yù)測超過規(guī)格界限的產(chǎn)品所占的比例.5%5%規(guī)格上限USL規(guī)格下限LSL2/5/2023標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布,也叫Z分布,有下列參數(shù):Z代表距離均值的標(biāo)準(zhǔn)差的數(shù)量μ=0
σ=1
-4σ
-3σ
-2σ
-1σ
μ
1σ2σ
3σ
4σ
2/5/2023Z代表從均值到能在達到(容納)多少個標(biāo)準(zhǔn)差
-4σ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國數(shù)字城市行業(yè)發(fā)展規(guī)模研究及投資風(fēng)險評估報告
- 配電安規(guī)習(xí)題與答案
- 2025屆山西省呂梁市汾陽中學(xué)高考英語倒計時模擬卷含解析
- 2025屆福建省福州市閩侯第六中學(xué)高三一診考試英語試卷含答案
- 職業(yè)技術(shù)學(xué)院2024級藥品生產(chǎn)技術(shù)專業(yè)人才培養(yǎng)方案
- 2025年常州市高三二模語文試試卷(含標(biāo)準(zhǔn)答案)
- 納米電機考核試卷
- 管道工程城市給水管網(wǎng)規(guī)劃與設(shè)計考核試卷
- 船舶改裝船舶廢氣凈化技術(shù)考核試卷
- 皮革制品行業(yè)的市場拓展與銷售策略考核試卷
- MTK安全架構(gòu)研究-全面剖析
- 餐飲食堂消防安全培訓(xùn)
- 山東省威海市乳山市2024-2025學(xué)年七年級上學(xué)期期末考試語文試題
- 18《井岡翠竹》公開課一等獎創(chuàng)新教學(xué)設(shè)計
- 高速激光加工系統(tǒng)-深度研究
- 2025屆高考地理二輪復(fù)習(xí):常見的天氣系統(tǒng) 提升練習(xí)題(含答案解析)
- 《客至》課件 統(tǒng)編版高二語文選擇性必修下冊
- CNAS-CL02-A004:2018 醫(yī)學(xué)實驗室質(zhì)量和能力認可準(zhǔn)則在臨床免疫學(xué)檢驗領(lǐng)域的應(yīng)用說明
- 醫(yī)學(xué)院大學(xué)課件--肝臟損傷
- 大學(xué)生舊物回收創(chuàng)業(yè)計劃書
- 汽車腳墊培訓(xùn)
評論
0/150
提交評論