獨(dú)立性檢驗課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性_第1頁
獨(dú)立性檢驗課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性_第2頁
獨(dú)立性檢驗課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性_第3頁
獨(dú)立性檢驗課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性_第4頁
獨(dú)立性檢驗課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

8.3.2

獨(dú)立性檢驗1.分類變量

用以區(qū)別不同的現(xiàn)象或性質(zhì)的一種特殊的隨機(jī)變量,稱為分類變量.分類變量的取值可以用實(shí)數(shù)表示,例如,學(xué)生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示,等等.2.列聯(lián)表將形如下表這種形式的數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表.2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).組別甲(Y=0)乙(Y=1)合計A(X=0)aba+bB(X=1)cdc+d合計a+cb+da+b+c+d復(fù)習(xí)回顧1.了解隨機(jī)變量χ2的意義.2.通過對典型案例分析,了解獨(dú)立性檢驗的基本思想和方法.學(xué)習(xí)目標(biāo)組別甲(Y=0)乙(Y=1)合計A(X=0)aba+bB(X=1)cdc+d合計a+cb+da+b+c+d

前面我們通過2×2列聯(lián)表整理成對分類變量的樣本觀測數(shù)據(jù),并根據(jù)隨機(jī)事件頻率的穩(wěn)定性推斷兩個分類變量之間是否有關(guān)聯(lián).對于隨機(jī)樣本而言,因為頻率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.問題情景問題情景問題1你知道法官是如何憑證據(jù)進(jìn)行判案的嗎?先做一個無罪假設(shè)找無罪假設(shè)下不可能出現(xiàn)的物證和人證。找到了,假設(shè)不成立,嫌疑人有罪。沒找到,沒有充分證據(jù)證明假設(shè)不成立,暫且認(rèn)為無罪。零假設(shè):假設(shè)X,Y相互獨(dú)立,無關(guān)聯(lián)。找零假設(shè)下不可能發(fā)生的事件。(利用小概率原理)發(fā)生了,假設(shè)不成立,X,Y不獨(dú)立,從而證明二者有關(guān)聯(lián)。沒發(fā)生,沒有充分證據(jù)證明假設(shè)不成立,暫且認(rèn)為X,Y相互獨(dú)立。類比追問1我們是否可以類比法官判案的方式去判斷兩個分類變量X,Y是否有關(guān)聯(lián)?問題2設(shè)X和Y為定義在以Ω為樣本空間上,且取值于{0,1}的成對分類變量,如何判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián)?XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d由條件概率的定義可知,零假設(shè)H0等價于:A與B相互獨(dú)立P(AB)=P(A)P(B)AB事件A事件B事件AB由此,零假設(shè)H0等價于{X=1}和{Y=1}獨(dú)立.我們需要判斷下面的假定關(guān)系是否成立H0:P(Y=1|X=0)=P(Y=1|X=1)通常稱H0為零假設(shè)或原假設(shè)新知探究問題2設(shè)X和Y為定義在以Ω為樣本空間上,且取值于{0,1}的成對分類變量,如何判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián)?根據(jù)已經(jīng)學(xué)過的概率知識,下面的四條性質(zhì)彼此等價:

如果這4個性質(zhì)成立,則稱分類變量X和Y獨(dú)立.零假設(shè)H0:分類變量X和Y獨(dú)立②我們可以用概率語言,將零假設(shè)改述為新知探究

假定我們通過簡單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表,如下表所示.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d②

對于隨機(jī)樣本,表中的頻數(shù)a,b,c,d都是隨機(jī)變量,而表中的相應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測結(jié)果.問題3如何基于②中的四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計量,對成對分類變量X和Y是否相互獨(dú)立作出推斷?新知探究問題3如何基于②中的四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計量,對成對分類變量X和Y是否相互獨(dú)立作出推斷?②在零假設(shè)H0成立的條件下,根據(jù)頻率穩(wěn)定于概率的原理,由②中的第一個等式,可以得到由頻率估計概率,可以得到:零假設(shè)H0:分類變量X和Y獨(dú)立{X=0,Y=0}發(fā)生的頻數(shù)的期望值(預(yù)期值):E(a)

即:

的值應(yīng)該不大頻數(shù)的觀測值新知探究綜合②中的四個式子,如果零假設(shè)H0成立,下面四個量的取值都不應(yīng)該太大:零假設(shè)H0:分類變量X和Y獨(dú)立

為了平衡各式的差值的變化,構(gòu)造一個方便科學(xué)的統(tǒng)計量:新知探究概念生成卡方統(tǒng)計量XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d追問1卡方統(tǒng)計量有什么用呢?

統(tǒng)計學(xué)家建議,用隨機(jī)變量

χ2取值

的大小作為判斷零假設(shè)H0是否成立的依據(jù)。

根據(jù)小概率事件在一次試驗中不大可能發(fā)生的規(guī)律,可以通過確定一個與H0相矛盾的小概率事件來實(shí)現(xiàn),在假定H0的條件下,對于有放回簡單隨機(jī)抽樣,當(dāng)樣本容量n充分大時,統(tǒng)計學(xué)家得到了χ2的近似分布.

P(χ2≥xα)=α

我們稱xα為α的臨界值,這個臨界值可以作為判斷χ2大小的標(biāo)準(zhǔn).

概率值α越小,臨界值xα越大.

概念生成xαα

這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗,讀作“卡方獨(dú)立性檢驗”,簡稱獨(dú)立性檢驗.

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表給出了χ2獨(dú)立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值:基于小概率值α的檢驗規(guī)則:概念生成追問3

怎么看這個表呢?α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追問3

怎么看這個表呢?例如,對于小概率值α=0.05,我們有如下的具體檢驗規(guī)則:

按α=0.1的卡方獨(dú)立性檢驗,沒有充分證據(jù)推斷H0不成立(數(shù)學(xué)結(jié)論),可以認(rèn)為X和Y獨(dú)立(實(shí)際結(jié)論).

(1)零假設(shè):設(shè)X和Y為定義在Ω上,取值于{0,1}的成對分類變量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互為對立事件,故要判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián),需要判斷假定關(guān)系H0:______________________________是否成立.P(Y=1|X=0)=P(Y=1|X=1)

a+b+c+d(3)臨界值:對任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使P(χ2≥xα)=α.稱xα為α的臨界值.臨界值可作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.(4)基于小概率值α的檢驗規(guī)則:當(dāng)χ2≥xα?xí)r,推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的概率不超過α;當(dāng)χ2<xα?xí)r,沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗,讀作“卡方獨(dú)立性檢驗”,簡稱獨(dú)立性檢驗.(5)χ2獨(dú)立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【微提醒】

χ2越小,獨(dú)立性越強(qiáng),相關(guān)性越弱;χ2越大,獨(dú)立性越弱,相關(guān)性越強(qiáng).[典例講評]

1.某人研究中學(xué)生的性別與成績、視力、智商、閱讀量這4個變量的關(guān)系,隨機(jī)抽查52名中學(xué)生,得到統(tǒng)計數(shù)據(jù)如表1至表4,則與性別有關(guān)聯(lián)的可能性最大的變量是(

)表1

單位:人性別成績合計不及格及格男61420女102232合計163652

表2單位:人性別視力合計好差男41620女122032合計163652

表3

單位:人性別智商合計偏高正常男81220女82432合計163652

表4

單位:人性別閱讀量合計豐富不豐富男14620女23032合計163652

A.成績 B.視力C.智商 D.閱讀量√

所以與性別有關(guān)聯(lián)的可能性最大的變量是閱讀量[典例講評]

1.某人研究中學(xué)生的性別與成績、視力、智商、閱讀量這4個變量的關(guān)系,隨機(jī)抽查52名中學(xué)生,得到統(tǒng)計數(shù)據(jù)如表1至表4,則與性別有關(guān)聯(lián)的可能性最大的變量是(

)反思領(lǐng)悟

獨(dú)立性檢驗的基本思想類似于反證法.

要確認(rèn)“兩個分類變量有關(guān)系”這一結(jié)論的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立.

在該假設(shè)下構(gòu)造的隨機(jī)變量χ2應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到的χ2的值很大,則在一定程度上說明假設(shè)不合理.

根據(jù)隨機(jī)變量的含義,可以通過概率P(χ2≥xα)的大小來評價該假設(shè)不合理的程度有多大,從而說明“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度有多大.

√√α

0.100.050.0250.0100.0050.001xα

2.7063.8415.0246.6357.87910.828(2)(多選)某研究所為了檢驗新開發(fā)的疫苗的預(yù)防作用,對1000名注射了疫苗的人與另外1000名未注射疫苗的人的一年的健康記錄進(jìn)行比較,并提出假設(shè):這種疫苗不能起到預(yù)防該疾病的作用,并計算出P(χ2≥6.635)≈0.01,則下列說法不正確的是(

)A.這種疫苗能起到預(yù)防該疾病的作用的有效率為1%B.若某人未使用該疫苗,則他在半年內(nèi)有99%的可能性得該疾病C.依據(jù)小概率值α=0.01的獨(dú)立性檢驗,認(rèn)為這種疫苗能起到預(yù)防該疾病的作用D.在犯錯誤的概率不超過0.01的前提下,認(rèn)為這種疫苗能起到預(yù)防該疾病的作用√√由P(χ2≥6.635)≈0.01可知,C,D正確,A,B都不正確.[典例講評]

2.在某醫(yī)院,因為患心臟病而住院的600名男性病人中,有200人禿頂,而另外750名不是因為患心臟病而住院的男性病人中有150人禿頂.(1)填寫下列列聯(lián)表:是否禿頂疾病合計患心臟病患其他病禿頂不禿頂合計據(jù)表中數(shù)據(jù)估計禿頂病患中患心臟病的概率P1和不禿頂病患中患心臟病的概率P2,并用兩個估計概率判斷禿頂與患心臟病是否有關(guān);20015040060060075035010001350

α

0.100.050.0250.0100.0050.001xα

2.7063.8415.0246.6357.87910.828

反思領(lǐng)悟

用χ2進(jìn)行“相關(guān)的檢驗”步驟(1)零假設(shè):即先假設(shè)兩變量間沒關(guān)系.(2)計算χ2:套用χ2的公式求得χ2值.(3)查臨界值:結(jié)合所給小概率值α查得相應(yīng)的臨界值xα.(4)下結(jié)論:比較χ2與xα的大小,并作出結(jié)論.[學(xué)以致用]

2.

80及80分以上80分以下合計實(shí)驗班351550對照班20m50合計5545n

α0.010.0050.001xα6.6357.87910.828

(1)由表得,m=50-20=30,n=55+45=100[典例講評]

3.某省進(jìn)行高中新課程改革,為了解教師對新課程教學(xué)模式的使用情況,某教育機(jī)構(gòu)對某學(xué)校的教師關(guān)于新課程教學(xué)模式的使用情況進(jìn)行了問卷調(diào)查,共調(diào)查了50人,其中有老教師20人,青年教師30人.老教師對新課程教學(xué)模式贊同的有10人,不贊同的有10人;青年教師對新課程教學(xué)模式贊同的有24人,不贊同的有6人.(1)根據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表;

α0.0250.010.005xα5.0246.6357.879教師年齡對新課程教學(xué)模式合計贊同不贊同老教師101020青年教師24630合計341650

α0.0250.010.005xα5.0246.6357.879

反思領(lǐng)悟

獨(dú)立性檢驗的關(guān)注點(diǎn)(1)χ2計算公式較復(fù)雜,一是公式要清楚;二是代入數(shù)值時不能張冠李戴;三是計算時要細(xì)心.(2)判斷時把計算結(jié)果與臨界值比較,其值越大,有關(guān)的可信度越高.[學(xué)以致用]

3.為了解某挑戰(zhàn)賽中是否接受挑戰(zhàn)與受邀者的性別是否有關(guān)系(假設(shè)每個人是否接受挑戰(zhàn)互不影響),某機(jī)構(gòu)進(jìn)行了隨機(jī)抽樣調(diào)查,得到如下調(diào)查數(shù)據(jù).性別挑戰(zhàn)合計接受挑戰(zhàn)不接受挑戰(zhàn)男性451560女性251540合計7030100試根據(jù)小概率值α=0.1的獨(dú)立性檢驗,分析比賽中是否接受挑戰(zhàn)與受邀者的性別是否有關(guān).

應(yīng)用遷移√1.在獨(dú)立性檢驗中,兩個分類變量“X與Y有關(guān)系”的可信度為99%,則隨機(jī)變量χ2的取值范圍是(

)A.[2.706,3.841) B.[3.841,6.635)C.[6.635,7.879) D.[7.879,10.828)C

對照臨界值表可知選C.3題號14則推斷“學(xué)生的性別與認(rèn)為作業(yè)量大有關(guān)”這種推斷犯錯誤的概率不超過(

)A.0.01 B.0.005C.0.05 D.0.001√

3題號142.某班主任對全班50名學(xué)生進(jìn)行了作業(yè)量的調(diào)查,數(shù)據(jù)如下表:性別大不大合計男生18927女生81523合計2624503.根據(jù)如下所示的列聯(lián)表得到如下四個判斷:①在犯錯誤的概率不超過0.001的前提下認(rèn)為患肝病與嗜酒有關(guān);②在犯錯誤的概率不超過0.01的前提下認(rèn)為患肝病與嗜酒有關(guān);③認(rèn)為患肝病與嗜酒有關(guān)的出錯的可能為0.001%;④沒有證據(jù)顯示患肝病與嗜酒有關(guān).

是否嗜酒合計嗜酒不嗜酒患肝病7775427817未患肝病2099492148合計9874919965單位:人√其中正確命題的個數(shù)為(

)A.1B.2C.3D.4

4.下表是某屆某校本科志愿報名時,對其中304名學(xué)生進(jìn)入高校時是否了解所學(xué)專業(yè)的調(diào)查表:性別是否了解所學(xué)專業(yè)合計了解所學(xué)專業(yè)不了解所學(xué)專業(yè)男生63117180女生4282124合計105199304單位:人根據(jù)表中數(shù)據(jù),則下列說法正確的是________.(填序號)①性別與了解所學(xué)專業(yè)有關(guān);②性別與了解所學(xué)專業(yè)無關(guān);③女生比男生更了解所學(xué)專業(yè).②

解決獨(dú)立性檢驗問題的基本步驟零假設(shè)先假設(shè)兩變量間沒關(guān)系計算χ2套用χ2的公式求得χ2值查臨界值結(jié)合所給小概率值α查得相應(yīng)的臨界值xα.下結(jié)論比較χ2與xα的大小,并作出結(jié)論.1.知識鏈:(1)2×2列聯(lián)表.(2)獨(dú)立性檢驗、χ2公式.2.方法鏈:數(shù)形結(jié)合.3.警示牌:對χ2的計算出現(xiàn)錯誤,對獨(dú)立性檢驗的原理不理解,不會用χ2分析問題.THANKS1.下列關(guān)于回歸分析與獨(dú)立性檢驗的說法正確的是(

)①回歸分析和獨(dú)立性檢驗沒有什么區(qū)別;②回歸分析是對兩個變量準(zhǔn)確關(guān)系的分析,而獨(dú)立性檢驗是分析兩個變量之間的不確定性關(guān)系;③回歸分析研究兩個變量之間的相關(guān)關(guān)系,獨(dú)立性檢驗是對兩個變量是否具有某種關(guān)系的一種檢驗;④獨(dú)立性檢驗可以100%確定兩個變量之間是否具有某種關(guān)系.A.①② B.③C.③④ D.全選回歸分析是對兩個變量之間的相關(guān)關(guān)系的一種分析,而相關(guān)關(guān)系是一種不確定關(guān)系,通過回歸分析分析兩個變量之間可能具有的相關(guān)關(guān)系,而獨(dú)立性檢驗是對兩個變量之間是否具有某種關(guān)系的分析,并且可以分析這兩個變量在多大程度上具有這種關(guān)系,但不能100%肯定這種關(guān)系.故①②④錯誤,③正確.故選B.√2.對于分類變量X與Y的隨機(jī)變量χ2,下列說法正確的是(

)A.χ2越大,認(rèn)為“X與Y有關(guān)系”的犯錯誤的概率越大B.χ2越小,認(rèn)為“X與Y有關(guān)系”的犯錯誤的概率越大C.χ2越接近于0,認(rèn)為“X與Y沒有關(guān)系”的犯錯誤的概率越大D.χ2越大,認(rèn)為“X與Y沒有關(guān)系”的犯錯誤的概率越小χ2越大,認(rèn)為“X與Y沒有關(guān)系”的犯錯誤的概率越大,則“X與Y有關(guān)系”的犯錯誤的概率越?。处?越小,“X與Y有關(guān)系”的犯錯誤的概率越大.√α0.10.050.0250.010.001xα2.7063.8415.0246.63510.8283.某校為了研究學(xué)生的性別和對待某一活動的態(tài)度(支持與不支持)的關(guān)系,運(yùn)用2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗,經(jīng)計算χ2=7.805,則所得到的統(tǒng)計學(xué)結(jié)論是:在犯錯誤的概率不大于________的前提下認(rèn)為“學(xué)生性別與支持該活動有關(guān)系”(

)A.0.01 B.0.001C.0.99 D.0.999∵χ2=7.805,對照表格:6.635<7.805<10.828,∴根據(jù)小概率值α=0.01的獨(dú)立性檢驗,在犯錯誤的概率不大于0.01的前提下認(rèn)為“學(xué)生性別與支持該活動有關(guān)系”,故選A.√4.某學(xué)校食堂對高三學(xué)生偏愛蔬菜還是肉類與性別的關(guān)系進(jìn)行了一次調(diào)查,根據(jù)獨(dú)立性檢驗原理,處理所得數(shù)據(jù)之后發(fā)現(xiàn),在犯錯誤的概率不大于0.01但大于0.001的前提下認(rèn)為偏愛蔬菜還是肉類與性別有關(guān),則χ2的觀測值可能為(

)A.χ2=3.206 B.χ2=6.561C.χ2=7.869 D.χ2=11.208α0.10.050.0250.010.0050.001xα2.7063.8415.0246.6357.87910.828因為犯錯誤

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論