2020年高考數(shù)學(xué)一輪復(fù)習(xí)考點與題型總結(jié):第十章 統(tǒng)計與統(tǒng)計案例_第1頁
2020年高考數(shù)學(xué)一輪復(fù)習(xí)考點與題型總結(jié):第十章 統(tǒng)計與統(tǒng)計案例_第2頁
2020年高考數(shù)學(xué)一輪復(fù)習(xí)考點與題型總結(jié):第十章 統(tǒng)計與統(tǒng)計案例_第3頁
2020年高考數(shù)學(xué)一輪復(fù)習(xí)考點與題型總結(jié):第十章 統(tǒng)計與統(tǒng)計案例_第4頁
2020年高考數(shù)學(xué)一輪復(fù)習(xí)考點與題型總結(jié):第十章 統(tǒng)計與統(tǒng)計案例_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十章統(tǒng)計與統(tǒng)計案例第一節(jié)隨機(jī)抽樣一、基礎(chǔ)知識1.簡單隨機(jī)抽樣定義:一般地,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(nWN),如果每次抽取時總體內(nèi)的各個個體被抽到的機(jī)會都相等,就把這種抽樣方法叫做簡單隨機(jī)抽樣.這樣抽取的樣本,叫做簡單隨機(jī)樣本.常用方法:抽簽法和隨機(jī)數(shù)法.2.分層抽樣在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.分層抽樣的應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.系統(tǒng)抽樣定義:當(dāng)總體中的個體數(shù)較多時,可以將總體分成均衡的幾部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個個體,得到所需的樣本,這種抽樣的方法叫做系統(tǒng)抽樣.系統(tǒng)抽樣的步驟假設(shè)要從容量為N的總體中抽取容量為n的樣本.先將總體的N個個體編號;確定分段間隔k,對編號進(jìn)行分段.當(dāng)N(n是樣本容量)是整數(shù)時,取k=n;當(dāng)總體中的個體數(shù)不能被樣本容量整除時,可先用簡單隨機(jī)抽樣的方法從總體中剔除幾個個體,使剩下的個體數(shù)能被樣本容量整除,然后再按系統(tǒng)抽樣進(jìn)行.這時在整個抽樣過程中每個個體被抽取的可能性仍然相等.在第1段用簡單隨機(jī)抽樣確定第一個個體編號l(lWk)按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個個體編號l+k,再加k得到第3個個體編號l+2k,依次進(jìn)行下去,直到獲取整個樣本.二、常用結(jié)論(1)不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.系統(tǒng)抽樣一般也稱為等距抽樣,入樣個體的編號相差分段間隔k的整數(shù)倍.分層抽樣是按比例抽樣,每一層入樣的個體數(shù)為該層的個體數(shù)乘抽樣比.(4)三種抽樣方法的特點、聯(lián)系及適用范圍類別共同點各自特點聯(lián)系適用范圍簡單隨機(jī)抽樣抽樣過程中每個個體被抽到的可能性相等;每次抽出個體后不再將它放回,即不放回抽樣從總體中逐個抽取總體個數(shù)較少系統(tǒng)抽樣將總體均分成幾部分,按預(yù)先定出的規(guī)則在各部分中抽取在起始部分取樣時,采用簡單隨機(jī)抽樣總體個數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時,米用簡單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成考點一簡單隨機(jī)抽樣[典例]下列抽取樣本的方式屬于簡單隨機(jī)抽樣的個數(shù)有()從無限多個個體中抽取100個個體作為樣本;盒子里共有80個零件,從中選出5個零件進(jìn)行質(zhì)量檢驗.在抽樣操作時,從中任意拿出一個零件進(jìn)行質(zhì)量檢驗后再把它放回盒子里;用抽簽方法從10件產(chǎn)品中選取3件進(jìn)行質(zhì)量檢驗;某班有56名同學(xué),指定個子最高的5名同學(xué)參加學(xué)校組織的籃球賽.A.0個B.1個C.2個D.3個[解析]①不是簡單隨機(jī)抽樣,因為被抽取樣本的總體的個數(shù)是無限的,而不是有限的;②不是簡單隨機(jī)抽樣,因為它是有放回抽樣;③明顯為簡單隨機(jī)抽樣;④不是簡單隨機(jī)抽樣,因為不是等可能抽樣.[答案]B[解題技法]應(yīng)用簡單隨機(jī)抽樣應(yīng)注意的問題

(1)一個抽樣試驗?zāi)芊裼贸楹灧?,關(guān)鍵看兩點:一是抽簽是否方便;二是號簽是否易攪勻.一般地,當(dāng)總體容量和樣本容量都較小時可用抽簽法.(2)在使用隨機(jī)數(shù)法時,如遇到三位數(shù)或四位數(shù),可從選擇的隨機(jī)數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復(fù)號碼的數(shù)字舍去.[題組訓(xùn)練]總體由編號為01,02,???,19,20的20個個體組成,利用下面的隨機(jī)數(shù)表選取5個個體,選取方法是從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出來的第5個個體的編號為()7816657208026314070243699728019832049234493582003623486969387481A.08C.02A.08C.02D.01解析:選D由隨機(jī)數(shù)法的隨機(jī)抽樣的過程可知選出的5個個體是08,02,14,07,01,所以第5個個體的編號是01.利用簡單隨機(jī)抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為3則在整個抽樣過程中,每個個體被抽到的概率為()D10D10D27解析:選C解析:選C根據(jù)題意9=1

n—13'解得n=28故在整個抽樣過程中每個個體被抽到的概率為28=14-考點二系統(tǒng)抽樣TOC\o"1-5"\h\z[典例](1)某校為了解1000名高一新生的身體生長狀況,用系統(tǒng)抽樣法(按等距的規(guī)則)抽取40名同學(xué)進(jìn)行檢查,將學(xué)生從1?1000進(jìn)行編號,現(xiàn)已知第18組抽取的號碼為443,則第一組用簡單隨機(jī)抽樣抽取的號碼為()A.16B.17C.18D.19(2)中央電視臺為了解觀眾對某綜藝節(jié)目的意見,準(zhǔn)備從502名現(xiàn)場觀眾中抽取10%進(jìn)行座談,現(xiàn)用系統(tǒng)抽樣的方法完成這一抽樣,則在進(jìn)行分組時,需剔除個個體,抽樣間隔為樣間隔為[解析](1)因為從1000名學(xué)生中抽取一個容量為40的樣本,所以系統(tǒng)抽樣的分段間隔為100040隔為100040=25,設(shè)第一組隨機(jī)抽取的號碼為x,則抽取的第18組編號為x+17X25=443,所以x=18.(2)把502名觀眾平均分成50組,由于502除以50的商是10,余數(shù)是2,所以每組有10名觀眾,還剩2名觀眾,采用系統(tǒng)抽樣的方法抽樣時,應(yīng)先用簡單隨機(jī)抽樣的方法從502名觀眾中抽取2名觀眾,這2名觀眾不參加座談;再將剩下的500名觀眾編號為1,2,3,…,500,并均勻分成50段,每段含500=10個個體.所以需剔除2個個體,抽樣間隔為10.[答案](1)C(2)210[變透練清](變結(jié)論)若本例(1)的條件不變,貝y編號落入?yún)^(qū)間[501,750啲人數(shù)為.解析:從1000名學(xué)生中抽取一個容量為40的樣本,系統(tǒng)抽樣分40組,每組1400=25個號碼,每組抽取一個,從501到750恰好是第21組到第30組,共抽取10人.答案:10(2018?南昌摸底調(diào)研)某校高三(2)班現(xiàn)有64名學(xué)生,隨機(jī)編號為0,1,2,…,63,依編號順序平均分成8組,組號依次為1,2,3,…,8?現(xiàn)用系統(tǒng)抽樣方法抽取一個容量為8的樣本,若在第1組中隨機(jī)抽取的號碼為5,貝在第6組中抽取的號碼為64解析:由題知分組間隔為瓦=8,又第1組中抽取的號碼為5,所以第6組中抽取的號碼為5X8+5=45.答案:45[解題技法]系統(tǒng)抽樣中所抽取編號的特點系統(tǒng)抽樣又稱等距抽樣,所以依次抽取的樣本對應(yīng)的號碼就是一個等差數(shù)列,首項就是第1組所抽取樣本的號碼,公差為間隔數(shù),根據(jù)等差數(shù)列的通項公式就可以確定每一組內(nèi)所要抽取的樣本號碼.[提醒]系統(tǒng)抽樣時,如果總體中的個數(shù)不能被樣本容量整除時,可以先用簡單隨機(jī)抽樣從總體中剔除幾個個體,然后再按系統(tǒng)抽樣進(jìn)行.考點三分層抽樣[典例]某電視臺在網(wǎng)上就觀眾對其某一節(jié)目的喜愛程度進(jìn)行調(diào)查,參加調(diào)查的一共有20000人,其中各種態(tài)度對應(yīng)的人數(shù)如下表所示:最喜愛喜愛一般不喜歡4800720064001600電視臺為了了解觀眾的具體想法和意見,打算從中抽取100人進(jìn)行詳細(xì)的調(diào)查,為此要進(jìn)行分層抽樣,那么在分層抽樣時,每類人中應(yīng)抽取的人數(shù)分別為()A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8[解析]法一:因為抽樣比為20冊=2oc,所以每類人中應(yīng)抽取的人數(shù)分別為4800X200=24,7200X200=36,6400X200=32,1600^200=8.法二:最喜愛、喜愛、一般、不喜歡的比例為4800:7200:6400:1600=6:9:8:2,所以每類人中應(yīng)抽取的人數(shù)分別為66+9所以每類人中應(yīng)抽取的人數(shù)分別為66+9+8+2X100=24,96+9+8+2X100=36,826+9+8+2X100=32,6+9+8+2X100=8.[答案]D[解題技法]分層抽樣問題的類型及解題思路(1)求某層應(yīng)抽個體數(shù)量:按該層所占總體的比例計算.(2)已知某層個體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比例式進(jìn)行計算.樣本容量⑶分層抽樣的計算應(yīng)根據(jù)抽樣比構(gòu)造方程求解,其中“抽樣比=總體容量=各層樣本數(shù)量”各層個體數(shù)量°[題組訓(xùn)練]1?(2019?山西五校聯(lián)考)某校為了解學(xué)生的學(xué)習(xí)情況,采用分層抽樣的方法從高一1000人、高二1200人、高三n人中抽取81人進(jìn)行問卷調(diào)查,若高二被抽取的人數(shù)為30,則n=()A860B720C1020D1040301811解析:選D由已知條件知抽樣比為市=40從而1000+1200+n=40,解得n=1040,故選D.

答案:85答案:85[課時跟蹤檢測]1.從2019名學(xué)生中選取50名學(xué)生參加全國數(shù)學(xué)聯(lián)賽,若采用以下方法選?。合扔煤唵坞S機(jī)抽樣法從2019名學(xué)生中剔除19名學(xué)生,剩下的2000名學(xué)生再按系統(tǒng)抽樣的方法抽取,則每名學(xué)生入選的概率()A.不全相等B.均不相等C.都相等,且為需D.都相等,且為£解析:選C從N個個體中抽取M個個體,則每個個體被抽到的概率都等于鈴,故每名學(xué)生入選的概率都相等,且為2019.TOC\o"1-5"\h\z2.福利彩票“雙色球”中紅球的號碼可以從01,02,03,…,32,33這33個兩位號碼中選取,小明利用如下所示的隨機(jī)數(shù)表選取紅色球的6個號碼,選取方法是從第1行第9列的數(shù)字開始,從左到右依次讀取數(shù)據(jù),則第四個被選中的紅色球的號碼為()81472368639317901269868162935060913375856139850632359246225410027849821886704805468815192049A.12B.33C.06D.16解析:選C被選中的紅色球的號碼依次為17,12,33,06,32,22,所以第四個被選中的紅色球的號碼為06.某班共有學(xué)生52人,現(xiàn)根據(jù)座號,用系統(tǒng)抽樣的方法,抽取一個容量為4的樣本.已知5號、18號、44號同學(xué)在樣本中,那么樣本中還有一個同學(xué)的座號是()A.23B.27C.31DC.31CC.65D.66解析:選C分段間隔為才=13,故樣本中還有一個同學(xué)的座號為18+13=31.4.某工廠在12月份共生產(chǎn)了3600雙皮靴,在出廠前要檢查這批產(chǎn)品的質(zhì)量,決定采用分層抽樣的方法進(jìn)行抽取,若從一、二、三車間抽取的產(chǎn)品數(shù)分別為a,b,c,且a,b,c構(gòu)成等差數(shù)列,則第二車間生產(chǎn)的產(chǎn)品數(shù)為()A.800雙B.1000雙C.1200雙D.1500雙解析:選C因為a,b,c成等差數(shù)列,所以2b=a+c,即第二車間抽取的產(chǎn)品數(shù)占抽樣產(chǎn)品總數(shù)的三分之一,根據(jù)分層抽樣的性質(zhì)可知,第二車間生產(chǎn)的產(chǎn)品數(shù)占12月份生產(chǎn)總數(shù)的三分之一,即為1200雙皮靴.5.(2018?南寧摸底聯(lián)考)已知某地區(qū)中小學(xué)生人數(shù)和近視情況分別如圖甲和圖乙所示.為了了解該地區(qū)中小學(xué)生的近視形成原因,用分層抽樣的方法抽取2%的學(xué)生進(jìn)行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為()A.100,20B.200,20C.200,10D.100,10解析:選B由題圖甲可知學(xué)生總?cè)藬?shù)是10000,樣本容量為10000X2%=200,抽取的高中生人數(shù)是2000X2%=40,由題圖乙可知高中生的近視率為50%,所以抽取高中生的近視人數(shù)為40X50%=20,故選B.—個總體中有100個個體,隨機(jī)編號為0,1,2,…,99.依編號順序平均分成10個小組,組號依次為1,2,3,…,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量為10的樣本,如果在第一組隨機(jī)抽取的號碼為m,那么在第k組中抽取的號碼個位數(shù)字與m+k的個位數(shù)字相同.若m=6,則在第7組中抽取的號碼是()A.63B.64解析:選A若m=6,則在第7組中抽取的號碼個位數(shù)字與13的個位數(shù)字相同,而第7組中的編號依次為60,61,62,63,…,69,故在第7組中抽取的號碼是63.采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調(diào)查,為此將他們隨機(jī)編號為1,2,…,960,分組后在第一組采用簡單隨機(jī)抽樣的方法抽到的號碼為9.抽到的32人中,編號落入?yún)^(qū)間[1,450]的人做問卷A,編號落入?yún)^(qū)間(450,750]的人做問卷B,其余的人做問卷C.則抽到的人中,做問卷B的人數(shù)為()A.7B.9C.10D.15解析:選C960=32=30,故由題意可得抽到的號碼構(gòu)成以9為首項,以30為公差的等差數(shù)列,其通項公式為an=9+30(n-1)=30n-21.由450V30n—21W750,解得15.7VnW25.7.又n為正整數(shù),所以16WnW25,故做問卷B的人數(shù)為25—16+1=10.故選C.某企業(yè)三月中旬生產(chǎn)A,B,C三種產(chǎn)品共3000件,根據(jù)分層抽樣的結(jié)果,企業(yè)統(tǒng)計員制作了如下的統(tǒng)計表格:產(chǎn)品類別ABC產(chǎn)品數(shù)量(件)1300樣本容量(件)130由于不小心,表格中A,C產(chǎn)品的有關(guān)數(shù)據(jù)已被污染看不清楚,統(tǒng)計員記得A產(chǎn)品的樣本容量比C產(chǎn)品的樣本容量多10,根據(jù)以上信息,可得C的產(chǎn)品數(shù)量是件.x解析:設(shè)樣本容量為x,則3000X1300=130,?:x=300.???A產(chǎn)品和C產(chǎn)品在樣本中共有300—130=170(件).設(shè)C產(chǎn)品的樣本容量為y,則y+y+10=170,?y=80.:.C產(chǎn)品的數(shù)量為30°X80=800(件).答案:800某企業(yè)三個分廠生產(chǎn)同一種電子產(chǎn)品,三個分廠產(chǎn)量分布如圖所示,現(xiàn)在用分層抽樣方法從三個分廠生產(chǎn)的該產(chǎn)品中共抽取100件做使用壽命的測試,則第一分廠應(yīng)抽取的件數(shù)為;由所得樣品的測試結(jié)果計算出一、二、三分廠取出的產(chǎn)品的使用壽命平均值分別為1020小時、980小時、1030小時,估計這個企業(yè)所生產(chǎn)的該產(chǎn)品的平均使用壽命為小時.解析:第一分廠應(yīng)抽取的件數(shù)為100X50%=50;該產(chǎn)品的平均使用壽命為1020X0.5+980X0.2+1030X0.3=1015.答案:501015將參加冬季越野跑的600名選手編號為:001,002,…,600,采用系統(tǒng)抽樣方法抽取一個容量為50的樣本,把編號分為50組后,在第一組的001到012這12個編號中隨機(jī)抽得的號碼為004,這600名選手穿著三種顏色的衣服,從001到301穿紅色衣服,從302到496穿白色衣服,從497到600穿黃色衣服,則抽到穿白色衣服的選手人數(shù)為.解析:由題意及系統(tǒng)抽樣的定義可知,將這600名學(xué)生按編號依次分成50組,每一組各有12名學(xué)生,第k(kWN*)組抽中的號碼是4+12(k—1).令302W4+12(k—1)W496,得25|wkW42,因此抽到穿白色衣服的選手人數(shù)為42—25=17(人).答案:1711.某初級中學(xué)共有學(xué)生2000名,各年級男、女生人數(shù)如下表初一年級初二年級初三年級女生373xy男生377370z已知在全校學(xué)生中隨機(jī)抽取1名,抽到初二年級女生的概率是0.19.

第二節(jié)用樣本估計總體一、基礎(chǔ)知識1.頻率分布直方圖(1)縱軸表示頻率

組距即小長方形的高=(1)縱軸表示頻率

組距即小長方形的高=頻率組距;(2)小長方形的面積=組距X頻率組距=頻率;(3)各個小方形的面積總和等于1.2.頻率分布表的畫法極差第一步:求極差,決定組數(shù)和組距,組距=組數(shù);第二步:分組,通常對組內(nèi)數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間;第三步:登記頻數(shù),計算頻率,列出頻率分布表.3.莖葉圖莖葉圖是統(tǒng)計中用來表示數(shù)據(jù)的一種圖,莖是指中間的一列數(shù),葉就是從莖的旁邊生長出來的數(shù).4.中位數(shù)、眾數(shù)、平均數(shù)的定義中位數(shù)將一組數(shù)據(jù)按大小依次排列,處于最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).眾數(shù)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).平均數(shù)一組數(shù)據(jù)的算術(shù)平均數(shù)即為這組數(shù)據(jù)的平均數(shù),n個數(shù)據(jù)k,x2,…,x的平均數(shù)x=TOC\o"1-5"\h\z12nn(xi+x2+-+xn).5.樣本的數(shù)字特征如果有n個數(shù)據(jù)X[,x2,…,x,那么這n個數(shù)的12n(2)標(biāo)準(zhǔn)差s=(1)平均數(shù)X=1(x1+x2xn)(2)標(biāo)準(zhǔn)差s=[(X]—X)2+(X2—X)2卜(X”一X)2].(3)(3)方差S2=n〔(X]—x)2+(X2—x)2(x廠x)2].二、常用結(jié)論頻率分布直方圖中的常見結(jié)論(1)眾數(shù)的估計值為最高矩形的中點對應(yīng)的橫坐標(biāo).平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標(biāo)之和.中位數(shù)的估計值的左邊和右邊的小矩形的面積和是相等的.平均數(shù)、方差的公式推廣若數(shù)據(jù)x1,x2,…,x”的平均數(shù)為x,則mx1+a,mx2+a,mx3+a,…,mx”+a的平均數(shù)是mx+a.若數(shù)據(jù)x1,x2,…,x”的方差為s2,則數(shù)據(jù)ax1+b,ax2+b,…,ax”+b的方差為a2s2.考點一莖葉圖甲組乙蛆&59[典例](2017?山東高考)如圖所示的莖葉圖記錄了甲、乙兩組各525617y名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平x478均值也相等,則x和y的值分別為()A.3,5B.5,5C.3,7D.5,7[解析]由兩組數(shù)據(jù)的中位數(shù)相等可得65=60+y,解得y=5,又它們的平均值相等,所以jX[56+62+65+74+(70+x)]=|x(59+61+67+65+78),解得x=3.[答案]A[解題技法]莖葉圖的應(yīng)用莖葉圖通常用來記錄兩位數(shù)的數(shù)據(jù),可以用來分析單組數(shù)據(jù),也可以用來比較兩組數(shù)據(jù).通過莖葉圖可以確定數(shù)據(jù)的中位數(shù),數(shù)據(jù)大致集中在哪個莖,數(shù)據(jù)是否關(guān)于該莖對稱數(shù)據(jù)分布是否均勻等.給定兩組數(shù)據(jù)的莖葉圖,比較數(shù)字特征時,“重心”下移者平均數(shù)較大,數(shù)據(jù)集中者方差較小.[題組訓(xùn)練]

1?在如圖所示一組數(shù)據(jù)的莖葉圖中,有一個數(shù)字被污染后模糊不清,2015但曾計算得該組數(shù)據(jù)的極差與中位數(shù)之和為61,則被污染的數(shù)字為()3LL■4A.1B.223578C.3DC.3解析:選B由圖可知該組數(shù)據(jù)的極差為48—20=28,則該組數(shù)據(jù)的中位數(shù)為61—28=33,易得被污染的數(shù)字為2.甲乙872086128戈2152?甲、乙兩名籃球運動員5場比賽得分的原始記錄如莖葉圖所示,若甲、乙兩人的平均得分分別為7甲,7乙則下列結(jié)論正確的是()甲乙xVx;乙比甲得分穩(wěn)定甲乙x>x;甲比乙得分穩(wěn)定甲乙匚>匚;乙比甲得分穩(wěn)定甲乙xVx;甲比乙得分穩(wěn)定甲乙解析:選A因為2解析:選A因為2+7+8+16+228+12+18+21+25x乙=5=16.8,以xVx且乙比甲成績穩(wěn)定.甲乙考點二頻率分布直方圖[典例]某城市100戶居民的月平均用電量(單位:千瓦時),以[160,180),[180,200)[200,220),[220,240),[240,260),[260,280),[280,300]分組的頻率分布直方圖如圖.(1)求直方圖中x的值;求月平均用電量的眾數(shù)和中位數(shù).[解]⑴由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)X20=l,解得x=0.0075.即直方圖中x的值為0.0075.220+240(2)月平均用電量的眾數(shù)是一2一=230.???(0.002+0.0095+0.011)X20=0.45V0.5,(0.002+0.0095+0.011+0.0125)X20=0.7>0.5,???月平均用電量的中位數(shù)在[220,240)內(nèi).設(shè)中位數(shù)為a,則0.45+0.0125X(a—220)=0.5,解得a=224,即中位數(shù)為224.[變透練清]1.某校隨機(jī)抽取20個班,調(diào)查各班有出國意向的人數(shù),所得數(shù)據(jù)的莖葉圖如圖所示.以5為組距將數(shù)據(jù)分組為[0,5),[5,10),…,[30,35),[35,40],所作的頻率分布直方圖是()解析:選A以5為組距將數(shù)據(jù)分組為[0,5),[5,10),…,[30,35),[35,40],各組的頻數(shù)依次為1,1,424,3,3,2,可知畫出的頻率分布直方圖為選項A中的圖.2.(變結(jié)論)在本例條件下,在月平均電量為[220,240),[240,260),[260,280),[280,300]的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量在[220,240)的用戶中應(yīng)抽取戶.解析:月平均用電量在[220,240)的用戶有0.0125x20x100=25(戶).同理可得月平均用電量在[240,260)的用戶有15戶,月平均用電量在[260,280]的用戶有10戶,月平均用電量在[280,300]的用戶有[280,300]的用戶有5戶,故抽取比例為1125+15+10+5所以月平均用電量在[220,240)的用戶中應(yīng)抽取25x|=5(戶).答案:53.我國是世界上嚴(yán)重缺水的國家,某市為了制定合理的節(jié)水方案,對居民用水情況進(jìn)行了調(diào)查,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數(shù)據(jù)按照[0,0.5),[0.5,1),…,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.(1)求直方圖中a的值;(2)設(shè)該市有30萬居民,估計全市居民中月均用水量不低于3噸的人數(shù),說明理由.解:(1)由頻率分布直方圖可知,月均用水量在[0,0.5)的頻率為0.08x0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6組的頻率分別為0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5xa+0.5xa,解得a=0.30.(2)估計全市居民中月均用水量不低于3噸的人數(shù)為3.6萬.理由如下:由(1)知,100位居民中月均用水量不低于3噸的頻率為0.06+0.04+0.02=0.12.由以上樣本的頻率分布,可以估計30萬居民中月均用水量不低于3噸的人數(shù)為300000X0.12=36000=3.6(萬).考點三樣本的數(shù)字特征考法(一)樣本的數(shù)字特征與頻率分布直方圖交匯[典例](2019?遼寧師范大學(xué)附屬中學(xué)模擬)某校初三年級有400名學(xué)生,隨機(jī)抽查了40名學(xué)生測試1分鐘仰臥起坐的成績(單位:次),將數(shù)據(jù)整理后繪制成如圖所示的頻率分布直方圖.用樣本估計總體,下列結(jié)論正確的是()該校初三學(xué)生1分鐘仰臥起坐的次數(shù)的中位數(shù)為25該校初三學(xué)生1分鐘仰臥起坐的次數(shù)的眾數(shù)為24該校初三學(xué)生1分鐘仰臥起坐的次數(shù)超過30的人數(shù)約有80該校初三學(xué)生1分鐘仰臥起坐的次數(shù)少于20的人數(shù)約為8[解析]第一組數(shù)據(jù)的頻率為0.02X5=0.1,第二組數(shù)據(jù)的頻率為0.06X5=0.3,第三組數(shù)據(jù)的頻率為0.08X5=0.4,???中位數(shù)在第三組內(nèi),設(shè)中位數(shù)為25+x,則xX0.08=0.5—0.1—0.3=0.1,???x=1.25,???中位數(shù)為26.25,故A錯誤;第三組數(shù)據(jù)所在的矩形最高,第三組數(shù)據(jù)的中間值為27.5,?眾數(shù)為27.5,故B錯誤;1分鐘仰臥起坐的次數(shù)超過30的頻率為0.2,??超過30次的人數(shù)為400X0.2=80,故C正確;1分鐘仰臥起坐的次數(shù)少于20的頻率為0.1,??1分鐘仰臥起坐的次數(shù)少于20的人數(shù)為400X0.1=40,故D錯誤.故選C.[答案]C[解題技法]頻率分布直方圖與眾數(shù)、中位數(shù)、平均數(shù)的關(guān)系頻率分布直方圖與眾數(shù)、中位數(shù)、平均數(shù)的關(guān)系(1)最高的小長方形底邊中點的橫坐標(biāo)為眾數(shù);(2)中位數(shù)左邊和右邊的小長方形的面積和是相等的;平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標(biāo)之和.考法(二)樣本的數(shù)字特征與莖葉圖交匯[典例]將某選手的9個得分去掉1個最高分,去掉1個最低分,7個剩余分?jǐn)?shù)的平均分為91.現(xiàn)場作的9個分?jǐn)?shù)的莖葉圖后來有1個數(shù)據(jù)模糊,無法辨認(rèn),在圖中以x表示,則TOC\o"1-5"\h\z7個剩余分?jǐn)?shù)的方差為.774010■■91[解析]由莖葉圖可知去掉的兩個數(shù)是87,99,所以87+90X2+91X2+94+90+x=13691X7,解得x=4.故s2=7【(87—91)2+(90—91)2x2+(91—91)2x2+(94—91)2x2]=〒.[答案[答案]367[解題技法]樣本的數(shù)字特征與莖葉圖綜合問題的注意點在使用莖葉圖時,一定要觀察所有的樣本數(shù)據(jù),弄清楚這個圖中數(shù)字的特點,不要漏掉了數(shù)據(jù),也不要混淆莖葉圖中莖與葉的含義.莖葉圖既可以表示兩組數(shù)據(jù),也可以表示一組數(shù)據(jù),用它表示的數(shù)據(jù)是完整的數(shù)據(jù)因此可以從莖葉圖中看出數(shù)據(jù)的眾數(shù)(數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù))、中位數(shù)(中間位置的一個數(shù),或中間兩個數(shù)的平均數(shù))等.考法(三)樣本的數(shù)字特征與優(yōu)化決策問題交匯[典例](2018?周口調(diào)研)甲、乙兩人在相同條件下各射擊10次,每次中靶環(huán)數(shù)情況如圖所示.(1)請?zhí)顚懴卤?寫出計算過程):平均數(shù)方差命中9環(huán)及9環(huán)以上的次數(shù)甲乙(2)從下列三個不同的角度對這次測試結(jié)果進(jìn)行分析:從平均數(shù)和方差相結(jié)合看(分析誰的成績更穩(wěn)定);從平均數(shù)和命中9環(huán)及9環(huán)以上的次數(shù)相結(jié)合看(分析誰的成績好些);從折線圖上兩人射擊命中環(huán)數(shù)的走勢看(分析誰更有潛力).[解]由題圖,知甲射擊10次中靶環(huán)數(shù)分別為9,5,7,8,7,6,8,6,7,7.將它們由小到大排列為5,6,6,7,7,7,7,8,8,9.乙射擊10次中靶環(huán)數(shù)分別為2,4,6,8,7,7,8,9,9,10.將它們由小到大排列為2,4,6,7,7,8,8,9,9,10.1(1)x甲=^X(5+6X2+7X4+8X2+9)=7(環(huán)),—1x乙=話X(2+4+6+7X2+8X2+9X2+10)=7(環(huán)),s2=書X[(5—7)2+(6—7)2x2+(7—7)2x4+(8—7)2x2+(9—7)2]=^X(4+2+0+2+4)=1.2,s乙=占X[(2—7)2+(4—7)2+(6—7)2+(7—7)2x2+(8—7)2x2+(9—7)2x2+(10—7)2]二寺乂(25+9+1+0+2+8+9)=54填表如下:平均數(shù)方差命中9環(huán)及9環(huán)以上的次數(shù)甲71.21乙75.43⑵①???平均數(shù)相同,s甲Vs乙,???甲成績比乙穩(wěn)定.??平均數(shù)相同,命中9環(huán)及9環(huán)以上的次數(shù)甲比乙少,?乙成績比甲好些.??甲成績在平均數(shù)上下波動,而乙處于上升勢頭,從第三次以后就沒有比甲少的情況發(fā)生,?乙更有潛力.[解題技法]利用樣本的數(shù)字特征解決優(yōu)化決策問題的依據(jù)(1)平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.(2)用樣本估計總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征.[題組訓(xùn)練]1.對某商店一個月內(nèi)每天的顧客人數(shù)進(jìn)行統(tǒng)計,得到樣本的莖葉圖(如圖所示),則該樣本中的中位數(shù)、眾數(shù)、極差分別是()2502331244855577880011479I7fiA.46,45,56CA.46,45,56C.47,45,56D.45,47,5345+47解析:選A樣本共30個,中位數(shù)為一一=46;顯然樣本數(shù)據(jù)出現(xiàn)次數(shù)最多的為45,故眾數(shù)為45;極差為68—12=56,故選A.2.甲、乙、丙、丁四人參加某運動會射擊項目選拔賽,四人的平均成績和方差如下表所示:甲乙丙丁平均環(huán)數(shù)x8.38.88.88.7方差s23.53.62.25.4從這四個人中選擇一人參加該運動會射擊項目比賽,最佳人選是()A.甲B.乙C.丙D.丁解析:選C由表格中數(shù)據(jù)可知,乙、丙平均環(huán)數(shù)最高,但丙方差最小,說明成績好,且技術(shù)穩(wěn)定,選C.3.某儀器廠從新生產(chǎn)的一批零件中隨機(jī)抽取40個進(jìn)行檢測,如圖是根據(jù)抽樣檢測得到的零件的質(zhì)量(單位:克)繪制的頻率分布直方圖,樣本數(shù)據(jù)按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8組,將其按從左到右的順序分別記為第一組,第二組,,第八組.則樣本數(shù)據(jù)的中位數(shù)在第組.解析:由題圖可得,前四組的頻率為(0.0375+0.0625+0.0750+0.1000)X2=0.55,則其頻數(shù)為40X0.55=22,且第四組的頻數(shù)為40X0.1000X2=8,故中位數(shù)在第四組.答案:四[課時跟蹤檢測]A級1.一個頻數(shù)分布表(樣本容量為30)不小心被損壞了一部分,只記得樣本中數(shù)據(jù)在[20,60)上的頻率為0.8,則估計樣本在[40,60)內(nèi)的數(shù)據(jù)個數(shù)為()CC.2D.3AA.0B.1A.14B.15C.16D.17解析:選B由題意,樣本中數(shù)據(jù)在[20,60)上的頻數(shù)為30X0.8=24,所以估計樣本在[40,60)內(nèi)的數(shù)據(jù)個數(shù)為24—4—5=15.(2019?長春質(zhì)檢)如圖所示是某學(xué)校某年級的三個班在一學(xué)期內(nèi)的六次數(shù)學(xué)測試的平均成績y關(guān)于測試序號x的函數(shù)圖象,為了容易看出一個班級的成績變化,將離散的點用虛線連接,根據(jù)圖象,給出下列結(jié)論:一班成績始終高于年級平均水平,整體成績比較好;二班成績不夠穩(wěn)定,波動程度較大;三班成績雖然多數(shù)時間低于年級平均水平,但在穩(wěn)步提升.其中正確結(jié)論的個數(shù)為()

解析:選D①由圖可知一班每次考試的平均成績都在年級平均成績之上,故①正確.②由圖可知二班平均成績的圖象高低變化明顯,可知成績不穩(wěn)定,波動程度較大,故②正確.③由圖可知三班平均成績的圖象呈上升趨勢,并且圖象的大部分都在年級平均成績圖象的下方,故③正確.故選D.(2018.貴陽檢測)在某中學(xué)舉行的環(huán)保知識競賽中,將三個年級參賽學(xué)生的成績進(jìn)行整理后分為5組,繪制如圖所示的頻率分布直方圖,圖中從左到右依次為第一、第二、第三、第四、第五小組,已知第二小組的頻數(shù)是40,則成績在80?100分的學(xué)生人數(shù)是()B.18AB.18C.20D.25解析:選A根據(jù)頻率分布直方圖,得第二小組的頻率是0.04X10=0.4,:?頻數(shù)是40,40.?.樣本容量是肓=100,又成績在80?100分的頻率是(0.01+0.005)X10=0.15,.?.成績在80?100分的學(xué)生人數(shù)是100X0.15=15.故選A.A地B地274S679886249544.2017年4月,泉州有四處濕地被列入福建省首批重要濕地名錄,某同學(xué)決定從其中A,B兩地選擇一處進(jìn)行實地考察.因此,他通過網(wǎng)站了解上周去過這兩個地方的人對它們的綜合評分,并將評分?jǐn)?shù)據(jù)記錄為右圖的莖葉圖,記A,B兩地綜合評分?jǐn)?shù)據(jù)的均值分別為匚人,匚b,方差分別為sA,sB.若以備受好評為依據(jù),則下述判斷較合理的是()A.因為xA>XB,SA>SB,所以應(yīng)該去A地B?因為匚A>匚B,sA<sB,所以應(yīng)該去A地C?因為匚A<匚B,sa>sb,所以應(yīng)該去B地D?因為xA<xB,SA<SB,所以應(yīng)該去B地11解析:選B因為xA=6X(72+86+87+89+92+94)^86.67,xB=6X(74+73+88+86+95+94)=85,sa宀6【(72—86.67)2+(86—86.67)2+(87—86.67)2+(89—86.67)2+(92—86.67)2+(94—86.67)2]心50.56,sB=1〔(74—85)2+(73—85)2+(88—85)2+(86—85)2+(95—85)2+(94—85)2]=76,所以xA>xB,sa<sb(A數(shù)據(jù)集中,B數(shù)據(jù)分散),所以A地好評分高,且評價穩(wěn)定.故選B.5.(2018?青島三中期中)已知數(shù)據(jù)x],x2,…,x”的平均數(shù)x=5,方差s2=4,則數(shù)據(jù)3x]+7,3x2+7,…,3x“+7的平均數(shù)和標(biāo)準(zhǔn)差分別為()A.15,36B.22,6C.15,6D.22,36解析:選BVx],x2,x3,…,xn的平均數(shù)為5,TOC\o"1-5"\h\zx,+xo+x3x,+3xo+3x,3(x’+xo+x),,???―2n=5,?:2n+7=1―2顯+7=3X5+7=22.nnn,.*x],x2,x3,…,x”的方差為4,?.3x1+7,3x2+7,3x3+7,…,3x”+7的方差是32X4=36,故數(shù)據(jù)3x]+7,3x2+7,…,3x“+7的平均數(shù)和標(biāo)準(zhǔn)差分別為22,6,故選B.6.(2018?江蘇高考)已知5位裁判給某運動員打出的分?jǐn)?shù)的莖葉圖如圖所示,B99那么這5位裁判打出的分?jǐn)?shù)的平均數(shù)為.9°1解析:這5位裁判打出的分?jǐn)?shù)分別是89,89,90,91,91,因此這5位裁判打出的分?jǐn)?shù)的平均數(shù)為89+均數(shù)為89+89+90+91+915=90.答案:907.為了了解某校高三美術(shù)生的身體狀況,抽查了部分美術(shù)生的體重,將所得數(shù)據(jù)整理后,作出了如圖所示的頻率分布直方圖.已知圖中從左到右的前3個小組的頻率之比為1:3:5,第2個小組的頻數(shù)為15,則被抽查的美術(shù)生的人數(shù)是.解析:設(shè)被抽查的美術(shù)生的人數(shù)為n因為后2個小組的頻率之和為(0.0375+0.0125)X5=0.25,所以前3個小組的頻率之和為0.75.又前3個小組的頻率之比為1:3:5,第2個小組的頻數(shù)為15,所以前3個小組的頻數(shù)分別為個小組的頻數(shù)為15,所以前3個小組的頻數(shù)分別為5,15,25,所以5+15+25n=0.75=60.答案:608.某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9?已知這組數(shù)據(jù)的平均數(shù)為10,方差為2,貝ylx—yl的值為.解析:由題意知這組數(shù)據(jù)的平均數(shù)為10,方差為2,可得x+y=20,(x-10)2+(y-10)2=8,設(shè)x=10+t,y=10—t,由(x—10)2+(y—10)2=8得t2=4,所以lx—yl=2ltl=4.答案:49.某班100名學(xué)生期中考試語文成績的頻率分布直方圖如圖所示,其中成績分組區(qū)間是[50,60),[60,70),[70,80),[80,90),[90,100].求圖中a的值;根據(jù)頻率分布直方圖,估計這100名學(xué)生語文成績的平均分;(3)若這100名學(xué)生語文成績某些分?jǐn)?shù)段的人數(shù)(x)與數(shù)學(xué)成績相應(yīng)分?jǐn)?shù)段的人數(shù)(y)之比如表所示,求數(shù)學(xué)成績在[50,90)之外的人數(shù).分?jǐn)?shù)段[50,60)[60,70)[70,80)[80,90)X:y1:12:13:44:5解:⑴由頻率分布直方圖知(0.04+0.03+0.02+2a)X10=l,因此a=0.005.因為55X0.05+65X0.4+75X0.3+85X0.2+95X0.05=73.所以這100名學(xué)生語文成績的平均分為73分.分別求出語文成績在分?jǐn)?shù)段[50,60),[60,70),[70,80),[80,90)的人數(shù)依次為0.05X100=5,0.4X100=40,0.3X100=30,0.2X100=20.所以數(shù)學(xué)成績分?jǐn)?shù)段在[50,60),[60,70),[70,80),[80,90)的人數(shù)依次為5,20,40,25.所以數(shù)學(xué)成績在[50,90)之外的人數(shù)有100-(5+20+40+25)=10.B級1.某車間將10名技工平均分成甲、乙兩組加工某種零件,在單位時間內(nèi)每個技工加工的合格零件數(shù)的統(tǒng)計數(shù)據(jù)的莖葉圖如圖所示,已知兩組技工在單位時間內(nèi)加工的合格零件的平均數(shù)都為10.求出m,n的值;求出甲、乙兩組技工在單位時間內(nèi)加工的合格零件的方差s甲和s乙并由此分析兩組技工的加工水平.11解:(1)根據(jù)題意可知:x甲=5(7+8+10+12+10+m)=10,x乙=5(9+n+10+11+12)=10,所以m=3,n=8.(2)s2=*[(7—10)2+(8—10)2+(10—10)2+(12—10)2+(13—10)2]=5.2,S2=1[(8—10)2+(9—10)2+(10—10)2+(11—10)2+(12—10)2]=2,因為x甲=x乙,S2>S2,所以甲、乙兩組的整體水平相當(dāng),乙組更穩(wěn)定一些.2.某大學(xué)藝術(shù)專業(yè)的400名學(xué)生參加某次測評,根據(jù)男女學(xué)生人數(shù)比例,使用分層抽樣的方法從中隨機(jī)抽取了100名學(xué)生,記錄他們的分?jǐn)?shù),將數(shù)據(jù)按[20,30),[30,40),…,[80,90]分成7組,并整理得到如圖所示的頻率分布直方圖.估計總體的眾數(shù);已知樣本中分?jǐn)?shù)小于40的學(xué)生有5人,試估計總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù);已知樣本中有一半男生的分?jǐn)?shù)不小于70,且樣本中分?jǐn)?shù)不小于70的男女學(xué)生人數(shù)相等.試估計總體中男生和女生人數(shù)的比例.70+80解:(1)由頻率分布直方圖可估計總體的眾數(shù)為一2—=75.由頻率分布直方圖可知,樣本中分?jǐn)?shù)在區(qū)間[50,90]內(nèi)的人數(shù)為(0.01+0.02+0.04+0.02)X10X100=90.因為樣本中分?jǐn)?shù)小于40的學(xué)生有5人,所以樣本中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù)為100-90-5=5.5x設(shè)總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù)為x,則而=而,解得x=20,故估計總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù)為20.由頻率分布直方圖可知,樣本中分?jǐn)?shù)不小于70的人數(shù)為(0.04+0.02)X10X100=60.因為樣本中分?jǐn)?shù)不小于70的男女學(xué)生人數(shù)相等,所以樣本中分?jǐn)?shù)不小于70的男生人數(shù)為30.因為樣本中有一半男生的分?jǐn)?shù)不小于70,所以樣本中男生的人數(shù)為60,女生的人數(shù)為40.由樣本估計總體,得總體中男生和女生人數(shù)的比例約為3:2.第三節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計案例—、基礎(chǔ)知識變量間的相關(guān)關(guān)系常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.I體現(xiàn)的不一定是因果關(guān)系從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為正相關(guān);點散布在左上角到右下角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系為負(fù)相關(guān).兩個變量的線性相關(guān)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.AAA回歸方程%y=bx+a,其中通過求Q=’(y-bx~a)2的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點到i,=f回歸直線的距離的平方和最小,這一方法叫做最小二乘法.相關(guān)系數(shù):當(dāng)r>0時,表明兩個變量正相關(guān);當(dāng)rVO時,表明兩個變量負(fù)相關(guān).r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常Irl大于0.75時,認(rèn)為兩個變量有很強的線性相關(guān)性.獨立性檢驗(1)2X2列聯(lián)表設(shè)X,Y為兩個變量,它們的取值分別為{x1,x2}和V],y2},其樣本頻數(shù)列聯(lián)表(2X2列聯(lián)表)如下:丁1丁2總計x1aba+bX2cdc+d總計a+cb+da+b+c+d(2)獨立性檢驗利用隨機(jī)變量利用隨機(jī)變量K2(也可表示為X)的觀測值k=(a+b)(c¥d)(a¥c)(b+d)(其中n=a+b+c+d為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨立性檢驗.,二、常用結(jié)論AA(1)求解回歸方程的關(guān)鍵是確定回歸系數(shù)ab,應(yīng)充分利用回歸直線過樣本中心點(x,y)?根據(jù)K的值可以判斷兩個分類變量有關(guān)的可信程度,若K越大,則兩分類變量有關(guān)的把握越大.A根據(jù)回歸方程計算的y值,僅是一個預(yù)報值,不是真實發(fā)生的值.考點一回歸分析考法(一)求線性回歸方程[典例](2019?湘東五校聯(lián)考)已知具有相關(guān)關(guān)系的兩個變量x,y的幾組數(shù)據(jù)如下表所示:x246810y3671012請根據(jù)上表數(shù)據(jù)在網(wǎng)格紙中繪制散點圖;AAA請根據(jù)上表數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程丁=方工+。,并估計當(dāng)x=20時y的值.^n——乙xy)—nxyi=i=l參考公式:b=—A——A——a=y—bx.乙x?—nx21=1[解](1)散點圖如圖所示:1(2)依題意,x=5x(2+4+6+8+10)=6,—1y=5X(3+6+7+10+12)=76,£x2=4+16+36+64+100=220,£^=6+24+42+80+120=272,i=1i=1

£兀:丁廠5xya匸:272-5X6X7.644b===一=11i1b_220—5X62401.1i1X2a/.a=7.6—1.1X6=1,a??.線性回歸方程為y=1.1x+1,故當(dāng)x=20時,y=23.考法(二)相關(guān)系數(shù)及應(yīng)用由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明.[典例]如圖是我國2012年至2018由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明.[典例]如圖是我國2012年至2018年生活垃圾無害化處理量(單位:億噸)的折線圖.參考數(shù)據(jù):右尸9.32,i=1i=1~2.646.參考公式:相關(guān)系數(shù)r=為(廠t)2^(y-y)2i=1i=1[解]由折線圖中數(shù)據(jù)和參考數(shù)據(jù)及公式得t4,i=1£(—i=1£(——t)2=2&i=1£(y~y)2=0.55,£(t—t)(y—y)=£卩廠t£yi=40.17-4X9.32=2.89,r^0.55X2X2.646^0.".i=1i=1i=1因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當(dāng)高,從而可以用線性回歸模型擬合y與t的關(guān)系.[解題技法]1.線性回歸分析問題的類型及解題方法求線性回歸方程:AA利用公式,求出回歸系數(shù)b,a待定系數(shù)法:利用回歸直線過樣本點中心求系數(shù).利用回歸方程進(jìn)行預(yù)測:把回歸直線方程看作一次函數(shù),求函數(shù)值.利用回歸直線判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是系數(shù)b.2.模型擬合效果的判斷殘差平方和越小,模型的擬合效果越好.相關(guān)指數(shù)R2越大,模型的擬合效果越好.回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)Irl越趨近于1時,兩變量的線性相關(guān)性越強.[題組訓(xùn)練]1.(2019?惠州調(diào)研)某商場為了了解毛衣的月銷售量y(件)與月平均氣溫x(°C)之間的關(guān)系,隨機(jī)統(tǒng)計了某4個月的月銷售量與當(dāng)月平均氣溫,其數(shù)據(jù)如下表:月平均氣溫x/C171382月銷售量y/件24334055由表中數(shù)據(jù)算出線性回歸方程程y=bx+a中的b=-2,氣象部門預(yù)測下個月的平均氣溫約為6C,據(jù)此估計該商場下個月毛衣銷售量約為()A.46件B.40件C.38件D.58件AAAA解析:選A由題中數(shù)據(jù),得x=10,y=38,回歸直^y=bx+a過點(x,y),且bAA=—2,代入得a=58,則回歸方程y=—2x+58,所以當(dāng)x=6時,y=46,故選A.2.近期,某公交公司分別推出支付寶和微信掃碼支付乘車活動,活動設(shè)置了一段時間的推廣期,由于推廣期內(nèi)優(yōu)惠力度較大,吸引越來越多的人開始使用掃碼支付.某線路公交車隊統(tǒng)計了活動剛推出一周內(nèi)每天使用掃碼支付的人次,用x表示活動推出的天數(shù),y表示每天使用掃碼支付的人次,統(tǒng)計數(shù)據(jù)如下表:x1234567y6011021034066010101960根據(jù)以上數(shù)據(jù),繪制了散點圖.參考數(shù)據(jù):yvi=1£xv.1Ii=1100.546212.542535078.123.4717其中v.=lgy.,v=~Lvi=1根據(jù)散點圖判斷,在推廣期內(nèi),y=a+bx與y=c?dx(c,d均為大于零的常數(shù))哪一個適宜作為掃碼支付的人次y關(guān)于活動推出天數(shù)x的回歸方程類型(給出判斷即可,不必說明理由)?根據(jù)(1)的判斷結(jié)果及上表中數(shù)據(jù),建立y關(guān)于x的回歸方程,并預(yù)測活動推出第8天使用掃碼支付的人次.參考公式:AAA對于一組數(shù)據(jù)(U],v1),(u2,v2),…,(un,vn),其回歸直線v=a+紡的斜率和截距的工呼廠nuv=1AA最小二乘估計公式分別為〃=,a=vU.工叫—u2=1解:⑴根據(jù)散點圖可以判斷,y=c?dx適宜作為掃碼支付的人次y關(guān)于活動推出天數(shù)x的回歸方程類型.(2)y=c?dx兩邊同時取常用對數(shù),得lgy=lg(c?dx)=lgc+xlgd,設(shè)lgy=v,貝Uv=lgc+xlgd.*/x=4,v=2.54,£x?=140,i=1治廠7x治廠7xvi=1lgd=£x2—7x278.12—7X4X2.54?=140—7X42i=1把(4,2.54)代入v=lgc+xlgd,得lgc=1.54,AA...v=1.54+0.25x,.°.y=101.54+0.25x=1O1.54?(1Oo.25)x.A把x=8代入上式,得y=101.54+0.25X8=103.54=103X100.54=3470,A?y關(guān)于x的回歸方程為A=101.54.(100.25)x,活動推出第8天使用掃碼支付的人次為3470.考點二獨立性檢驗[典例](2018?全國卷III節(jié)選)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機(jī)分成兩組,每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時間(單位:min)繪制了如下莖葉圖:第…種生產(chǎn)方式第一種住產(chǎn)方式865568997(i270122345fifi89877654332811452110090(1)求40名工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:超過m不超過m第一種生產(chǎn)方式第二種生產(chǎn)方式(2)根據(jù)(1)中的列聯(lián)表,能否有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異?n(ad—bc)2附.K2=°(a+b)(c+d)(a+c)(b+d)V(K^k)0.0500.0100.001k亂841乩6351①刪

[解](1)由莖葉圖知m=篤81=80.列聯(lián)表如下:(2)因為K(2)因為K2=40(15X15—5X5)220X20X20X20=10>6.635,所以有99%的把握認(rèn)為兩種生產(chǎn)方式的效超過m不超過m第一種生產(chǎn)方式155第二種生產(chǎn)方式515率有差異.[解題技法]2個明確明確兩類主體;明確研究的兩個問題2個關(guān)鍵準(zhǔn)確畫出2X2列聯(lián)表;準(zhǔn)確求解K3個步驟(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表;⑵根據(jù)公式K2—冊)(丄d)(a丄)(b+d),計算K的值;(3)查表比較K2與臨界值的大小關(guān)系,作統(tǒng)計判斷[題組訓(xùn)練]1.(2019?滄州模擬)某班主任對全班50名學(xué)生進(jìn)行了作業(yè)量的調(diào)查,數(shù)據(jù)如表:認(rèn)為作業(yè)量大認(rèn)為作業(yè)量不大總計男生18927女生81523總計262450已知P(K2±3.841)a0.05,P(K2±5.024)a0.025,P(K226.635)~0.010.則(填“有”或“沒有”)97.5%的把握認(rèn)為“學(xué)生的性別與認(rèn)為作業(yè)量大有關(guān)”.解析:因為K2解析:因為K2=50X(18X15—8X9)226X24X27X23~5.059>5.024,所以有97.5%的把握認(rèn)為“學(xué)生的性別與認(rèn)為作業(yè)量大有關(guān)”答案:有2.為考察某種疫苗預(yù)防疾病的效果,進(jìn)行動物試驗,得到統(tǒng)計數(shù)據(jù)如下:未發(fā)病發(fā)病總計未注射疫苗20xA注射疫苗30yB總計5050100現(xiàn)從所有試驗動物中任取一只,取到“注射疫苗”動物的概率為2?⑴求2X2列聯(lián)表中的數(shù)據(jù)x,y,A,B的值.(2)繪制發(fā)病率的條形統(tǒng)計圖,并判斷疫苗是否影響到了發(fā)病率?n=a+bn=a+b+c+d.臨界值表:P(K2±k0)0.050.010.0050.001k03.8416.6357.87910.828附:皆咖W2(a+b)(c+d)(a+c)(b+d)解:(1)設(shè)“從所有試驗動物中任取一只,取到‘注射疫苗'動物”為事件M由已知得p(m)=,I。。=5,所以y=10,則B=40,x=40,A=60.4。2⑵未注射疫苗發(fā)病率為60=3^0.67,注射疫苗發(fā)病率為40=4=0.25.發(fā)病率的條形統(tǒng)計圖如圖所示,由圖可以看出疫苗影響到了發(fā)病率.宀“100X(20X10—40X30)2⑶因為K2=60X40X50X50^16,67>10,828,所以能在犯錯誤的概率不超過0.001的前提下認(rèn)為疫苗有效.[課時跟蹤檢測]A級1.對變量x,y有觀測數(shù)據(jù)(x.,y.)(z=1,2,-,10),得散點圖如圖①,對變量u,v有觀測數(shù)據(jù)(冷,v.)(i=1,2,-,10),得散點圖如圖②?由這兩個散點圖可以判斷()

變量x與y正相關(guān),u與v正相關(guān)變量x與y正相關(guān),u與v負(fù)相關(guān)變量x與y負(fù)相關(guān),u與v正相關(guān)變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析:選C由散點圖可得兩組數(shù)據(jù)均線性相關(guān),且圖①的線性回歸方程斜率為負(fù),圖②的線性回歸方程斜率為正,則由散點圖可判斷變量x與y負(fù)相關(guān),u與v正相關(guān).2.(2019?長沙模擬)為了解某社區(qū)居民購買水果和牛奶的年支出費用與購買食品的年支出費用的關(guān)系,隨機(jī)調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計表:購買食品的年支出費用x/萬元2.092.152.502.842.92購買水果和牛奶的年支出費用y/萬兀1.251.301.501.701.75根據(jù)上表可得回歸方程y=bx+a,其中b=0.59,a=y一bx,據(jù)此估計,該社區(qū)一戶購買食品的年支出費用為3.00萬元的家庭購買水果和牛奶的年支出費用約為()A.1.795萬元B.2.555萬元C.1.915萬元D.1.945萬元11解析:選Ax=5X(2.09+2.15+2.50+2.84+2.92)=2.50(萬元),y=5^(1.25+1.30+1.50+1.50+1.70+1.75)=1.50(萬元),其中b=0.59,AAA貝Ua=y—bx=0.025,y=0.59x+0.025,故年支出費用為3.00萬元的家庭購買水果和牛奶的年支出費用約為y=0.59X3.00+0.025=1.795(萬元).

3.下面四個命題中,錯誤的是()從勻速傳遞的產(chǎn)品生產(chǎn)流水線上,質(zhì)檢員每15分鐘從中抽取一件產(chǎn)品進(jìn)行某項指標(biāo)檢測,這樣的抽樣是系統(tǒng)抽樣B?對分類變量X與Y的隨機(jī)變量K的觀測值k來說,k越大,“X與Y有關(guān)系”的把握程度越大C.兩個隨機(jī)變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近于0AD.在回歸直線方程y=0.4x+12中,當(dāng)解釋變量x每增加一個單位時,預(yù)報變量平均增加0.4個單位解析:選C兩個隨機(jī)變量的線性相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近于1,故C錯誤.4.春節(jié)期間,“厲行節(jié)約,反對浪費”之風(fēng)悄然吹開,某市通過隨機(jī)詢問100名性別不同的居民是否能做到“光盤”行動,得到如下的列聯(lián)表:做不到“光盤”能做到“光盤”男4510女3015則下面的正確結(jié)論是()附表及公式:P(K2±k0)0.1000.0500.0100.001k02.7063.8416.63510.828n(ad—bc)2K(a+b)(c+d)(a+c)(b+d)'有90%以上的把握認(rèn)為“該市居民能否做到'光盤'與性別有關(guān)”在犯錯誤的概率不超過1%的前提下,認(rèn)為“該市居民能否做到'光盤'與性別無關(guān)”在犯錯誤的概率不超過1%的前提下,認(rèn)為“該市居民能否做到'光盤'與性別有關(guān)”有90%以上的把握認(rèn)為“該市居民能否做到'光盤'與性別無關(guān)”解析:選A由列聯(lián)表得到a=45,b=10,c=30,d=15,則a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,計算得K的觀測值k=n(ad~bc)2100X(675—300)23.030.因為2.706<3.030<3.8413.030.因為2.706<3.030<3.841,(a+b)(c+d)(a+c)(b+d)55X45X75X25所以有90%以上的把握認(rèn)為“該市居民能否做到‘光盤'與性別有關(guān)”.5.為了研究工人的日平均工作量是否與年齡有關(guān),從某工廠抽取了100名工人,且規(guī)定日平均生產(chǎn)件數(shù)不少于80件者為“生產(chǎn)能手”,列出的2X2列聯(lián)表如下:

生產(chǎn)能手非生產(chǎn)能手總計25周歲以上25356025周歲以下103040總計3565100解析:由2X2解析:由2X2列聯(lián)表可知,K2=100X(25X30—10X35)240X60X35X652.93,因為2.93>2.706,所以有90%以上的把握認(rèn)為“工人是否為‘生產(chǎn)能手'與工人的年齡有關(guān)”.答案:90%6.隨著我國經(jīng)濟(jì)的發(fā)展,居民的儲蓄存款逐年增長.設(shè)某地區(qū)城鄉(xiāng)居民人民幣儲蓄存款(年底余額)如下表:年份20142015201620172018時間代號t12345儲蓄存款y(千億元)567810則y關(guān)于t的回歸方程是.1旳15—1孫36解析:由表中數(shù)據(jù)得n=5,t=^t.=15=3,y=nSyi=3?=7.2.i=1i=1n又工t2—nt2=55—5X32=10,ii=1nLty-nty=120—5X3X7.2=12.i=1乙ty—nty,人i'=112從而b==10=1.2,Lt2_nt2ii=1AA—a=y—bt=7.2—1.2X3=3.6,故所求回歸方程為y=1.2t+3.6.A答案:y=1.2t+3.67.某電視廠家準(zhǔn)備在元旦舉行促銷活動,現(xiàn)根據(jù)近

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論