




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGEPAGE1第1講隨機(jī)抽樣最新考綱1.理解隨機(jī)抽樣的必要性和重要性;2.會(huì)用簡(jiǎn)單隨機(jī)抽樣方法從總體中抽取樣本;了解分層抽樣和系統(tǒng)抽樣方法.知識(shí)梳理1.簡(jiǎn)單隨機(jī)抽樣(1)定義:設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.(2)最常用的簡(jiǎn)單隨機(jī)抽樣的方法:抽簽法和隨機(jī)數(shù)法.(3)應(yīng)用范圍:總體中的個(gè)體數(shù)較少.2.系統(tǒng)抽樣(1)定義:當(dāng)總體中的個(gè)體數(shù)目較多時(shí),可將總體分成均衡的幾個(gè)部分,然后按照事先定出的規(guī)則,從每一部分抽取一個(gè)個(gè)體得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣.(2)系統(tǒng)抽樣的操作步驟第一步編號(hào):先將總體的N個(gè)個(gè)體編號(hào);第二步分段:確定分段間隔k,對(duì)編號(hào)進(jìn)行分段,當(dāng)eq\f(N,n)(n是樣本容量)是整數(shù)時(shí),取k=eq\f(N,n);第三步確定首個(gè)個(gè)體:在第1段用簡(jiǎn)單隨機(jī)抽樣確定第一個(gè)個(gè)體編號(hào)l(l≤k);第四步獲取樣本:按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第2個(gè)個(gè)體編號(hào)(l+k),再加k得到第3個(gè)個(gè)體編號(hào)(l+2k),依次進(jìn)行下去,直到獲取整個(gè)樣本.(3)應(yīng)用范圍:總體中的個(gè)體數(shù)較多.3.分層抽樣(1)定義:在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法叫做分層抽樣.(2)應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣.診斷自測(cè)1.判斷正誤(在括號(hào)內(nèi)打“√”或“×”)精彩PPT展示(1)在簡(jiǎn)單隨機(jī)抽樣中,某一個(gè)個(gè)體被抽到的可能性與第幾次抽取有關(guān),第一次抽到的可能性最大.(×)(2)系統(tǒng)抽樣在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣.(√)(3)要從1002個(gè)學(xué)生中用系統(tǒng)抽樣的方法選取一個(gè)容量為20的樣本,需要剔除2個(gè)學(xué)生,這樣對(duì)被剔除者不公平.(×)(4)分層抽樣中,每個(gè)個(gè)體被抽到的可能性與層數(shù)及分層有關(guān).(×)2.(2014·四川卷)在“世界讀書(shū)日”前夕,為了了解某地5000名居民某天的閱讀時(shí)間,從中抽取了200名居民的閱讀時(shí)間進(jìn)行統(tǒng)計(jì)分析.在這個(gè)問(wèn)題中,5000名居民的閱讀時(shí)間的全體是()A.總體B.個(gè)體C.樣本的容量D.從總體中抽取的一個(gè)樣本解析由題目條件知,5000名居民的閱讀時(shí)間的全體是總體;其中1名居民的閱讀時(shí)間是個(gè)體;從5000名居民某天的閱讀時(shí)間中抽取的200名居民的閱讀時(shí)間是從總體中抽取的一個(gè)樣本,樣本容量是200.答案A3.(2014·湖南卷)對(duì)一個(gè)容量為N的總體抽取容量為n的樣本,當(dāng)選取簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣三種不同方法抽取樣本時(shí),總體中每個(gè)個(gè)體被抽中的概率分別為p1,p2,p3,則()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析由隨機(jī)抽樣的知識(shí)知,三種抽樣中,每個(gè)個(gè)體被抽到的概率都相等,故選D.答案D4.(2014·天津卷)某大學(xué)為了解在校本科生對(duì)參加某項(xiàng)社會(huì)實(shí)踐活動(dòng)的意向,擬采用分層抽樣的方法,從該校四個(gè)年級(jí)的本科生中抽取一個(gè)容量為300的樣本進(jìn)行調(diào)查.已知該校一年級(jí)、二年級(jí)、三年級(jí)、四年級(jí)的本科生人數(shù)之比為4∶5∶5∶6,則應(yīng)從一年級(jí)本科生中抽取________名學(xué)生.解析根據(jù)題意,應(yīng)從一年級(jí)本科生中抽取的人數(shù)為:300×eq\f(4,4+5+5+6)=60.答案605.大、中、小三個(gè)盒子中分別裝有同一種產(chǎn)品120個(gè)、60個(gè)、20個(gè),現(xiàn)在需從這三個(gè)盒子中抽取一個(gè)樣本容量為25的樣本,較為恰當(dāng)?shù)某闃臃椒開(kāi)_______________.解析因?yàn)槿齻€(gè)盒子中裝的是同一種產(chǎn)品,且按比例抽取每盒中抽取的不是整數(shù),所以將三盒中產(chǎn)品放在一起攪勻按簡(jiǎn)單隨機(jī)抽樣法(抽簽法)較為適合.答案簡(jiǎn)單隨機(jī)抽樣考點(diǎn)一簡(jiǎn)單隨機(jī)抽樣【例1】下列抽取樣本的方式是否屬于簡(jiǎn)單隨機(jī)抽樣?(1)從無(wú)限多個(gè)個(gè)體中抽取100個(gè)個(gè)體作為樣本.(2)盒子里共有80個(gè)零件,從中選出5個(gè)零件進(jìn)行質(zhì)量檢驗(yàn).在抽樣操作時(shí),從中任意拿出一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后再把它放回盒子里.(3)從20件玩具中一次性抽取3件進(jìn)行質(zhì)量檢驗(yàn).(4)某班有56名同學(xué),指定個(gè)子最高的5名同學(xué)參加學(xué)校組織的籃球賽.解(1)不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)楸怀槿〉臉颖究傮w的個(gè)體數(shù)是無(wú)限的,而不是有限的.(2)不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)樗欠呕爻闃樱?3)不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)檫@是“一次性”抽取,而不是“逐個(gè)”抽取.(4)不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)椴皇堑瓤赡艹闃樱?guī)律方法(1)簡(jiǎn)單隨機(jī)抽樣需滿足:①被抽取的樣本總體的個(gè)體數(shù)有限;②逐個(gè)抽??;③是不放回抽取;④是等可能抽取.(2)簡(jiǎn)單隨機(jī)抽樣常有抽簽法(適用總體中個(gè)體數(shù)較少的情況)、隨機(jī)數(shù)法(適用于個(gè)體數(shù)較多的情況).【訓(xùn)練1】(1)總體由編號(hào)為01,02,…,19,20的20個(gè)個(gè)體組成,利用下面的隨機(jī)數(shù)表選取5個(gè)個(gè)體,選取方法是從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開(kāi)始由左到右依次選取兩個(gè)數(shù)字,則選出來(lái)的第5個(gè)個(gè)體的編號(hào)為()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01(2)下列抽樣試驗(yàn)中,適合用抽簽法的有()A.從某廠生產(chǎn)的5000件產(chǎn)品中抽取600件進(jìn)行質(zhì)量檢驗(yàn)B.從某廠生產(chǎn)的兩箱(每箱18件)產(chǎn)品中抽取6件進(jìn)行質(zhì)量檢驗(yàn)C.從甲、乙兩廠生產(chǎn)的兩箱(每箱18件)產(chǎn)品中抽取6件進(jìn)行質(zhì)量檢驗(yàn)D.從某廠生產(chǎn)的5000件產(chǎn)品中抽取10件進(jìn)行質(zhì)量檢驗(yàn)解析(1)從第1行第5列、第6列組成的數(shù)65開(kāi)始由左到右依次選出的數(shù)為08,02,14,07,01,所以第5個(gè)個(gè)體編號(hào)為01.(2)A,D中的總體中個(gè)體數(shù)較多,不適宜抽簽法,C中甲、乙兩廠的產(chǎn)品質(zhì)量有區(qū)別,也不適宜抽簽法,故選B.答案(1)D(2)B考點(diǎn)二系統(tǒng)抽樣【例2】(1)已知某單位有40名職工,現(xiàn)要從中抽取5名職工,將全體職工隨機(jī)按1~40編號(hào),并按編號(hào)順序平均分成5組.按系統(tǒng)抽樣方法在各組內(nèi)抽取一個(gè)號(hào)碼.若第1組抽出的號(hào)碼為2,則所有被抽出職工的號(hào)碼為_(kāi)_______.(2)為了解1000名學(xué)生的學(xué)習(xí)情況,采用系統(tǒng)抽樣的方法,從中抽取容量為40的樣本,則分段的間隔為()A.50B.40C.25D.20解析(1)由系統(tǒng)抽樣知識(shí)知,第一組1~8號(hào);第二組為9~16號(hào);第三組為17~24號(hào);第四組為25~32號(hào);第五組為33~40號(hào).第一組抽出號(hào)碼為2,則依次為10,18,26,34.(2)由系統(tǒng)抽樣的定義知,分段間隔為eq\f(1000,40)=25.故答案為C.答案(1)2,10,18,26,34(2)C規(guī)律方法(1)系統(tǒng)抽樣又稱“等距抽樣”,所以依次抽取的樣本對(duì)應(yīng)的號(hào)碼就組成一個(gè)等差數(shù)列,首項(xiàng)就是第1組所抽取的樣本號(hào)碼,公差為間隔數(shù),根據(jù)等差數(shù)列的通項(xiàng)公式就可以確定每一組內(nèi)所要抽取的樣本號(hào)碼,但有時(shí)也不是按一定間隔抽取的.(2)系統(tǒng)抽樣時(shí),如果總體中的個(gè)體數(shù)不能被樣本容量整除時(shí),可以先用簡(jiǎn)單隨機(jī)抽樣從總體中剔除幾個(gè)個(gè)體,然后再按系統(tǒng)抽樣進(jìn)行.【訓(xùn)練2】(1)從編號(hào)為1~50的50枚最新研制的某種型號(hào)的導(dǎo)彈中隨機(jī)抽取5枚來(lái)進(jìn)行發(fā)射實(shí)驗(yàn),若采用每部分選取的號(hào)碼間隔一樣的系統(tǒng)抽樣方法,則所選取5枚導(dǎo)彈的編號(hào)可能是()A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32(2)(2014·臨沂模擬)某班共有52人,現(xiàn)根據(jù)學(xué)生的學(xué)號(hào),用系統(tǒng)抽樣的方法,抽取一個(gè)容量為4的樣本,已知3號(hào)、29號(hào)、42號(hào)同學(xué)在樣本中,那么樣本中還有一個(gè)同學(xué)的學(xué)號(hào)是()A.10B.11C.12D.16解析(1)間隔距離為10,故可能編號(hào)是3,13,23,33,43.(2)因?yàn)?9號(hào)、42號(hào)的號(hào)碼差為13,所以3+13=16,即另外一個(gè)同學(xué)的學(xué)號(hào)是16.答案(1)B(2)D考點(diǎn)三分層抽樣【例3】(1)(2014·湖北卷)甲、乙兩套設(shè)備生產(chǎn)的同類型產(chǎn)品共4800件,采用分層抽樣的方法從中抽取一個(gè)容量為80的樣本進(jìn)行質(zhì)量檢測(cè).若樣本中有50件產(chǎn)品由甲設(shè)備生產(chǎn),則乙設(shè)備生產(chǎn)的產(chǎn)品總數(shù)為_(kāi)_______件.(2)某學(xué)校高一、高二、高三年級(jí)的學(xué)生人數(shù)之比為3∶3∶4,現(xiàn)用分層抽樣的方法從該校高中三個(gè)年級(jí)的學(xué)生中抽取容量為50的樣本,則應(yīng)從高二年級(jí)抽取________名學(xué)生.解析(1)由題意知,甲、乙兩套設(shè)備產(chǎn)品數(shù)量抽樣比為5∶3,故乙設(shè)備生產(chǎn)的產(chǎn)品共4800×eq\f(3,8)=1800(件).(2)高二年級(jí)學(xué)生人數(shù)占總數(shù)的eq\f(3,3+3+4)=eq\f(3,10).樣本容量為50,則高二年級(jí)抽?。?0×eq\f(3,10)=15(名)學(xué)生.答案(1)1800(2)15規(guī)律方法在分層抽樣的過(guò)程中,為了保證每個(gè)個(gè)體被抽到的可能性是相同的,這就要求各層所抽取的個(gè)體數(shù)與該層所包含的個(gè)體數(shù)之比等于樣本容量與總體的個(gè)體數(shù)之比,即ni∶Ni=n∶N.【訓(xùn)練3】(1)(2014·云南檢測(cè))某公司一共有職工200人,其中老年人25人,中年人75人,青年人100人,有關(guān)部門為研究老年人、中年人、青年人對(duì)公司發(fā)展的態(tài)度問(wèn)題,現(xiàn)在用分層抽樣的方法從這個(gè)公司抽取m人進(jìn)行問(wèn)卷調(diào)查,如果抽到老年人3人,那么m=()A.16B.20C.24D.28(2)(2014·廣東卷)已知某地區(qū)中小學(xué)生人數(shù)和近視情況分別如圖1和圖2所示.為了解該地區(qū)中小學(xué)生的近視形成原因,用分層抽樣的方法抽取2%的學(xué)生進(jìn)行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為()A.100,10B.200,10C.100,20D.200,20解析(1)由eq\f(3,25)=eq\f(m,200),解得m=24,故選C.(2)共有10000名學(xué)生,樣本容量為10000×2%=200,高中生近視人數(shù)200×eq\f(1,5)×eq\f(1,2)=20,故選D.答案(1)C(2)D[思想方法]三種抽樣方法中簡(jiǎn)單隨機(jī)抽樣是最基本的抽樣方法,是其他兩種方法的基礎(chǔ),適用范圍不同,要根據(jù)總體的具體情況選用不同的方法;它們的共同點(diǎn)都是等概率抽樣,即抽樣過(guò)程中每個(gè)個(gè)體被抽取的概率相等,體現(xiàn)了這三種抽樣方法的客觀性和公平性,若樣本容量為n,總體的個(gè)體數(shù)為N,則用這三種方法抽樣時(shí),每一個(gè)個(gè)體被抽到的概率都是eq\f(n,N).[易錯(cuò)防范]應(yīng)用分層抽樣應(yīng)遵循的三點(diǎn):(1)分層,將相似的個(gè)體歸為一類,即為一層,分層要求每層的各個(gè)個(gè)體互不交叉,即不重復(fù)不遺漏.(2)分層保證每個(gè)個(gè)體等可能被抽取,需遵循在各層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,每層樣本數(shù)量與每層個(gè)體數(shù)量的比與這層個(gè)體數(shù)量與總體容量的比相等.(3)若各層應(yīng)抽取的個(gè)體數(shù)不都是整數(shù),則應(yīng)當(dāng)調(diào)整樣本容量,先剔除“多余”的個(gè)體.基礎(chǔ)鞏固題組(建議用時(shí):30分鐘)一、選擇題1.某中學(xué)進(jìn)行了該學(xué)年度期末統(tǒng)一考試,該校為了了解高一年級(jí)1000名學(xué)生的考試成績(jī),從中隨機(jī)抽取了100名學(xué)生的成績(jī),就這個(gè)問(wèn)題來(lái)說(shuō),下面說(shuō)法正確的是 ()A.1000名學(xué)生是總體B.每個(gè)學(xué)生是個(gè)體C.1000名學(xué)生的成績(jī)是一個(gè)個(gè)體D.樣本的容量是100解析1000名學(xué)生的成績(jī)是總體,其容量是1000,100名學(xué)生的成績(jī)組成樣本,其容量是100.答案D2.(2014·西安質(zhì)檢)現(xiàn)要完成下列3項(xiàng)抽樣調(diào)查:①?gòu)?0盒酸奶中抽取3盒進(jìn)行食品衛(wèi)生檢查.②科技報(bào)告廳有32排,每排有40個(gè)座位,有一次報(bào)告會(huì)恰好坐滿了聽(tīng)眾,報(bào)告會(huì)結(jié)束后,為了聽(tīng)取意見(jiàn),需要請(qǐng)32名聽(tīng)眾進(jìn)行座談.③高新中學(xué)共有160名教職工,其中一般教師120名,行政人員16名,后勤人員24名,為了了解教職工對(duì)學(xué)校在校務(wù)公開(kāi)方面的意見(jiàn),擬抽取一個(gè)容量為20的樣本.較為合理的抽樣方法是 ()A.①簡(jiǎn)單隨機(jī)抽樣,②系統(tǒng)抽樣,③分層抽樣B.①簡(jiǎn)單隨機(jī)抽樣,②分層抽樣,③系統(tǒng)抽樣C.①系統(tǒng)抽樣,②簡(jiǎn)單隨機(jī)抽樣,③分層抽樣D.①分層抽樣,②系統(tǒng)抽樣,③簡(jiǎn)單隨機(jī)抽樣解析對(duì)于①,個(gè)體沒(méi)有差異且總數(shù)不多可用隨機(jī)抽樣法,是簡(jiǎn)單隨機(jī)抽樣;對(duì)于②,將總體分成均衡的若干部分指的是將總體分段,在第1段內(nèi)采用簡(jiǎn)單隨機(jī)抽樣確定一個(gè)起始編號(hào),在此編號(hào)的基礎(chǔ)上加上分段間隔的整數(shù)倍即為抽樣編號(hào),是系統(tǒng)抽樣;對(duì)于③,個(gè)體有明顯的差異,所以選用分層抽樣,故選A.答案A3.某單位有840名職工,現(xiàn)采用系統(tǒng)抽樣方法抽取42人做問(wèn)卷調(diào)查,將840人按1,2,…,840隨機(jī)編號(hào),則抽取的42人中,編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為 ()A.11 B.12C.13 D.14解析由eq\f(840,42)=20,即每20人抽取1人,所以抽取編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為eq\f(720-480,20)=eq\f(240,20)=12(人).答案B4.某工廠在12月份共生產(chǎn)了3600雙皮靴,在出廠前要檢查這批產(chǎn)品的質(zhì)量,決定采用分層抽樣的方法進(jìn)行抽取,若從一、二、三車間抽取的產(chǎn)品數(shù)分別為a,b,c,且a,b,c構(gòu)成等差數(shù)列,則第二車間生產(chǎn)的產(chǎn)品數(shù)為 ()A.800 B.1000 C.1200 D解析因?yàn)閍,b,c成等差數(shù)列,所以2b=a+c,即第二車間抽取的產(chǎn)品數(shù)占抽樣產(chǎn)品總數(shù)的三分之一,根據(jù)分層抽樣的性質(zhì)可知,第二車間生產(chǎn)的產(chǎn)品數(shù)占12月份生產(chǎn)總數(shù)的三分之一,即為1200雙皮靴.答案C5.(1)某學(xué)校為了了解2014年高考數(shù)學(xué)學(xué)科的考試成績(jī),在高考后對(duì)1200名學(xué)生進(jìn)行抽樣調(diào)查,其中文科400名考生,理科600名考生,藝術(shù)和體育類考生共200名,從中抽取120名考生作為樣本.(2)從10名家長(zhǎng)中抽取3名參加座談會(huì).Ⅰ.簡(jiǎn)單隨機(jī)抽樣法;Ⅱ.系統(tǒng)抽樣法;Ⅲ.分層抽樣法.問(wèn)題與方法配對(duì)正確的是 ()A.(1)Ⅲ,(2)Ⅰ B.(1)Ⅰ,(2)ⅡC.(1)Ⅱ,(2)Ⅲ D.(1)Ⅲ,(2)Ⅱ解析通過(guò)分析可知,對(duì)于(1),應(yīng)采用分層抽樣法,對(duì)于(2),應(yīng)采用簡(jiǎn)單隨機(jī)抽樣法.答案A二、填空題6.課題組進(jìn)行城市空氣質(zhì)量調(diào)查,按地域把24個(gè)城市分成甲、乙、丙三組,對(duì)應(yīng)的城市數(shù)分別為4,12,8,若用分層抽樣抽取6個(gè)城市,則丙組中應(yīng)抽取的城市數(shù)為_(kāi)_______.解析由已知得抽樣比為eq\f(6,24)=eq\f(1,4),∴丙組中應(yīng)抽取的城市數(shù)為8×eq\f(1,4)=2.答案27.(2015·青島模擬)某班級(jí)有50名學(xué)生,現(xiàn)要采取系統(tǒng)抽樣的方法在這50名學(xué)生中抽出10名學(xué)生,將這50名學(xué)生隨機(jī)編號(hào)1~50號(hào),并分組,第一組1~5號(hào),第二組6~10號(hào),…,第十組46~50號(hào),若在第三組中抽得號(hào)碼為12的學(xué)生,則在第八組中抽得號(hào)碼為_(kāi)_______的學(xué)生.解析因?yàn)?2=5×2+2,即第三組抽出的是第二個(gè)同學(xué),所以每一組都相應(yīng)抽出第二個(gè)同學(xué),所以第8組中抽出的號(hào)碼為5×7+2=37號(hào).答案37
8.200名職工年齡分布如圖所示,從中隨機(jī)抽40名職工作樣本,采用系統(tǒng)抽樣方法,按1~200編號(hào)為40組,分別為1~5,6~10,…,196~200,第5組抽取號(hào)碼為22,第8組抽取號(hào)碼為_(kāi)_____.若采用分層抽樣,40歲以下年齡段應(yīng)抽取________人.解析將1~200編號(hào)分為40組,則每組的間隔為5,其中第5組抽取號(hào)碼為22,則第8組抽取的號(hào)碼應(yīng)為22+3×5=37;由已知條件200名職工中40歲以下的職工人數(shù)為200×50%=100,設(shè)在40歲以下年齡段中抽取x人,則eq\f(40,200)=eq\f(x,100),解得x=20.答案3720三、解答題9.某初級(jí)中學(xué)共有學(xué)生2000名,各年級(jí)男、女生人數(shù)如下表:初一年級(jí)初二年級(jí)初三年級(jí)女生373xy男生377370z已知在全校學(xué)生中隨機(jī)抽取1名,抽到初二年級(jí)女生的概率是0.19.(1)求x的值;(2)現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,問(wèn)應(yīng)在初三年級(jí)抽取多少名?解(1)∵eq\f(x,2000)=0.19.∴x=380.(2)初三年級(jí)人數(shù)為y+z=2000-(373+377+380+370)=500,現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,應(yīng)在初三年級(jí)抽取的人數(shù)為:eq\f(48,2000)×500=12名.10.某政府機(jī)關(guān)有在編人員100人,其中副處級(jí)以上干部10人,一般干部70人,工人20人.上級(jí)機(jī)關(guān)為了了解政府機(jī)構(gòu)改革意見(jiàn),要從中抽取一個(gè)容量為20的樣本,試確定用何種方法抽取,請(qǐng)具體實(shí)施抽取.解用分層抽樣方法抽?。唧w實(shí)施抽取如下:(1)∵20∶100=1∶5,∴eq\f(10,5)=2,eq\f(70,5)=14,eq\f(20,5)=4,∴從副處級(jí)以上干部中抽取2人,從一般干部中抽取14人,從工人中抽取4人.(2)因副處級(jí)以上干部與工人的人數(shù)較少,他們分別按1~10編號(hào)與1~20編號(hào),然后采用抽簽法分別抽取2人和4人;對(duì)一般干部70人采用00,01,02,…,69編號(hào),然后用隨機(jī)數(shù)表法抽取14人.(3)將2人,4人,14人的編號(hào)匯合在一起就取得了容量為20的樣本.能力提升題組(建議用時(shí):20分鐘)11.某初級(jí)中學(xué)有學(xué)生270人,其中一年級(jí)108人,二、三年級(jí)各81人,現(xiàn)要利用抽樣方法抽取10人參加某項(xiàng)調(diào)查,考慮選用簡(jiǎn)單隨機(jī)抽樣、分層抽樣和系統(tǒng)抽樣三種方案,使用簡(jiǎn)單隨機(jī)抽樣和分層抽樣時(shí),將學(xué)生按一、二、三年級(jí)依次統(tǒng)一編號(hào)為1,2,…,270,使用系統(tǒng)抽樣時(shí),將學(xué)生統(tǒng)一隨機(jī)編號(hào)為1,2,…,270,并將整個(gè)編號(hào)依次分為10段,如果抽得號(hào)碼有下列四種情況:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.關(guān)于上述樣本的下列結(jié)論中,正確的是 ()A.②、③都不能為系統(tǒng)抽樣B.②、④都不能為分層抽樣C.①、④都可能為系統(tǒng)抽樣D.①、③都可能為分層抽樣解析①在1~108之間有4個(gè),109~189之間有3個(gè),190~270之間有3個(gè),符合分層抽樣的規(guī)律,可能是分層抽樣.同時(shí),從第二個(gè)數(shù)據(jù)起每個(gè)數(shù)據(jù)與其前一個(gè)的差都為27,符合系統(tǒng)抽樣的規(guī)律,則可能是系統(tǒng)抽樣得到的;同理③符合分層抽樣的規(guī)律,可能是分層抽樣時(shí),從第二個(gè)數(shù)據(jù)起每個(gè)數(shù)據(jù)與其前一個(gè)的差都為27,符合系統(tǒng)抽樣的規(guī)律,則可能是系統(tǒng)抽樣得到的,故選D.答案D12.(2015·青島模擬)將參加夏令營(yíng)的600名學(xué)生編號(hào)為001,002,…,600.采用系統(tǒng)抽樣方法抽取一個(gè)容量為50的樣本,且隨機(jī)抽得的號(hào)碼為003.這600名學(xué)生分住在三個(gè)營(yíng)區(qū),從001到300在第Ⅰ營(yíng)區(qū),從301到495在第Ⅱ營(yíng)區(qū),從496到600在第Ⅲ營(yíng)區(qū),三個(gè)營(yíng)區(qū)被抽中的人數(shù)依次為 ()A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9解析由題意及系統(tǒng)抽樣的定義可知,將這600名學(xué)生按編號(hào)依次分成50組,每一組各有12名學(xué)生,第k(k∈N*)組抽中的號(hào)碼是3+12(k-1).令3+12(k-1)≤300得k≤eq\f(103,4),因此第Ⅰ營(yíng)區(qū)被抽中的人數(shù)是25;令300<3+12(k-1)≤495得eq\f(103,4)<k≤42,因此第Ⅱ營(yíng)區(qū)被抽中的人數(shù)是42-25=17.結(jié)合各選項(xiàng)知,選B.答案B13.一個(gè)總體中有90個(gè)個(gè)體,隨機(jī)編號(hào)0,1,2,…,89,依從小到大的編號(hào)順序平均分成9個(gè)小組,組號(hào)依次為1,2,3,…,9.現(xiàn)用系統(tǒng)抽樣方法抽取一個(gè)容量為9的樣本,規(guī)定如果在第1組隨機(jī)抽取的號(hào)碼為m,那么在第k組中抽取的號(hào)碼個(gè)位數(shù)字與m+k的個(gè)位數(shù)字相同,若m=8,則在第8組中抽取的號(hào)碼是________.解析由題意知:m=8,k=8,則m+k=16,也就是第8組抽取的號(hào)碼個(gè)位數(shù)字為6,十位數(shù)字為8-1=7,故抽取的號(hào)碼為76.答案7614.某公路設(shè)計(jì)院有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取n個(gè)人參加市里召開(kāi)的科學(xué)技術(shù)大會(huì).如果采用系統(tǒng)抽樣和分層抽樣的方法抽取,不用剔除個(gè)體,如果參會(huì)人數(shù)增加1個(gè),則在采用系統(tǒng)抽樣時(shí),需要在總體中先剔除1個(gè)個(gè)體,求n.解總體容量為6+12+18=36.當(dāng)樣本容量是n時(shí),由題意知,系統(tǒng)抽樣的間隔為eq\f(36,n),分層抽樣的比例是eq\f(n,36),抽取的工程師人數(shù)為eq\f(n,36)×6=eq\f(n,6),技術(shù)員人數(shù)為eq\f(n,36)×12=eq\f(n,3),技工人數(shù)為eq\f(n,36)×18=eq\f(n,2),所以n應(yīng)是6的倍數(shù),36的約數(shù),即n=6,12,18.當(dāng)樣本容量為(n+1)時(shí),總體容量是35人,系統(tǒng)抽樣的間隔為eq\f(35,n+1),因?yàn)閑q\f(35,n+1)必須是整數(shù),所以n只能取6.即樣本容量n=6.
第2講用樣本估計(jì)總體最新考綱1.了解分布的意義和作用,會(huì)列頻率分布表,會(huì)畫(huà)頻率分布直方圖、頻率折線圖、莖葉圖,理解他們各自的特點(diǎn);2.理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會(huì)計(jì)算數(shù)據(jù)標(biāo)準(zhǔn)差;3.能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋;4.會(huì)用樣本的頻率分布估計(jì)總體分布,會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本數(shù)字特征,理解用樣本估計(jì)總體的思想;5.會(huì)用隨機(jī)抽樣的基本方法和樣本估計(jì)總體的思想解決一些簡(jiǎn)單的實(shí)際問(wèn)題.知識(shí)梳理1.用樣本的頻率分布估計(jì)總體分布(1)頻率分布:樣本中所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻數(shù)和樣本容量的比,就是該數(shù)據(jù)的頻率,所有數(shù)據(jù)(或者數(shù)據(jù)組)的頻率的分布變化規(guī)律叫做頻率分布.(2)作頻率分布直方圖的步驟:①求極差,即一組數(shù)據(jù)中的最大值與最小值的差;②決定組距與組數(shù);③將數(shù)據(jù)分組;④列頻率分布表;⑤畫(huà)頻率分布直方圖.在頻率分布直方圖中,縱軸表示eq\f(頻率,組距),數(shù)據(jù)落在各小組內(nèi)的頻率用各小長(zhǎng)方形的面積表示,各小長(zhǎng)方形的面積總和等于1.(3)總體密度曲線①頻率分布折線圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),就得到頻率分布折線圖.②總體密度曲線:隨著樣本容量的增加,作圖時(shí)所分的組數(shù)增加,組距減小,相應(yīng)的頻率分布折線圖就會(huì)越來(lái)越接近于一條光滑的曲線,統(tǒng)計(jì)中稱之為總體密度曲線.(4)莖葉圖:統(tǒng)計(jì)中還有一種被用來(lái)表示數(shù)據(jù)的圖叫莖葉圖,莖是指中間一列數(shù),葉是從莖的旁邊生長(zhǎng)出來(lái)的數(shù).當(dāng)樣本數(shù)據(jù)較少時(shí),用莖葉圖表示數(shù)據(jù)的效果較好,它不但可以保留所有信息,而且可以隨時(shí)記錄,給數(shù)據(jù)的記錄和表示都帶來(lái)方便.2.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征(1)眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).(2)中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).(3)平均數(shù):樣本數(shù)據(jù)的算術(shù)平均數(shù),即eq\o(x,\s\up6(-))=eq\f(1,n)(x1+x2+…+xn).(4)樣本方差、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差s=eq\r(\f(1,n)[(x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2]).其中xn是樣本數(shù)據(jù)的第n項(xiàng),n是樣本容量,eq\o(x,\s\up6(-))是平均數(shù).標(biāo)準(zhǔn)差是反映總體波動(dòng)大小的特征數(shù),樣本方差是標(biāo)準(zhǔn)差的平方.通常用樣本方差估計(jì)總體方差,當(dāng)樣本容量接近總體容量時(shí),樣本方差很接近總體方差.診斷自測(cè)1.判斷正誤(在括號(hào)內(nèi)打“√”或“×”)精彩PPT展示(1)在頻率分布直方圖中,小矩形的高表示頻率.(×)(2)平均數(shù)、眾數(shù)與中位數(shù)從不同的角度描述了一組數(shù)據(jù)的集中趨勢(shì).(√)(3)從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就被抹掉了.(√)(4)莖葉圖一般左側(cè)的葉按從大到小的順序?qū)?,右?cè)的葉按從小到大的順序?qū)?,相同的?shù)據(jù)可以只記一次.(×)2.對(duì)某商店一個(gè)月內(nèi)每天的顧客人數(shù)進(jìn)行了統(tǒng)計(jì),得到樣本的莖葉圖(如圖所示),則該樣本的中位數(shù)、眾數(shù)、極差分別是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53解析由題意知各數(shù)為12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位數(shù)是46,眾數(shù)是45,最大數(shù)為68,最小數(shù)為12,極差為68-12=56.答案A3.(2014·山東卷)為了研究某藥品的療效,選取若干名志愿者進(jìn)行臨床試驗(yàn).所有志愿者的舒張壓數(shù)據(jù)(單位:kPa)的分組區(qū)間為[12,13),[13,14),[14,15),[15,16),[16,17],將其按從左到右的順序分別編號(hào)為第一組,第二組,……,第五組.下圖是根據(jù)試驗(yàn)數(shù)據(jù)制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒(méi)有療效的有6人,則第三組中有療效的人數(shù)為()A.6B.8C.12D.18解析全體志愿者共有:eq\f(20,(0.24+0.16)×1)=50(人),所以第三組有志愿者:0.36×1×50=18(人),∵第三組中沒(méi)有療效的有6人,∴有療效的有18-6=12(人),故選C.答案C4.由正整數(shù)組成的一組數(shù)據(jù)x1,x2,x3,x4,其平均數(shù)和中位數(shù)都是2,且標(biāo)準(zhǔn)差等于1,則這組數(shù)據(jù)為_(kāi)_______(從小到大排列).解析不妨設(shè)x1≤x2≤x3≤x4,由中位數(shù)及平均數(shù)均為2,得x1+x4=x2+x3=4,故這四個(gè)數(shù)只可能為1,1,3,3或1,2,2,3或2,2,2,2,由標(biāo)準(zhǔn)差為1可得這四個(gè)數(shù)只能為1,1,3,3.答案1,1,3,35.(人教A必修3P82A6改編)甲乙兩臺(tái)機(jī)床同時(shí)生產(chǎn)一種零件,10天中,兩臺(tái)機(jī)床每天出的次品數(shù)分別是:甲0102203124乙2311021101則機(jī)床性能較好的為_(kāi)_______.解析∵eq\o(x,\s\up6(-))甲=1.5,eq\o(x,\s\up6(-))乙=1.2,seq\o\al(2,甲)=1.65,seq\o\al(2,乙)=0.76,∴seq\o\al(2,乙)<seq\o\al(2,甲),∴乙機(jī)床性能較好.答案乙考點(diǎn)一頻率分布直方圖【例1】(2014·新課標(biāo)全國(guó)Ⅰ卷)從某企業(yè)生產(chǎn)的某種產(chǎn)品中抽取100件,測(cè)量這些產(chǎn)品的一項(xiàng)質(zhì)量指標(biāo)值,由測(cè)量結(jié)果得如下頻數(shù)分布表:質(zhì)量指標(biāo)值分組[75,85)[85,95)[95,105)[105,115)[115,125)頻數(shù)62638228(1)作出這些數(shù)據(jù)的頻率分布直方圖:(2)估計(jì)這種產(chǎn)品質(zhì)量指標(biāo)值的平均數(shù)及方差(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表);(3)根據(jù)以上抽樣調(diào)查數(shù)據(jù),能否認(rèn)為該企業(yè)生產(chǎn)的這種產(chǎn)品符合“質(zhì)量指標(biāo)值不低于95的產(chǎn)品至少要占全部產(chǎn)品80%”的規(guī)定?解(1)(2)質(zhì)量指標(biāo)值的樣本平均數(shù)為eq\o(x,\s\up6(-))=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.質(zhì)量指標(biāo)值的樣本方差為s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以這種產(chǎn)品質(zhì)量指標(biāo)值的平均數(shù)的估計(jì)值為100,方差的估計(jì)值為104.(3)質(zhì)量指標(biāo)值不低于95的產(chǎn)品所占比例的估計(jì)值為0.38+0.22+0.08=0.68.由于該估計(jì)值小于0.8,故不能認(rèn)為該企業(yè)生產(chǎn)的這種產(chǎn)品符合“質(zhì)量指標(biāo)值不低于95的產(chǎn)品至少要占全部產(chǎn)品80%”的規(guī)定.規(guī)律方法解決頻率分布直方圖的問(wèn)題,關(guān)鍵在于找出圖中數(shù)據(jù)之間的聯(lián)系.這些數(shù)據(jù)中,直接的有組距、eq\f(頻率,組距),間接的有頻率、小長(zhǎng)方形的面積,合理使用這些數(shù)據(jù),再結(jié)合兩個(gè)等量關(guān)系:小長(zhǎng)方形面積=組距×eq\f(頻率,組距)=頻率,小長(zhǎng)方形面積之和等于1,即頻率之和等于1,就可以解決直方圖的有關(guān)問(wèn)題.【訓(xùn)練1】某工廠對(duì)一批產(chǎn)品進(jìn)行了抽樣檢測(cè),如圖是根據(jù)抽樣檢測(cè)后的產(chǎn)品凈重(單位:克)數(shù)據(jù)繪制的頻率分布直方圖,其中產(chǎn)品凈重的范圍是[96,106],樣本數(shù)據(jù)分組為[96,98),[98,100),[100,102),[102,104),[104,106].已知樣本中產(chǎn)品凈重小于100克的個(gè)數(shù)是36,則樣本中凈重大于或等于98克并且小于104克的產(chǎn)品的個(gè)數(shù)是()A.90B.75C.60D.45解析產(chǎn)品凈重小于100克的頻率為(0.050+0.100)×2=0.300,已知樣本中產(chǎn)品凈重小于100克的個(gè)數(shù)是36.設(shè)樣本容量為n,則eq\f(36,n)=0.300,所以n=120,凈重大于或等于98克并且小于104克的產(chǎn)品的頻率為(0.100+0.150+0.125)×2=0.750,所以樣本中凈重大于或等于98克并且小于104克的產(chǎn)品的個(gè)數(shù)是120×0.750=90.答案A考點(diǎn)二莖葉圖【例2】(2014·廣東卷)某車間20名工人年齡數(shù)據(jù)如下表:年齡(歲)工人數(shù)(人)191283293305314323401合計(jì)20(1)求這20名工人年齡的眾數(shù)與極差;(2)以十位數(shù)為莖,個(gè)位數(shù)為葉,作出這20名工人年齡的莖葉圖;(3)求這20名工人年齡的方差.解(1)由題意可知,這20名工人年齡的眾數(shù)是30,極差是40-19=21.(2)這20名工人年齡的莖葉圖如圖所示:(3)這20名工人年齡的平均數(shù)為eq\o(x,\s\up6(-))=eq\f(1,20)(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴這20名工人年齡的方差為s2=eq\f(1,20)eq\o(∑,\s\up6(20),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))2=eq\f(112+6×22+7×12+5×02+102,20)=eq\f(252,20)=12.6.規(guī)律方法(1)莖葉圖的繪制需注意:①“葉”的位置只有一個(gè)數(shù)字,而“莖”的位置的數(shù)字位數(shù)一般不需要統(tǒng)一;②重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉”的位置上的數(shù)據(jù).(2)莖葉圖通常用來(lái)記錄兩位數(shù)的數(shù)據(jù),可以用來(lái)分析單組數(shù)據(jù),也可以用來(lái)比較兩組數(shù)據(jù).通過(guò)莖葉圖可以確定數(shù)據(jù)的中位數(shù),數(shù)據(jù)大致集中在哪個(gè)莖,數(shù)據(jù)是否關(guān)于該莖對(duì)稱,數(shù)據(jù)分布是否均勻等.【訓(xùn)練2】(2015·??谡{(diào)研)某樣本數(shù)據(jù)的莖葉圖如圖所示,若該組數(shù)據(jù)的中位數(shù)為85,則該組數(shù)據(jù)的平均數(shù)為_(kāi)_______.解析依題意得,將樣本數(shù)據(jù)由小到大排列,中間的兩個(gè)數(shù)之和等于85×2=170,因此x=6,樣本數(shù)據(jù)的平均數(shù)等于eq\f(1,10)(70×2+80×6+90×2+53)=85.3.答案85.3考點(diǎn)三用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征【例3】甲、乙二人參加某體育項(xiàng)目訓(xùn)練,近期的五次測(cè)試成績(jī)得分情況如圖.(1)分別求出兩人得分的平均數(shù)與方差;(2)根據(jù)圖和上面算得的結(jié)果,對(duì)兩人的訓(xùn)練成績(jī)作出評(píng)價(jià).解(1)由題圖可得甲、乙兩人五次測(cè)試的成績(jī)分別為甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.eq\o(x,\s\up6(-))甲=eq\f(10+13+12+14+16,5)=13,eq\o(x,\s\up6(-))乙=eq\f(13+14+12+12+14,5)=13,seq\o\al(2,甲)=eq\f(1,5)[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,seq\o\al(2,乙)=eq\f(1,5)[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由seq\o\al(2,甲)>seq\o\al(2,乙)可知乙的成績(jī)較穩(wěn)定.從折線圖看,甲的成績(jī)基本呈上升狀態(tài),而乙的成績(jī)上下波動(dòng),可知甲的成績(jī)?cè)诓粩嗵岣?,而乙的成?jī)則無(wú)明顯提高.規(guī)律方法平均數(shù)與方差都是重要的數(shù)字特征,是對(duì)總體的一種簡(jiǎn)明的描述,它們所反映的情況有著重要的實(shí)際意義,平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢(shì),方差和標(biāo)準(zhǔn)差描述其波動(dòng)大?。居?xùn)練3】(1)將某選手的9個(gè)得分去掉1個(gè)最高分,去掉1個(gè)最低分,7個(gè)剩余分?jǐn)?shù)的平均分為91.現(xiàn)場(chǎng)作的9個(gè)分?jǐn)?shù)的莖葉圖后來(lái)有1個(gè)數(shù)據(jù)模糊,無(wú)法辨認(rèn),在圖中以x表示:eq\a\vs4\al(\a\al(8,9))\b\lc\|(\a\vs4\al\co1(77,4\a\vs4\al(010x91)))則7個(gè)剩余分?jǐn)?shù)的方差為()A.eq\f(116,9)B.eq\f(36,7)C.36D.eq\f(6\r(7),7)(2)甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績(jī)的條形統(tǒng)計(jì)圖如圖所示,則()A.甲的成績(jī)的平均數(shù)小于乙的成績(jī)的平均數(shù)B.甲的成績(jī)的中位數(shù)等于乙的成績(jī)的中位數(shù)C.甲的成績(jī)的方差小于乙的成績(jī)的方差D.甲的成績(jī)的極差小于乙的成績(jī)的極差解析(1)由題意知eq\f(87+94+90+91+90+90+x+91,7)=91,解得x=4.所以s2=eq\f(1,7)[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=eq\f(1,7)(16+9+1+0+1+9+0)=eq\f(36,7).(2)由題意可知,甲的成績(jī)?yōu)?,5,6,7,8,乙的成績(jī)?yōu)?,5,5,6,9.所以甲、乙的成績(jī)的平均數(shù)均為6,A錯(cuò);甲、乙的成績(jī)的中位數(shù)分別為6,5,B錯(cuò);甲、乙的成績(jī)的方差分別為eq\f(1,5)×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,eq\f(1,5)×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=eq\f(12,5),C對(duì);甲、乙的成績(jī)的極差均為4,D錯(cuò).答案(1)B(2)C[思想方法]1.用樣本頻率分布來(lái)估計(jì)總體分布的重點(diǎn)是頻率分布表和頻率分布直方圖的繪制及用樣本頻率分布估計(jì)總體分布;難點(diǎn)是頻率分布表和頻率分布直方圖的理解及應(yīng)用.在計(jì)數(shù)和計(jì)算時(shí)一定要準(zhǔn)確,在繪制小矩形時(shí),寬窄要一致.通過(guò)頻率分布表和頻率分布直方圖可以對(duì)總體作出估計(jì).2.莖葉圖、頻率分布表和頻率分布直方圖都是用來(lái)描述樣本數(shù)據(jù)的分布情況的.莖葉圖由所有樣本數(shù)據(jù)構(gòu)成,沒(méi)有損失任何樣本信息,可以隨時(shí)記錄;而頻率分布表和頻率分布直方圖則損失了樣本的一些信息,必須在完成抽樣后才能制作.3.若取值x1,x2,…,xn的頻率分別為p1,p2,…,pn,則其平均值為x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均數(shù)為eq\o(x,\s\up6(-)),方差為s2,則ax1+b,ax2+b,…,axn+b的平均數(shù)為aeq\o(x,\s\up6(-))+b,方差為a2s2.[易錯(cuò)防范]1.在使用莖葉圖時(shí),一定要注意看清楚所有的樣本數(shù)據(jù),弄清楚這個(gè)圖中的數(shù)字特點(diǎn),不要漏掉了數(shù)據(jù),也不要混淆莖葉圖中莖與葉的含義.2.利用頻率分布直方圖求眾數(shù)、中位數(shù)與平均數(shù)時(shí),應(yīng)注意這三者的區(qū)分:(1)最高的矩形的中點(diǎn)即眾數(shù);(2)中位數(shù)左邊和右邊的直方圖的面積是相等的;(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.3.直方圖與條形圖不要搞混(1)條形圖是用條形的長(zhǎng)度表示各類別頻數(shù)的多少,其寬度(表示類別)是固定的;直方圖是用面積表示各組頻率的多少,矩形的高度表示每一組的頻率除以組距,寬度則表示各組的組距,因此其高度與寬度均有意義.(2)由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開(kāi)排列.基礎(chǔ)鞏固題組(建議用時(shí):40分鐘)一、選擇題1.(2014·青島檢測(cè))如圖是一容量為100的樣本的質(zhì)量的頻率分布直方圖,樣本質(zhì)量均在[5,20]內(nèi),其分組為[5,10),[10,15),[15,20],則樣本質(zhì)量落在[15,20]內(nèi)的頻數(shù)為()A.10 B.20C.30 D.40解析由題意得組距為5,故樣本質(zhì)量在[5,10),[10,15)內(nèi)的頻率分別為0.3和0.5,所以樣本質(zhì)量在[15,20]內(nèi)的頻率為1-0.3-0.5=0.2,頻數(shù)為100×0.2=20,故選B.答案B2.(2015·西安檢測(cè))某班級(jí)有50名學(xué)生,其中有30名男生和20名女生,隨機(jī)詢問(wèn)了該班五名男生和五名女生在某次數(shù)學(xué)測(cè)驗(yàn)中的成績(jī),五名男生的成績(jī)分別為86,94,88,92,90,五名女生的成績(jī)分別為88,93,93,88,93.下列說(shuō)法中一定正確的是 ()A.這種抽樣方法是一種分層抽樣B.這種抽樣方法是一種系統(tǒng)抽樣C.這五名男生成績(jī)的方差大于這五名女生成績(jī)的方差D.該班級(jí)男生成績(jī)的平均數(shù)小于該班女生成績(jī)的平均數(shù)解析依題意,顯然不能確定題中的抽樣方法是屬于哪種抽樣,因此選項(xiàng)A,B均不正確;選項(xiàng)D,僅有5名男生,5名女生的數(shù)學(xué)成績(jī),而不能得出該班男生成績(jī)的平均數(shù)小于該班女生成績(jī)的平均數(shù);對(duì)于C,注意到將這五個(gè)男生與女生的成績(jī)均按由小到大排列,這五名男生的成績(jī)相對(duì)較為分散,因此這五名男生成績(jī)的方差大于這五名女生成績(jī)的方差,故選C.答案C3.(2014·臨沂一模)某中學(xué)高三從甲、乙兩個(gè)班中各選出7名學(xué)生參加數(shù)學(xué)競(jìng)賽,他們?nèi)〉玫某煽?jī)(滿分100分)的莖葉圖如圖,其中甲班學(xué)生成績(jī)的眾數(shù)是85,乙班學(xué)生成績(jī)的中位數(shù)是83,則x+y的值為 ()A.7 B.8 C.9 D.10解析由莖葉圖可知,甲班學(xué)生成績(jī)的眾數(shù)是85,所以x=5.乙班學(xué)生成績(jī)的中位數(shù)是83,所以y=3,所以x+y=5+3=8.答案B4.(2015·東北三省三校聯(lián)考)在某次測(cè)量中得到的A樣本數(shù)據(jù)如下:42,43,46,52,42,50,若B樣本數(shù)據(jù)恰好是A樣本數(shù)據(jù)每個(gè)都減5后所得數(shù)據(jù),則A,B兩樣本的下列數(shù)字特征對(duì)應(yīng)相同的是 ()A.平均數(shù)B.標(biāo)準(zhǔn)差C.眾數(shù)D.中位數(shù)解析利用平均數(shù)、標(biāo)準(zhǔn)差、眾數(shù)、中位數(shù)等統(tǒng)計(jì)特征數(shù)的概念求解.由B樣本數(shù)據(jù)恰好是A樣本數(shù)據(jù)每個(gè)都減5后所得數(shù)據(jù),可得平均數(shù)、眾數(shù)、中位數(shù)分別是原來(lái)結(jié)果減去5,即與A樣本不相同,標(biāo)準(zhǔn)差不變,故選B.答案B5.(2015·沈陽(yáng)監(jiān)測(cè))某高校進(jìn)行自主招生,先從報(bào)名者中篩選出400人參加筆試,再按筆試成績(jī)擇優(yōu)選出100人參加面試.現(xiàn)隨機(jī)調(diào)查了24名筆試者的成績(jī),如下表所示:分?jǐn)?shù)段[60,65)[65,70)[70,75)[75,80)[80,85)[85,90]人數(shù)234951據(jù)此估計(jì)允許參加面試的分?jǐn)?shù)線大約是 ()A.75 B.80C.85 D.90解析因?yàn)閰⒓庸P試的400人中擇優(yōu)選出100人,故每個(gè)人被擇優(yōu)選出的概率P=eq\f(100,400)=eq\f(1,4),因?yàn)殡S機(jī)調(diào)查24名筆試者,則估計(jì)能夠參加面試的人數(shù)為24×eq\f(1,4)=6,觀察表格可知,分?jǐn)?shù)在[80,85)有5人,分?jǐn)?shù)在[85,90)的有1人,故面試的分?jǐn)?shù)線大約為80分,故選B.答案B二、填空題6.(2014·甘肅診斷)如圖是根據(jù)某賽季甲、乙兩名籃球運(yùn)動(dòng)員參加11場(chǎng)比賽的得分情況畫(huà)出的莖葉圖.若甲運(yùn)動(dòng)員的中位數(shù)為a,乙運(yùn)動(dòng)員的眾數(shù)為b,則a-b=________.解析由莖葉圖可知甲運(yùn)動(dòng)員的中位數(shù)為a=19,乙運(yùn)動(dòng)員的眾數(shù)為b=11,所以a-b=8.答案87.樣本中共有五個(gè)個(gè)體,其值分別為a,0,1,2,3.若該樣本的平均值為1,則樣本方差為_(kāi)_______.解析由題可知樣本的平均值為1,所以eq\f(a+0+1+2+3,5)=1,解得a=-1,所以樣本的方差為eq\f(1,5)[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案28.(2015·銀川檢測(cè))某企業(yè)3個(gè)分廠同時(shí)生產(chǎn)同一種電子產(chǎn)品,第一、二、三分廠的產(chǎn)量之比為1∶2∶1,用分層抽樣方法(每個(gè)分廠的產(chǎn)品為一層)從3個(gè)分廠生產(chǎn)的電子產(chǎn)品中共取100件作使用壽命的測(cè)試,由所得的測(cè)試結(jié)果算得從第一、二、三分廠取出的產(chǎn)品的使用壽命的平均值分別為980h,1020h,1032h,則抽取的100件產(chǎn)品的使用壽命的平均值為_(kāi)_______h.解析依題意,抽取的100件產(chǎn)品來(lái)自于第一、二、三分廠分別有25,50,25件,因此抽取的100件產(chǎn)品的使用壽命的平均值為eq\f(1,100)(980×25+1032×25+1020×50)=1013(h).答案1013三、解答題9.某校高一某班的某次數(shù)學(xué)測(cè)試成績(jī)(滿分為100分)的莖葉圖和頻率分布直方圖都受了不同程度的破壞,但可見(jiàn)部分如圖,據(jù)此解答下列問(wèn)題:(1)求分?jǐn)?shù)在[50,60]的頻率及全班人數(shù);(2)求分?jǐn)?shù)在[80,90]之間的頻數(shù),并計(jì)算頻率分布直方圖中[80,90]間的矩形的高.解(1)分?jǐn)?shù)在[50,60]的頻率為0.008×10=0.08.由莖葉圖知,分?jǐn)?shù)在[50,60]之間的頻數(shù)為2,所以全班人數(shù)為eq\f(2,0.08)=25.(2)分?jǐn)?shù)在[80,90]之間的頻數(shù)為25-2-7-10-2=4,頻率分布直方圖中[80,90]間的矩形的高為eq\f(4,25)÷10=0.016.10.(2014·北京卷)從某校隨機(jī)抽取100名學(xué)生,獲得了他們一周課外閱讀時(shí)間(單位:小時(shí))的數(shù)據(jù),整理得到數(shù)據(jù)分組及頻數(shù)分布表和頻率分布直方圖:組號(hào)分組頻數(shù)1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合計(jì)100(1)從該校隨機(jī)選取一名學(xué)生,試估計(jì)這名學(xué)生該周課外閱讀時(shí)間少于12小時(shí)的概率;(2)求頻率分布直方圖中的a,b的值;(3)假設(shè)同一組中的每個(gè)數(shù)據(jù)可用該組區(qū)間的中點(diǎn)值代替,試估計(jì)樣本中的100名學(xué)生該周課外閱讀時(shí)間的平均數(shù)在第幾組(只需寫出結(jié)論).解(1)根據(jù)頻數(shù)分布表知,100名學(xué)生中一周課外閱讀時(shí)間不少于12小時(shí)的學(xué)生共有6+2+2=10(名),所以樣本中的學(xué)生一周課外閱讀時(shí)間少于12小時(shí)的頻率是1-eq\f(10,100)=0.9.故從該校隨機(jī)選取一名學(xué)生,估計(jì)其該周課外閱讀時(shí)間少于12小時(shí)的概率為0.9.(2)課外閱讀時(shí)間落在組[4,6)內(nèi)的有17人,頻率為0.17,所以a=eq\f(頻率,組距)=eq\f(0.17,2)=0.085.課外閱讀時(shí)間落在組[8,10)內(nèi)的有25人,頻率為0.25,所以b=eq\f(頻率,組距)=eq\f(0.25,2)=0.125.(3)樣本中的100名學(xué)生該周課外閱讀時(shí)間的平均數(shù)在第4組.能力提升題組(建議用時(shí):25分鐘)11.某學(xué)校隨機(jī)抽取20個(gè)班,調(diào)查各班中有網(wǎng)上購(gòu)物經(jīng)歷的人數(shù),所得數(shù)據(jù)的莖葉圖如圖所示,以組距為5將數(shù)據(jù)分組成[0,5),[5,10),…,[30,35),[35,40]時(shí),所作的頻率分布直方圖是 ()073176443027554320385430解析由于頻率分布直方圖的組距為5,排除C、D,又[0,5),[5,10)兩組各一人,排除B,應(yīng)選A.答案A12.(2014·益陽(yáng)模擬)為了了解某校九年級(jí)1600名學(xué)生的體能情況,隨機(jī)抽查了部分學(xué)生,測(cè)試1分鐘仰臥起坐的成績(jī)(次數(shù)),將數(shù)據(jù)整理后繪制成如圖所示的頻率分布直方圖,根據(jù)統(tǒng)計(jì)圖的數(shù)據(jù),下列結(jié)論錯(cuò)誤的是 ()A.該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)的中位數(shù)為26.25次B.該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)的眾數(shù)為27.5次C.該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)超過(guò)30次的人數(shù)約有320人D.該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)少于20次的人數(shù)約有32人解析由題圖可知中位數(shù)是26.25次,眾數(shù)是27.5次,1分鐘仰臥起坐的次數(shù)超過(guò)30次的頻率為0.2,所以估計(jì)該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)超過(guò)30次的人數(shù)約有320人;1分鐘仰臥起坐的次數(shù)少于20次的頻率為0.1,所以該校九年級(jí)學(xué)生1分鐘仰臥起坐的次數(shù)少于20次的人數(shù)約有160人.故D是錯(cuò)誤的,選D.答案D13.在樣本的頻率分布直方圖中,共有4個(gè)小長(zhǎng)方形,這4個(gè)小長(zhǎng)方形的面積由小到大構(gòu)成等比數(shù)列{an},已知a2=2a1,且樣本容量為300,則小長(zhǎng)方形面積最大的一組的頻數(shù)為_(kāi)_______.解析∵小長(zhǎng)方形的面積由小到大構(gòu)成等比數(shù)列{an},且a2=2a1,∴樣本的頻率構(gòu)成一個(gè)等比數(shù)列,且公比為2,∴a1+2a1+4a1+8a1=15a1=1,∴a1=eq\f(1,15),∴小長(zhǎng)方形面積最大的一組的頻數(shù)為300×8a1=160.答案16014.為了比較兩種治療失眠癥的藥(分別稱為A藥,B藥)的療效,隨機(jī)地選取20位患者服用A藥,20位患者服用B藥,這40位患者在服用一段時(shí)間后,記錄他們?nèi)掌骄黾拥乃邥r(shí)間(單位:h),試驗(yàn)的觀測(cè)結(jié)果如下:服用A藥的20位患者日平均增加的睡眠時(shí)間:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B藥的20位患者日平均增加的睡眠時(shí)間:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5(1)分別計(jì)算兩組數(shù)據(jù)的平均數(shù),從計(jì)算結(jié)果看,哪種藥的療效更好?(2)根據(jù)兩組數(shù)據(jù)完成下面莖葉圖,從莖葉圖看,哪種藥的療效更好?解(1)設(shè)A藥觀測(cè)數(shù)據(jù)的平均數(shù)為eq\o(x,\s\up6(-))A,B藥觀測(cè)數(shù)據(jù)的平均數(shù)為eq\o(x,\s\up6(-))B,則eq\o(x,\s\up6(-))A=eq\f(1,20)(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.eq\o(x,\s\up6(-))B=eq\f(1,20)(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.則eq\o(x,\s\up6(-))A>eq\o(x,\s\up6(-))B,因此A藥的療效更好.(2)由觀測(cè)結(jié)果繪制如下莖葉圖:從莖葉圖可以看出,A藥療效的試驗(yàn)結(jié)果有eq\f(7,10)的葉集中在莖“2.”,“3.”上;B藥療效的試驗(yàn)結(jié)果有eq\f(7,10)的葉集中在莖“0.”,“1.”上.由上述可看出A藥的療效更好.
第3講變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例最新考綱1.會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系;2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程;3.了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用;4.了解回歸分析的基本思想、方法及其簡(jiǎn)單應(yīng)用.知識(shí)梳理1.變量間的相關(guān)關(guān)系(1)常見(jiàn)的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.(2)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)散布在左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的相關(guān)關(guān)系為負(fù)相關(guān).2.回歸分析對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫回歸分析.其基本步驟是:(ⅰ)畫(huà)散點(diǎn)圖;(ⅱ)求回歸直線方程;(ⅲ)用回歸直線方程作預(yù)報(bào).(1)回歸直線:如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.(2)回歸直線方程的求法——最小二乘法.設(shè)具有線性相關(guān)關(guān)系的兩個(gè)變量x,y的一組觀察值為(xi,yi)(i=1,2,…,n),則回歸直線方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x的系數(shù)為:其中eq\o(x,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))xi,eq\o(y,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))yi,(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))稱為樣本點(diǎn)的中心.(3)相關(guān)系數(shù)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng).r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性.3.獨(dú)立性檢驗(yàn)(1)分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這類變量稱為分類變量.(2)列聯(lián)表:列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表y1y2總計(jì)x1aBa+bx2cDc+d總計(jì)a+cb+da+b+c+d構(gòu)造一個(gè)隨機(jī)變量K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d為樣本容量.(3)獨(dú)立性檢驗(yàn)利用隨機(jī)變量K2來(lái)判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).診斷自測(cè)1.判斷正誤(在括號(hào)內(nèi)打“√”或“×”)精彩PPT展示(1)通過(guò)回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))可以估計(jì)和觀測(cè)變量的取值和變化趨勢(shì).(√)(2)事件X,Y關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的K2的觀測(cè)值越大.(√)(3)由獨(dú)立性檢驗(yàn)可知,有99%的把握認(rèn)為物理成績(jī)優(yōu)秀與數(shù)學(xué)成績(jī)有關(guān),某人數(shù)學(xué)成績(jī)優(yōu)秀,則他有99%的可能物理優(yōu)秀.(×)2.下面哪些變量是相關(guān)關(guān)系()A.出租車車費(fèi)與行駛的里程B.房屋面積與房屋價(jià)格C.身高與體重D.鐵塊的大小與質(zhì)量答案C3.為了評(píng)價(jià)某個(gè)電視欄目的改革效果,在改革前后分別從居民點(diǎn)抽取了100位居民進(jìn)行調(diào)查,經(jīng)過(guò)計(jì)算K2≈0.99,根據(jù)這一數(shù)據(jù)分析,下列說(shuō)法正確的是()A.有99%的人認(rèn)為該電視欄目?jī)?yōu)秀B.有99%的人認(rèn)為該電視欄目是否優(yōu)秀與改革有關(guān)系C.有99%的把握認(rèn)為該電視欄目是否優(yōu)秀與改革有關(guān)系D.沒(méi)有理由認(rèn)為該電視欄目是否優(yōu)秀與改革有關(guān)系解析只有K2≥6.635才能有99%的把握認(rèn)為該電視欄目是否優(yōu)秀與改革有關(guān)系,而既使K2≥6.635也只是對(duì)“該電視欄目是否優(yōu)秀與改革有關(guān)系”這個(gè)論斷成立的可能性大小的結(jié)論,與是否有99%的人等無(wú)關(guān).故只有D正確.答案D4.(2014·湖北卷)根據(jù)如下樣本數(shù)據(jù)x345678y4.02.5-0.50.5-2.0-3.0得到的回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),則()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0解析作出散點(diǎn)圖,由散點(diǎn)圖可知eq\o(b,\s\up6(^))<0,eq\o(a,\s\up6(^))>0,故選A.答案A5.(人教A選修2-3P95例1改編)在一項(xiàng)打鼾與患心臟病的調(diào)查中,共調(diào)查了1671人,經(jīng)過(guò)計(jì)算K2的觀測(cè)值k=27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是________的(填“有關(guān)”或“無(wú)關(guān)”).答案有關(guān)
考點(diǎn)一相關(guān)關(guān)系的判斷【例1】(1)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=eq\f(1,2)x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()A.-1B.0C.eq\f(1,2)D.1(2)對(duì)變量x,y有觀測(cè)數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點(diǎn)圖(1);對(duì)變量u,v有觀測(cè)數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點(diǎn)圖(2).由這兩個(gè)散點(diǎn)圖可以判斷()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負(fù)相關(guān)C.變量x與y負(fù)相關(guān),u與v正相關(guān)D.變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)解析(1)所有點(diǎn)均在直線上,則樣本相關(guān)系數(shù)最大即為1,故選D.(2)由圖(1)可知,各點(diǎn)整體呈遞減趨勢(shì),x與y負(fù)相關(guān);由圖(2)可知,各點(diǎn)整體呈遞增趨勢(shì),u與v正相關(guān).答案(1)D(2)C規(guī)律方法對(duì)兩個(gè)變量的相關(guān)關(guān)系的判斷有兩個(gè)方法:一是根據(jù)散點(diǎn)圖,具有很強(qiáng)的直觀性,直接得出兩個(gè)變量是正相關(guān)或負(fù)相關(guān);二是計(jì)算相關(guān)系數(shù)法,這種方法能比較準(zhǔn)確地反映相關(guān)程度,相關(guān)系數(shù)的絕對(duì)值越接近1,相關(guān)性就越強(qiáng),相關(guān)系數(shù)就是描述相關(guān)性強(qiáng)弱的,相關(guān)性有正相關(guān)和負(fù)相關(guān).【訓(xùn)練1】變量X與Y相對(duì)應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對(duì)應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關(guān)系數(shù),r2表示變量V與U之間的線性相關(guān)系數(shù),則()A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r1解析對(duì)于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關(guān),即r1>0;對(duì)于變量V與U而言,V隨U的增大而減小,故V與U負(fù)相關(guān),即r2<0,所以選C.答案C考點(diǎn)二回歸方程的求法及回歸分析【例2】(2014·新課標(biāo)全國(guó)Ⅱ卷)某地區(qū)2007年至2013年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表:年份2007200820092010201120122013年份代號(hào)t1234567人均純收入y2.93.33.64.44.85.25.9(1)求y關(guān)于t的線性回歸方程;(2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測(cè)該地區(qū)2015年農(nóng)村居民家庭人均純收入.附:回歸直線的斜率和截距的最小二乘估計(jì)公式分別為:eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(ti-\o(t,\s\up6(^)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(^))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(^)).解(1)由所給數(shù)據(jù)計(jì)算得eq\o(t,\s\up6(^))=eq\f(1,7)(1+2+3+4+5+6+7)=4,eq\o(y,\s\up6(^))=eq\f(1,7)(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,eq\o(∑,\s\up6(7),\s\do4(i=1))(ti-eq\o(t,\s\up6(-)))2=9+4+1+0+1+4+9=28,eq\o(∑,\s\up6(7),\s\do4(i=1))(ti-eq\o(t,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(7),\s\do4(i=1))(ti-\o(t,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(7),\s\do4(i=1))(ti-\o(t,\s\up6(-)))2)=eq\f(14,28)=0.5,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(-))=4.3-0.5×4=2.3,所求回歸方程為eq\o(y,\s\up6(^))=0.5t+2.3.(2)由(1)知,eq\o(b,\s\up6(^))=0.5>0,故2007至2013年該地區(qū)農(nóng)村居民家庭人均純收入逐年增加,平均每年增加0.5千元.將2015年的年份代號(hào)t=9代入(1)中的回歸方程,得eq\o(y,\s\up6(^))=0.5×9+2.3=6.8,故預(yù)測(cè)該地區(qū)2015年農(nóng)村居民家庭人均純收入為6.8千元.規(guī)律方法(1)正確理解計(jì)算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的公式和準(zhǔn)確的計(jì)算是求線性回歸方程的關(guān)鍵.(2)回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過(guò)樣本點(diǎn)中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).(3)在分析兩個(gè)變量的相關(guān)關(guān)系時(shí),可根據(jù)樣本數(shù)據(jù)作出散點(diǎn)圖來(lái)確定兩個(gè)變量之間是否具有相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可通過(guò)線性回歸方程來(lái)估計(jì)和預(yù)測(cè).【訓(xùn)練2】(2014·云南檢測(cè))春節(jié)期間,某銷售公司每天銷售某種取暖商品的銷售額y(單位:萬(wàn)元)與當(dāng)天的平均氣溫x(單位:℃)有關(guān).現(xiàn)收集了春節(jié)期間這個(gè)銷售公司4天的x與y的數(shù)據(jù)列于下表:平均氣溫(℃)-2-3-5-6銷售額(萬(wàn)元)20232730根據(jù)以上數(shù)據(jù),用線性回歸的方法,求得y與x之間的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的系數(shù)eq\o(b,\s\up6(^))=-eq\f(12,5),則eq\o(a,\s\up6(^))=________.解析由表中數(shù)據(jù)可得eq\o(x,\s\up6(-))=-4,eq\o(y,\s\up6(-))=25,所以線性回歸方程eq\o(y,\s\up6(^))=-eq\f(12,5)x+eq\o(a,\s\up6(^))過(guò)點(diǎn)(-4,25),代入方程得25=-eq\f(12,5)×(-4)+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=eq\f(77,5).答案eq\f(77,5)考點(diǎn)三獨(dú)立性檢驗(yàn)【例3】(2014·安徽卷)某高校共有學(xué)生15000人,其中男生10500人,女生4500人.為調(diào)查該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí)).(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個(gè)樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計(jì)該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率;(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí),請(qǐng)完成每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表,并判斷是否有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)300×eq\f(4500,15000)=90,所以應(yīng)收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖得1-2×(0.100+0.025)=0.75,所以該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率的估計(jì)值為0.75.(3)由(2)知,300位學(xué)生中有300×0.75=225人的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí),75人的每周平均體育運(yùn)動(dòng)時(shí)間不超過(guò)4小時(shí).又因?yàn)闃颖緮?shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的.所以每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表如下:每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表男生女生總計(jì)每周平均體育運(yùn)動(dòng)時(shí)間不超過(guò)4小時(shí)453075每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)16560225總計(jì)21090300結(jié)合列聯(lián)表可算得K2=eq\f(300×(45×60-165×30)2,75×225×210×90)=eq\f(100,21)≈4.762>3.841.所以,有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”.規(guī)律方法利用獨(dú)立性檢驗(yàn),能夠幫助我們對(duì)日常生活中的實(shí)際問(wèn)題作出合理的推斷和預(yù)測(cè).獨(dú)立性檢驗(yàn)就是考察兩個(gè)分類變量是否有關(guān)系,并能較為準(zhǔn)確地給出這種判斷的可信度,具體做法是根據(jù)公式K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),計(jì)算隨機(jī)變量的觀測(cè)值k,k值越大,說(shuō)明“兩個(gè)變量有關(guān)系”的可能性越大.【訓(xùn)練3】某學(xué)生對(duì)其親屬30人的飲食習(xí)慣進(jìn)行了一次調(diào)查,并用下圖所示的莖葉圖表示30人的飲食指數(shù)(說(shuō)明:圖中飲食指數(shù)低于70的人,飲食以蔬菜為主;飲食指數(shù)高于70的人,飲食以肉類為主).(1)根據(jù)以上數(shù)據(jù)完成下列2×2列聯(lián)表:主食蔬菜主食肉類合計(jì)50歲以下50歲以上合計(jì)(2)能否有99%的把握認(rèn)為其親屬的飲食習(xí)慣與年齡有關(guān)?并寫出簡(jiǎn)要分析.解(1)2×2列聯(lián)表如下:主食蔬菜主食肉類合計(jì)50歲以下481250歲以上16218合計(jì)201030(2)因?yàn)镵2=eq\f(30×(4×2-16×8)2,12×18×20×10)=10>6.635,所以有99%的把握認(rèn)為其親屬的飲食習(xí)慣與年齡有關(guān).[思想方法]1.回歸分析是處理變量相關(guān)關(guān)系的一種數(shù)學(xué)方法.主要解決:(1)確定特定量之間是否有相關(guān)關(guān)系,如果有就找出它們之間貼近的數(shù)學(xué)表達(dá)式;(2)根據(jù)一組觀察值,預(yù)測(cè)變量的取值及判斷變量取值的變化趨勢(shì);(3)求出線性回歸方程.2.根據(jù)K2的值可以判斷兩個(gè)分類變量有關(guān)的可信程度.[易錯(cuò)防范]1.回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法,只有在散點(diǎn)圖大致呈線性時(shí),求出的線性回歸方程才有實(shí)際意義,否則,求出的線性回歸方程毫無(wú)意義.根據(jù)回歸方程進(jìn)行預(yù)報(bào),僅是一個(gè)預(yù)報(bào)值,而不是真實(shí)發(fā)生的值.2.獨(dú)立性檢驗(yàn)中統(tǒng)計(jì)量K2的觀測(cè)值k的計(jì)算公式很復(fù)雜,在解題中易混淆一些數(shù)據(jù)的意義,代入公式時(shí)出錯(cuò),而導(dǎo)致整個(gè)計(jì)算結(jié)果出錯(cuò).基礎(chǔ)鞏固題組(建議用時(shí):40分鐘)一、選擇題1.(2015·湖北七市(州)聯(lián)考)為研究語(yǔ)文成績(jī)和英語(yǔ)成績(jī)之間是否具有線性相關(guān)關(guān)系,統(tǒng)計(jì)兩科成績(jī)得到如圖所示的散點(diǎn)圖(兩坐標(biāo)軸單位長(zhǎng)度相同),用回歸直線eq\o(y,\s\up6(^))=bx+a近似地刻畫(huà)其相關(guān)關(guān)系,根據(jù)圖形,以下結(jié)論最有可能成立的是 ()A.線性相關(guān)關(guān)系較強(qiáng),b的值為3.25B.線性相關(guān)關(guān)系較強(qiáng),b的值為0.83C.線性相關(guān)關(guān)系較強(qiáng),b的值為-0.87D.線性相關(guān)關(guān)系太弱,無(wú)研究?jī)r(jià)值解析依題意,注意到題中的相關(guān)的點(diǎn)均集中在某條直線的附近,且該直線的斜率小于1,結(jié)合各選項(xiàng)知,故選B.答案B2.設(shè)(x1,y1),(x2,y2),…,(xn,yn)是變量x和y的n個(gè)樣本點(diǎn),直線l是由這些樣本點(diǎn)通過(guò)最小二乘法得到的線性回歸直線(如圖),以下結(jié)論正確的是()A.直線l過(guò)點(diǎn)(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.x和y的相關(guān)系數(shù)為直線l的斜率C.x和y的相關(guān)系數(shù)在0到1之間D.當(dāng)n為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)一定相同解析由樣本的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))落在回歸直線上可知A正確;x和y的相關(guān)系數(shù)表示為x與y之間的線性相關(guān)程度,不表示直線l的斜率,故B錯(cuò);x和y的相關(guān)系數(shù)應(yīng)在-1到0之間,故C錯(cuò);分布在回歸直線兩側(cè)的樣本
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)編輯師證書(shū)常見(jiàn)陷阱分享試題及答案
- 特許金融分析師考試考生分享學(xué)習(xí)經(jīng)驗(yàn)試題及答案
- 2024年網(wǎng)絡(luò)編輯師職業(yè)素養(yǎng)考核試題及答案
- 理財(cái)師考試涉及的法律法規(guī)試題及答案
- 網(wǎng)絡(luò)編輯師稿件編輯思路試題及答案
- 2024年網(wǎng)絡(luò)編輯師知識(shí)分享試題及答案
- 2025年特許金融分析師考試考前準(zhǔn)備試題及答案
- 網(wǎng)絡(luò)編輯師證書(shū)考試難點(diǎn)與試題及答案分析
- 常熟初二期末試卷及答案
- 曹縣一中英語(yǔ)試卷及答案
- 2024年阜陽(yáng)太和縣第二人民醫(yī)院招聘筆試真題
- 癌癥治療協(xié)議書(shū)模板
- 2025年平頂山文化藝術(shù)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 弘揚(yáng)航天精神中國(guó)航天日主題宣教課件
- 上海市寶山區(qū)上海交大附中2024-2025學(xué)年高考生物試題模擬試卷(8)生物試題含解析
- 私募基金財(cái)務(wù)管理制度版本
- 人教部編版語(yǔ)文四年級(jí)下冊(cè)第七單元大單元教學(xué)設(shè)計(jì)
- 2025-2030全球及中國(guó)煉油廠服務(wù)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025中國(guó)海洋大學(xué)輔導(dǎo)員考試題庫(kù)
- 土地房屋測(cè)繪項(xiàng)目投標(biāo)方案技術(shù)標(biāo)
- 2025年河北省初中學(xué)業(yè)水平模擬考試英語(yǔ)試卷(含答案含聽(tīng)力原文無(wú)音頻)
評(píng)論
0/150
提交評(píng)論