高考數(shù)學(xué)總復(fù)習(xí)課件統(tǒng)計(jì)﹑概率_第1頁
高考數(shù)學(xué)總復(fù)習(xí)課件統(tǒng)計(jì)﹑概率_第2頁
高考數(shù)學(xué)總復(fù)習(xí)課件統(tǒng)計(jì)﹑概率_第3頁
高考數(shù)學(xué)總復(fù)習(xí)課件統(tǒng)計(jì)﹑概率_第4頁
高考數(shù)學(xué)總復(fù)習(xí)課件統(tǒng)計(jì)﹑概率_第5頁
已閱讀5頁,還剩144頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)學(xué)直通車-統(tǒng)計(jì)概率知識(shí)體系知識(shí)體系 第一節(jié)第一節(jié) 隨機(jī)抽樣隨機(jī)抽樣基礎(chǔ)梳理基礎(chǔ)梳理ll1. 簡(jiǎn)單隨機(jī)抽樣(1)定義:設(shè)一個(gè)總體含有n個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(nn),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.(2)最常用的簡(jiǎn)單隨機(jī)抽樣的方法:抽簽法和隨機(jī)數(shù)法. 2. 系統(tǒng)抽樣假設(shè)要從容量為n的總體中抽取容量為n的樣本,步驟如下:(1)先將總體的n個(gè)個(gè)體編號(hào);(2)確定分段間隔k,對(duì)編號(hào)進(jìn)行分段,當(dāng) 是整數(shù)時(shí),取k= ;(3)在第1段用簡(jiǎn)單隨機(jī)抽樣確定第1個(gè)個(gè)體編號(hào) ( k);(4)按照一定的規(guī)則抽取樣本,通常是將 加上間隔k得到第

2、2個(gè)個(gè)體編號(hào)( +k),再加k得到第3個(gè)個(gè)體編號(hào)( +2k),依次進(jìn)行下去,直到獲取整個(gè)樣本.nnnnl ll3. 分層抽樣(1)定義:在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法叫做分層抽樣.(2)分層抽樣的應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣.4. 三種抽樣方法比較類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣抽樣過程中每個(gè)個(gè)體被抽到的機(jī)會(huì)均等從總體中逐個(gè)抽取總體中的個(gè)體數(shù)較少系統(tǒng)抽樣將總體均勻分成幾部分,按一定的規(guī)則分別在各部分中抽取在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣總體中的個(gè)

3、體數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成典例分析典例分析題型一題型一 簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣【例1】某車間工人加工一種軸100件,為了了解這種軸的直徑,要從中抽取10件在同一條件下測(cè)量,請(qǐng)?jiān)O(shè)計(jì)一種抽樣方案.分析分析 考慮到總體中個(gè)體數(shù)較少,利用抽簽法或隨機(jī)數(shù)法容易獲取樣本.解解 方法一(抽簽法):將100件軸編號(hào)為1,2,,100,并做好大小、形狀相同的號(hào)簽,分別寫上這100個(gè)數(shù),將這些號(hào)簽放在一起,進(jìn)行均勻攪拌,接著連續(xù)抽取10個(gè)號(hào)簽,與這10個(gè)號(hào)簽號(hào)碼相同的軸的直徑即為所要抽取的樣本.方法二(隨機(jī)數(shù)表法):將100件軸編號(hào)

4、為00,01,,99,在隨機(jī)數(shù)表(見教材附表)中選定一個(gè)起始位置,如取第21行第1個(gè)數(shù)開始,選取10個(gè)為68,34,30,13,70,55,74,30,77,40,這10個(gè)號(hào)碼對(duì)應(yīng)的軸的直徑即為所要抽取的樣本.學(xué)后反思學(xué)后反思 (1)隨機(jī)數(shù)法的步驟:將總體的個(gè)體編號(hào);在隨機(jī)數(shù)表中選擇開始數(shù)字;讀數(shù)獲取樣本號(hào)碼.隨機(jī)數(shù)法簡(jiǎn)單易行,它很好地解決了抽簽法在總體個(gè)數(shù)較多時(shí)制簽難的問題,但是當(dāng)總體中的個(gè)體很多,需要的樣本容量也很大時(shí),用隨機(jī)數(shù)法抽取樣本仍不方便;(2)一個(gè)抽樣試驗(yàn)?zāi)芊裼贸楹灧?,關(guān)鍵要看:制簽是否方便;號(hào)簽是否容易被攪勻.一般地,總體容量和樣本容量都較小時(shí),可用抽簽法.舉一反三舉一反三1.

5、 某事業(yè)單位有102名職工,從中抽取10人參加體檢,試采用簡(jiǎn)單隨機(jī)抽樣進(jìn)行具體實(shí)施.解析:將每一個(gè)人編一個(gè)號(hào)由001至102;制作大小相同的號(hào)簽并寫上號(hào)碼;放入容器中,均勻攪拌;依次抽取10個(gè)號(hào)碼,具有這十個(gè)編號(hào)的人組成一個(gè)樣本.題型二題型二 系統(tǒng)抽樣系統(tǒng)抽樣【例2】從某廠生產(chǎn)的905輛家用轎車中隨機(jī)抽取90輛測(cè)試某項(xiàng)性能,請(qǐng)合理選擇抽樣方法進(jìn)行抽樣,并寫出抽樣過程.分析分析 由于總體容量較大,因此,采用系統(tǒng)抽樣法進(jìn)行抽樣,又因總體容量不能被樣本容量整除,需先剔除5輛家用轎車,使得總體容量能被樣本容量整除,取間隔k= =10;然后利用系統(tǒng)抽樣的方法進(jìn)行抽樣.90090解解 可用系統(tǒng)抽樣法進(jìn)行抽

6、樣,抽樣步驟如下:第一步,將905輛轎車用隨機(jī)方式編號(hào);第二步,從總體中剔除5輛(剔除法可用隨機(jī)數(shù)法),將剩下的900輛轎車重新編號(hào)(分別為001,002,900)并分成90段;第三步,在第一段001,002,010這十個(gè)編號(hào)中用簡(jiǎn)單隨機(jī)抽樣法抽出一個(gè)作為起始號(hào)碼(如006);第四步,把起始號(hào)碼依次加間隔10,可獲得樣本.學(xué)后反思學(xué)后反思 在利用系統(tǒng)抽樣時(shí),經(jīng)常遇到總體容量不能被樣本容量整除的情況,則可以先從總體中隨機(jī)地剔除幾個(gè)個(gè)體,使得總體中剩余的個(gè)體數(shù)能被樣本容量整除.舉一反三舉一反三2. 某工廠有1 003名工人,從中抽取10人參加體檢,試用系統(tǒng)抽樣進(jìn)行具體實(shí)施.解析:(1)將每個(gè)人編一

7、個(gè)號(hào)由0001至1003;(2)利用隨機(jī)數(shù)表法找到3個(gè)號(hào),將這3名工人排除;(3)將剩余的1 000名工人重新編號(hào)0001至1000;(4)分段,取間隔 ,將總體均分為10組,每組含100個(gè)工人;(5)從第一段,即從0001號(hào)到0100號(hào)中隨機(jī)抽取一個(gè)號(hào)l;(6)按編號(hào)將l,100+l,200+l,900+l共10個(gè)號(hào)選出.這10個(gè)號(hào)所對(duì)應(yīng)的工人組成樣本.100010010k 題型三題型三 分層抽樣分層抽樣【例3】某單位最近組織了一次健身活動(dòng),活動(dòng)分為登山組和游泳組,且每個(gè)職工至多參加了其中一組.在參加活動(dòng)的職工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山組的職工占參加活動(dòng)

8、總?cè)藬?shù)的 ,且該組中,青年人占50%,中年人占40%,老年人占10%.為了了解各組不同的年齡層次的職工對(duì)本次活動(dòng)的滿意程度,現(xiàn)從參加活動(dòng)的全體職工中抽取一個(gè)容量為200的樣本.(1)在游泳組中,試確定青年人、中年人、老年人分別所占的比例;(2)在游泳組中,試確定青年人、中年人、老年人分別應(yīng)抽取的人數(shù).14分析分析 因本題中已給出了青年人、中年人和老年人三類,如何分配他們之間的比例和他們各自的人數(shù)是解決本題的關(guān)鍵.解解 采用分層抽樣的方法.(1)設(shè)登山組人數(shù)為x,在游泳組中,青年人、中年人、老年人各占比例分別為a、b、c,根據(jù)題意得解得b=50%,c=10%.401047.51044xxbxxc

9、xx故a=100%-50%-10%=40%,即在游泳組中,青年人、中年人、老年人各占比例分別為40%、50%、10%. (2)在游泳組中,抽取的青年人人數(shù)為200 40%=60(人);抽取的中年人人數(shù)為200 50%=75(人);抽取的老年人人數(shù)為200 10%=15(人).343434學(xué)后反思學(xué)后反思 分層抽樣是當(dāng)總體由差異明顯的幾部分組成時(shí)采用的抽樣方法,進(jìn)行分層抽樣時(shí)應(yīng)注意以下幾點(diǎn):(1)分層抽樣中分多少層、如何分層要視具體情況而定,總的原則是,層內(nèi)樣本的差異要小,兩層之間的樣本差異要大,且互不重疊;(2)為保證每個(gè)個(gè)體等可能入樣,所有層中每個(gè)個(gè)體被抽到的可能性應(yīng)相同;(3)在每層抽樣時(shí)

10、,應(yīng)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的方法進(jìn)行抽樣.舉一反三舉一反三3. 某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個(gè)容量為n的樣本.(1)如果采用系統(tǒng)抽樣法和分層抽樣法抽取,不用剔除個(gè)體,求樣本容量n;(2)如果樣本容量增加一個(gè),則在采用系統(tǒng)抽樣時(shí),需要在總體中先剔除一個(gè)個(gè)體,求樣本容量n.解析: (1)總體容量為6+12+18=36.當(dāng)樣本容量是n時(shí),由題意知,系統(tǒng)抽樣的間隔為 ,分層抽樣的比例是 ,抽取工程師 6= (人),抽取技術(shù)員 12= (人),抽取技工 18= (人).所以n應(yīng)是6的倍數(shù),36的約數(shù),即n=6,12,18,36.(2)當(dāng)樣本容量為(n+1)時(shí),總體

11、容量是35,系統(tǒng)抽樣的間隔為 .因?yàn)?必須是整數(shù),所以n只能取6,即樣本容量n=6.36n36n36n36n3n36n2n351n351n6n題型四題型四 抽樣方法的綜合應(yīng)用抽樣方法的綜合應(yīng)用【例4】(12分)為了考察某校的教學(xué)水平,將抽查這個(gè)學(xué)校高三年級(jí)的部分學(xué)生本年度的考試成績(jī).為了全面反映實(shí)際情況,采取以下三種方式進(jìn)行抽查(已知該校高三年級(jí)共有20個(gè)班,并且每個(gè)班內(nèi)的學(xué)生已經(jīng)按隨機(jī)方式編好了學(xué)號(hào),假定該校每班學(xué)生的人數(shù)相同):從高三年級(jí)20個(gè)班中任意抽取一個(gè)班,再從該班中任意抽取20名學(xué)生,考察他們的學(xué)習(xí)成績(jī);每個(gè)班抽取1人,共計(jì)20人,考察這20名學(xué)生的成績(jī);把學(xué)生按成績(jī)分成優(yōu)秀、良好

12、、普通三個(gè)級(jí)別,從其中共抽取100名學(xué)生進(jìn)行考察(已知該校高三學(xué)生共1 000人,若按成績(jī)分,其中優(yōu)秀生共150人,良好生共600人,普通生共250人).根據(jù)上面的敘述,試回答下列問題:(1)上面三種抽取方式的總體、個(gè)體、樣本分別是什么?每一種抽取方式抽取的樣本中,樣本容量分別是多少?(2)上面三種抽取方式各自采用的是何種抽取樣本的方法?(3)試分別寫出上面三種抽取方式各自抽取樣本的步驟.分析分析 本題主要考查基本概念和三種抽樣方法的聯(lián)系與區(qū)別,準(zhǔn)確把握三種抽樣方法的概念與特點(diǎn)是解此題的關(guān)鍵;另外要注意敘述的完整性和條理性.解解 (1)這三種抽取方式的總體都是指該校高三全體學(xué)生本年度的考試成績(jī)

13、,個(gè)體都是指高三年級(jí)每個(gè)學(xué)生本年度的考試成績(jī).其中第一種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績(jī),樣本容量為20;第二種抽取方式的樣本為所抽取的20名學(xué)生本年度的考試成績(jī),樣本容量為20;第三種抽取方式的樣本為所抽取的100名學(xué)生本年度的考試成績(jī),樣本容量為100.3(2)三種抽取方式中,第一種采用的是簡(jiǎn)單隨機(jī)抽樣法;第二種采用的是系統(tǒng)抽樣法和簡(jiǎn)單隨機(jī)抽樣法;第三種采用的是分層抽樣法和簡(jiǎn)單隨機(jī)抽樣法.6(3)第一種方式抽樣的步驟:第一步,用抽簽法在這20個(gè)班中任意抽取一個(gè)班;第二步,從這個(gè)班中按學(xué)號(hào)用隨機(jī)數(shù)表法或抽簽法抽取20名學(xué)生,考察其考試成績(jī).7第二種方式抽樣的步驟如下:第一步

14、,用簡(jiǎn)單隨機(jī)抽樣法從第一個(gè)班中任意抽取一名學(xué)生,記其學(xué)號(hào)為a;第二步,在其余的19個(gè)班中,選取學(xué)號(hào)為a的學(xué)生,加上第一個(gè)班中的一名學(xué)生,共計(jì)20人.9第三種方式抽樣的步驟如下:第一步,分層.因?yàn)槿舭闯煽?jī)分,其中優(yōu)秀生共150人,良好生共600人,普通生共250人,所以在抽取樣本時(shí),應(yīng)該把全體學(xué)生分成三個(gè)層次;第二步,確定各個(gè)層次抽取的人數(shù).因?yàn)闃颖救萘颗c總體的個(gè)數(shù)之比為1001 000=110,所以在每個(gè)層次中抽取的個(gè)體數(shù)依次為 ,即15,60,25;第三步,按層次分別抽取.在優(yōu)秀生中用簡(jiǎn)單隨機(jī)抽樣法抽15人;在良好生中用簡(jiǎn)單隨機(jī)抽樣法抽取60人;在普通生中用簡(jiǎn)單隨機(jī)抽樣法抽取25人.1215

15、0 600 250,101010學(xué)后反思學(xué)后反思 本題主要考查數(shù)理統(tǒng)計(jì)中一些基本的概念和方法.做這種題目時(shí),應(yīng)該注意敘述的完整性和條理性.舉一反三舉一反三4. 判斷下面這幾個(gè)抽樣調(diào)查選取樣本的方法是否合適.(1)一啤酒廠為了了解其產(chǎn)品的質(zhì)量情況,在其生產(chǎn)流水線上每隔1 000瓶選取一瓶檢驗(yàn)其質(zhì)量;(2)一手表廠欲了解611歲少年兒童帶手表的比例,周末來到一家業(yè)余藝術(shù)學(xué)校調(diào)查200名在那里學(xué)習(xí)的學(xué)生;(3)為調(diào)查全校學(xué)生對(duì)購買正版書籍、唱片和軟件的支持率,用簡(jiǎn)單隨機(jī)抽樣方法在全校所有的班級(jí)中抽取8個(gè)班級(jí),調(diào)查這8個(gè)班級(jí)中所有學(xué)生對(duì)購買正版書籍、唱片和軟件的支持率;(4)為調(diào)查一個(gè)省的環(huán)境污染情況

16、,調(diào)查省會(huì)城市的環(huán)境污染情況.解析:(1)合適;(2)不合適,這所學(xué)校的200名學(xué)生不能代表全部的611歲兒童;(3)合適;(4)不合適,調(diào)查的城市為省會(huì),不滿足隨機(jī)抽樣的隨機(jī)性和機(jī)會(huì)均等性原理.易錯(cuò)警示易錯(cuò)警示【例】下列抽取樣本的方式是否屬于簡(jiǎn)單隨機(jī)抽樣?并說明理由.(1)從無限多個(gè)個(gè)體中抽取100個(gè)個(gè)體作樣本.(2)盒子里共有80個(gè)零件,從中選出5個(gè)零件進(jìn)行質(zhì)量檢查,在抽樣操作時(shí),從中任意拿出一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后,再把它放回盒子中.錯(cuò)解錯(cuò)解 (1)是簡(jiǎn)單隨機(jī)抽樣,因?yàn)闃颖臼请S機(jī)任意抽取的.(2)是簡(jiǎn)單隨機(jī)抽樣,因?yàn)榫褪菑?0個(gè)零件中任取5個(gè)零件的抽樣.錯(cuò)解分析錯(cuò)解分析 上述兩問題不具有簡(jiǎn)

17、單隨機(jī)抽樣的特點(diǎn):不放回、有限性.正解正解 (1)不是簡(jiǎn)單隨機(jī)抽樣,由于被抽取樣本的總體的個(gè)數(shù)不是有限的而是無限的.(2)不是簡(jiǎn)單隨機(jī)抽樣,由于它是放回抽樣,而簡(jiǎn)單隨機(jī)抽樣的前提是不放回抽樣.考點(diǎn)演練考點(diǎn)演練10. (2010茂名模擬)一個(gè)總體中有100個(gè)個(gè)體,隨機(jī)編號(hào)0,1,2,99.依編號(hào)順序平均分成10個(gè)小組,組號(hào)依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個(gè)容量為10的樣本,規(guī)定如果在第一組隨機(jī)抽取的號(hào)碼為t,則在第k組中抽取的號(hào)碼個(gè)位數(shù)字與t+k的個(gè)位數(shù)字相同,若t=7,則在第8組中抽取的號(hào)碼應(yīng)是.解析: t+k=7+8=15,第8組中75的個(gè)位數(shù)字與t+k的個(gè)位數(shù)字相同,所以為7

18、5.答案: 7511. 某校有在校高中學(xué)生1 600人,其中高一學(xué)生520人,高二學(xué)生500人,高三學(xué)生580人.如果想抽查其中的80人來調(diào)查學(xué)生的消費(fèi)情況,考慮到學(xué)生的年級(jí)高低消費(fèi)情況有明顯差別,而同一年級(jí)內(nèi)消費(fèi)情況差異較小,應(yīng)當(dāng)采用 抽樣,高三學(xué)生中應(yīng)抽查 人.解析解析 因?yàn)椴煌昙?jí)的學(xué)生消費(fèi)情況有明顯的差別,所以應(yīng)采用分層抽樣.由于520500580=262529,于是將80分成262529三部分,設(shè)三部分各抽個(gè)體數(shù)分別為26x,25x,29x,則26x+25x+29x=80,解得x=1,故高三年級(jí)中應(yīng)抽取291=29(人).答案答案 分層 2912. 某校高中三年級(jí)有253名學(xué)生,為了

19、解他們的身體狀況,準(zhǔn)備按15的比例抽取一個(gè)樣本,試寫出用系統(tǒng)抽樣法進(jìn)行抽樣的過程.解析解析 第一步,計(jì)算要抽取的個(gè)體數(shù): ,所以先從253個(gè)個(gè)體中隨機(jī)剔除3個(gè);第二步,把剩下的250名學(xué)生隨機(jī)編號(hào)為:1,2,,250,然后分組為1 5,6 10,246 250;第三步,在1 5之間任選一個(gè)號(hào),記為i(1i5),然后依次在第n組選取i+(n-1)5號(hào)(2n50).這樣就得到所需的樣本.25335055第二節(jié)第二節(jié) 用樣本估計(jì)總體用樣本估計(jì)總體基礎(chǔ)梳理基礎(chǔ)梳理1. 作頻率分布直方圖的步驟(1)求極差(即一組數(shù)據(jù)中最大值與最小值的差);(2)決定組距與組數(shù);(3)將數(shù)據(jù)分組;(4)列頻率分布表;(5

20、)畫頻率分布直方圖.2. 頻率分布折線圖和總體密度曲線(1)頻率分布折線圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),就得到頻率分布折線圖;(2)總體密度曲線:隨著樣本容量的增加,作圖時(shí)所分的組數(shù)增加,組距減小,相應(yīng)的頻率折線圖會(huì)越來越接近于一條光滑曲線,即總體密度曲線.12,.nx xx12.nxxxxn3. 眾數(shù)、中位數(shù)、平均數(shù)(1)在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).(2)將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個(gè)數(shù)據(jù)(或中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).(3)如果有n個(gè)數(shù) ,那么 叫做這n個(gè)數(shù)的平均數(shù).4. 標(biāo)準(zhǔn)差和方差(1)標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種

21、平均距離;(2)(3)方差: ( 是樣本數(shù)據(jù),n是樣本容量, 是樣本平均數(shù)).222121.nsxxxxxxn2222121.nsxxxxxxnnxx5. 用莖葉圖刻畫數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn)(1)所有的信息都可以從圖中得到;(2)莖葉圖便于記錄和表示,能夠展示數(shù)據(jù)的分布情況.但當(dāng)樣本數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時(shí),莖葉圖的效果就不是很好了.典例分析典例分析題型一題型一 圖形信息題圖形信息題【例1】為了了解九年級(jí)學(xué)生中女生的身高(單位:cm)情況,某中學(xué)對(duì)九年級(jí)女生進(jìn)行了一次身高測(cè)量,所得數(shù)據(jù)整理后,列出了頻率分布表如下:分組頻數(shù)頻率145.5-149.510.02149.5-153.540.08153.5-

22、157.5200.40157.5-161.5150.30161.5-165.580.16165.5-169.5mn合計(jì)mn(1)求出表中m,n,m,n所表示的數(shù)分別是多少;(2)畫出頻率分布直方圖;(3)試問:全體女生中身高在哪組范圍內(nèi)的人數(shù)最多?估計(jì)九年級(jí)學(xué)生中女生的身高在161.5 cm以上的概率.分析分析 每一組距的頻率是該組距中個(gè)體的個(gè)數(shù)與所研究對(duì)象的個(gè)數(shù)之比;所有組距的頻率之和為1;每一組距的頻率是頻率分布直方圖中該組距所對(duì)應(yīng)的矩形的面積.解解 (1)m= =50,m=50-(1+4+20+15+8)=2,n=1, .(2)作出直角坐標(biāo)系,組距為4,縱軸表示 ,橫軸表示身高,畫出直方

23、圖如圖:(3)在153.5-157.5 cm范圍內(nèi)最多,估計(jì)身高在161.5 cm以上的概率為p= =0.2.10.0220.0450mnm頻率組距1050學(xué)后反思學(xué)后反思 頻率分布直方圖反映樣本的頻率分布(其中縱軸表示 ,頻率= ,橫軸表示樣本數(shù)據(jù)).直方圖中每一個(gè)矩形的面積是樣本數(shù)據(jù)落在這個(gè)區(qū)間上的頻率,所有的小矩形的面積之和等于1,即頻率之和為1.由此可以估計(jì)樣本數(shù)據(jù)落在某個(gè)區(qū)間的頻率或概率或者總體的數(shù)字特征.頻率組距頻數(shù)樣本總量舉一反三舉一反三1. 一個(gè)社會(huì)調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10 000人,并根據(jù)所得數(shù)據(jù)畫了樣本的頻率分布直方圖(如圖).為了分析居民的收入與年齡、學(xué)歷、職

24、業(yè)等方面的關(guān)系,要從這10 000人中再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則在2 500,3 000)(元)月收入段應(yīng)抽出 人. 解析: 月收入在2 500,3 000)(元)段的頻率為0.000 5500=0.25,應(yīng)抽人數(shù)為1000.25=25(人).答案: 25題型二題型二 用樣本分布估計(jì)總體用樣本分布估計(jì)總體【例2】對(duì)某電子元件進(jìn)行壽命追蹤調(diào)查,情況如下:(1)列出頻率分布表;(2)畫出頻率分布直方圖;(3)估計(jì)電子元件壽命在100 h400 h以內(nèi)的頻率;(4)估計(jì)電子元件壽命在400 h以上的頻率.壽命(h) 100,200)200,300)300,400)400,500)5

25、00,600個(gè)數(shù)2030804030分析 從分組中看壽命在某一范圍內(nèi)的電子元件的比例即壽命在該范圍內(nèi)的頻率.解 (1)樣本頻率分布表如下:壽命(h)頻數(shù)頻率100,200)200.10200,300)300.15300,400)800.40400,500)300.15500,600300.15合計(jì)2001(2)頻率分布直方圖如圖:(3)電子元件壽命在100 h400 h以內(nèi)的頻數(shù)為130,則頻率 為 =0.65.(4)壽命在400 h以上的電子元件的頻數(shù)為70,則頻率 為 =0.35.學(xué)后反思利用樣本的頻率分布可近似地估計(jì)總體的分布.從本例可以看出,要比較準(zhǔn)確地反映出總體分布的情況,必須準(zhǔn)確地

26、作出頻率分布表或頻率分布直方圖,充分利用所給的數(shù)據(jù)正確地作出估計(jì).7020013020070200舉一反三舉一反三2. (2009銀川模擬)某校對(duì)高三年級(jí)的學(xué)生進(jìn)行體檢,現(xiàn)將高三男生的體重(單位:kg)數(shù)據(jù)進(jìn)行整理后分成五組,并繪制頻率分布直方圖(如下圖).根據(jù)一般標(biāo)準(zhǔn),高三男生的體重超過65 kg屬于偏胖,低于55 kg屬于偏瘦.已知圖中從左到右第一、第三、第四、第五小組的頻率分別為0.25、0.20、0.10、0.05,第二小組的頻數(shù)為400,則該校高三年級(jí)的男生總數(shù)和體重正常的頻率分別為( )a. 1 000,0.50 b. 800,0.50c. 800, 0.60 d. 1 000,0

27、.60解析: 由題知,體重在55,60)的頻率為1-(0.25+0.20+0.10+0.05)=0.40,又頻數(shù)為400,故總?cè)藬?shù)為1 000;體重正常的頻率為0.4+0.2=0.60.答案: d題型三題型三 用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征【例3】對(duì)劃艇運(yùn)動(dòng)員甲、乙二人在相同的條件下進(jìn)行了6次測(cè)試,測(cè)得他們最大速度的數(shù)據(jù)如下:甲:27,38,30,37,35,31;乙:33,29,38,34,28,36.根據(jù)以上數(shù)據(jù),試判斷他們誰更優(yōu)秀.分析分析 要判斷甲、乙兩人誰更優(yōu)秀,只需計(jì)算它們的平均數(shù)與方差即可.已知一組數(shù)據(jù) ,則平均數(shù)方差 ,標(biāo)準(zhǔn)差 123,.n

28、x xxx123.nxxxxxn2211niisxxn211niisxxn解解 由此可以說明,甲、乙二人的最大速度的平均值相同,但乙比甲更穩(wěn)定,故乙比甲更優(yōu)秀.2222222222222222127383037353133613329383428363361s2733383330333733353331 336129415631s333329333833343328333633612761263ssxxxx甲乙甲乙乙乙甲甲,學(xué)后反思學(xué)后反思 平均數(shù)反映了數(shù)據(jù)取值的平均水平,標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離

29、散程度越小,越穩(wěn)定.舉一反三舉一反三3. 據(jù)調(diào)查,某公司的33名職工的月工資(單位:元)如下: (1)計(jì)算該公司職工月工資的平均數(shù)、中位數(shù)、眾數(shù);(2)假如副董事長(zhǎng)的工資從5 000提升到20 000,董事長(zhǎng)的工資從5 500提升到30 000,那么新的平均數(shù)、中位數(shù)、眾數(shù)又是多少?(3)你認(rèn)為哪個(gè)統(tǒng)計(jì)量更能反映這個(gè)公司員工的工資水平?結(jié)合此問題談?wù)勀愕目捶?職務(wù)董事長(zhǎng) 副董事長(zhǎng)董事總經(jīng)理經(jīng)理管理員職員人數(shù)11215320工資5500500035003000250020001500解析: (1)該公司職工的月工資的平均數(shù)為 (5 500+5 000+23 500+3 000+52 500+32

30、 000+201 500)= 69 0002 091.中位數(shù)是1 500,眾數(shù)是1 500.(2)當(dāng)副董事長(zhǎng)的工資從5 000提升到20 000,董事長(zhǎng)的工資從5 500提升到30 000時(shí),所得新數(shù)據(jù)的平均數(shù)為 (30 000+20 000+23 500+3 000+52 500+32 000+201 500)= 108 5003 288.所以平均數(shù)為3 288,中位數(shù)是1 500,眾數(shù)是1 500.(3)在這個(gè)問題中,中位數(shù)或眾數(shù)均能反映該公司員工的工資水平.因?yàn)楣局猩贁?shù)人的月工資額與大多數(shù)人的月工資額差別較大,這樣導(dǎo)致了平均數(shù)與中位數(shù)的偏差較大,所以平均數(shù)不能客觀真實(shí)地反映這個(gè)公司員工

31、的工資水平.133x 133133x 133【例4】(12分)某種瓶裝溶液,因?yàn)檠b瓶機(jī)的不穩(wěn)定性,所以很可能每瓶裝的容量都不是標(biāo)準(zhǔn)的容量.我們隨機(jī)抽出了20瓶,測(cè)得它們的容量(單位:百毫升)如下:12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.112.3 12.5 11.7 12.4 12.3 11.8 11.3 12.111.4 11.6 11.2 12.2(1)根據(jù)數(shù)據(jù)列出頻數(shù)分布表,畫出頻數(shù)分布圖;(2)計(jì)算出這組數(shù)據(jù)的平均數(shù)和標(biāo)準(zhǔn)差(結(jié)果精確到0.01);(3)結(jié)合(1)、(2)的結(jié)果,描述一下樣本的分布情況,并根據(jù)實(shí)際意義寫一個(gè)簡(jiǎn)短的報(bào)告(對(duì)總體情況作出估

32、計(jì)).分析分析 現(xiàn)實(shí)中對(duì)一組數(shù)據(jù),往往是從多角度、多層面進(jìn)行分析.主要標(biāo)準(zhǔn)是平均數(shù)、方差的大小,頻率分布直方圖是否集中等.題型四題型四 綜合問題綜合問題解解 (1)頻數(shù)分布表如下: 分組 頻數(shù) 11.0,11.5) 3 11.5,12.0) 4 12.0,12.5) 11 12.5,13.0 2 2頻數(shù)分布圖如圖所示: .4(2)平均數(shù) (12.1+11.9+12.2+12.2)= 12.02.6標(biāo)準(zhǔn)差s 0.41.8(3)標(biāo)準(zhǔn)差相對(duì)于平均數(shù)來說比較小;從頻數(shù)分布圖中可以看出,每瓶的容量大致位于1 150毫升到1 250毫升之間.因此判斷裝瓶機(jī)工作穩(wěn)定.121x20240.32022212.1

33、 12.0211.9 12.02.12.2 12.0220學(xué)后反思學(xué)后反思 數(shù)據(jù)的圖形分布情況和數(shù)字特征從不同方面對(duì)總體(或樣本)的分布作出了刻畫.在解決實(shí)際問題時(shí),這兩個(gè)方面應(yīng)結(jié)合起來,發(fā)揮各自的長(zhǎng)處,以便能更清晰地描繪總體(或樣本)的分布.舉一反三舉一反三4. (2009海南、寧夏)某工廠有工人1 000名,其中250名工人參加過短期培訓(xùn)(稱為a類工人),另外750名工人參加過長(zhǎng)期培訓(xùn)(稱為b類工人).現(xiàn)用分層抽樣方法(按a類、b類分二層)從該工廠的工人中共抽查100名工人,調(diào)查他們的生產(chǎn)能力(此處生產(chǎn)能力指一天加工的零件數(shù)),從a類工人中的抽查結(jié)果和從b類工人中的抽查結(jié)果分別如下表1和表

34、2.表1: 表2:生產(chǎn)能力分組100,110)110,120) 120,130) 130,140) 140,150)人數(shù)48x53生產(chǎn)能力分組110,120) 120,130) 130,140) 140,150)人數(shù)6y3618(1)先確定x、y,再完成下列頻率分布直方圖,就生產(chǎn)能力而言,a類工人中個(gè)體間的差異程度與b類工人中個(gè)體間的差異程度哪個(gè)更?。浚ú挥糜?jì)算,可通過觀察直方圖直接回答結(jié)論)(2)分別估計(jì)a類工人和b類工人生產(chǎn)能力的平均數(shù),并估計(jì)該工廠工人的生產(chǎn)能力的平均數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表).解析: (1)由題意知a類工人中應(yīng)抽查25名,b類工人中應(yīng)抽查75名.故4+

35、8+x+5+3=25,得x=5;6+y+36+18=75,得y=15.頻率分布直方圖如下:從直方圖可以判斷:b類工人中個(gè)體間的差異程度更小.(2) a類工人生產(chǎn)能力的平均數(shù)、b類工人生產(chǎn)能力的平均數(shù)以及全廠工人生產(chǎn)能力的平均數(shù)的估計(jì)值分別為123,133.8和131.1.485310511512514512325252525ax 6153618115125135145133.875757575bx 2575123133.8131.1100100 x 10. (2008海南、寧夏)從甲、乙兩品種的棉花中各抽測(cè)了25根棉花的纖維長(zhǎng)度(單位:mm),結(jié)果如下:甲品種:271 273 280 285

36、285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352乙品種:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356根據(jù)以上數(shù)據(jù)設(shè)計(jì)了莖葉圖如下:根據(jù)以上莖葉圖,對(duì)甲、乙兩品種棉花的纖維長(zhǎng)度作比較,寫出兩個(gè)統(tǒng)計(jì)結(jié)論: ; .解析: 根據(jù)題目要求,從所給數(shù)表和莖葉圖中提煉有用信息,便能得到結(jié)論.答案:乙品種棉花的纖維平均長(zhǎng)度大于甲品種棉花的纖維

37、平均長(zhǎng)度(或乙品種棉花的纖維長(zhǎng)度普遍大于甲品種棉花的纖維長(zhǎng)度).甲品種棉花的纖維長(zhǎng)度較乙品種棉花的纖維長(zhǎng)度更分散(或乙品種棉花的纖維長(zhǎng)度較甲品種棉花的纖維長(zhǎng)度更集中、穩(wěn)定).甲品種棉花的纖維長(zhǎng)度的中位數(shù)為307 mm,乙品種棉花的纖維長(zhǎng)度的中位數(shù)為318 mm.乙品種棉花的纖維長(zhǎng)度基本上是對(duì)稱的,而且大多集中在中間(均值附近).甲品種棉花的纖維長(zhǎng)度除一個(gè)特殊值(352)外,也大致對(duì)稱,其分布較均勻.(上面四個(gè)結(jié)論,任選兩個(gè)即可)11. (2009廣東改編)根據(jù)空氣質(zhì)量指數(shù)api(為整數(shù))的不同,可將空氣質(zhì)量分級(jí)如下表: 對(duì)某城市一年(365天)的空氣質(zhì)量進(jìn)行監(jiān)測(cè),獲得的api數(shù)據(jù)按照區(qū)間0,5

38、0,(50,100,(100,150,(150,200,(200,250,(250,300進(jìn)行分組,得到頻率分布直方圖如圖.api05051100101150151200201250251300300級(jí)別狀況優(yōu)良輕微污染輕度污染中度污染中度重污染重度污染(1)求直方圖中x的值;(2)計(jì)算一年中空氣質(zhì)量分別為良和輕微污染的天數(shù).解析:(1)根據(jù)頻率分布直方圖可知, (2)空氣質(zhì)量為y的天數(shù)=(y對(duì)應(yīng)的頻率組距)組距365天,所以一年中空氣質(zhì)量為良和輕微污染的天數(shù)分別是 50365=119(天)和 50365=100(天).3273811915050182536518251825912518250

39、 x11918250236512. 為了解a、b兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機(jī)抽取了8個(gè)進(jìn)行測(cè)試,下面列出了每個(gè)輪胎行駛的最遠(yuǎn)里程數(shù)(單位:1 000 km):輪胎a:96,112,97,108,100,103,86,98輪胎b:108,101,94,105,96,93,97,106(1)分別計(jì)算a、b兩種輪胎行駛的最遠(yuǎn)里程數(shù)的平均數(shù)、中位數(shù);(2)分別計(jì)算a、b兩種輪胎行駛的最遠(yuǎn)里程數(shù)的極差、標(biāo)準(zhǔn)差;(3)根據(jù)以上數(shù)據(jù)你認(rèn)為哪種型號(hào)的輪胎性能更加穩(wěn)定?解析解析 (1)a輪胎行駛的最遠(yuǎn)里程數(shù)的平均數(shù)為中位數(shù)為b輪胎行駛的最遠(yuǎn)里程數(shù)的平均數(shù)為中位數(shù)為(2)a輪胎行駛的最遠(yuǎn)里程

40、數(shù)的極差為112-86=26,標(biāo)準(zhǔn)差為96 11297 108 100 1038698100810098992108 101 94 105969397 1061008101 97992222222241238031422217.4382sb輪胎行駛的最遠(yuǎn)里程數(shù)的極差為108-93=15,標(biāo)準(zhǔn)差為(3)由于b輪胎行駛的最遠(yuǎn)里程數(shù)的極差和標(biāo)準(zhǔn)差較小,所以b輪胎性能更加穩(wěn)定.222222281 6547361185.4382s 左下角右上角左上角右下角一條直線附近線性相關(guān)1. 兩個(gè)變量間的相關(guān)關(guān)系 (1)正相關(guān) 在散點(diǎn)圖中,點(diǎn)散布在從 到 的區(qū)域.對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān). (

41、2)負(fù)相關(guān) 在散點(diǎn)圖中,點(diǎn)散步在從 到 的區(qū)域,兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān). (3)線性相關(guān)關(guān)系、回歸直線 如果散點(diǎn)圖中點(diǎn)的分布從整體上看是大致在 ,就稱這兩個(gè)變量之間具有 關(guān)系,這條直線叫做回歸直線.第三節(jié)第三節(jié) 變量間的相關(guān)關(guān)系變量間的相關(guān)關(guān)系基礎(chǔ)梳理基礎(chǔ)梳理距離的平方和最小121()()()niiiniixxyyxx1221niiiniix ynxyxnxybx2.線性回歸方程 (1)最小二乘法 求回歸直線使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的的方法叫做最小二乘法. (2)線性回歸方程 方程 是兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù) 的線性回歸方程,其中a,b是待定參數(shù)。 ybxa112,2,

42、(,),(),.,()nnx yx yx yba題型一題型一 相關(guān)關(guān)系的判斷相關(guān)關(guān)系的判斷 【例1】下列兩個(gè)變量之間的關(guān)系是相關(guān)關(guān)系的是 ( )a. 正方體的棱長(zhǎng)與體積 b. 單位面積產(chǎn)量為常數(shù)時(shí),土地面積與產(chǎn)量c. 日照時(shí)間與水稻的畝產(chǎn)量d. 電壓一定時(shí),電流與電阻 分析 函數(shù)關(guān)系和相關(guān)關(guān)系都是指兩個(gè)變量之間的關(guān)系,函數(shù)關(guān)系是兩變量之間的一種確定關(guān)系,而相關(guān)關(guān)系是一種不確定關(guān)系. 解 a、b、d中兩個(gè)變量間的關(guān)系都是確定的,所以是函數(shù)關(guān)系,c中的兩個(gè)變量間是相關(guān)關(guān)系,對(duì)于日照時(shí)間一定的水稻,仍可以有不同的畝產(chǎn). 學(xué)后反思 判斷兩個(gè)變量間的關(guān)系是函數(shù)關(guān)系還是相關(guān)關(guān)系,關(guān)鍵是判斷兩個(gè)變量間的關(guān)系

43、是否是確定的.若確定,則是函數(shù)關(guān)系;若不確定,則是相關(guān)關(guān)系.典例分析典例分析1.有五組變量:汽車的重量和汽車每消耗1升汽油所行駛的平均路程;平均日學(xué)習(xí)時(shí)間和平均學(xué)習(xí)成績(jī);某人每日吸煙量和其身體健康情況;正方形的邊長(zhǎng)和面積;汽車的載重量和百公里耗油量.其中兩個(gè)變量成正相關(guān)的是 ( )a. b. c. d. 解析:由相關(guān)的有關(guān)概念可知為正相關(guān),為負(fù)相關(guān),為函數(shù)關(guān)系. 答案:c 舉一反三舉一反三480470460410360330320水稻產(chǎn)量45403530252015施化肥量【例2】下面是水稻產(chǎn)量與施化肥量的一組觀測(cè)數(shù)據(jù) (1)將上述數(shù)據(jù)制成散點(diǎn)圖;(2)你能從散點(diǎn)圖中發(fā)現(xiàn)施化肥量與水稻產(chǎn)量近似

44、成什么關(guān)系嗎?水稻產(chǎn)量會(huì)一直隨施化肥量的增加而增長(zhǎng)嗎?分析 判斷變量間是否是線性相關(guān),一種常用的簡(jiǎn)便可行的方法就是作散點(diǎn)圖. 解(1)散點(diǎn)圖如下:(2)從圖中可以發(fā)現(xiàn)施化肥量與水稻產(chǎn)量具有線性相關(guān)關(guān)系.當(dāng)施化肥量由小到大變化時(shí),水稻產(chǎn)量由小變大,圖中的數(shù)據(jù)點(diǎn)大致分布在一條直線的附近,因此施化肥量和水稻產(chǎn)量近似成線性相關(guān)關(guān)系,但水稻產(chǎn)量只是在一定范圍內(nèi)隨著化肥施用量的增加而增長(zhǎng).學(xué)后反思 散點(diǎn)圖是由大量數(shù)據(jù)點(diǎn)分布構(gòu)成的,是定義在具有相關(guān)關(guān)系的兩個(gè)變量基礎(chǔ)之上的,對(duì)于性質(zhì)不明確的兩組數(shù)據(jù)可先作散點(diǎn)圖,直觀地分析它們有無關(guān)系及關(guān)系的密切程度.2.下表是某地的年降雨量(mm)與年平均氣溫()的數(shù)據(jù)資料

45、,兩者是線性相關(guān)關(guān)系嗎?求回歸直線方程有意義嗎?舉一反三舉一反三年平均氣溫() 12.5112.8412.8413.6913.3312.4713.05年降雨量(mm) 748542507813574701432解析:以x軸為年平均氣溫,y軸為年降雨量,可得相應(yīng)的散點(diǎn)圖如圖所示.因?yàn)閳D中各點(diǎn)并不在一條直線的附近,所以兩者不具有線性相關(guān)關(guān)系,沒必要用回歸直線進(jìn)行擬合.如果用公式求得回歸直線方程也是沒有意義的.題型二題型二 求回歸直線方程求回歸直線方程【例例3 3】在研究硝酸鈉的可溶性程度時(shí),對(duì)于不同的溫度觀測(cè)它在水中的溶解度,得觀測(cè)結(jié)果如下: 分析分析 利用公式確定參數(shù)a、b的值,從而求出回歸直線

46、方程. 溫度(x) 010205070溶解度(y) 66.776.085.0112.3128.0由資料看y對(duì)x呈線性相關(guān),試求回歸直線方程.51522130,66.7+76.0+85.0+112.3+128.093.6.550.8809.593.60.88093067.173.iiiiixyx yxybxxaybx解 回歸直線方程為y=0.8809x+67.173.學(xué)后反思學(xué)后反思 因?yàn)閥對(duì)x呈線性相關(guān)關(guān)系,所以可以用一元線性相關(guān)的方法解決問題.(1)利用公式 , 來計(jì)算回歸系數(shù),有時(shí)常制表對(duì)應(yīng)求出 ,以便于求和.(2)本題在計(jì)算時(shí)可以借助計(jì)算器.1221niiiniix ynxybxnxay

47、bx2,iiix y x 舉一反三舉一反三3. (2009日照模擬)某中學(xué)期中考試后,對(duì)成績(jī)進(jìn)行分析,從某班中選出5名學(xué)生的總成績(jī)和外語成績(jī)?nèi)缦卤恚?學(xué)生學(xué)科12345總成績(jī)(x)482383421364362外語成績(jī)(y)7865716461則外語成績(jī)對(duì)總成績(jī)的回歸直線方程是1,221,ybxanx ynxyi iibnxnxiiaybx設(shè)歸線,將數(shù)歸線為y=0.132x+14.7.y=0.132x+14:.7回直方程是以上據(jù)代入所以回直方程解析:答案 題型三題型三 利用回歸直線方程對(duì)總體進(jìn)行估計(jì)利用回歸直線方程對(duì)總體進(jìn)行估計(jì)【例4】(12分)下表是幾個(gè)國家近年來男性與女性的平均壽命(單位:

48、歲)情況:國家男性平均壽命(x) 女性平均壽(y) 調(diào)查年號(hào)中國70732000韓國73.480.42002馬來西亞7175.52003美國78.182.62005法國75.5822001日本78.685.62004(1)如果男性與女性的平均壽命近似成線性關(guān)系,求它們之間的回歸直線方程;(2)科學(xué)家預(yù)測(cè),到2075年,加拿大男性平均壽命為87歲.現(xiàn)請(qǐng)你預(yù)測(cè),到2075年,加拿大女性的平均壽命(精確到0.1歲).分析(1)本題若沒有告訴我們y與x間是呈線性相關(guān)的,應(yīng)首先進(jìn)行相關(guān)性檢驗(yàn).如果兩個(gè)變量不具備線性相關(guān)關(guān)系,或者說它們之間相關(guān)關(guān)系不顯著時(shí),即使求出回歸直線方程也是沒有意義的,而且其估計(jì)與

49、預(yù)測(cè)也是不可信的.(2)求回歸直線方程的關(guān)鍵:計(jì)算出211,.nniiiiixyxxy解 列表如下 1 2 3 4 5 6 70 73.4 71 78.1 75.5 78.6 73 80.4 75.5 82.6 82 85.6 5110 5901.36 5360.5 6451.06 6191 6728.16iixiyiix y 4 4662235742.08,33306.38,74.43,79.85,5539.82.11x yxxyxi iiii可得. 6 6(1),6682.66711.23,11.7.667.462261 1.2311.7.ybxax yxyi iibaybxxxiiyx設(shè)

50、歸線為歸線為所求回直的方程所求回直方程. . 8. 8(2)87,1.23 87 11.7 95.31 95.3.xy當(dāng)時(shí)x x. 10 10可預(yù)測(cè),到2075年,加拿大女性的平均壽命為95.3歲. . 12 12學(xué)后反思 利用回歸直線方程對(duì)總體進(jìn)行估計(jì)時(shí),需先求出回歸直線方程,然后代入回歸直線方程得到估計(jì)值. 舉一反三舉一反三4. 下表是某小賣部6天賣出熱茶的杯數(shù)(y)與當(dāng)天氣溫(x)的對(duì)比表.氣溫/ 261813104-1杯數(shù)202434385064(1)將上表中的數(shù)據(jù)制成散點(diǎn)圖; (2)你能從散點(diǎn)圖中發(fā)現(xiàn)當(dāng)天氣溫與熱茶杯數(shù)近似成什么關(guān)系嗎?(3)如果近似成線性關(guān)系的話,請(qǐng)求出回歸直線方程

51、來近似地表示這種線性關(guān)系;(4)如果某天的氣溫是-5 時(shí),預(yù)測(cè)這天小賣部賣出熱茶的杯數(shù).解析 (1)散點(diǎn)圖如圖:(2)從散點(diǎn)圖中發(fā)現(xiàn)當(dāng)天氣溫與熱茶杯數(shù)近似成線性相關(guān)關(guān)系.(3)求出回歸直線方程(用來近似地表示這種線性關(guān)系),用 來近似地表示這種線性關(guān)系.(4)如果某天的氣溫是-5,用 預(yù)測(cè)這天小賣部賣出熱茶的杯數(shù)約為1.6477 ( 5) 57.557 66y 1.647757.557yx1.647757.557yx10. (2009濱州模擬)某小賣部為了了解熱茶銷量y(杯)與氣溫x()之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了某4天賣出的熱茶的杯數(shù)與當(dāng)天氣溫,并制作了對(duì)照表如下: 氣溫()181310-1杯數(shù)2

52、4343864由表中數(shù)據(jù)算得線性回歸方程 中的 ,預(yù)測(cè)當(dāng)氣溫為-5時(shí),熱茶的銷量約為解析:由題意知 ,所以樣本中心點(diǎn)為(10,40),因?yàn)闃颖局行狞c(diǎn)必在線性回歸方程上,易得a=60,所以線性回歸方程為 ,根據(jù)回歸方程的預(yù)測(cè),當(dāng)氣溫為-5 時(shí),熱茶銷量為(-2)(-5)+60=70.答案:70 ybxa2b 10,40 xy260yx 考點(diǎn)演練考點(diǎn)演練11. 下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對(duì)照數(shù)據(jù). x3456y2.5344.5(1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖;(2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程

53、;(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線 性回歸方程,預(yù)測(cè)生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤?(參考數(shù)值:32.5+43+54+64.5=66.5) ybxa解析 (1)如圖,從散點(diǎn)圖看出兩組變量具有線性相關(guān)關(guān)系.24(2)3 2.5+4 3+5 4+6 4.5=66.5,134562.5 344.54.5,3.5,44422222345686,166.5-44.53.566.5630.7,86-44.586813.5-0.74.5=0.35.x yi iixyxiibaybx 故線性回歸方程為 . (3)根據(jù)回歸方程的預(yù)測(cè),現(xiàn)在生產(chǎn)

54、100噸產(chǎn)品消耗的標(biāo)準(zhǔn)煤的數(shù)量為0.7100+0.35=70.35(噸),故耗能減少了90-70.35=19.65(噸). y=0.7 +0.35x 故線性回歸方程為 . (3)根據(jù)回歸方程的預(yù)測(cè),現(xiàn)在生產(chǎn)100噸產(chǎn)品消耗的標(biāo)準(zhǔn)煤的數(shù)量為0.7100+0.35=70.35(噸),故耗能減少了90-70.35=19.65(噸). y=0.7 +0.35x12. 要分析學(xué)生初中升學(xué)考試的數(shù)學(xué)成績(jī)對(duì)高一年級(jí)數(shù)學(xué)學(xué)習(xí)有什么影響,在高一年級(jí)學(xué)生中隨機(jī)抽選10名學(xué)生,記錄他們?nèi)雽W(xué)的數(shù)學(xué)成績(jī)和高一年級(jí)期末數(shù)學(xué)考試成績(jī)?nèi)缦卤恚?學(xué)生編號(hào) 入學(xué)成績(jī)(x) 高一期末考試成績(jī)(y) 1636526778345524

55、88825819267189752738999895856107675(1)畫出散點(diǎn)圖;(2)求出線性回歸方程;(3)若某學(xué)生入學(xué)的數(shù)學(xué)成績(jī)?yōu)?0分,試估計(jì)他高一期末數(shù)學(xué)考試成績(jī)(保留兩位有效數(shù)字).解析 (1)入學(xué)成績(jī)(x)與高一期末考試成績(jī)(y)兩組變量的散點(diǎn)圖如圖.從散點(diǎn)圖看,這兩組變量具有線性相關(guān)關(guān)系.(2)設(shè)線性回歸方程為 ,在兩組變量具有顯著的線性相關(guān)關(guān)系的情況下, .因此所求的線性回歸方程是 . (3)若某學(xué)生入學(xué)的數(shù)學(xué)成績(jī)?yōu)?0分,代入式可求得 ,即這個(gè)學(xué)生高一期末數(shù)學(xué)考試成績(jī)的預(yù)測(cè)值為84分. yabx12210 .7 6 5 5 6,2 2 .4 1 0 8 0niiini

56、ibx yn xyayb xxn x22.410800.76556yx84y 第四節(jié)第四節(jié) 統(tǒng)計(jì)案例統(tǒng)計(jì)案例. 1. 回歸分析(1)回歸直線一組具有線性相關(guān)關(guān)系的數(shù)據(jù) 其回歸方程的截距和斜率分別為1,122(), (,), ., (,).nnxyxyxy12111()(),()11,( ,)niiiniinniiiixxyyaybx bxxxx yyx ynn其中稱為樣本點(diǎn)的中心.基礎(chǔ)梳理基礎(chǔ)梳理(2)相關(guān)系數(shù)r 12211()();()()niiinniiiixxyyrxxyy當(dāng)r0時(shí),表明兩個(gè)變量 ; 當(dāng)r0時(shí),表明兩個(gè)變量 .r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性 ;r的絕對(duì)值越接近于

57、0時(shí),表明兩個(gè)變量之間 .通常當(dāng)r的絕對(duì)值大于 時(shí)認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系.正相關(guān)負(fù)相關(guān)相關(guān)性越強(qiáng)幾乎不存在線性相關(guān)關(guān)系 0.75ybxae(3)隨機(jī)誤差在線性回歸模型 中,a和b為模型的 ,e是y與= 之間的 ,通常e為隨機(jī)變量,稱為隨機(jī)誤差,它的均值 線性回歸模型的完整表達(dá)式為 隨機(jī)誤差e的方差 越小,通過回歸直線 預(yù)報(bào)真實(shí)值y的精度 .2. 殘差分析(1)殘差對(duì)于樣本點(diǎn) 而言,相應(yīng)于它們的隨機(jī)誤差為 其估計(jì)值為 稱為相應(yīng)于點(diǎn) 的殘差.(2)用 來分析殘差特性;用 來刻畫回歸的效果.2未知參數(shù)誤差越高(1, 2,.,).iiiiieyyybxa inie( ,)iix y ybxa

58、2( )0,( )0.e ed e方差2,( )0,( ).ybxaee ed eybxa1,122(),(,),.,(,).nnx yxyxy(1, 2,.,),iiiiieyyybxa in22121()1()niiiniiiyyryy相關(guān)指數(shù)殘差圖3. 獨(dú)立性檢驗(yàn) (1)分類變量:變量的不同“值”表示個(gè)體所屬的 ,像這類變量稱為分類變量. (2)列聯(lián)表:列出的兩個(gè)分類變量的 ,稱為列聯(lián)表.(3)22列聯(lián)表:假設(shè)有兩個(gè)分類變量x和y,它們的可能取值分別為x1,x2和y1,y2,其 列聯(lián)表(稱為22列聯(lián)表)為22列聯(lián)表不同類別頻數(shù)表樣本頻數(shù)y1y1y2y2總計(jì)x1x1a ab ba+ba+b

59、x2x2c cd dc+dc+d總計(jì)a+ca+cb+db+da+b+c+da+b+c+d22()()()()()()n adbcknabcdab cd ac bd 其中為樣本容量 ,則利用獨(dú)立性檢驗(yàn)判斷表來判斷“x與y的關(guān)系”.2k(4)利用隨機(jī)變量 來確定在多大程度上可以認(rèn)為 的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn). “兩個(gè)分類變量有關(guān)系” 題型一題型一 回歸直線分析回歸直線分析【例1】彈簧長(zhǎng)度y(cm)隨所掛物體質(zhì)量x(g)不同變化的情況如下:(1)畫出散點(diǎn)圖; (2)求y對(duì)x的回歸直線方程;(3)預(yù)測(cè)所掛物體質(zhì)量為27 g時(shí)的彈簧長(zhǎng)度(精確到0.01 cm).物體質(zhì)量x 5101520253

60、0彈簧長(zhǎng)度y 7.258.128.959.9010.9611.80分析 利用散點(diǎn)圖可得出是否線性相關(guān),再利用公式求回歸直線方程,而關(guān)鍵是求和.典例分析典例分析解(1)散點(diǎn)圖:(2) =16(5+10+15+20+25+30)=17.5, =16(7.25+8.12+8.95+9.90+10.96+11.80)9.50. =1 077.7-617.59.502 275-617.520.183, =9.50-0.18317.56.30.y對(duì)x的回歸直線方程為xy662112 2 7 5,1 0 7 7 .7 ,iiiiixx yb a6.300.183 .yx(3)當(dāng)質(zhì)量為27 g時(shí),有 =6.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論