高中數(shù)學統(tǒng)計板塊二頻率直方圖講義(學生版)_第1頁
高中數(shù)學統(tǒng)計板塊二頻率直方圖講義(學生版)_第2頁
高中數(shù)學統(tǒng)計板塊二頻率直方圖講義(學生版)_第3頁
高中數(shù)學統(tǒng)計板塊二頻率直方圖講義(學生版)_第4頁
高中數(shù)學統(tǒng)計板塊二頻率直方圖講義(學生版)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

學而思高中完好講義:直線與圓錐曲線.板塊一.直線與橢圓(1).學生版知識內(nèi)容一.隨機抽樣1.隨機抽樣:知足每個個體被抽到的時機是均等的抽樣,共有三種常常采納的隨機抽樣方法:⑴簡單隨機抽樣:從元素個數(shù)為

N的整體中不放回地抽取容量為

n的樣本,假如每一次抽取時整體中的各個個體有同樣的可能性被抽到,這類抽樣方法叫做簡單隨機抽樣.抽出方法:①抽簽法:用紙片或小球分別標號后抽簽的方法.②隨機數(shù)表法:隨機數(shù)表是使用計算器或計算機的應用程序生成隨機數(shù)的功能生成的一張數(shù)表.表中每一地點出現(xiàn)各個數(shù)字的可能性同樣.隨機數(shù)表法是對樣本進行編號后,依據(jù)必定的規(guī)律從隨機數(shù)表中讀數(shù),并拿出相應的樣本的方法.簡單隨機抽樣是最簡單、最基本的抽樣方法.⑵系統(tǒng)抽樣:將整體分紅平衡的若干部分,而后依據(jù)早先擬訂的規(guī)則,從每一部分抽取一個個體,獲取所需要的樣本的抽樣方法.抽出方法:從元素個數(shù)為N的整體中抽取容量為n的樣本,假如整體容量能被樣本容量整除,設kN,先對整體進行編號,號碼從1到N,再從數(shù)字1到k中隨機抽取一個數(shù)s作nsk,s2k,,s(n1)k個數(shù),這樣就獲取容量為n的樣為開端數(shù),而后按序抽取第本.假如整體容量不可以被樣本容量整除,可隨機地從整體中剔除余數(shù),而后再按系統(tǒng)抽樣方法進行抽樣.系統(tǒng)抽樣合用于大規(guī)模的抽樣檢查,因為抽樣間隔相等,又被稱為等距抽樣.⑶分層抽樣:當整體有顯然差其他幾部分構成時,要反應整體狀況,常采納分層抽樣,使整體中各個個體按某種特色分紅若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在整體中所占比率進行簡單隨機抽樣,這類抽樣方法叫做分層抽樣.分層抽樣的樣本擁有較強的代表性,并且各層抽樣時,可靈巧采納不一樣的抽樣方法,應用寬泛.2.簡單隨機抽樣一定具備以下特色:⑴簡單隨機抽樣要求被抽取的樣本的整體個數(shù)N是有限的.⑵簡單隨機樣本數(shù)n小于等于樣本整體的個數(shù)N.⑶簡單隨機樣本是從整體中逐一抽取的.⑷簡單隨機抽樣是一種不放回的抽樣.⑸簡單隨機抽樣的每個個體入樣的可能性均為n.N3.系統(tǒng)抽樣時,當整體個數(shù)N恰巧是樣本容量n的整數(shù)倍時,取kN;n若N不是整數(shù)時,先從整體中隨機地剔除幾個個體,使得整體中節(jié)余的個體數(shù)能被樣本容n量n整除.因為每個個體被剔除的時機相等,因此整個抽樣過程中每個個體被抽取的時機仍舊相等,為N.n二.頻次直方圖列出樣本數(shù)據(jù)的頻次散布表和頻次散布直方圖的步驟:①計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差;極差②決定組距與組數(shù):取組距,用決定組數(shù);組距③決定分點:決定起點,進行分組;④列頻次散布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,獲取各小組的頻次.⑤繪制頻次散布直方圖:以數(shù)據(jù)的值為橫坐標,以頻次的值為縱坐標繪制直方圖,組距知小長方形的面積=組距×頻次=頻次.組距頻次散布折線圖:將頻次散布直方圖各個長方形上面的中點用線段連結起來,就獲取頻次分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩頭點沒有實質意義.整體密度曲線:樣本容量不停增大時,所分組數(shù)不停增添,分組的組距不停減小,頻次散布直方圖能夠用一條圓滑曲線yf(x)來描述,這條圓滑曲線就叫做整體密度曲線.整體密度曲線精準地反應了一個整體在各個地區(qū)內(nèi)取值的規(guī)律.三.莖葉圖制作莖葉圖的步驟:①將數(shù)據(jù)分為“莖”、“葉”兩部分;②將最大莖與最小莖之間的數(shù)字按大小次序排成一列,并畫上豎線作為分開線;③將各個數(shù)據(jù)的“葉”在分界限的一側對應莖處同隊列出.四.統(tǒng)計數(shù)據(jù)的數(shù)字特色用樣本均勻數(shù)預計整體均勻數(shù);用樣本標準差預計整體標準差.數(shù)據(jù)的失散程序能夠用極差、方差或標準差來描述.極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反應一組數(shù)據(jù)的改動幅度;樣本方差描述了一組數(shù)據(jù)均勻數(shù)顛簸的大小,樣本的標準差是方差的算術平方根.一般地,設樣本的元素為x1,x2,,xn樣本的均勻數(shù)為x,定義樣本方差為2(x1x)2(x2x)2(xnx)2,sn(xx)2(x2x)2(xnx)2樣本標準差s1n簡化公式:s21[(x12x22xn2)nx2].n五.獨立性查驗1.兩個變量之間的關系;常有的有兩類:一類是確立性的函數(shù)關系;另一類是變量間存在關系,但又不具備函數(shù)關系所要求確實定性,它們的關系是帶有必定隨機性的.當一個變量取值一準時,另一個變量的取值帶有必定隨機性的兩個變量之間的關系叫做有關關系.2.散點圖:將樣本中的n個數(shù)據(jù)點(xi,yi)(i12)描在平面直角坐標系中,就獲取,,,n了散點圖.散點圖形象地反應了各個數(shù)據(jù)的親密程度,依據(jù)散點圖的散布趨向能夠直觀地判斷剖析兩個變量的關系.3.假如當一個變量的值變大時,另一個變量的值也在變大,則這類有關稱為正有關;此時,散點圖中的點在從左下角到右上角的地區(qū).反之,一個變量的值變大時,另一個變量的值由大變小,這類有關稱為負有關.此時,散點圖中的點在從左上角到右下角的地區(qū).散點圖能夠判斷兩個變量之間有沒有有關關系.4.統(tǒng)計假定:假如事件A與B獨立,這時應當有P(AB)P(A)P(B),用字母H0表示此式,即H0:P(AB)P(A)P(B),稱之為統(tǒng)計假定.5.2(讀作“卡方”)統(tǒng)計量:統(tǒng)計學中有一個特別實用的統(tǒng)計量,它的表達式為2n(n11n22n12n21)2,用它的大小能夠n1n2n1n2用來決定能否拒絕本來的統(tǒng)計假定H0.假如2的值較大,就拒絕H0,即以為A與B是有關的.2統(tǒng)計量的兩個臨界值:3.841、6.635;當23.841時,有95%的掌握說事件A與B有關;當26.635時,有99%的掌握說事件A與B有關;當2≤3.841時,以為事件A與B是沒關的.獨立性查驗的基本思想與反證法近似,由結論不建即刻推出有益于結論建立的小概率事件發(fā)生,而小概率事件在一次試驗中往常是不會發(fā)生的,所以以為結論在很大程度上是建立的.1.獨立性查驗的步驟:統(tǒng)計假定:H0;列出22聯(lián)表;計算2統(tǒng)計量;核對臨界值表,作出判斷.2.幾個臨界值:P(2≥2.706)0.10,P(2≥3.841)0.05,P(2≥6.635)0.01.22聯(lián)表的獨立性查驗:22假如關于某個集體有兩種狀態(tài),關于每種狀態(tài)又有兩個狀況,這樣排成一張的表,如下:狀態(tài)B狀態(tài)B共計狀態(tài)An11n12n1狀態(tài)An21n22n2n1n2n假如有檢查得來的四個數(shù)據(jù)n11,n12,n21,n22,并希望依據(jù)這樣的4個數(shù)據(jù)來查驗上述的兩種狀態(tài)A與B能否有關,就稱之為22聯(lián)表的獨立性查驗.六.回歸剖析1.回歸剖析:關于擁有有關關系的兩個變量進行統(tǒng)計剖析的方法叫做回歸剖析,即回歸剖析就是找尋有關關系中這類非確立關系的某種確立性.回歸直線:假如散點圖中的各點都大概散布在一條直線鄰近,就稱這兩個變量之間擁有線性有關關系,這條直線叫做回歸直線.2.最小二乘法:記回歸直線方程為:?abx,稱為變量Y對變量x的回歸直線方程,此中a,b叫做回歸y系數(shù).?y,當xxyi,而直線上對應于xy是為了劃分Y的實質值取值i時,變量Y的相應察看值為i的縱坐標是?bxi.yia設x,Y的一組察看值為(xi,yi),i1,2,,n,且回歸直線方程為y?abx,當x取值xi時,Y的相應察看值為yi,差yiy?i(i1,2,,n)刻畫了實質察看值yi與回歸直線上相應點的縱坐標之間的偏離程度,稱這些值為離差.我們希望這n個離差構成的總離差越小越好,這樣才能使所找的直線很切近已知點.n(yiabxi)2,回歸直線就是所有直線中記QQ取最小值的那條.i1這類使“離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數(shù)a,b有以下的公式:?b

nxiyinxy?i1,a?nybx,此中a,b上方加“^”,表示是由察看值按最小二乘法求得xi2nx2i1的回歸系數(shù).3.線性回歸模型:將用于預計y值的線性函數(shù)abx作為確立性函數(shù);y的實質值與預計值之間的偏差記為,稱之為隨機偏差;將yabx稱為線性回歸模型.產(chǎn)生隨機偏差的主要原由有:①所用確實定性函數(shù)不恰立即模型近似惹起的偏差;②忽視了某些要素的影響,往常這些影響都比較??;③因為丈量工具等原由,存在觀察偏差.4.線性回歸系數(shù)的最正確預計值:利用最小二乘法能夠獲取?的計算公式為a?,bnni1(xix)(yiy)i1xiyinxy?1n1n,?,bnnybx,此中xxiyyi222ani(xini11i1x)i1xin(x)由此獲取的直線??bx就稱為回歸直線,此直線方程即為線性回歸方程.此中?,b分a別為a,b的預計值,?稱為回歸截距,b稱為回歸系數(shù),?稱為回歸值.a(chǎn)5.有關系數(shù):6.有關系數(shù)r的性質:|r|≤1;|r|越湊近于1,x,y的線性有關程度越強;⑶|r|越湊近于0,x,y的線性有關程度越弱.可見,一條回歸直線有多大的展望功能,和變量間的有關系數(shù)親密有關.7.轉變思想:依據(jù)專業(yè)知識或散點圖,對某些特別的非線性關系,選擇適合的變量代換,把非線性方程轉變?yōu)榫€性回歸方程,進而確立未知參數(shù).8.一些存案①回歸(regression)一詞的來歷:“回歸”這個詞英國統(tǒng)計學家FrancilsGalton提出來的.1889年,他在研究先人與后輩的身高之間的關系時發(fā)現(xiàn),身材較高的父親母親,他們的孩子也較高,但這些孩子的均勻身高并無他們父親母親的均勻身高高;身材較矮的父親母親,他們的孩子也較矮,但這些孩子的均勻身高卻比他們父親母親的均勻身高高.Galton把這類后輩的身高向中間值湊近的趨向稱為“回歸現(xiàn)象”.以后,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸剖析.②回歸系數(shù)的推導過程:na22a(bxiyi)b2xi22bxiyiyi2,把上式當作a的二次函數(shù),a2的系數(shù)n0,所以當a2(bxiyi)yibxi時取最小值.2nn同理,把Q的睜開式按b的降冪擺列,當作b的二次函數(shù),當bxiyiaxi時取最小值.xi2nxiyinxy(xix)(yiy)解得:bi1ybx,nxi2nx2(xix)2,ai1此中y11xi是樣本均勻數(shù).nyi,xn9.對有關系數(shù)r進行有關性查驗的步驟:①提出統(tǒng)計假定H0:變量x,y不擁有線性有關關系;②假如以95%的掌握作出推測,那么能夠依據(jù)10.950.05與n2(n是樣本容量)在相關性查驗的臨界值表中查出一個r的臨界值r0.05(此中10.950.05稱為查驗水平);③計算樣真有關系數(shù)r;④作出統(tǒng)計推測:若|r|r0.05,則否認H0,表示有95%的掌握以為變量y與x之間擁有線性有關關系;若|r|≤r0.05,則沒有原由拒絕H0,即就當前數(shù)據(jù)而言,沒有充分原由以為變量y與x之間擁有線性有關關系.說明:⑴對有關系數(shù)r進行明顯性查驗,一般取查驗水平0.05,即靠譜程度為95%.⑵這里的r指的是線性有關系數(shù),r的絕對值很小,不過說明線性有關程度低,不必定不有關,可能是非線性有關的某種關系.⑶這里的r是對抽樣數(shù)據(jù)而言的.有時即便|r|1,二者也不必定是線性有關的.故在統(tǒng)計剖析時,不可以就數(shù)據(jù)論數(shù)據(jù),要聯(lián)合實質狀況進行合理解說.典例剖析題型一頻次散布直方圖【例1】(2010西城二模)某區(qū)高二年級的一次數(shù)學統(tǒng)考取,隨機抽取200名同學的成績,成績所有在50分至100分之間,將成績按以下方式分紅5組:第一組,成績大于等于50分且小于60分;第二組,成績大于等于60分且小于70分;第五組,成績大于等于90分且小于等于100分,據(jù)此繪制了以下圖的頻次散布直方圖.則這200名同學中成績大于等于80分且小于90分的學生有______名.【例2】(2010東城二模)已知一個樣本容量為100的樣本數(shù)據(jù)的頻次散布直方圖以下圖,樣本數(shù)據(jù)落在[6,10)內(nèi)的樣本頻數(shù)為,樣本數(shù)據(jù)落在[2,10)內(nèi)的頻次為.【例3】(2010北京)從某小學隨機抽取100名同學,將他們的身高(單位:厘米)數(shù)據(jù)繪制成頻次散布直方圖(如圖).由圖中數(shù)據(jù)可知a.若要從身高在120,130,130,140,140,150三組內(nèi)的學生中,用分層抽樣的方法選用18人參加一項活動,則從身高在140,150內(nèi)的學生中選用的人數(shù)應為.【例4】(2010江蘇高考)某棉紡廠為了認識一批棉花的質量,從中隨機抽取了100根棉花纖維的長度(棉花纖維的長度是棉花質量的重要指標),所得數(shù)據(jù)都在區(qū)間5,40中,其頻次散布直方圖以下圖,則其抽樣的100根中,有____根在棉花纖維的長度小于20mm.【例5】(2009湖北15)以下圖是樣本容量為200的頻次散布直方圖.依據(jù)樣本的頻次散布直方圖預計,樣本數(shù)據(jù)落在6,10內(nèi)的頻數(shù)為,數(shù)據(jù)落在2,10內(nèi)的概率約為.【例6】(2009福建3)一個容量為100的樣本,其數(shù)據(jù)的分組與各組的頻數(shù)以下:組0,1010,2020,3030,4040,5050,6060,70別頻1213241516137數(shù)則樣本數(shù)據(jù)落在10,40上的頻次為()A.0.13B.0.39C.0.52D.0.64【例7】某校為了認識學生的課外閱讀狀況,隨機檢查了50名學生,獲取他們在某一天各自課外閱讀所用時間的數(shù)據(jù),結果用下邊的條形圖表示,依據(jù)條形圖可得這50名學生這天均勻每人的課外閱讀時間為()A.0.6hB.0.9hC.1.0hD.1.5h【例8】為了檢查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的數(shù)目.產(chǎn)品數(shù)目的分組區(qū)間為45,55,55,65,65,75,75,85,85,95由此獲取頻次散布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)目在55,75的人數(shù)是.【例9】(2009山東8)某工廠對一批產(chǎn)品進行了抽樣檢測.右圖是依據(jù)抽樣檢測后的產(chǎn)品凈重(單位:克)數(shù)據(jù)繪制的頻次散布直方圖,此中產(chǎn)品凈重的范圍是[96,106],樣本數(shù)據(jù)分組為96,98,98,100,100,102,102,104,[104,106].已知樣本中產(chǎn)品凈重小于100克的個數(shù)是36,則樣本中凈重要于或等于98克并且小于104克的產(chǎn)品的個數(shù)是()A.90B.75C.60D.451000【例10】某路段檢查站監(jiān)控錄象顯示,在某時段內(nèi),有輛汽車經(jīng)過該站,此刻隨機抽取此中的200輛汽車進行車速剖析,剖析的結果表示為右圖的頻次散布直方圖,則預計在這一時段內(nèi)經(jīng)過該站的汽車中速度不小于90km/h的車輛數(shù)為()A.200B.600C.500D.300【例11】(2006年全國II)一個社會檢查機構就某地居民的月收入檢查了10000人,并依據(jù)所得數(shù)據(jù)畫了樣本頻次散布直方圖,為了剖析居民的收入與年紀、學歷、職業(yè)等方面的聯(lián)系,要從這10000人頂用分層抽樣的方法抽出100人做進一步檢查,則在[2500,3000](元)月收入段應抽出_____人.【例12】如圖為某樣本數(shù)據(jù)的頻次散布直方圖,則以下說法不正確的選項是()A.[6,10)的頻次為0.32B.若樣本容量為100,則[10,14)的頻數(shù)為40C.若樣本容量為100,則(,10]的頻數(shù)為40D.由頻次散布布直方圖可得出結論:預計整體大概有10%散布在[10,14)【例13】(2006北京模擬)下邊是某學校學誕辰睡眠時間的抽樣頻次散布表:睡眠時間人數(shù)頻次[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9)20.02共計1001畫出頻次散布直方圖,預計該校學生的日均勻睡眠時間.【例14】(2010崇文一模)為了檢查某廠2000名工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了m位工人某天生產(chǎn)該產(chǎn)品的數(shù)目,產(chǎn)品數(shù)目的分組區(qū)間為10,15,15,20,20,25,25,30,[30,35],頻次散布直方圖以下圖.已知生產(chǎn)的產(chǎn)品數(shù)目在20,25之間的工人有位.⑴求m;⑵工廠規(guī)定從各組中任選1人進行再培訓,則選用5人不在同一組的概率是多少?171169167169151168170160168174165168174159167156157164169180176157162161158164163163167161【例15】考察某校高三年級男生的身高,隨機抽取40名高三男生,實測身高數(shù)據(jù)(單位:cm)以下:⑴作出頻次散布表;⑵畫出頻次散布直方圖.【例16】(2010陜西卷高考)為認識學生身高狀況,某校以10%的比率對全校700名學生按性別進行出樣檢查,測得身高狀況的統(tǒng)計圖以下:⑴預計該小男生的人數(shù);⑵預計該校學生身高在170~185cm之間的概率;⑶從樣本中身高在165~180cm之間的女生中任選2人,求起碼有1人身高在..170~180cm之間的概率.【例17】從某校高一年級的1002名重生頂用系統(tǒng)抽樣的方法抽取一個容量為100的身高樣本,以下(單位:cm).作出該樣本的頻次散布表,畫出頻次散布直方圖及折線圖,并依據(jù)作出的頻次散布直方圖預計身高不小于170的同學的人數(shù).168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174170165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166【例18】

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論