統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第1頁
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第2頁
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型1. 總體和樣本:在統(tǒng)計(jì)學(xué)中,把研究對(duì)象的全體叫做總體.把每個(gè)研究對(duì)象叫做個(gè)體.把總體中個(gè)體的總數(shù)叫做總體容量.為了研究總體T的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一部分:,心,,研究,我們稱它為樣本.其中個(gè)體的個(gè)數(shù)稱為樣本容量.2. 簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、戈咲、排隊(duì)等, 完全隨機(jī)地抽取調(diào)查單位。特點(diǎn)是:每個(gè)樣本單位被抽中的可能性相同(概率相等),樣本的每個(gè)單位完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣 是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少 時(shí),才采用這種方法。3. 簡(jiǎn)單隨機(jī)抽樣常用的方法:(1)抽簽法

2、;隨機(jī)數(shù)表法;計(jì)算機(jī)模擬法;使用統(tǒng)計(jì)軟件直接抽取。 在簡(jiǎn)單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允 許誤差范圍;概率保證程度。4 .抽簽法:(1)給調(diào)查對(duì)象群體中的每一個(gè)對(duì)象編號(hào);(2)準(zhǔn)備抽簽的工具,實(shí)施抽簽(3)對(duì)樣本中的每一個(gè)個(gè)體進(jìn)行測(cè)量或調(diào)查例:請(qǐng)調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動(dòng)情況。5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級(jí)中抽取10位同學(xué)參加某項(xiàng)活動(dòng)。1. 系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽 取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。K (抽樣距離)二N (總體規(guī)模)/n (樣本規(guī)模)前提條件

3、:總體中個(gè)體的排列對(duì)于研究的變量來說,應(yīng)是隨機(jī)的,即不存在 某種與研究變量相關(guān)的規(guī)則分布??梢栽谡{(diào)查允許的條件下,從不同的樣本幵始 抽樣,對(duì)比幾次樣本的特點(diǎn)。如果有明顯差別,說明樣本在總體中的分布承某種 循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2. 系統(tǒng)抽樣,即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘?duì)抽樣框的 要求較低,實(shí)施也比較簡(jiǎn)單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助 變量可供使用,總體單元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大 大提高估計(jì)精度。1. 分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或

4、層次中采用簡(jiǎn)單隨機(jī)抽樣或系用抽樣的辦法抽取一 個(gè)子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1. 先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2. 先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊 排列,最后用系統(tǒng)抽樣的方法抽取樣本。2. 分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同 的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):(1) 以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2) 以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變 量作為分層變量。(3) 以那

5、些有明顯分層區(qū)分的變量作為分層變量。3. 分層的比例問題:(1) 按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比 重來抽取子樣本的方法。(2) 不按比例分層抽樣:有的層次在總體中的比重太小, 其樣本量就會(huì)非常少, 此時(shí)采用該方法,主要是便于對(duì)不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。 如果要用樣本資料推斷總體時(shí),則需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整 樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。1、 樣 本均值:X 厘丄2Xnn2、.樣本標(biāo)準(zhǔn)差:S礙J% X)2 % X)2 區(qū)k»n3. 用樣本估計(jì)總體時(shí),如果抽樣的方法比較合理, 那么樣本可以反映

6、總體的信息, 但從樣本得到的信息會(huì)有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我 們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個(gè)估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時(shí),它們確實(shí) 反映了總體的信息。4. (1)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上或減去同一個(gè)共同的常數(shù),標(biāo)準(zhǔn) 差不變(2) 如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)乘以一個(gè)共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉?的k倍(3) 組數(shù)據(jù)中的最大值和最小值對(duì)標(biāo)準(zhǔn)差的影響,區(qū)間(X 3s,x 3s)的應(yīng)用; “去掉一個(gè)最高分,去掉一個(gè)最低分”中的科學(xué)道理1、 概念:(1)回歸直線方程(2)回歸系數(shù)2. 回歸直線方程

7、的應(yīng)用(1) 描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系(2) 利用回歸方程進(jìn)行預(yù)測(cè);把預(yù)報(bào)因子(即自變量x )代入回歸方程對(duì)預(yù)報(bào)量(即因變量 Y)進(jìn)行估計(jì),即可得到個(gè)體 Y值的容許區(qū)間。(3) 利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定 Y值的變化,通過控制x的范圍來實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo)。如已經(jīng)得到了空氣中 NO的濃度和汽車流量間的 回歸方程,即可通過控制汽車流量來控制空氣中NO的濃度。4應(yīng)用直線回歸的注意事項(xiàng)(1)做回歸分析要有實(shí)際意義;( 2)回歸分析前 , 最好先作出散點(diǎn)圖;(3)回歸直線不要外延。題型一選擇合適的抽樣方法簡(jiǎn)單隨機(jī)抽樣 ,也叫純隨機(jī)抽樣。 就是從總體

8、中不加任何分組、劃類、排隊(duì) 等,完全隨機(jī)地抽取調(diào)查單位系統(tǒng)抽樣 (等距抽樣或機(jī)械抽樣) :把總體的單位進(jìn)行排序,再計(jì)算出抽樣距 離,然后按照這一固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn) 單隨機(jī)抽樣的辦法抽取。分層抽樣 (類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、 年齡等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或?qū)哟沃胁?用簡(jiǎn)單隨機(jī)抽樣或系用抽樣的辦法抽取一個(gè)子樣本,最后,將這 些子樣本合起來構(gòu)成總體的樣本。1. 現(xiàn)有以下兩項(xiàng)調(diào)查:某裝訂廠平均每小時(shí)大約裝訂圖書362冊(cè),要求檢驗(yàn)員 每小時(shí)抽取40冊(cè)圖書,檢查其裝訂質(zhì)量狀況;某市有大型、中型與小型的商店共1500家,三者數(shù)量之比為

9、1 : 5 : 9.為了調(diào)查全市商店每日零售額情況,抽取 其中15家進(jìn)行調(diào)查. 完成、這兩項(xiàng)調(diào)查宜采用的抽樣方法依次是()A. 簡(jiǎn)單隨機(jī)抽樣法,分層抽樣法B. 分層抽樣法,簡(jiǎn)單隨機(jī)抽樣法C.分層抽樣法,系統(tǒng)抽樣法D .系統(tǒng)抽樣法,分層抽樣法2. 某社區(qū)有 400個(gè)家庭,其中高等收入家庭 120 戶,中等收入家庭 180戶,低收入家庭 1 0 0戶.為了調(diào)查社會(huì)購買力的某項(xiàng)指標(biāo), 要從中抽取一個(gè)容量為 100的樣 本記作;某校高一年級(jí)有 12名女排球運(yùn)動(dòng)員,要從中選出 3人調(diào)查學(xué)習(xí)負(fù)擔(dān)情 況,記作;那么,完成上述 2項(xiàng)調(diào)查應(yīng)采用的抽樣方法是()A.用隨機(jī)抽樣法,用系統(tǒng)抽樣法B.用分層抽樣法,用隨

10、機(jī)抽樣法C.用系統(tǒng)抽樣法,用分層抽樣法D. 用分層抽樣法,用系統(tǒng)抽樣法題型二: 系統(tǒng)抽樣剔除個(gè)體數(shù)計(jì)算 當(dāng)系統(tǒng)抽樣中樣本總量除以樣本容量不是整數(shù)時(shí),需要用簡(jiǎn)單隨機(jī)抽樣法剔除部分個(gè)體,剔除個(gè)35體的數(shù)量=樣本總量一組距卅羊本容量。例.若總體中含有 1650 個(gè)個(gè)體,現(xiàn)在要采用系統(tǒng)抽樣,從中抽取一個(gè)容量為的樣本,分段時(shí)應(yīng)從總體中隨機(jī)剔除 個(gè)個(gè)體,編號(hào)后應(yīng)均分為 _段,每段有 個(gè)個(gè)體.5,35,47題型三:分層抽樣有關(guān)計(jì)算 樣本容量分層抽樣特點(diǎn):各層抽樣比例 =總體抽樣比例=,每層抽取個(gè)體數(shù)量=該層個(gè)體總量 抽樣總體容量比例。經(jīng)典例題:某校高中部有三個(gè)年級(jí),其中高三有學(xué)生1000人,現(xiàn)采用分層抽樣法

11、抽取一個(gè)容量為185的樣本,已知在高一年級(jí)抽取了75人,高二年級(jí)抽取了 60人,則高中部共有多少學(xué)生?練習(xí).某單位業(yè)務(wù)人員、管理人員、后勤服務(wù)人員人數(shù)之比依次為15 : 3: 2.為了了解該單位職員的某種情況,采用分層抽樣方法抽出一個(gè)容量為n的樣本,樣本中業(yè)務(wù)人員人數(shù)為30,則此樣本的容量 門為( )C. 40D . 80題型四:頻率分布直方圖畫法步驟作頻率分布直方圖分布的步驟求極差(即一組數(shù)據(jù)中最大值與最小值的差)決定組距與組數(shù),一般樣本容量越大組數(shù)越多,經(jīng)常分為512組,組距盡量取整。將數(shù)據(jù)分組,通過唱票計(jì)算各組的頻數(shù)列頻率分布表,根據(jù)各組頻數(shù)計(jì)算頻率,列出頻率分布表畫出頻率分布直方圖,橫

12、軸只畫最小值與最大值之間部分,縱軸表示頻率組距的值題型五:由頻率分布直方圖估計(jì)眾數(shù)、平均數(shù)、中位數(shù)(由頻率分布直方圖估計(jì)眾數(shù):一般先計(jì)算各部分小矩形的面積,找到面積最大的矩形,取該矩形橫邊中點(diǎn)對(duì)應(yīng)的數(shù)即為所求(由頻率分布直方圖估計(jì)平均數(shù):一般利用平均數(shù)公式 X X.P, x2p2xnpn來計(jì)算,其中Xn表示第n個(gè)矩形橫邊中點(diǎn)對(duì)應(yīng)的數(shù),Pn表示第n個(gè)矩形的面積。(由頻率分布直方圖估計(jì)中位數(shù):就是平分直方圖面積且垂直于橫軸的直線對(duì)應(yīng)的數(shù)。前n個(gè)小矩形面積不足時(shí),不足部分?jǐn)?shù)值中位數(shù)=下一個(gè)矩形橫邊左端點(diǎn)+x組距該小矩形面積題型六:頻率分布表中未知量計(jì)算各組頻數(shù)之和二樣本容量,各組頻率之和 =1,各組

13、頻數(shù)我率二樣本容 數(shù)據(jù)落在某區(qū)間的概率 V區(qū)間包括的各組頻率之和經(jīng)典例題:為了了解小學(xué)生的體能情況,抽取了某小學(xué)同年級(jí)部分學(xué)生進(jìn)行跳繩測(cè)試,將所得的數(shù)據(jù)整理后畫出頻率分布直方圖(如下圖),已知圖中從左到右的 前三個(gè)小組的頻率分別是,.第一小組的頻數(shù)是5.(1)求第四小組的頻率和參加這次測(cè)試的學(xué)生人數(shù);(2)在這次測(cè)試中,學(xué)生跳繩次數(shù)的中位數(shù)落在第幾小組內(nèi)?(3)參加這次測(cè)試跳繩次數(shù)在100次以上為優(yōu)秀,試估計(jì)該校此年級(jí)跳繩成績(jī)優(yōu)秀率是多少?組試估計(jì)該年級(jí)學(xué)生平均跳繩次數(shù),中位數(shù)、眾數(shù)練習(xí)一.2005年降雨量的概率如下表所示:次數(shù)(1)求年降雨量在100,200范圍內(nèi)的概率;(2)求年降雨量在1

14、50,200或250,300范圍內(nèi) 的概率; 求年降雨量不在150,300范圍內(nèi)的概率;(4)求年降雨量在100,300范圍內(nèi)的概率.年降雨量/mm概率0. 120. 250. 160. 14練習(xí)2某地區(qū)的年降水量在下列范圍內(nèi)的概率如下表所示年降水量(單位::100,:150,:200,:250,mm150)200)250)300)概率則年降水量在150, 300 (mm范圍內(nèi)的概率為()A. B . C .D練習(xí)3. (2014重慶文17)(本小題滿分13分.(I )小問4分,(II )小問4分,(III )小問5分)20名學(xué)生某次數(shù)學(xué)考試成績(jī)(單位:分)的頻率分布直方圖如圖所示: 洞穿高考

15、預(yù)測(cè)題六(I)求頻率分布直方圖中a的值;(II )分別求出成績(jī)落在50,60與60,70中的學(xué)生人數(shù);(III )從成績(jī)?cè)?0,70的學(xué)生中任選2人,求此2人的成績(jī)都在60,70中的概率.題型七:用平均數(shù)和方差判斷產(chǎn)品質(zhì)量、成績(jī)好壞、產(chǎn)量高低等平均數(shù)和方差(標(biāo)準(zhǔn)差)都是反映數(shù)據(jù)離散程度的工具。成績(jī)好壞、產(chǎn)量高低等指標(biāo)首先看平均數(shù)越高越好,當(dāng)平均數(shù)相近或相同時(shí),可以用方差(標(biāo)準(zhǔn)差)來刻畫樣本的穩(wěn)定性。題型八:求線性相關(guān)的兩個(gè)變量的回歸直線方程,并作出適當(dāng)預(yù)測(cè)第一步:作散點(diǎn)圖第二步:求回歸方程第三步:代值計(jì)算nn_xx nX y(Xj x)(yi y)求線性回歸方程系數(shù)公式:I?匕,? y bX.X2 nX2(xi x)2i 1i 1重要結(jié)論正相關(guān)則 b> 0,負(fù)相關(guān)則bv 0,當(dāng)解釋變量增加一個(gè)單位時(shí),預(yù)報(bào)變量相應(yīng)增加(b>0)或減少(b v 0) | b丨個(gè)單位? y bx , (x, y)稱為樣本點(diǎn)的中心,此點(diǎn)一定在回歸直線上。用回歸直線方程計(jì)算出的 y值不是真實(shí)值,真實(shí)值在計(jì)算值的左右,可能大,可能小也可能相等。相關(guān)指數(shù)R2用來刻畫擬合效果,R2的值越大,擬合效果越好,反之則越差,一般選擇 氏值大的模型。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論