版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、體育統(tǒng)計(jì)學(xué)第一章 緒論第一節(jié) 體育統(tǒng)計(jì)及其研究對象統(tǒng)計(jì)的作用客觀事物的特征質(zhì)的特征量的特征統(tǒng)計(jì)活動研究 統(tǒng)計(jì)的分類(從性質(zhì)上)(一) 描述性統(tǒng)計(jì) 對事物的特征與狀態(tài)進(jìn)行數(shù)量描述 身高=226 cm 體重=141 kg百米速度=15 s 投籃命中率=52% (二) 推斷性統(tǒng)計(jì) 通過樣本數(shù)量特征估計(jì)推斷總體特征總體抽取隨機(jī)樣本均值 X = 14.6秒抽樣總體平均成績是14.6秒嗎 體育統(tǒng)計(jì)的概念體育統(tǒng)計(jì)是運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法對體育領(lǐng)域里各種隨機(jī)現(xiàn)象規(guī)律性進(jìn)行研究的一門基礎(chǔ)應(yīng)用學(xué)科。屬于方法論學(xué)科范疇。理解:1:用普遍的方法研究特殊領(lǐng)域的問題。2:無論描述統(tǒng)計(jì)還是推斷統(tǒng)計(jì),都服務(wù)于對隨機(jī)現(xiàn)象規(guī)律
2、性的研究。 統(tǒng)計(jì)工作的基本過程統(tǒng)計(jì)資料的搜集統(tǒng)計(jì)資料的整理統(tǒng)計(jì)資料的分析統(tǒng)計(jì)資料的搜集:(基礎(chǔ)環(huán)節(jié))根據(jù)研究設(shè)計(jì)的要求獲取有關(guān)數(shù)據(jù)資料。統(tǒng)計(jì)資料的整理:(中間環(huán)節(jié))按照分析的要求對數(shù)據(jù)資料進(jìn)行審核和分類。統(tǒng)計(jì)資料的分析:(決定性階段)按照研究目的對整理后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理。 統(tǒng)計(jì)工作的基本過程 體育統(tǒng)計(jì)的研究對象及其特征研究對象:(1)體育領(lǐng)域里的各種可量化的隨機(jī)現(xiàn)象。(2)非體育領(lǐng)域里對體育發(fā)展有關(guān)的各種隨機(jī)現(xiàn)象。研究范圍逐漸擴(kuò)大了! 體育統(tǒng)計(jì)研究對象的特征運(yùn)動性特征:反映運(yùn)動能力心理能力等方面的數(shù)量指標(biāo)是具有 運(yùn)動性特征的。(1,與運(yùn)動有關(guān);2,是動態(tài)的)綜合性特征:兼有自然科學(xué)和社會科
3、學(xué)的綜合屬性??陀^性特征:數(shù)據(jù)來源于客觀事物本身,是對客觀事物的反映。第二節(jié) 體育統(tǒng)計(jì)在體育活動中的作用是體育教育科研活動的基礎(chǔ)有助于訓(xùn)練工作的科學(xué)化能幫助研究者制定研究設(shè)計(jì)能幫助研究者有效地獲取文獻(xiàn)資料總體與個體1,總體的概念:根據(jù)統(tǒng)計(jì)研究的具體研究目的而確定的同質(zhì)對象的全體。2,個體的概念:組成總體的每個基本單位。3,總體的分類:第三節(jié) 體育統(tǒng)計(jì)中的若干基本概念總體現(xiàn)存總體假想總體有限總體無限總體有限總體:基本研究單位的邊界是明晰的,并且基本研究單位的數(shù)量是有限的總體。無限總體:基本研究單位的數(shù)量是無限多個的總體。樣本1,樣本的概念:根據(jù)研究需要與可能,從總體中抽取的部 分研究對象所形成的
4、子集為樣本。2,樣本的分類:隨機(jī)樣本和非隨機(jī)樣本樣本隨機(jī)樣本非隨機(jī)樣本采用隨機(jī)抽樣方法獲得的樣本研究者根據(jù)研究需要,制定某些條件獲得的帶非隨機(jī)性質(zhì)的樣本必然事件和隨機(jī)事件1,必然事件:在確定的條件范圍內(nèi),必然發(fā)生 (或不發(fā)生)的事件。 (具備可預(yù)言性)2,隨機(jī)事件:在一定的實(shí)驗(yàn)條件下,有可能發(fā)生,也有可能不發(fā)生的事件。(具備不可預(yù)言性,只能猜)隨機(jī)變量1,隨機(jī)變量:隨機(jī)事件的數(shù)量表現(xiàn)。隨機(jī)變量連續(xù)型隨機(jī)變量離散型隨機(jī)變量至少理論上可以窮舉不能窮舉總體參數(shù)和樣本統(tǒng)計(jì)量1,總體參數(shù):反映總體數(shù)量特征的指標(biāo)。2,樣本統(tǒng)計(jì)量:反映樣本數(shù)量特征的指標(biāo)。概率1,古典概率:適用于總體明晰的情況下。2:統(tǒng)計(jì)概
5、率:適用于總體狀況不明的情況下。 補(bǔ)充內(nèi)容:連加和的縮寫式 在高等數(shù)學(xué)中,采用連加求和縮寫式形式來表示連加求和數(shù),它的一般形式為: 其中:連加求和號 變量(一組觀測數(shù)據(jù))在 中, i 是下標(biāo),n 是上標(biāo) , i 、n 表示連加求和的界限,即從通項(xiàng)公式具體分解的第一項(xiàng)開始相加一直到第n項(xiàng)為止。各具體項(xiàng)根據(jù) i 的取值不同而有所不同,i 取1為第一項(xiàng),取“n”為第n項(xiàng)。體育中常用的連加求和運(yùn)算: 為了避免符號過于復(fù)雜,今后凡在求和范圍可以看清的條件下,通常將號上下標(biāo)省略不寫,簡記為 補(bǔ)充內(nèi)容:連加和的縮寫式課堂練習(xí):展開連加和縮寫式體育統(tǒng)計(jì)學(xué)第二章 統(tǒng)計(jì)資料的收集與整理 收集資料的基本要求 1:資
6、料的準(zhǔn)確性 2:資料的齊同性 3:資料的隨機(jī)性 收集資料的基本方法 1:日常積累 2:全面普查 3:專題研究 第一節(jié) 統(tǒng)計(jì)資料的收集 幾種常用的抽樣方法簡單隨機(jī)抽樣(完全隨機(jī)抽樣)抽取特點(diǎn):1:不分組,不分類,不排隊(duì)地抽?。?2:總體中每個個體都有被抽中的機(jī)會; 3:總體中每個個體被抽中的機(jī)會是均等的。抽取方法:1:抽簽法 2:隨機(jī)數(shù)表法(見隨機(jī)數(shù)表)該方法的優(yōu)點(diǎn):樣本代表性好該方法的缺點(diǎn):總體含量大時,編號困難。工作量大。 幾種常用的抽樣方法分層抽樣抽取步驟方法:1:按屬性特征分成若干類型、部分或?qū)樱?:在類型、部分或?qū)又邪凑毡壤M(jìn)行簡單隨機(jī)抽樣。分層的需注意的問題:1:層間必須有清晰的界面
7、;(類間差異大,類內(nèi)差異小)2:必須知道各類型中的個體數(shù)目和比例;3:層的數(shù)目不宜太多,但也不要極少。分層抽樣的優(yōu)點(diǎn):1:能夠提高樣本代表性,又不至于給調(diào)查工作帶來麻煩,在代表性和工作量之間做出了平衡;2:適用于總體情況復(fù)雜、個體數(shù)目較多的情況。分層抽樣范例某大學(xué)體育系大一新生總體人數(shù)合計(jì)900人田徑350人籃球200人足球150人網(wǎng)球100人體操80人游泳20人分層田徑35人籃球20人足球15人網(wǎng)球10人體操8人游泳2人按照10%比例簡單隨機(jī)抽樣研究樣本含量為90人按照學(xué)生專項(xiàng)屬性分層繼續(xù)下一步的研究過程 幾種常用的抽樣方法整群抽樣整群抽樣的特點(diǎn):區(qū)別于簡單隨機(jī)抽樣和分層抽樣,抽樣的單位不再
8、是總體中的個體,是總體中的劃分出來的群。劃分群應(yīng)注意的問題: 群間差異要小,群內(nèi)差異要大。討論: 調(diào)查廣東省初中畢業(yè)生體質(zhì)達(dá)標(biāo)的情況。如何抽樣?第二節(jié) 統(tǒng)計(jì)資料的整理 資料的審核1:初審簡單排誤2:邏輯檢查專業(yè)知識、常識,指標(biāo)關(guān)系間排誤3:復(fù)核按比例抽樣復(fù)核 頻數(shù)整理頻數(shù)分布表的制作頻數(shù)分布表的編制(實(shí)例)【例】某小學(xué)五年級學(xué)生跳繩成績?nèi)缦拢▎挝唬簜€/分鐘)。對數(shù)據(jù)進(jìn)行分組。 117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123
9、118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121分組方法單變量值分組1. 將一個變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況單變量值分組表表 某小學(xué)五年級學(xué)生跳繩成績表成績(個)頻數(shù)(人)成績(個)頻數(shù)(人)成績(個)頻數(shù)(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組將變量值
10、的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組的步驟(等距分組)求全距(極差)R:R最大值最小值確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時,可以按 Sturges 提出的經(jīng)驗(yàn)公式來確定組數(shù)K確定組距I:組距(Class Width)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即:組距( 最大值最小值) 組數(shù) (k)確定組限 (組限:是指每組的起點(diǎn)值與終點(diǎn)值)5. 根據(jù)分組整理成頻數(shù)分布表 填寫組限 按照從上到下、從小到大的順序填寫,只寫下限,不寫上限 劃記
11、將數(shù)據(jù)逐個劃記到相應(yīng)的組中,五個為一組 計(jì)算:頻數(shù)(f);頻率;組中值( 組中值該組下限 組距2 )組距分組涉及的幾個概念1. 下 限:一個組的最小值2. 上 限:一個組的最大值3. 組 距:上限與下限之差4. 組中值:下限與上限之間的中點(diǎn)值課堂練習(xí)117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124
12、 115 139 128 124 121【例】某小學(xué)五年級學(xué)生跳繩成績?nèi)缦拢▎挝唬簜€/分鐘)。對數(shù)據(jù)進(jìn)行分組。 1.求全距(極差)R: R最大值(Xmax) 139最小值(Xmin) 107 322.確定組數(shù):3.確定組距: 組距( 最大值139 - 最小值107) 組數(shù)7 51 + 1.70/0.306.66774.確定組限: 第一組下限(L1)最小值(Xmin) 組距(I)/2 107 5 /2 104.5105 其他組組限的確定:從第一組開始,每一組的下限加上組距,就得到該組的上限,此上限又是下一組的下限,于是就形成了一列左閉右開的半開區(qū)間5.根據(jù)分組整理成頻數(shù)分布表:(略,參照書P17
13、-P18)需要說明的幾個問題 關(guān)于組數(shù)的確定: 1:可以依據(jù)已有的成熟的專業(yè)經(jīng)驗(yàn)來確定; 2:可參考前蘇聯(lián)專家制定的參考表(如右表)確定: 關(guān)于圖形的繪制:可以繪制直觀的圖形來方便了解數(shù)據(jù)的信息。較常使用的圖形形式有多邊形圖和直方圖等。圖形中,一般橫坐標(biāo)代表組限,縱坐標(biāo)代表頻數(shù)。樣本含量(n)分組數(shù)(k)30-605-860-1007-10100-2009-12200-50011-15作業(yè)1.每人準(zhǔn)備一本固定的作業(yè)本。2.教材P19第二章習(xí)題第4題,按照步驟與格式制作頻數(shù)分布表及其直方圖。體育統(tǒng)計(jì)學(xué)第三章 樣本特征數(shù)第一節(jié) 集中位置量數(shù)集中趨勢 (位置)離中趨勢 (分散程度)偏態(tài)和峰度(形狀)
14、數(shù)據(jù)的分布特征及其測量指標(biāo)數(shù)據(jù)特征及其測量指標(biāo)分布狀況集中趨勢離散程度方差和標(biāo)準(zhǔn)差平均差峰 度絕對差全距偏 態(tài)幾何平均數(shù)眾數(shù)中位數(shù)算術(shù)平均數(shù)集中趨勢(Central tendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的集中趨勢指標(biāo)值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢指標(biāo)值并不適用于低層次的測量數(shù)據(jù)選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定中位數(shù) (Median)中位數(shù),又稱中數(shù),中點(diǎn)數(shù)。 符號Md (Median),定義:是指位于一組數(shù)據(jù)中較大一半與較小一
15、半中間位置的那個數(shù)。Md50%50%中位數(shù) (Median)特征:此數(shù)可能是數(shù)據(jù)中的某一個,也可能根本不是原有的數(shù)據(jù)。不受極端值的影響計(jì)算方法:將數(shù)據(jù)依大小次序排列,若數(shù)據(jù)個數(shù)為奇數(shù),則取數(shù)列中間的那個數(shù)為中數(shù);若數(shù)據(jù)個數(shù)為偶數(shù),則取中間兩個數(shù)的平均數(shù)為中數(shù)。概念:樣本觀測值在頻數(shù)分布表中頻數(shù)最多的那一組的組中值。(分組數(shù)據(jù)的眾數(shù),屬于引申概念)原始概念:眾數(shù),符號Mo,它指在一組數(shù)中出現(xiàn)次數(shù)最多的那個數(shù)。計(jì)算方法是直接找到出現(xiàn)次數(shù)最多的那個數(shù)。眾數(shù)具有不唯一性。例如: 眾數(shù) (Mode)無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多于一個眾數(shù)原始數(shù)據(jù)
16、: 25 28 28 36 42 42分組數(shù)據(jù)中眾數(shù)的計(jì)算頻數(shù)最多的那一組的組中值。如書P21-P22:練習(xí):找找眾數(shù),利用上次所做的作業(yè)。幾何平均數(shù)概念:樣本觀測值的連乘積,并以樣本觀測值的總數(shù)作為次數(shù),開方所得的數(shù)據(jù)。主要適用于一組數(shù)據(jù)中有少量數(shù)據(jù)偏大或偏小,數(shù)據(jù)分布呈偏態(tài)。計(jì)算公式:舉例說明:1,2,3,4,8,16,42,108見教材P22,例題3.4算術(shù)平均數(shù)算術(shù)平均數(shù)簡稱為平均數(shù)或均值,符號為M(Mean)總體算術(shù)平均數(shù):希臘字母 (音:miu)樣本算術(shù)平均數(shù):英文字母 (音:X bar)。算術(shù)平均數(shù)是由所有數(shù)據(jù)之和除以數(shù)據(jù)個數(shù)所得的商數(shù),用公式表示為:算術(shù)平均數(shù)在應(yīng)用上有如下特點(diǎn)
17、:算術(shù)平均數(shù)是一個良好的集中量數(shù),具有反應(yīng)靈敏、確定嚴(yán)密、簡明易解、計(jì)算簡單、適合進(jìn)一步演算和較小受抽樣變化的影響等優(yōu)點(diǎn)。算術(shù)平均數(shù)易受極端數(shù)據(jù)的影響,這是因?yàn)槠骄鶖?shù)反應(yīng)靈敏,每個數(shù)據(jù)的或大或小的變化都會影響到最終結(jié)果。第二節(jié):離中趨勢量數(shù)數(shù)據(jù)分布的另一個重要特征離中趨勢的各指標(biāo)值是對數(shù)據(jù)離散程度所作的描述反映各變量值遠(yuǎn)離其中心值的程度,因此也稱為離中趨勢從另一個側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值 全距(極差,兩極差)概念:一組數(shù)據(jù)最大值與最小值之差。公式: R最大值(Xmax) 最小值(Xmin)特征與缺陷:1:能夠了解數(shù)據(jù)的范圍(區(qū)域,區(qū)間)。2:只考慮
18、極值,容易受到異常數(shù)據(jù)的影響,屬于粗略的指標(biāo)值,精細(xì)程度不夠。絕對差與平均差絕對差:平均差;方差和標(biāo)準(zhǔn)差1:是離散程度的測量指標(biāo)值之一,最常用。2:能反映數(shù)據(jù)的分布。3:能反映各變量值與均值的平均差異。4:根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差。4 6 8 10 12X = 8.3總體方差和標(biāo)準(zhǔn)差的計(jì)算公式總體方差的計(jì)算公式總體標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差樣本方差的計(jì)算公式樣本標(biāo)準(zhǔn)差的計(jì)算公式自由度(degree of freedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,只有n-1個數(shù)據(jù)可以自由取值
19、,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2時,它是2的無偏估計(jì)量 平均數(shù)與標(biāo)準(zhǔn)差在體育中的應(yīng)用平均數(shù)與標(biāo)準(zhǔn)差在決策中的直接應(yīng)用。變異系數(shù)在穩(wěn)定性研究中的應(yīng)用。 法在原始數(shù)據(jù)邏輯審核中的應(yīng)用。 平均數(shù)與標(biāo)準(zhǔn)差在決策中的直接應(yīng)用例題:教練員要從兩名標(biāo)槍運(yùn)動員中決定一人參加 比賽,如何作出決策?
20、 隊(duì)員甲:40.50;41.26;40.44;39.62;40.12 42.10;39.84;40.18;38.70;39.54 隊(duì)員乙:40.48;42.88;40.50;39.50;38.00; 43.32;38.72;41.82;36.84;40.24簡單應(yīng)用平局?jǐn)?shù)與標(biāo)準(zhǔn)差進(jìn)行數(shù)據(jù)決策的步驟:1:確定樣本數(shù)據(jù)的全域。2:確定樣本數(shù)據(jù)的平均水平。3:確定樣本數(shù)據(jù)的離散程度。4:根據(jù)專業(yè)專項(xiàng)應(yīng)用要求采取相應(yīng)不同決策。注意:決策前提是認(rèn)同所取得的數(shù)據(jù)是真實(shí)客觀有效的。 變異系數(shù)在穩(wěn)定性研究中的應(yīng)用例題:某運(yùn)動員主項(xiàng)為100m跑,兼項(xiàng)為跳遠(yuǎn),在競技期內(nèi),其主、兼項(xiàng)目測試結(jié)果如下: 100m: s
21、 s 跳遠(yuǎn): m m 試比較該運(yùn)動員主項(xiàng)、兼項(xiàng)成績的穩(wěn)定性。 (試比較該運(yùn)動員100m跑、跳遠(yuǎn)兩成績的離散程度。)解答:二者的指標(biāo)單位不同且性質(zhì)不同,不能夠直接進(jìn)行比較。 依據(jù)變異系數(shù)的概念特征,可以計(jì)算CV進(jìn)行比較:由于該運(yùn)動員100m跑的CV跳遠(yuǎn)的CV,故該運(yùn)動員的100m跑的成績比跳遠(yuǎn)成績穩(wěn)定。(或說100m跑成績的離散程度小于跳遠(yuǎn)成績)例題:隨機(jī)抽取某市300名初中男生的身高,經(jīng)檢驗(yàn)基本服從正態(tài)分布,并得出 cm, cm,在這300名學(xué)生中,有三人的身高原始數(shù)據(jù)為 cm, cm, cm。試用 法檢查這三個數(shù)據(jù)是否為可疑數(shù)據(jù)。 法進(jìn)行原始數(shù)據(jù)邏輯審核的步驟:1:求 的下限和上限。2:數(shù)據(jù)
22、檢驗(yàn),看數(shù)據(jù)是否存在 下限,上限 區(qū)間之內(nèi)。3:作出初步判定 a:在區(qū)間之內(nèi),可以初步認(rèn)定數(shù)據(jù)正常; b:在區(qū)間之外,需要進(jìn)一步審核數(shù)據(jù)的準(zhǔn)確性。法在原始數(shù)據(jù)邏輯審核中的應(yīng)用作業(yè)1.計(jì)算教材P19第二章習(xí)題第4題中樣本數(shù)據(jù)的所有集中量數(shù)指標(biāo)和離散量數(shù)指標(biāo)。2.教材P39第三章習(xí)題第2題。3.自習(xí)教材第三章與第四章未講到的內(nèi)容。體育統(tǒng)計(jì)學(xué)第五章 正態(tài)分布 正態(tài)分布的概念與性質(zhì)100個樣本數(shù)據(jù)的頻率分布直方圖200個樣本數(shù)據(jù)的頻率分布直方圖總體密度曲線無窮多個樣本數(shù)據(jù)的頻率分布直方圖正態(tài)分布的重要性1.描述連續(xù)型隨機(jī)變量的最重要的分布2.可用于近似連續(xù)型的離散變量的分布3.經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)xf
23、(x)概率密度函數(shù)f(x) :隨機(jī)變量 X 的頻數(shù) :總體方差 =3.14159; e = 2.71828x = 隨機(jī)變量的取值 (- x 0正態(tài)曲線的最高點(diǎn)在均值,它也是分布的中位數(shù)和眾數(shù)正態(tài)分布是一簇分布,每一特定正態(tài)分布通過均值和標(biāo)準(zhǔn)差來區(qū)分。 決定曲線的位置,稱為位置參數(shù);決定曲線的形狀,稱為形狀參數(shù)。曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠(yuǎn)不會與橫軸相交正態(tài)曲線下的總面積等于1,即概率值等于1隨機(jī)變量的概率由曲線下的面積給出 和 對正態(tài)曲線的影響xf(x)CAB正態(tài)分布的概率概率是曲線下的面積 !abxf(x)標(biāo)準(zhǔn)正態(tài)分布 任何一個一般的正態(tài)分布,可通過下面的
24、線性變換 轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)xms一般正態(tài)分布 =1u標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的重要性一般正態(tài)分布的不同取決于均值和標(biāo)準(zhǔn)差 計(jì)算概率時 ,每一個一般正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的。若能將一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計(jì)算概率時就只需查一張表(標(biāo)準(zhǔn)正態(tài)分布表)就可以了。先將一個一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布計(jì)算概率時,查標(biāo)準(zhǔn)正態(tài)概率分布表對于負(fù)的 x ,可由 (-x)- x得到對于標(biāo)準(zhǔn)正態(tài)分布,即X N(0,12),有P (a X b) b aP (|X| a) 2 a 1對于一般正態(tài)分布,即X N( , 2),有標(biāo)準(zhǔn)正態(tài)分
25、布表的使用 標(biāo)準(zhǔn)化的例子A(5,102)x =5=10一般正態(tài)分布6.2 =1u標(biāo)準(zhǔn)正態(tài)分布 00.12.0478P(5 X 6.2) 標(biāo)準(zhǔn)化的例子B(5,102)一般正態(tài)分布.1664.0832.0832標(biāo)準(zhǔn)正態(tài)分布P(2.9 X 7.1)正態(tài)分布(實(shí)例) 【例】設(shè)UN(0,12),求以下概率值: (1) P(U2); (3) P(-1U3) ; (4) P(| U| 2) 解:(1) P(U 2)=1- P(U 2)=1-0.9973=0.0227 (3) P(-1U 3)= P(U 3)- P(U-1) = (3)- (-1)= (3) 1-(1) = 0.9987-(1-0.8413)
26、=0.8354 (4) P(| U | 2) = P(-2 U 2)= (2)- (-2) = (2)- 1-(2)=2 (2)- 1=0.9545 正態(tài)分布(實(shí)例) 【例】設(shè)XN(5,32),求以下概率值 (1) P(X 10) ; (2) P(2X 10) 解: (1) (2)正態(tài)分布(實(shí)例)【例】設(shè)XN(1,4),求P (0X1.6)解: XN(1,4) XN(1,22) 故, = 1, = 2 P (0X1.6) 正態(tài)分布理論在體育中的應(yīng)用主要應(yīng)用方面:制定考核標(biāo)準(zhǔn)制定離差評價表進(jìn)行人數(shù)估算在綜合評價中統(tǒng)一 變量單位應(yīng)用正態(tài)分布理論制定考核標(biāo)準(zhǔn)制定考核標(biāo)準(zhǔn)的步驟:1:制作正態(tài)曲線的分布
27、草圖。2:計(jì)算出從 到 ui值所圍成的面積概率。3:查表求得各等級的ui值。4:求得各等級標(biāo)準(zhǔn)的原始成績xi值。舉例說明(如書本例5.1)應(yīng)用正態(tài)分布理論制定離差評價表制定離差評價表的步驟:1:根據(jù)指標(biāo)總數(shù)畫好框表。2:將各個指標(biāo)的平均數(shù)填入0標(biāo)準(zhǔn)差等級線與各個指標(biāo)縱線的交叉處。3:計(jì)算1標(biāo)準(zhǔn)差,2標(biāo)準(zhǔn)差,3標(biāo)準(zhǔn)差的對應(yīng)指標(biāo)數(shù)值,并填入各級標(biāo)準(zhǔn)差等級線與各個指標(biāo)縱線的交叉處。特別要注意計(jì)量的方向性(如:田徑中田賽與徑賽的計(jì)分區(qū)別)。4:依據(jù)指標(biāo)成績基礎(chǔ)值和指標(biāo)變化值畫出不同時期的變化圖線。5:注意離差等級的劃分標(biāo)準(zhǔn)合理制定。(參考標(biāo)準(zhǔn)有兩種)舉例說明(如書本例5.2)應(yīng)用正態(tài)分布理論進(jìn)行人數(shù)估
28、算應(yīng)用正態(tài)分布理論進(jìn)行人數(shù)估算的步驟:1:作正態(tài)分布曲線的草圖,以確定估計(jì)范圍。2:求各個區(qū)間的ui 值。3:查表找到所估計(jì)范圍的面積概率。4:計(jì)算估計(jì)范圍的人數(shù)。舉例說明(如書本例5.3)在綜合評價中統(tǒng)一 變量單位U分法:就是依據(jù)距離平均數(shù)有多少個標(biāo)準(zhǔn)差的距離來確定分?jǐn)?shù)的方法。如果距離平均數(shù)在正方向有2個標(biāo)準(zhǔn)差的距離,則記為U分為2分。在負(fù)方向有2個標(biāo)準(zhǔn)差距離,則記為U分為-2分。直接用u值來評分。Z分法:是通過U分轉(zhuǎn)換成更加符合實(shí)際運(yùn)用情況的分?jǐn)?shù)計(jì)量方法??梢赞D(zhuǎn)換為百分計(jì)分法,公式為:累計(jì)計(jì)分法:用于符合正態(tài)分布的前提下不等距升分的方法之一。其公式為:百分位數(shù)法:用于不符合正態(tài)分布的條件下
29、使用變換分?jǐn)?shù)的變量標(biāo)準(zhǔn)化法。其公式見教材P99(5.15)。作業(yè)1. P49 第三章課后習(xí)題第7題。2. P99 第五章課后習(xí)題第2題。3. P100 第五章課后習(xí)題第3題。4. P100 第五章課后習(xí)題第5題。體育統(tǒng)計(jì)學(xué)第六章 統(tǒng)計(jì)推斷 (假設(shè)檢驗(yàn)) 關(guān)于誤差的說明1:隨機(jī)誤差偶然因素造成,不可避免,無法消除2:系統(tǒng)誤差實(shí)驗(yàn)條件和研究方法造成的,可以改善3:抽樣誤差抽出的樣本統(tǒng)計(jì)量之間或樣本統(tǒng)計(jì)量與總體參數(shù)之間的偏差,主要由于個體間差異造成的,樣本含量增大時,抽樣誤差會有減少的趨勢4:人為誤差(過失錯誤)人為過失錯誤造成的統(tǒng)計(jì)數(shù)據(jù)的失真性。統(tǒng)計(jì)處理中最關(guān)心的是系統(tǒng)誤差和抽樣誤差。第一節(jié) 參數(shù)
30、估計(jì)第一節(jié) 參數(shù)估計(jì) 關(guān)于“標(biāo)準(zhǔn)誤”的概念表示樣本均數(shù)(或樣本率)與總體均數(shù) (或總體率)之間偏差程度的標(biāo)準(zhǔn)差。 均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式:第一節(jié) 參數(shù)估計(jì) 均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式:第一節(jié) 參數(shù)估計(jì) 點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn) 估 計(jì)選定適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量作為參數(shù)的估計(jì)量。區(qū)間估計(jì)以變量的概率分布規(guī)律來確定未知參數(shù) 值的可能范圍。置信概率在區(qū)間估計(jì)中,預(yù)選規(guī)定的概率。置信區(qū)間在區(qū)間估計(jì)中,按照預(yù)選規(guī)定的概率確 定下來的區(qū)間范圍。 置信區(qū)間的計(jì)算一:總體均數(shù)的置信區(qū)間1:大樣本含量(n45),可以認(rèn)定符合正態(tài)分布,根據(jù)正態(tài)分布原理,用u分計(jì)算。2:小樣本含量(n45),不符合正態(tài)分布,只能根據(jù)t分布原理,用t分
31、計(jì)算。二:總體率的置信區(qū)間 樣本含量必須足夠大(如:n100) p的抽樣分布逼近正態(tài)分布,用u分計(jì)算。計(jì)算公式:教材P108-109.假設(shè)檢驗(yàn)的基本思想及步驟 主要學(xué)習(xí)目標(biāo) : 假設(shè)檢驗(yàn)的基本知識 u 檢驗(yàn) t 檢驗(yàn) 卡方檢驗(yàn)(不講)什么是假設(shè)?假設(shè)是對總體參數(shù)的一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需要有合理的陳述我認(rèn)為:蛙跳訓(xùn)練能夠促進(jìn)100m跑成績的提高!什么是假設(shè)檢驗(yàn)?根據(jù)研究目的,對樣本所屬總體的特征提出一個假設(shè),然后根據(jù)樣本資料所提供的信息,對這個假設(shè)作出拒絕或者不拒絕的判斷,這一過程成為假設(shè)檢驗(yàn)。概念核心:事先對總體參數(shù)或分布形式作出某種假設(shè)然后利用樣本信息來判斷原
32、假設(shè)是否成立假設(shè)檢驗(yàn)的基本思想. 因此我們拒絕假設(shè) = 173 cm. 我們假設(shè)這個是總體的真實(shí)均值樣本均值m = 173 cm抽樣分布H0這個是我們抽樣得出的某個樣本均值 .150總體假設(shè)檢驗(yàn)的過程(提出假設(shè)抽取樣本作出決策)抽取隨機(jī)樣本均值 X = 15.6秒初三男生100M平均成績是13.6秒提出假設(shè) 拒絕假設(shè)! 別無選擇.作出決策假設(shè)檢驗(yàn)中的小概率原理 什么是小概率?1.在一次試驗(yàn)中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2.在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3.小概率由研究者事先確定(與置信區(qū)間相關(guān))抽樣分布H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受
33、域1 - 置信水平假設(shè)檢驗(yàn)的基本步驟(1)根據(jù)實(shí)際情況建立原假設(shè)H0 ,備擇假設(shè)H1(2)選擇并計(jì)算檢驗(yàn)統(tǒng)計(jì)量的取值(3)確定顯著性水平,查表得出相應(yīng)的臨界值(4)把實(shí)值與臨界值進(jìn)行比較,作出統(tǒng)計(jì)判斷 什么檢驗(yàn)統(tǒng)計(jì)量?1. 用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量2. 選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮是大樣本還是小樣本總體方差已知還是未知3.檢驗(yàn)統(tǒng)計(jì)量的基本形式為確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量提出原假設(shè)H0 和備擇假設(shè)H1 什么是原假設(shè)?(Null Hypothesis)1.待檢驗(yàn)的假設(shè),又稱“0假設(shè)、虛無假設(shè)”。2.如果錯誤地作出決策會導(dǎo)致一系列后果。3.總是有等號 , 或4.表示為 H0 H0 : 某一數(shù)值0
34、 例如, H0 : 1.73(米)提出原假設(shè)H0和備擇假設(shè)H1 什么是備擇假設(shè)?(Alternative Hypothesis)1.與原假設(shè)對立的假設(shè)2.總是有不等號: , 或 3.表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H1: F ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對觀察值有顯著影響若FF ,則不能拒絕原假設(shè)H0 ,表明所檢驗(yàn)的因素(A)對觀察值沒有顯著影響 單因素方差分析表(基本結(jié)構(gòu))方差來源平方和SS自由度df均方MSF 值組間(因素影響)組內(nèi)(誤差)總和SSASSESSTk-1n-kn-1MSAMSEMSAMSE單因素方差分析(一個例子)
35、【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的樣本,其中零售業(yè)抽取7家,旅游業(yè)抽取了6家,航空公司抽取5家、家電制造業(yè)抽取了5家,然后記錄了一年中消費(fèi)者對總共23家服務(wù)企業(yè)投訴的次數(shù),結(jié)果如表9.7。試分析這四個行業(yè)的服務(wù)質(zhì)量是否有顯著差異?(0.05)單因素方差分析(一個例子)消費(fèi)者對四個行業(yè)的投訴次數(shù) 觀察值( j )行業(yè)( A )零售業(yè)旅游業(yè)航空公司家電制造業(yè)123456757554645545347 624960545655 5149485547 7068636960 單因素方差分析(計(jì)算結(jié)果)解:設(shè)四個行業(yè)被投訴次數(shù)的均值分別
36、為,m1、m2 、m3、m4 ,則需要檢驗(yàn)如下假設(shè) H0: m1 = m2 = m3 = m4 (四個行業(yè)的服務(wù)質(zhì)量無顯著差異) H1: m1 ,m2 ,m3, m4不全相等 (有顯著差異)Excel輸出的結(jié)果如下 結(jié)論:拒絕H0。四個行業(yè)的服務(wù)質(zhì)量有顯著差異 方差分析中的多重比較 (作用)多重比較是通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底哪些均值之間有差異 LSD方法是對檢驗(yàn)兩個總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來代替)而得到的 方差分析中的多重
37、比較(步驟)提出假設(shè)H0: mi = mj (第i個總體的均值等于第j個總體的均值)H1: mi mj (第i個總體的均值不等于第j個總體的均值)檢驗(yàn)的統(tǒng)計(jì)量為 若|t|t,拒絕H0;若|t|t,不能拒絕H0方差分析中的多重比較(基于統(tǒng)計(jì)量xi-xj的LSD方法)通過判斷樣本均值之差的大小來檢驗(yàn) H0檢驗(yàn)的統(tǒng)計(jì)量為 :xi xj檢驗(yàn)的步驟為 提出假設(shè)H0: mi = mj (第i個總體的均值等于第j個總體的均值)H1: mi mj (第i個總體的均值不等于第j個總體的均值)計(jì)算LSD若|xi-xj| LSD,拒絕H0,若|xi-xj| 2.096 顏色1與顏色2的銷售量有顯著差異|x1-x3|
38、= |27.3-26.4| =0.92.096 顏色1與顏色4的銷售量有顯著差異|x2-x3|= |29.5-26.4| =3.12.096 顏色2與顏色3的銷售量有顯著差異|x2-x4|= |29.5-31.4| =1.92.096 顏色3與顏色4的銷售量有顯著差異體育統(tǒng)計(jì)學(xué)第八章 相關(guān)分析變量間的關(guān)系(函數(shù)關(guān)系)是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個數(shù)值時, y 依確定的關(guān)系取相應(yīng)的值,則稱 y 是 x 的函數(shù),記為 y = f (x),其中 x 稱為自變量,y 稱為因變量各觀測點(diǎn)落在一條線上 xy 函數(shù)關(guān)系的
39、例子圓的面積(S)與半徑之間的關(guān)系可表示為: S = R2 某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為: y = p x (p 為單價)變量間的關(guān)系(函數(shù)關(guān)系)變量間的關(guān)系(相關(guān)關(guān)系)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個變量的取值不能由另一個變量唯一確定當(dāng)變量 x 取某個值時,變量 y 的取值可能有幾個各觀測點(diǎn)分布在直線周圍 xy 相關(guān)關(guān)系的例子父親身高(y)與子女身高(x)之間的關(guān)系家庭收入狀況(y)與體育消費(fèi)(x)之間的關(guān)系體育用品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系變量間的關(guān)系(相關(guān)關(guān)系)相關(guān)關(guān)系的類型相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正
40、相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)相關(guān)系數(shù)對變量之間關(guān)系密切程度的度量對兩個變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)或積差相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為 r簡單相關(guān)系數(shù)(積差相關(guān)系數(shù)) 樣本相關(guān)系數(shù)的計(jì)算公式或化簡為相關(guān)系數(shù)取值及其意義 r 的取值范圍是 -1,1|r|=1,為完全相關(guān)r =1,為完全正相關(guān)r = -1,為完全負(fù)正相關(guān) r = 0,不存在線性相關(guān)-1 r 0,為負(fù)相關(guān) 0 t,拒絕H0 若tt,接受H0若IrI大
41、于表上的=5%相應(yīng)的值,且小于表上1%相應(yīng)的值,稱變量x與y之間有顯著的線性關(guān)系若IrI大于表上=1%相應(yīng)的值,稱變量x與y之間有十分(非常)顯著的線性關(guān)系若IrI小于表上=5%相應(yīng)的值,稱變量x與y之間沒有明顯的線性關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn) 相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)以例8.1為例:對其相關(guān)系數(shù)進(jìn)行檢驗(yàn)解:第一步:提出假設(shè): H0: ;H1: 0第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)第三步:確定顯著性水平,并作出決策體育統(tǒng)計(jì)學(xué)第九章 回歸分析(一元線性回歸)什么是回歸分析?(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某
42、一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量 x 和 y 都是隨機(jī)變量;回歸分析中,因變量 y 是隨機(jī)變量,自變量 x 可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量 x 對變量 y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制 回歸
43、模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸模型與回歸方程回歸模型回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1 個數(shù)字的因變量(響應(yīng)變量)被預(yù)測的變量1 個或多個數(shù)字的或分類的自變量 (解釋變量)用于預(yù)測的變量3.主要用于預(yù)測和估計(jì)一元線性回歸模型 (概念要點(diǎn))當(dāng)只涉及一個自變量時稱為一元回歸,若因變量 y 與自變量 x 之間為線性關(guān)系時稱為一元線性回歸對于具有線性關(guān)系的兩個變量,可以用一條線性方程來表示它們之間的關(guān)系描述因變量 y 如何依賴于自變量 x 和誤差項(xiàng) 的方程稱為回歸模型一元線性回歸模型 (概念要點(diǎn)) 對于只涉及一個自變量
44、的簡單線性回歸模型可表示為 y = b0 + b1 x + e模型中,y 是 x 的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于 x 的變化而引起的 y 的變化誤差項(xiàng) 是隨機(jī)變量反映了除 x 和 y 之間的線性關(guān)系之外的隨機(jī)因素對 y 的影響是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性0 和 1 稱為模型的參數(shù)一元線性回歸模型(基本假定)誤差項(xiàng)是一個期望值為0的隨機(jī)變量,即E()=0。對于一個給定的 x 值,y 的期望值為E ( y ) = 0+ 1 x對于所有的 x 值,的方差2 都相同誤差項(xiàng)是一個服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即N( 0 ,2 )獨(dú)立性意味著對于一個特定的 x
45、值,它所對應(yīng)的與其他 x 值所對應(yīng)的不相關(guān)對于一個特定的 x 值,它所對應(yīng)的 y 值與其他 x 所對應(yīng)的 y 值也不相關(guān)回歸方程 (概念要點(diǎn))描述 y 的平均值或期望值如何依賴于 x 的方程稱為回歸方程簡單線性回歸方程的形式如下 E( y ) = 0+ 1 x方程的圖示是一條直線,因此也稱為直線回歸方程0是回歸直線在 y 軸上的截距,是當(dāng) x=0 時 y 的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng) x 每變動一個單位時,y 的平均變動值估計(jì)(經(jīng)驗(yàn))的回歸方程簡單線性回歸中估計(jì)的回歸方程為其中: 是估計(jì)的回歸直線在 y 軸上的截距, 是直線的斜率,它表示對于一個給定的 x 的值,是 y 的估計(jì)
46、值,也表示 x 每變動一個單位時, y 的平均變動值 用樣本統(tǒng)計(jì)量 和 代替回歸方程中的未知參數(shù) 和 ,就得到了估計(jì)的回歸方程總體回歸參數(shù) 和 是未知的,必需利用樣本數(shù)據(jù)去估計(jì)參數(shù) 0 和 1 的最小二乘估計(jì)最小二乘法 (概念要點(diǎn))使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得 和 的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小最小二乘法(圖示)xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi最小二乘法 ( 和 的計(jì)算公式) 根據(jù)最小二乘法的要求,可得求解 和 的標(biāo)準(zhǔn)方程如下估計(jì)方程的求法(實(shí)例)
47、 【例】根據(jù)例10.1中的數(shù)據(jù),配合人均消費(fèi)金額對人均國民收入的回歸方程 根據(jù) 和 的求解公式得估計(jì)(經(jīng)驗(yàn))方程 人均消費(fèi)金額對人均國民收入的回歸方程為y = 54.22286 + 0.52638 x估計(jì)方程的求法(Excel的輸出結(jié)果)回歸方程的顯著性檢驗(yàn)離差平方和的分解因變量 y 的取值是不同的,y 取值的這種波動稱為變差。變差來源于兩個方面由于自變量 x 的取值不同造成的除 x 以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差 來表示離差平方和的分解(圖示)xyy離差分解圖離差平方和的分解 (三個平方和的關(guān)系)2.
48、 兩端平方后求和有從圖上看有SST = SSR + SSE總變差平方和(SST)回歸平方和(SSR)殘差平方和(SSE)離差平方和的分解 (三個平方和的意義)總平方和(SST)反映因變量的 n 個觀察值與其均值的總離差回歸平方和(SSR)反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩余平方和樣本決定系數(shù) (判定系數(shù) r2 )回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在 0 , 1 之間 r2 1
49、,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即r2(r)2回歸方程的顯著性檢驗(yàn) (線性關(guān)系的檢驗(yàn) )檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關(guān)系如果不顯著,兩個變量之間不存在線性關(guān)系回歸方程的顯著性檢驗(yàn) (檢驗(yàn)的步驟)提出假設(shè)H0:線性關(guān)系不顯著2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F 作出決策:若FF ,拒絕H0;若Ft,拒絕H0; tt=2.201,拒絕H0,表明
50、人均收入與人均消費(fèi)之間有線性關(guān)系對前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(0.05)回歸系數(shù)的顯著性檢驗(yàn)(Excel輸出的結(jié)果)預(yù)測及應(yīng)用利用回歸方程進(jìn)行估計(jì)和預(yù)測根據(jù)自變量 x 的取值估計(jì)或預(yù)測因變量 y的取值估計(jì)或預(yù)測的類型點(diǎn)估計(jì)y 的平均值的點(diǎn)估計(jì)y 的個別值的點(diǎn)估計(jì)區(qū)間估計(jì)y 的平均值的置信區(qū)間估計(jì)y 的個別值的預(yù)測區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(點(diǎn)估計(jì))2. 點(diǎn)估計(jì)值有y 的平均值的點(diǎn)估計(jì)y 的個別值的點(diǎn)估計(jì)3. 在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對于自變量 x 的一個給定值x0 ,根據(jù)回歸方程得到因變量 y 的一個估計(jì)值利用回歸方程進(jìn)行估計(jì)和預(yù)
51、測(點(diǎn)估計(jì)) y 的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的平均值的一個估計(jì)值E(y0) ,就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)人均國民收入為2000元時,所有年份人均消費(fèi)金額的的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利用回歸方程進(jìn)行估計(jì)和預(yù)測(點(diǎn)估計(jì)) y 的個別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的一個個別值的估計(jì)值 ,就是個別值的點(diǎn)估計(jì)2. 比如,如果我們只是想知道1990年人均國民收入為1250.7元時的人均消費(fèi)金額是多少,則屬于個別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利
52、用回歸方程進(jìn)行估計(jì)和預(yù)測 (區(qū)間估計(jì))點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對于自變量 x 的一個給定值 x0,根據(jù)回歸方程得到因變量 y 的一個估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)預(yù)測區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(置信區(qū)間估計(jì)) y 的平均值的置信區(qū)間估計(jì) 利用估計(jì)的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的平均值E(y0)的估計(jì)區(qū)間 ,這一估計(jì)區(qū)間稱為置信區(qū)間 E(y0) 在1-置信水平下的置信區(qū)間為式中:Sy為估計(jì)標(biāo)準(zhǔn)誤差利用回歸方程進(jìn)行估計(jì)和預(yù)測(置信區(qū)間估計(jì):算例) 【例】根據(jù)前例,求出人均國民收入為1250.7
53、元時,人均消費(fèi)金額95%的置信區(qū)間 解:根據(jù)前面的計(jì)算結(jié)果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為712.5710.265人均消費(fèi)金額95%的置信區(qū)間為702.305元722.835元之間利用回歸方程進(jìn)行估計(jì)和預(yù)測(預(yù)測區(qū)間估計(jì)) y 的個別值的預(yù)測區(qū)間估計(jì) 利用估計(jì)的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的一個個別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間 y0在1-置信水平下的預(yù)測區(qū)間為注意!利用回歸方程進(jìn)行估計(jì)和預(yù)測(置預(yù)測區(qū)間估計(jì):算例) 【例】根據(jù)前例,求出1990年人均國民收入為1250.7元時,人均消費(fèi)金額的95%的預(yù)測區(qū)
54、間 解:根據(jù)前面的計(jì)算結(jié)果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為712.5734.469人均消費(fèi)金額95%的預(yù)測區(qū)間為678.101元747.039元之間影響區(qū)間寬度的因素1.置信水平 (1 - )區(qū)間寬度隨置信水平的增大而增大2.數(shù)據(jù)的離散程度 (s)區(qū)間寬度隨離散程度的增大而增大3.樣本容量區(qū)間寬度隨樣本容量的增大而減小4.用于預(yù)測的 xp與x的差異程度區(qū)間寬度隨 xp與x 的差異程度的增大而增大置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測下限置信下限第三節(jié) 多元線性回歸一. 多元線性回歸模型回歸參數(shù)的估計(jì)回歸方程的顯著性檢驗(yàn)回歸系
55、數(shù)的顯著性檢驗(yàn)多元線性回歸的預(yù)測多元線性回歸模型多元線性回歸模型 (概念要點(diǎn))一個因變量與兩個及兩個以上自變量之間的回歸描述因變量 y 如何依賴于自變量 x1 , x2 , xp 和誤差項(xiàng) 的方程稱為多元線性回歸模型涉及 p 個自變量的多元線性回歸模型可表示為 b0 ,b1,b2 ,bp是參數(shù) 是被稱為誤差項(xiàng)的隨機(jī)變量 y 是x1,,x2 , ,xp 的線性函數(shù)加上誤差項(xiàng) 說明了包含在y里面但不能被p個自變量的線性關(guān)系所解釋的變異性多元線性回歸模型 (概念要點(diǎn)) 對于 n 組實(shí)際觀察數(shù)據(jù)(yi ; xi1,,xi2 , ,xip ),(i=1,2,n),多元線性回歸模型可表示為y1 = b0
56、+ b1 x11+ b2 x12 + bpx1p + e1y2= b0 + b1 x21 + b2 x22 + bpx2p + e2 yn= b0 + b1 xn1 + b2 xn2 + bpxnp + en多元線性回歸模型(基本假定)自變量 x1,x2,xp是確定性變量,不是隨機(jī)變量隨機(jī)誤差項(xiàng)的期望值為0,且方差2 都相同誤差項(xiàng)是一個服從正態(tài)分布的隨機(jī)變量,即N(0,2),且相互獨(dú)立多元線性回歸方程 (概念要點(diǎn))描述 y 的平均值或期望值如何依賴于 x1, x1 ,xp的方程稱為多元線性回歸方程多元線性回歸方程的形式為 E( y ) = 0+ 1 x1 + 2 x2 + p xp b1,b2,bp稱為偏回歸系數(shù) bi 表示假定其他變量不變,當(dāng) xi 每變動一個單位時,y 的平均平均變動值多元線性回歸方方程的直觀解釋二元線
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅游餐飲員工績效總結(jié)
- 木材銷售工作總結(jié)
- 服裝店衛(wèi)生衛(wèi)生規(guī)范標(biāo)準(zhǔn)
- 十年級化學(xué)學(xué)科的教學(xué)工作總結(jié)
- 制冷空調(diào)行業(yè)人力資源管理實(shí)踐
- 《疼痛治療》課件
- 《房地產(chǎn)市場簡報》課件
- 2021年廣東省汕尾市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2024年四川省德陽市公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2021年內(nèi)蒙古自治區(qū)烏海市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 期末測試卷(二)(試題)-2023-2024學(xué)年二年級上冊數(shù)學(xué)蘇教版
- 人教版(2024新版)七年級上冊數(shù)學(xué)第六章《幾何圖形初步》測試卷(含答案)
- 新能源發(fā)電技術(shù) 課件 第4章 太陽能發(fā)電
- 小學(xué)生防性侵安全教育主題班會課件
- 脆性糖尿病全面解析
- DBT29-305-2024 天津市裝配式建筑評價標(biāo)準(zhǔn)
- 2021-2022學(xué)年廣東省廣州市海珠區(qū)六年級(上)期末英語試卷
- 2025牛津上海版初中英語單詞表(六-九年級)中考復(fù)習(xí)必背
- 【年產(chǎn)2000噸色氨酸發(fā)酵工廠的計(jì)算與設(shè)計(jì)(附布置圖流程圖)15000字(論文)】
- 《社交禮儀(慕課版)》-課程標(biāo)準(zhǔn)
- 一年級數(shù)學(xué)練習(xí)題-20以內(nèi)加減法口算題(4000道)直接打印版
評論
0/150
提交評論