




已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
“變量間的相關關系”中的核心概念和思想方法解讀及教學建議河北師范大學數(shù)學與信息科學學院 程??兞块g的相關關系的主要內容為采用定性和定量相結合的方法研究變量之間的相關關系,主要研究線性相關關系主要概念有“相關關系”、“散點圖”、“回歸直線和回歸直線方程”、“相關系數(shù)”等研究方法為先繪制散點圖,直觀表示觀測數(shù)據(jù),定性描述變量間相關關系的類型、方向、相關程度然后應用最小二乘法確定變量間相關關系的具體表達形式,描述變量間的數(shù)量規(guī)律,并由一個變量的取值去推測另一個變量的取值這部分內容涉及到一些重要的統(tǒng)計思想和方法,對學生的學習和教師的教學都有一定的難度本文就研究對象、核心概念、研究方法、統(tǒng)計思想及相關應用進行簡單的解讀,提出一些教學建議,希望對教學能提供一些幫助一、相關概念及統(tǒng)計思想方法1相關關系變量間的不確定關系兩個變量之間的數(shù)量關系有兩種不同的類型:一種是函數(shù)關系,一種是相關關系當一個變量取一定的值時,另一個變量有確定的值與之對應,我們稱這種關系為確定的函數(shù)關系一般把作為影響因素的變量稱為自變量,把與之對應變化的變量稱為因變量當一個變量取一定的數(shù)值時,與之對應的另一個變量的值雖然不確定,但它按某種規(guī)律在一定的范圍內變化,變量間的這種關系稱為不確定性的相關關系或者說兩個變量之間確實存在某種關系,但不具備函數(shù)關系所要求的確定性函數(shù)關系和相關關系都是指兩個變量之間的數(shù)量關系函數(shù)關系是兩個非隨機變量之間的一種確定關系,是一種因果關系而相關關系是兩個變量之間的一種不確定的關系,這兩個變量中至少有一個是隨機變量兩個相關變量之間可能有內在聯(lián)系(真實相關),也可能完全不存在內在聯(lián)系(虛假相關)之所以X和Y之間是相關關系,原因是變量X是影響變量Y的主要因素,但不是唯一因素,還有其他種種因素,而這些因素我們又不能完全把握研究函數(shù)關系,可以用數(shù)學分析的方法例如,已知y和x之間具有線性關系,即,此時只要知道變量的兩組取值就可以確定函數(shù)表達式研究相關關系則必須對變量進行多次觀測,借助統(tǒng)計的相關思想和方法例如,有人認為人的體重y和身高x之間具有近似的二次函數(shù)關系,由三個人的身高和體重數(shù)據(jù),確定出y和x之間的表達式這樣得到的結果很不可靠,難以使人信服2散點圖描述相關關系的直觀工具由于相關關系的不確定性,尋找變量X和Y之間的相關關系時,首先要對變量進行觀測設n次觀測值為在直角坐標系中,橫軸代表變量X,縱軸代表變量Y,將觀測數(shù)據(jù)用坐標點的形式描繪出來,得到的圖形稱為散點圖散點圖是研究相關關系的直觀工具,可以定性的判斷相關的方向和程度 如果散點大致分布在一條直線附近,又不完全在一條直線上,說明變量間具有線性相關關系;如果這些點大致分布在一條曲線附近,說明變量間具有非線性相關關系;如果這些點的分布幾乎沒有什么規(guī)則,說明兩個變量間沒有相關關系對于線性相關,如果散點從左下角到右上角沿直線分布,那么兩個變量正相關,如果散點從左上角到右下角沿直線分布,兩個變量負相關如果散點在整體上和某一直線越接近,表明變量間相關關系越強3數(shù)據(jù)分析方法相關分析與回歸分析對變量間相關關系,在定性分析的基礎上,需要進行定量分析定量分析有相關分析和回歸分析兩種方法相關分析是用一個指標(稱為相關系數(shù))來反映變量間相關關系的密切程度(見人教A版必修3P85,閱讀與思考)回歸分析就是根據(jù)相關關系的具體形態(tài),選擇一個合適的數(shù)學模型,來近似表達變量間的平均變化關系相關分析和回歸分析具有共同的研究對象,在具體應用時,需要互相補充作相關分析需要依靠回歸分析表明變量相關的具體形式,而進行回歸分析需要通過相關分析表明變量間的相關程度,只有變量間存在高度相關時,由回歸分析得到的變量間的具體形式才有意義相關分析研究變量間的相關的方向和相關程度,它不提供相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況相關分析不必確定哪個變量是自變量,哪個是因變量,所涉及的兩個變量可以都是隨機變量回歸分析根據(jù)觀測數(shù)據(jù),確定一個數(shù)學方程式(回歸方程),根據(jù)這個方程式可以由已知量推測未知量,為估算和預測提供一個重要方法回歸分析必須事先確定具有相關關系的變量中哪個為自變量,哪個為因變量一般地說,自變量是普通變量(人為可以控制其取值),因變量是隨機變量4最小二乘思想統(tǒng)計學基礎的重要部分當兩個變量之間存在相關關系時,由于不確定性,如果只有很少幾組變量觀測值,很難估計誤差的大小法國法數(shù)學家勒讓德(Le Gendre,17521833)在根據(jù)測量數(shù)據(jù)預測彗星軌道的問題時,發(fā)現(xiàn)了如何有效利用全部測量數(shù)據(jù)的方法即通過計算得出一組數(shù)值,在使數(shù)據(jù)組的偏差達到最小的意義下,這些數(shù)值是最優(yōu)的由勒讓德的方法得出的數(shù)值充分利用了所有數(shù)據(jù)信息,這個方法現(xiàn)在叫做最小二乘法人們立即認識到勒讓德發(fā)現(xiàn)的價值,運用最小二乘法的數(shù)學并不難,所以絕大多數(shù)從事測量的科學家,都能從這一方法中受益,他們可以充分利用數(shù)據(jù)當時最小二乘思想在科學界迅速流傳1809年,德國數(shù)學家高斯(Gauss,17771855年)在一篇論文中,分析了如何充分利用一系列測量數(shù)據(jù)來預測天體軌道的問題,在文章中也敘述了最小二乘法,并聲稱自己發(fā)明了這一方法事實上,勒讓德第一個發(fā)表了最小二乘法思想,并影響了統(tǒng)計學;高斯也使用了最小二乘法,并且考慮了最小二乘法的誤差分析問題,他還發(fā)現(xiàn)了最小二乘法理論中的重要結果,它從統(tǒng)計學的角度回答了最小二乘法在縮小誤差上的優(yōu)勢,使得在勒讓德那里只是處理測量數(shù)據(jù)的代數(shù)方法逐漸滲透到統(tǒng)計數(shù)據(jù)分析的領域,最小二乘法對統(tǒng)計學就象微積分對于數(shù)學中的影響一樣深遠,高斯的巨大聲望使一些歷史學家把最小二乘法歸功于他下面通過一個簡單問題,闡述最小二乘思想一段公路,實際長度為a千米,a是未知的,對公路進行n次實際測量,假設測量值為可是每次測量都有一定的誤差,這些誤差或正或負,或大或小應該如何估計a的值呢?直觀的想法是a 的值應該最接近這些測量數(shù)據(jù),數(shù)學描述就是: a的值應該使所有的誤差平方和達到最小當時,達到最小即用測量數(shù)據(jù)的平均值作為a的估計值這里估計參數(shù)a所采用的就是最小二乘法的思想用數(shù)理統(tǒng)計知識可以證明這樣的估計也是最佳的最小二乘法的優(yōu)點是:有效利用了全部測量數(shù)據(jù),使誤差平方和達到最小,防止了某一極端誤差對決定參數(shù)估計值取得支配性地位在計算上只需對參數(shù)求偏導數(shù)求解線性方程組即可5回歸直線與回歸方程當兩個變量之間具有線性相關關系時,散點圖中的點大致分布在一條直線附近,這條直線叫做回歸直線,這條直線的方程叫做回歸方程數(shù)學模型:假設因變量y主要受自變量x的影響,它們之間的數(shù)量關系為,其中x是非隨機變量,是未知的常數(shù)是隨機誤差項,它反映了未列入方程的其它各種因素對y的影響從而y是隨機變量,它可以用由x的值完全確定的部分和隨機誤差部分來解釋當由觀測數(shù)據(jù)估計出和b時,得到直線回歸方程為將觀測數(shù)據(jù)代入中,得,或,其中為n次觀測的誤差求的估計值,使“從整體上看各點與直線的距離最小”應用最小二乘思想,就是求使誤差平方和達到最小的的值可以用配方法或求偏導數(shù)的方針求出的估計值6相關系數(shù)變量間線性關系密切程度的度量相關系數(shù)是用來衡量兩個變量之間線性關系密切程度(強與弱)的一個數(shù)量指標只有了解構造相關系數(shù)的統(tǒng)計思想,才能對相關系數(shù)有較深刻的理解下面對相關統(tǒng)計量的意義及構造相關系數(shù)的統(tǒng)計思想做一簡述設回歸方程為,與對應的回歸值為稱為偏差,稱為偏差方和的值越小,反映各偏差普遍較小,數(shù)據(jù)點整體上比較接近回歸直線,說明變量間線性關系比較密切但是一個絕對量,需要進行調整為方便引入以下記號:,衡量數(shù)據(jù)的波動大小,衡量數(shù)據(jù)的波動大小,反映主要由的變化引起的間的波動,反映除線性關系之外的各種隨機因素引起的間的波動可以證明:令,顯然,而且越接近1,就越接近0,說明x和y之間的線性關系越密切當時,x和y正相關,當時,x和y負相關但由于只與有關,所以不能反映相關的方向因此定義相關系數(shù)如下:,一般越接近1,x和y之間的線性關系越密切需要注意的兩點是:(1)相關系數(shù)只衡量變量間線性關系的密切程度,即使變量間具有確定的非線性函數(shù)關系,也可能非常接近0(2)當n很小時,即使非常接近1,也不表明變量間的線性關系強例如,無論x和y之間是何種關系,當n=2時,總有二、教學建議1“相關關系”的有關概念及定性描述相關關系的概念是描述性的,不必追求形式化上的嚴格建議采用案例教學法對比函數(shù)關系,重點突出相關關系的兩個本質特征:關聯(lián)性和不確定性關聯(lián)性是指當一個變量變化時,伴隨另一個變量有一定的變化趨勢;不確定性是指當一個變量取定值時,與之相關的變量的取值仍具有隨機性因為有關聯(lián)性,才有研究的必要性因為其不確定性,從少量的變量觀測值,很難估計誤差的大小,因此必須對變量作大量的觀測但每個觀測值都有一定誤差,為了消除誤差的影響,揭示變量間的本質聯(lián)系,就必須要用統(tǒng)計分析方法判斷兩個變量間是否具有相關關系,一是憑經驗及學科專業(yè)知識,二是借助散點圖下面是一些可供選擇的例子,教學時可先逐一分析其關聯(lián)性和不確定性,然后結合散點圖,進一步判斷相關關系的類型和方向實例變量X和Y關聯(lián)性不確定性相關類型例1家庭收入X,消費支出Y收入高的家庭消費支出相應也較高收入相同的家庭,消費支出未必相同正線性相關例2人的身高X,腳的長度Y一般身材較高者,腳的尺寸也較大同樣身高的人,腳的尺寸不一定相同正線性相關例3數(shù)學成績X,英語成績Y數(shù)學成績高者,一般英語成績也較高,反之也對存在數(shù)學成績高(低)而英語成績低(高)的學生正線性相關(虛假相關)例4氣溫X,熱飲銷量Y隨著氣溫的升高,熱飲的銷量相應會減少溫度相同的日期內,熱飲的銷量也未必相同負線性相關例5(非線性相關和不相關的例子)對0到18歲之間的未成年人來說,年齡和身高之間具有非線性的相關關系對成年人來說,年齡和身高之間沒有相關關系(散點圖略)例6 吸煙和患肺部疾病之間不具有因果關系,但具有相關關系我們引入兩值變量X和Y:如果調查了700人,其中400個不吸煙者中有40人患肺部疾?。?0%),300個吸煙者中有60個人患肺部疾病(20%),說明吸煙對患肺部疾病有一定的影響但不吸煙者也可能患肺部疾病,吸煙者也可能不患肺部疾病,因此X和Y之間具有相關關系例7 有人曾經觀察過某一國家歷年的國內生產總值與精神病患者的人數(shù)的關系,發(fā)現(xiàn)兩者之間存在較強的正相關實際上國內生產總值與精神病患者的人數(shù)之間沒有內在聯(lián)系,是一種典型的虛假相關這是因為它們都和人口總量有內在的相關關系說明:(1)適當例舉非線性相關和不相關的例子,有助于對相關關系的全面了解,但我們研究的重點是線性相關關系,而且正相關或負相關只對線性相關有意義(2)討論“相關關系”時,對中學生來說,不要求說明哪個變量是隨機變量,哪個變量是普通變量(3)根據(jù)學生實際情況,可以從散點圖判斷線性關系的強弱,進行適當拓展2相關關系的定量描述求回歸直線方程本小節(jié)的重點是用最小二乘法求回歸直線方程采用探究式教學方式在給出回歸直線和回歸直線方程的定義后,提出如下問題:如何求回歸直線方程,要求這條直線在整體上與數(shù)據(jù)點最接近?許多統(tǒng)計思想和方法都比較直觀,學生可能提出各種不同的方法,包括教材上列舉的方法為了防止漫無目的,對求回歸直線的方法應提出一些基本要求:盡可能利用全部數(shù)據(jù),體現(xiàn)整體偏差最小,便于數(shù)學計算,結果確定等離這些要求越來越遠的方法,不必多加考慮通過對有些方法逐步修正,最后引導到使用最小二乘法求回歸直線方程方法1:逐漸移動直線,測量各點到直線的距離,使距離和最小該方法體現(xiàn)了整體偏差最小的思想,缺點是難以實現(xiàn),而且測量的方法很難得到確定的結果方法2:選擇兩點畫直線,使直線兩側的點的個數(shù)基本相同這種方法沒有利用全部數(shù)據(jù)信息,其結果會因人而異方法3:用多條直線的斜率和截距的平均值作為回歸直線的斜率和截距這種方法既沒有利用全部數(shù)據(jù)信息,也沒有體現(xiàn)整體誤差最小的思想,結果也不確定設回歸方程為,是第i個觀測值的偏差,是第i個觀測點到回歸直線的距離設是回歸直線的傾斜角,則方法4:距離和最小求a,b使達到最小這是方法1的數(shù)學嚴格化方法5:總的偏差和最小求a,b使達到最小方法4和方法5是等價的方法5利用了全部數(shù)據(jù),體現(xiàn)整體偏差最小的思想,結果是唯一確定的唯一的缺點是不便數(shù)學計算方法6偏差平方和最小求a,b使達到最小該方法克服了方法5的缺點這種方法稱為最小二乘法說明:(1)我們的目的是通過探究找到一個求回歸方程的“較優(yōu)”的方法,這里所說的“較優(yōu)”也是基于直觀的思想,在學生現(xiàn)有的知識水平下,無法嚴格證明如果對用上面的方法得到直線的“優(yōu)劣”進行評判,我認為是理解上的偏差,況且也做不到(2)應用最小二乘法求回歸方程是一個純數(shù)學的問題,用配方法顯得繁瑣,用求偏導數(shù)的方法超出了學生的能力要求對此不做要求,直接給出a,b的公式,不影響對統(tǒng)計方法的理解(3)也可以按下面的過程展開教學提供實際問題情境,從測量數(shù)據(jù)出發(fā),采用偏差平方和最小的思想(最小二乘思想)求參數(shù)的估計值通過類比用最小二乘法求回歸直線方程3回歸方程的計算回歸方程中a,b的計算公式比較復雜,要求利用計算器或計算機進行計算為了熟悉公式的構成及相關量的計算過程,建議使用Excel軟件中的公式進行計算以年齡和脂肪含量的關系為例如下表所示:在相應的單元格內輸入數(shù)據(jù),第15行為合計先計算,在單元格C1,D1,E1中輸入相應的公式通過公式復制然后求和得到:(C15)(D15)(E15),相關系數(shù),,回歸方程為作為拓展還可以計算與對應的回歸值,與實際觀測值進行比較,了解偏差的大小由相關系數(shù)的大小判斷線性關系的強弱ABCDEFG1239.5628.50445.24315.4212.81-3.3122717.8443.94199.3289.4915.112.6933921.282.2654.9636.7222.03-0.8344125.949.989.621.8523.192.7154527.59.42-0.740.0625.492.0164926.30.86-0.890.9227.80-1.5075028.23.721.810.8828.37-0.1785329.624.3011.545.4830.10-0.5095430.235.1617.438.6430.68-0.48105631.462.8832.8317.1431.83-0.43115730.879.7431.6112.5332.41-1.61125833.598.6061.9638.9432.990.51136035.2142.3294.7263.0434.141.06146134.6167.1894.9153.8834.72-0.1215673381.71828.931054.34644.994回歸方程的意義及應用回歸直線方程作為變量x和y之間線性關系的代表,它近似描述了x和y之間的數(shù)量關系利用回歸方程,當已知x的值時,可以推斷y的取值回歸方程中b的意義為:當自變量x改變一個單位時,因變量y的平均改變量為當時y的估計值,也可以理解為當時y的可能取值的平均值在教學中下面的實例可供選擇例1主要解釋系數(shù)b和回歸值的意義;例2說明回歸方程用于預測時的作用;例3介紹“回歸”一詞的由來的背景知識,同時也說明了回歸方程在揭示了變量間的依存規(guī)律時的作用例1 年齡和脂肪含量之間的回歸方程為(1)解釋b(0.5765)的意義;(2)當x=37時,計算相應的值并解釋其意義解 (1)回歸直線方程中b是直線的斜率,b0表示隨年齡的增長,人體脂肪含量呈現(xiàn)增長的趨勢,b=0.5765說明年齡每增加1歲,身體脂肪含量平均增加0.5765%(2)當x=37時,%,20.9%是37歲的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設備升級換代如何選擇高效低耗的設備
- 2025年電視節(jié)目自動播出設備合作協(xié)議書
- 面向未來的市場趨勢分析與策略規(guī)劃
- 設計引領市場的創(chuàng)新廣告策略
- 遠程工作時代的招聘挑戰(zhàn)與對策
- 職位評價的量化方法與案例分析
- 老舊小區(qū)辦公樓的智能化管理與服務創(chuàng)新
- 胃腸道疾病基礎常見癥狀與自我識別
- 自我約束力對孩子高效學習的重要性
- 趣味數(shù)學教學法在家庭教育中的實踐
- 人教版八年級物理下冊 實驗題04 機械能的實驗(含答案詳解)
- 醫(yī)院護理培訓課件:《老年綜合評估與護理安全》
- 失能老人日常生活能力評分表
- 基礎工程之地基處理培訓講義
- 區(qū)域經濟一體化理論課件
- 肺動脈瓣狹窄球囊擴張術臨床路徑
- 一年級語文繪本《烏鴉面包店》課件PPT
- 中級技工防水工考核試題及答案
- 新店特大橋45#墩水渠改移施工方案打印版
- 消化系統(tǒng)(寵物解剖生理)
- 急重癥膿毒癥及膿毒性休克患者液體治療
評論
0/150
提交評論