資料審核與初步統(tǒng)計PPT課件_第1頁
資料審核與初步統(tǒng)計PPT課件_第2頁
資料審核與初步統(tǒng)計PPT課件_第3頁
資料審核與初步統(tǒng)計PPT課件_第4頁
資料審核與初步統(tǒng)計PPT課件_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十二章調(diào)查資料的審核與整理 資料的審核資料的整理統(tǒng)計表 第一節(jié)資料的審核 資料的審核資料的審核是資料處理的第一步工作 它是指研究者對所收集的原始資料 主要是問卷 進(jìn)行初步的審閱 校正錯填 誤填的答案 剔出亂填 空白和嚴(yán)重缺答的廢卷 其目的是使得原始資料具有較好的準(zhǔn)確性 完整性和真實性 從而為后續(xù)資料整理錄人與統(tǒng)計分析工作打下較好的基礎(chǔ) 資料的審核工作包含兩方面的內(nèi)容 一是檢查出問卷資料中的問題 二是重新向被調(diào)查者核實 資料的審核工作有兩種不同的做法 邊收集邊審核集中審核 第二節(jié)資料的整理 一 資料整理資料整理是根據(jù)研究目的將經(jīng)過審核的資料進(jìn)行分類匯總 使資料更加條理化和系統(tǒng)化 為進(jìn)一步深入分析提供條件 二 定性資料的整理整理筆記與建立檔案資料的編碼編碼類型 開放式編碼 軸心式編碼選擇式編碼 三 定量資料的整理資料的編碼 見下表一 資料的錄入 見下表二 數(shù)據(jù)清理有效范圍清理邏輯一致性清理數(shù)據(jù)質(zhì)量抽查 表一 06 表二 第三節(jié)統(tǒng)計表 一 統(tǒng)計表的結(jié)構(gòu)從外表形式上看 統(tǒng)計表由總標(biāo)題 橫行標(biāo)題 縱欄標(biāo)題 指標(biāo)數(shù)值四部分組成 總標(biāo)題是表的名稱 橫行標(biāo)題在表的左端 它代表所說明的對象 縱欄標(biāo)題在表的上方 它代表統(tǒng)計指標(biāo)的名稱 它們分別對橫行或縱欄內(nèi)的統(tǒng)計值作出說明 二 統(tǒng)計表的種類 1 簡單表某村歷年人均收入 2 簡單分組表是總體僅按一個標(biāo)志進(jìn)行分組 即運(yùn)用簡單分組形成的表格 某村各戶年人均收入統(tǒng)計表 3 復(fù)合分組表是總體按兩個以上標(biāo)志進(jìn)行層疊分組的統(tǒng)計表 它又稱為交互分類表 它能表現(xiàn)兩個分組標(biāo)志之間的關(guān)系 某村家庭規(guī)模和經(jīng)濟(jì)情況統(tǒng)計表 第十三章資料的統(tǒng)計分析 統(tǒng)計分析方法是一種定量分析 它是進(jìn)行科學(xué)預(yù)測的重要方法 統(tǒng)計分析的特點 1 統(tǒng)計分析要以定性分析為基礎(chǔ) 2 統(tǒng)計分析方法必須和其他分析結(jié)合運(yùn)用 統(tǒng)計分析有一套專門的方法和技術(shù) 觀察 調(diào)查 實驗 12229986489 如何使用各種統(tǒng)計表與統(tǒng)計圖來描述一組數(shù)據(jù)的分組與分布情況 如何通過一組數(shù)據(jù)計算一些特征數(shù) 簡縮數(shù)據(jù) 進(jìn)一步顯示與描述一組數(shù)據(jù)的全貌 集中情況 分散情況 分布特征 數(shù)據(jù)如何分組 收集方法 原始數(shù)據(jù) 表達(dá)形式 作用 分析過程 圖示 主要內(nèi)容 單變量描述統(tǒng)計單變量推論統(tǒng)計相關(guān)與回歸分析雙變量統(tǒng)計分析多變量統(tǒng)計分析 第一節(jié) 單變量描述統(tǒng)計 由一種變量的全部分?jǐn)?shù)或觀察值組成的一組或一批數(shù)據(jù)稱為一個分布 單變量數(shù)據(jù)的描述統(tǒng)計就是對其分布情況進(jìn)行說明 單變量描述統(tǒng)計包括集中量數(shù)分析 離散量數(shù)分析 一 頻數(shù)分布與頻率分布 頻數(shù)分布 FrequencyDistribution 就是指一組數(shù)據(jù)中取不同值的個案的次數(shù)分布情況 它一般以頻數(shù)分布表的形式表達(dá) 頻率分布 percentagesdistribution 是一組數(shù)據(jù)中不同取值的頻數(shù)相對于總數(shù)的比率分布情況 常以百分比的形式來表達(dá) 編制頻數(shù)分布表 畫出頻數(shù)分布圖 某中學(xué)初三甲班60人期中英語考試分?jǐn)?shù) 案例 某中學(xué)初三甲班60人英語期中考試成績累積頻數(shù) 頻率 分布表 二 集中量數(shù)分析 集中量數(shù)就是代表數(shù)據(jù)分布集中趨勢的量數(shù) 集中量數(shù)分析指的是用一個典型值或代表值來反映一組數(shù)據(jù)的一般水平 或者說反映這組數(shù)據(jù)向這個典型值集中的情況 最常見的集中量數(shù)有算術(shù)平均數(shù) 簡稱平均數(shù) 也稱為均值 眾數(shù)和中位數(shù)三種 中位數(shù) Md 中位數(shù) Md 又稱中數(shù) 是頻數(shù)分布上50 處的數(shù)值 即將觀察總數(shù)一分為二的變量值 在這個值的兩邊各有相同個數(shù)的數(shù)據(jù) 當(dāng)數(shù)據(jù)的個數(shù)為偶數(shù)時 取分布50 最中心 處的兩個數(shù)據(jù)的平均數(shù)作為中數(shù) 中位數(shù) Md 中位數(shù) Md 又稱中數(shù) 是頻數(shù)分布上50 處的數(shù)值 即將觀察總數(shù)一分為二的變量值 在這個值的兩邊各有相同個數(shù)的數(shù)據(jù) 當(dāng)數(shù)據(jù)的個數(shù)為偶數(shù)時 取分布50 最中心 處的兩個數(shù)據(jù)的平均數(shù)作為中數(shù) 幾何平均數(shù) Mg 是n個數(shù)據(jù)的連乘積開n次方的根 常用作速率的集中量數(shù) 如學(xué)齡兒童人數(shù)的增加率 學(xué)校經(jīng)費的增加率 閱讀能力的進(jìn)步率等 Mg 算術(shù)平均數(shù) 通常稱平均數(shù) 又稱均數(shù)或均值 英文為Mean 故以M表示 如果是由變量X計算得來的就記為 讀X杠 現(xiàn)在一般都以表示樣本的平均數(shù) 以U表示總體的平均數(shù) 算術(shù)平均數(shù)就是各個變量值相加求和再除以變量的總次數(shù) 算術(shù)平均數(shù)的計算方法 1 用原始數(shù)據(jù)計算平均數(shù) 當(dāng)一組數(shù)據(jù)個數(shù)不多時 可直接用原始數(shù)據(jù)來計算 如某實驗小組10人的實驗成績?yōu)?1 13 15 16 16 16 17 18 18 20 其平均數(shù)為 16 2 用頻數(shù)分布表求平均數(shù) 如果樣本的數(shù)據(jù)很多 達(dá)到數(shù)十個或數(shù)百個 則需編制頻數(shù)分布表 用頻數(shù)分布表求平均數(shù) Xc為各組的組中值 f為各組的頻數(shù) N為總次數(shù) 某中學(xué)初三甲班60人英語期中考試成績平均數(shù) 標(biāo)準(zhǔn)差計算表 73 5 73 5 73 5 73 5 73 5 中位術(shù)與平均數(shù)的比較 1 平均數(shù)要求計算所有的數(shù)值 而中位數(shù)只用到數(shù)值的相對位置 一般說來平均數(shù)利用了更多的信息 更全面和準(zhǔn)確 2 平均數(shù)容易受到極端值的影響 中位數(shù)則不會受到這種影響 平均數(shù)是一種比中位數(shù)更為穩(wěn)定的量度 它隨樣本的變化比較少 3 當(dāng)資料是定序 定類測量或者是有開口組的定居測量時 中位數(shù)能夠擬補(bǔ)不足 三 離散量數(shù)分析 離散 中 量數(shù)分析指的是用一個特別的數(shù)值來反映一組數(shù)據(jù)相互之間的離散 中 程度 即各組數(shù)據(jù)相對于平均數(shù)的差異程度 離中程度 差異程度小 平均數(shù)的代表性高 差異程度大 代表性低 它與集中量數(shù)一起分別從兩個不同的側(cè)面描述和揭示一組數(shù)據(jù)的分布情況 共同反映出資料分布的全面特征 同時它還對現(xiàn)各集中量數(shù)的代表性做出補(bǔ)充說明 常見的離散量數(shù)統(tǒng)計量有全距 標(biāo)準(zhǔn)差 異眾比率 和四分位差 示例 某三個班各選5名同學(xué)參加測試 他們的成績分別如下中文系 78 79 80 81 82X 80數(shù)學(xué)系 65 72 80 88 95X 80外語系 35 78 89 98 100X 80如果僅以集中量數(shù)來衡量 這三個隊的水平一樣高 但是很明顯 這80分對中文系隊的同學(xué)代表性最高 而對外語系的同學(xué)代表性最低 1 全距 R 全距也叫極差 它是一組數(shù)據(jù)中 最大值與最小值之差 它是表示數(shù)據(jù)分布離散程度最簡單的方式 即一組數(shù)據(jù)中最大數(shù)與最小數(shù)差 故稱兩極差 R Xmax Xmin 當(dāng)數(shù)據(jù)較多時 應(yīng)用頻數(shù)分布表求全距 其方法為 最大組與最小組的組中值之差或最大組上限與最小組下限之差 R Xcmax Xcmin R Umax Lmin R 98 最大值 43 最小值 55 1 求全距 步驟 視數(shù)據(jù)資料的性質(zhì)和數(shù)據(jù)多少而定 組數(shù)不宜太多 如太多不能明顯表示出分布的主要趨勢 但也不宜太少 太少則把很多不同事實歸于一組 其分配的主要特征將因此而被蒙蔽 2 定組數(shù) 分組參考表 組距就是每一組的間距 即每組所包含的單位 組距以 i 表示 3 求組距 組距i 9 3 i 本例組數(shù)為6 組距 一般地 為計算方便 組距取10為宜 組限是分組的界限 其底數(shù)為下限 L 其頂數(shù)為上限 U 組限的寫法有很多 有的用上下限表示 有的用組中值表示 如以 10 為組距 一般多用首尾相接 間隔為10的形式表示 即60 70 70 80 80 90 其中每組上限即為下一組的下限 通常將組下限包含在本組中 而不包含在上限所在的組 因為分組的實際界限應(yīng)是這一組的精確界限 如 80 90 這一組的精確界限為 79 5 89 4999 4 定組限 5 求組中值 組中值XC 精確下限L 如以10為組距 則 80 90 一組的組中值為 組中值 79 5 84 5 某中學(xué)初三甲班60人英語期中考試成績頻數(shù)分布表 6 歸類劃記 2 標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差 一組數(shù)據(jù)對其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根 一般以S 或來表示 式中S 樣本統(tǒng)計值 為標(biāo)準(zhǔn)差 X為各學(xué)生的成績分?jǐn)?shù) 為學(xué)生成績的平均數(shù) x為各學(xué)生成績分?jǐn)?shù)的離差 n為學(xué)生 數(shù)據(jù) 數(shù) S 例1 某校三個系各選5名同學(xué) 參加智力競賽 他們的成績分別如下 中文系 7879808182數(shù)學(xué)系 6572808895英語系 35788998100平均成績 80標(biāo)準(zhǔn)差 一組數(shù)據(jù)對其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根 S 中文系 1 414 分 S 數(shù)學(xué)系 10 8 分 S 英語系 23 8 分 S 例2 例 有某生三次數(shù)學(xué)考試的成績分別為70 57 45 三次考試的班平均為70 55 42 標(biāo)準(zhǔn)差分別為8 4 5 如何看待該生的三次考試成績的地位 如果僅從原始分?jǐn)?shù)看 肯定認(rèn)為第一次最好 其實不然 要計算出各次的標(biāo)準(zhǔn)分?jǐn)?shù) 才能說明問題 Z1 70 70 8 0Z2 57 55 4 0 5Z3 45 42 5 0 6這說明 原始分?jǐn)?shù)為70 其位置正在平均線上 而原始分?jǐn)?shù)為57的 其位置在平均線上0 5處 而原始分?jǐn)?shù)為45的 其位置在平均線上0 6處 3 異從比率是指非眾數(shù)的次數(shù)與總體內(nèi)全部總體單位的比率 異眾比率越小 眾數(shù)的代表性越大 4 四分位差把一組數(shù)據(jù)按大小排列成序列 然后分成四個數(shù)據(jù)數(shù)目相等的段落 各段落分界點上的數(shù) 叫四分位數(shù) 即每組占25 舍去資料中數(shù)值最高的25 和最低的25 僅就中間50 數(shù)據(jù)求其量數(shù)作為離中量數(shù) 就是四分位差 四分位差之間的間距越小 中位數(shù)的代表性越大 1 對定序類資料計算四分位差 Q Q3 Q1 2 對定距類資料計算四分位差 使用說明 眾數(shù)與異眾比率配合 中位數(shù)與四分位差配合 平均數(shù)與標(biāo)準(zhǔn)差配合 四 相對差異 離散或離中 量數(shù) 1 離散系數(shù)離散系數(shù)是一種相對的離散量數(shù)統(tǒng)計量 它使我們能夠?qū)ν豢傮w中的兩種不同的離散量數(shù)進(jìn)行比較 或者對兩個不同總體中的同一離散量數(shù)進(jìn)行比較 離散系數(shù)的定義是 標(biāo)準(zhǔn)差與平均數(shù)的比值 用百分比表示 CV S XCV 100CV 100 例1 一項調(diào)查得到下列結(jié)果 某市人均平均收入為92元 標(biāo)準(zhǔn)差為17元 人均住房面積7 5平方米 標(biāo)準(zhǔn)差為1 8平方米 試比較該市人均收入和人均住房情況哪一個差異程度比較大 解 人均收入的離散系數(shù)為CV S 100 18 5 人均住房面積的離散系數(shù)為CV 1 8 7 5 100 24 例2 對廣州和武漢兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn) 廣州居民平均收入為680元 標(biāo)準(zhǔn)差為120元 武漢居民平均收入為360元 標(biāo)準(zhǔn)差為80元 問廣州居民相互之間的差異程度 與武漢居民相互之間在收入上的差異程度哪一個更大一些 解 廣州居民收入的離散系數(shù)為CV 120 680 100 17 6 武漢居民收入的離散系數(shù)為CV 80 360 100 22 2 五 標(biāo)準(zhǔn)分?jǐn)?shù) 是用來描述變量分布中某一分?jǐn)?shù)在整個分布中所處的位置 它是以標(biāo)準(zhǔn)差為單位的相對量數(shù) 其計算公式為 z 從公式可以得知標(biāo)準(zhǔn)分?jǐn)?shù)是一個分?jǐn)?shù)與其平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商 平均數(shù)以上各點的分?jǐn)?shù)為正值 平均數(shù)以下各點的分?jǐn)?shù)為負(fù)值 平均數(shù)的分?jǐn)?shù)為零 例如 某班語文平均考試成績?yōu)?5分 標(biāo)準(zhǔn)差為8 5分 甲生得92分 乙生得70分 問甲乙二生的分?jǐn)?shù)各為多少 Z甲 Z乙 2 59 據(jù)正態(tài)分布理論可知的取值范圍在 3到 3之間 為了使標(biāo)準(zhǔn)分?jǐn)?shù)變成正值并減少小數(shù)位數(shù) 以便于比較 我們可將標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)一步經(jīng)線性轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù) 其計算公式為 T 10Z 50 目前 我國各類學(xué)校招考新生和對學(xué)生進(jìn)行學(xué)習(xí)成績考查評定的主要手段是考試 而對考試成績的評分一般是用百分制來表示 并用各科成績相加按總分來決定被試者的優(yōu)劣取舍 這種做法開來似乎公平 實際上很不合理 因為各科試題的難易程度不同 造成評分標(biāo)準(zhǔn)的寬嚴(yán)不一 因此各科考試成績的統(tǒng)計量數(shù) 如平均數(shù) 標(biāo)準(zhǔn)差也不相等 我們不能說語文的考分80分等價于數(shù)學(xué)的考分的80分 也不能說英語考分75分等價于物理的考分75分 在這種情況下 把考生的各科考分等量齊觀地相加起來 憑個考生的總分來決定優(yōu)劣取舍 顯然是十分不合理的 科學(xué)的方法 就是把考生是各科分?jǐn)?shù) 經(jīng)過一個標(biāo)準(zhǔn)化的轉(zhuǎn)化過程 把每個考生的各科分?jǐn)?shù)變成標(biāo)準(zhǔn)分?jǐn)?shù) 然后再進(jìn)行相加和比較 甲乙兩位考生七科分?jǐn)?shù)的標(biāo)準(zhǔn)化表 練習(xí) 1 根據(jù)各小組調(diào)查的問卷 先進(jìn)行數(shù)據(jù)清理工作 然后對某些問題進(jìn)行單變量的統(tǒng)計描述 繪制頻數(shù)分布表 2 在一個社區(qū)診所 10天內(nèi)來排隊看病的人數(shù)分別是52 68 39 47 57 32 75 25 31和93 求算術(shù)平均數(shù)和中位數(shù) 以及標(biāo)準(zhǔn)差 第二節(jié)單變量統(tǒng)計推論 統(tǒng)計推斷 是指根據(jù)樣本所提供的詳細(xì) 運(yùn)用概率的理論進(jìn)行分析 論證 在一定的可靠程度上 對總體分布的特征進(jìn)行估計 推測 具體內(nèi)容包括 一 總體參數(shù)的估計 二 假設(shè)檢驗 一 區(qū)間估計 以樣本統(tǒng)計量的抽樣分布為理論依據(jù) 按一定概率要求 由樣本統(tǒng)計量的值來估計總體參數(shù)的值所在的范圍 叫做總體參數(shù)的區(qū)間估計 1 平均數(shù)抽樣分布與總體均數(shù)的區(qū)間估計 從正態(tài)分布中隨機(jī)抽取容量為的一切可能樣本的平均數(shù)抽樣分布是以總體平均數(shù)為中心的正態(tài)分布 當(dāng)總體標(biāo)準(zhǔn)差已知時 一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量呈標(biāo)準(zhǔn)正態(tài)分布 區(qū)間估計 區(qū)間估計的實質(zhì)就是在一定的可信度 置信度 下 用樣本統(tǒng)計值的某個范圍 置信區(qū)間 來估價總體的參數(shù)值 范圍的大小反映的是這種估計的精確性問題 而可信度高低反映的則是這種估計的可靠性或把握性的問題 其中 表示樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù) 表示樣本平均數(shù) 表示總體平均數(shù) 表示平均數(shù)標(biāo)準(zhǔn)誤 課堂練習(xí)題例 調(diào)查某廠職工的工資狀況 隨機(jī)抽取900名工人做樣本 調(diào)查得到他們的月平均工資為186元 標(biāo)準(zhǔn)差為42元 求95 的置信度下 全廠職工的月平均工資的置信取間是多少 解 將調(diào)查資料代入總體均值的區(qū)間估計公式得總體均值的置信區(qū)間為183 26 188 74當(dāng)將置信度提高到99 總體的置信區(qū)間為182 39 189 61元 隨著可靠性的提高 所估計的區(qū)間擴(kuò)大了 但估計的精確性就相應(yīng)地降低了 例 從某工廠隨機(jī)抽取400名工人進(jìn)行調(diào)查 結(jié)果表明女工的比例為20 現(xiàn)在要求在90 的置信度下 估計全廠工人中女工比例的置信區(qū)間 解 帶入總體百分?jǐn)?shù)的區(qū)間估計公式得16 7 23 小結(jié) 要對總體均數(shù)進(jìn)行區(qū)間估計 即在一定的可靠程度上求出總體均數(shù)的置信區(qū)間的上下限 首先 要知道與所要估計的參數(shù)相對應(yīng)的樣本統(tǒng)計量的值 以及樣本統(tǒng)計量的抽樣分布 其次 要求出該統(tǒng)計量的標(biāo)準(zhǔn)誤 最后 要明確在多大的可靠度上對總體均數(shù)作估計 再通過查抽樣分布概率分布表 找出與該可靠度所對應(yīng)的該分布在橫軸上記分的臨界值 從而計算出總體均數(shù)的置信區(qū)間 二 假設(shè)檢驗 利用樣本信息 根據(jù)一定的概率 對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷 稱為假設(shè)檢驗 當(dāng)對某一總體參數(shù)進(jìn)行假設(shè)檢驗時 首先從該總體中隨機(jī)抽取一個樣本 然后計算統(tǒng)計量的值 并根據(jù)經(jīng)驗對相應(yīng)的總體參數(shù)提出一個假設(shè)值 這個假設(shè)是說這個樣本統(tǒng)計量的值是由這個假設(shè)總體參數(shù)值的一個隨機(jī)樣本 即這個樣本來源于這個總體 而樣本統(tǒng)計量的值與總體參數(shù)值之間的差異是由抽樣誤差所致 根據(jù)這一假設(shè) 可以認(rèn)為像這樣的一切可能樣本統(tǒng)計量的值應(yīng)當(dāng)以總體參數(shù)值 假設(shè)的 為中心形成該統(tǒng)計量的一個抽樣分布 如果這個隨機(jī)樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率較大時 就得保留這個假設(shè) 即承認(rèn)這個樣本來自這個總體 而樣本統(tǒng)計量的值與總體參數(shù)值之間的差異是由抽樣誤差所致 此時稱樣本統(tǒng)計量的總體參數(shù)與假設(shè)的總體參數(shù)差異不顯著 否則就拒絕這個假設(shè) 否認(rèn)這個樣本來自這個總體 樣本統(tǒng)計量的總體參數(shù)與總體參數(shù)值之間有顯著差異 假設(shè)檢驗先對總體的某一參數(shù)作出假設(shè) 然后用樣本的統(tǒng)計量去進(jìn)行驗證 以決定假設(shè)是否為總體做接受 依據(jù)的概率論中的小概率原理 即 小概率事件在一次觀察中不可能出現(xiàn) 的原理 步驟 1 建立虛無假設(shè)和研究假設(shè) 通常是將原假設(shè)作為虛無假設(shè) 2 根據(jù)需要選擇適當(dāng)?shù)娘@著性水平 即概率的大小 通常有 0 01等 3 根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計值 并根據(jù)顯著性水平查出對應(yīng)的臨界值 4 將臨界值與統(tǒng)計值進(jìn)行比較 若臨界值大于統(tǒng)計值的絕對值 則接受虛無假設(shè) 反之 則接受研究假設(shè) 例 某單位職工上月平均收入為210元 標(biāo)準(zhǔn)差為15元 問該單位職工本月平均收入與上月相比是否有變化 解 建立虛無假設(shè) H0 和研究假設(shè)H1H0 210H1 210選擇顯著性水平a 0 05 帶入樣本數(shù)據(jù)計算統(tǒng)計值Z 得 6 67 1 96所以拒絕虛無假設(shè) 接受研究假設(shè) 即從總體上來說 該單位職工月平均收入與上月相比有變化 Z檢驗 Z檢驗是用正態(tài)分布的理論差異發(fā)生的概率 誤差發(fā)生的概率 從而比較兩個平均數(shù) 樣本平均數(shù)與總體平均數(shù)或兩個樣本平均數(shù) 的差異是否顯著 Z檢驗適用于大樣本 n 30 Z檢驗可分為單總體檢驗和雙總體檢驗 單總體的檢驗 t檢驗 單總體的檢驗單總體的檢驗是檢驗一個樣本平均數(shù)與一已知的總體平均數(shù)的差異是否顯著 其檢驗統(tǒng)計量的計算公式為 式中t為檢驗的樣本平均數(shù)與已知總體平均數(shù)的標(biāo)準(zhǔn)離差分?jǐn)?shù) df為t分布的自由度 例如 某校初中三年級學(xué)生期中英語考試成績平均數(shù)為73分 標(biāo)準(zhǔn)差為17分 期終考試后 從該年級學(xué)生中隨機(jī)抽取20人的英語成績 其平均數(shù)為79 4分 問該年級學(xué)生的英語成績是否真有進(jìn)步 第三節(jié)相關(guān)與回歸分析 對兩變量間關(guān)系進(jìn)行描述 最常用的是相關(guān)量 相關(guān)就是指二列變量之間的相互關(guān)系 如身高和體重 學(xué)習(xí)成績與思想品德等的相互關(guān)系 類型 單相關(guān) 一元回歸與多元相關(guān) 多元回歸 回歸又分為線性與非線性回歸 一種是兩列變量的變動方向相同 即一種變量變動時 另一種變量也發(fā)生或大或小的相同方向的變動 如身高與體重的關(guān)系 一般來說 身高越高 體重越重 這叫正相關(guān) 另一種相關(guān)情況是當(dāng)一種變量變動時另一種變量是或大或小地向相反方向變動 如身體健康狀況與患病率的關(guān)系 身體越好 患病率越小 這叫負(fù)相關(guān) 第三種是零相關(guān) 即兩列變量變化方向無一定規(guī)律 一個變量變動時 另一變量的變動方向可能與其相同 也可能與其相反 且相同與相反的機(jī)會趨于相等 如人的相貌與其思想品德之間是毫無關(guān)系的零相關(guān) 第三節(jié)相關(guān)與回歸分析 相關(guān)系數(shù)回歸分析及測定方法 一 相關(guān)系數(shù) 相關(guān)系數(shù)是用來表示相關(guān)程度的量的指標(biāo) 用r表示 其數(shù)值范圍在 1至 1之間 r的正負(fù)號表示變化的方向 正號表示變化的方向相同 是正相關(guān) 負(fù)號表示變化的方向相反 是負(fù)相關(guān) r的絕對值表示兩變量之間的密切程度 強(qiáng)度 絕對值越接近1 表示兩變量之間的關(guān)系越密切 越接近0 表示兩變量之間的關(guān)系越不密切 如r 1表示完全正相關(guān) r 1表示完全負(fù)相關(guān) r 0表示零相關(guān) 計算相關(guān)系數(shù)時 要求二列變量必須成對 而且變量的性質(zhì)不同亦應(yīng)計算不同的相關(guān)系數(shù) 即不同的相關(guān)系數(shù)適用于不同的變量類型 如皮爾遜積差相關(guān)系數(shù)適用于兩列等距變量 斯皮爾曼等級相關(guān)系數(shù)適用于兩列等級變量 點二列相關(guān)系數(shù)適用于反映一等距變量與另一真正二分變量間相關(guān)程度 二列相關(guān)系數(shù)適用于反映一等距變量與另一人為二分變量間相關(guān)程度 積差相關(guān)系數(shù) 式中 n為成對變量的數(shù)目 SX為X變量的標(biāo)準(zhǔn)差 SY為Y變量的標(biāo)準(zhǔn)差 若用原始分?jǐn)?shù)直接求r 其計算公式為 若用標(biāo)準(zhǔn)分?jǐn)?shù)計算r 其公式為 5名大學(xué)生身高提高相關(guān)系數(shù)計算表 不同層次變量的相關(guān)測量與檢驗1 定類變量與定類變量消減誤差比例 指的就是知道X的值時所減少的誤差 E1 E2 與總誤差的比 2 定序變量與定序變量3 定類變量 或定序變量 與定距變量4 定距變量和定距變量 二 回歸分析及測定方法 相關(guān)系數(shù)是一種廣泛使用的描述統(tǒng)計量 用以描述兩個變量間的關(guān)系 除此以外 它還具有預(yù)測功能 即根據(jù)一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論