版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章資料的整理與基本分析下一張
主頁
退出
上一張
數(shù)據(jù)資料的分類數(shù)據(jù)資料的整理常用統(tǒng)計表與統(tǒng)計圖數(shù)據(jù)資料的特征值分析第二章資料的整理與基本分析正確地進行資料的分類是資料整理的前提。在調查或試驗中,由觀察、測量所得的數(shù)據(jù)按其性質的不同,一般可以分為計量資料、計數(shù)資料和等級(半定量)資料三大類。下一張
主頁
退出
上一張
第一節(jié)資料的分類
第二章資料的整理與基本分析下一張
主頁
退出
上一張
數(shù)據(jù)資料的來源1、實驗觀察所得的科學實驗記錄
2、調查研究所得的資料
3、生產記錄、病理等現(xiàn)場資料第二章資料的整理與基本分析下一張
主頁
退出
上一張
一計量資料(數(shù)值變量)指用量測方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長度、容積、重量等來表示。這種資料的各個觀測值不一定是整數(shù),兩個相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計量資料也稱為連續(xù)性變異資料。體現(xiàn):動物的各種生理、生化指標,藥動力學指標等,如血液中血紅蛋白含量。第二章資料的整理與基本分析下一張
主頁
退出
上一張
二計數(shù)資料(無序分類變量)指用計數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。這些觀察值只能以整數(shù)來表示,各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。如:畜禽疫病感染個數(shù)、發(fā)病數(shù)、死亡數(shù)、呼吸次數(shù)、單位容積內細胞數(shù)、細菌數(shù)等。第二章資料的整理與基本分析
等級或半定量資料(rankeddata
or
semi-quantitative)是指將觀察單位按所考察的性狀或指標的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點,又有程度或量的不同。也稱為分類資料。下一張
主頁
退出
上一張
三、等級(半定量)資料(有序分類變量)第二章資料的整理與基本分析下一張
主頁
退出
上一張
如糞便潛血試驗的陽性反應是在涂有糞便的棉簽上加試劑后觀察顏色出現(xiàn)的快慢及深淺程度分為六個等級;又如用某種藥物治療畜禽的某種疾病,療效分為“無效”、“好轉”、“顯效”和“控制”四個級別;然后統(tǒng)計各級別的供試畜禽數(shù)。
半定量資料在醫(yī)學研究中是常見的。在生物醫(yī)學中,這類資料常用相對數(shù)(率)或構成比的形式表示(如:發(fā)病率、死亡率、感染率、治愈率、免疫率、陽性率等)第二章資料的整理與基本分析率(rate):說明某現(xiàn)象或某事物發(fā)生的頻率或強度。率=(實際發(fā)生數(shù)/可能發(fā)生總數(shù))×比例基數(shù)
比例基數(shù):100%、1000‰、10000/萬、100000(1/10萬)等
如:發(fā)病率、死亡率、發(fā)生率、陽性率、患病率等構成比(proportion):說明某一事物內部,各組成部分所占的比重。也叫百分比。
構成比=(某部分觀察單位數(shù)/各組成部分觀察單位總數(shù))×100%
如:教研室16人中高級職稱有4人,占20%(1/5)。相對比(relativeratio):是A、B兩個有關指標之比,說明A是B的若干倍或百分之幾,通常用倍數(shù)或分數(shù)表示。
如:男:女、醫(yī)生:護士、教師:學生下一張
主頁
退出
上一張
第二章資料的整理與基本分析率與構成比率構成比概念發(fā)生的頻率或強度各組成部分所占的比重強調點隨機發(fā)生事件各部分的構成(分類)資料獲得較難容易特點不一定合計為100%下一張
主頁
退出
上一張
第二章資料的整理與基本分析1.1白豬和黑豬子二代的毛色分離情況率與構成比的例子下一張
主頁
退出
上一張
占第二章資料的整理與基本分析年齡組(周)⑴受檢個數(shù)⑵白內障例數(shù)⑶患者周齡構成比(%)⑷患病率(%)⑸=(3)/(2)4~5~6~7~≥8合計5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.361468448100.0030.521.24周齡以上仔豬患某一疾病的記錄下一張
主頁
退出
上一張
存在分類隨機事件第二章資料的整理與基本分析應用注意事項1、不能以構成比代替率。2、計算相對數(shù)的分母不宜過小。小則直接敘述。3、進行率的對比分析時,應注意資料可比性。如比較療效時,比較組間應病情輕重相同,性別影響,應按性別分組后再作比較。4、正確求平均率。例:若P1=x1/n1
P2=x2/n2P3=x3/n3
P=(x1+x2+x3)/n1+n2+n3)(正確)
P=(P1+P2+P3)/3(錯誤)下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
三種不同類型的資料相互間是有區(qū)別的,但有時可根據(jù)研究的目的和統(tǒng)計方法的要求將一種類型資料轉化成另一種類型的資料。
例如,醫(yī)學臨床化驗動物的白細胞總數(shù)得到的資料屬于計數(shù)資料,根據(jù)化驗的目的,可按白細胞總數(shù)正?;虿徽7譃閮山M,清點各組的次數(shù),或者按白細胞總數(shù)過高、正常、過低分為三組,清點各組次數(shù),就轉化成了半定量資料。小結第二章資料的整理與基本分析第二節(jié)資料的整理
下一張
主頁
退出
上一張
統(tǒng)計學第二章資料的整理與基本分析一、資料的檢查與核對目的:確保原始資料的完整性和正確性。
完整性:指原始資料無遺缺或重復。
正確性:指原始資料的測量和記載無差錯或未進行不合理的歸并。
檢查中要注意:
1.數(shù)據(jù)本身差錯2.取樣差錯3.數(shù)據(jù)資料的不合理合并和歸類下一張
主頁
退出
上一張
檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結合專業(yè)知識作出判斷)。對于有重復、異常或遺漏的資料,應予以刪除或補齊;對有錯誤、相互矛盾的資料應進行更正,必要時進行復查或重新試驗。第二章資料的整理與基本分析
當變數(shù)不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當變數(shù)較多(n>30)時,宜將變數(shù)分成若干組,以便統(tǒng)計分析。將變數(shù)分組后,制成次數(shù)分布表(統(tǒng)計學上把經過數(shù)據(jù)整理后得到的反映變數(shù)在各組內的分布情況表格),即可看到資料的集中和變異情況。資料的性質不同,整理方法不同。二、資料的整理方法下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析表2-250枚受精種蛋出雛天數(shù)的次數(shù)分布表下一張
主頁
退出
上一張
第二章資料的整理與基本分析
問題:有些計數(shù)資料,觀察值較多,變異范圍較大,若以每一變數(shù)為一組,則組數(shù)太多,而每組內包含的變數(shù)太少,資料的規(guī)律性顯示不出來。
方法:可擴大為以幾個相鄰變數(shù)為一組,適當減少組數(shù),增加每組的變數(shù)。這樣資料的規(guī)律性就較明顯,對資料進一步計算分析也比較方便。變數(shù)較多,變異幅度較大的資料整理下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
【例2-1】對100例患病的斷奶仔豬血液涂片顯微鏡下病變紅細胞數(shù)資料進行整理分組。(原始資料略),病變紅細胞數(shù)變異范圍在6-21個,如果以一個單獨觀測值為一組,分16組就太多,不易看出資料的分布規(guī)律。如每間隔2個分為一組,則可使組數(shù)適當減少。經適當合并后分為9組,資料的分布規(guī)律就比較明顯,見表2-3。第二章資料的整理與基本分析表2-3100例血液涂片病變紅細胞數(shù)的次數(shù)分布表
下一張
主頁
退出
上一張
病變細胞數(shù)(個)組中值(x)劃線計數(shù)次數(shù)()5~67~89~1011~1213~1415~1617~1819~2021~225.57.59.511.513.515.517.519.521.5|||||卌卌|卌卌卌卌卌卌卌卌卌卌|卌卌卌|卌卌|卌|14112031161151合計
100第二章資料的整理與基本分析(二)、計量資料的整理計量資料在分組前需要確定全距、組數(shù)、組距、組中值及組限,然后將全部變數(shù)劃線計數(shù)歸組。
——頻數(shù)與頻數(shù)分布下一張
主頁
退出
上一張
第二章資料的整理與基本分析1概念下一張
主頁
退出
上一張
頻數(shù):某個(組)測量值的個(例)數(shù)。頻數(shù)分布表(frequencydistributiontable):又稱頻數(shù)表。是將原始數(shù)據(jù)值適當分組后得到各組的頻數(shù)。適用樣本量較大的資料進行統(tǒng)計描述的常用方法。通過頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。可用手工和計算機軟件(如SAS、SPSS等)方便制作頻數(shù)表。第二章資料的整理與基本分析2頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。
(2)決定組數(shù)、組限和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調整。
(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃線計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
(1)、求全距
全距是資料中最大值與最小值之差,又稱為極差(range),用R表示,即
R=Max(x)-Min(x)
本例R=65.0-37.0=28.0(kg)第二章資料的整理與基本分析下一張
主頁
退出
上一張
(2-1)、確定組數(shù)
組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計量越精確,但增大了運算量;若分組過少,資料的規(guī)律性就反映不出來,計算出的統(tǒng)計量的精確性也較差。一般組數(shù)的確定,可參考表2-5。第二章資料的整理與基本分析表2-5樣本含量與組數(shù)
本例中,n=126,根據(jù)表2-5,初步確定組數(shù)為10組。下一張
主頁
退出
上一張
第二章資料的整理與基本分析(2-2)、確定組距
每組最大值與最小值之差稱為組距,記為i。分組時要求各組的組距相等。組距的計算公式為:組距(i)=全距/組數(shù)
本例i=28.0/10≈3.0(化整)下一張
主頁
退出
上一張
第二章資料的整理與基本分析(2-3)、確定組限及組中值
各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距
由于相鄰兩組的組中值間的距離等于組距,所以當?shù)谝唤M的組中值確定以后,加上組距就是第二組的組中值,第二組的組中值加上組距就是第三組的組中值,其余類推。下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
組距確定后,首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意,最末一組的上限應大于資料中的最大值。注意第二章資料的整理與基本分析下一張
主頁
退出
上一張
(3)列出組段表2-2中,最小值為37.0,第一組的組中值取37.5,因組距已確定為3.0,所以第一組的下限為:37.5-(1/2)×3.0=36.0;第一組的上限也就是第二組的下限為:36.0+3.0=39.0;第二組的上限也就是第三組的下限為:39.0+3.0=42.0,……,以此類推,一直到某一組的上限大于資料中的最大值為止。于是可分組為:36.0
39.0,39.0
42.0,……。第二章資料的整理與基本分析為了使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入后一組。通常將上限略去不寫。第一組記為36.0
,第二組記為39.0
,……下一張
主頁
退出
上一張
第二章資料的整理與基本分析
下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
在歸組劃線時應注意,不要重復或遺漏,歸組劃線后將各組的次數(shù)相加,結果應與樣本含量相等,如不等,證明歸組劃線有誤,應予糾正。在分組后所得實際組數(shù),有時和最初確定的組數(shù)不同,如第一組下限和資料中的最小值相差較大或實際組距比計算的組距為小,則實際分組的組數(shù)將比原定組數(shù)多;反之則少。注意第二章資料的整理與基本分析
(三)等級(半定量)資料的整理
對于等級(半定量)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。下一張
主頁
退出
上一張
第二章資料的整理與基本分析
表2-7F2代山羊的有角無角分離情況下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
表2-8仔豬死亡情況第二章資料的整理與基本分析第三節(jié)常用統(tǒng)計表與統(tǒng)計圖
下一張
主頁
退出
上一張
使用統(tǒng)計表和統(tǒng)計圖,可以把研究對象的特征、內部構成、相互關系等簡明、形象地表達出來,便于比較分析。第二章資料的整理與基本分析一、統(tǒng)計表任何反映統(tǒng)計資料的表格(廣義)統(tǒng)計整理與分析階段使用的表格(狹義)下一張
主頁
退出
上一張
用表格形式來表示數(shù)據(jù)間的數(shù)量關系第二章資料的整理與基本分析(一)統(tǒng)計表的結構和要求統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計構成,其基本格式如下表:下一張
主頁
退出
上一張
第二章資料的整理與基本分析編制統(tǒng)計表的總原則:結構簡單,層次分明,內容安排合理,重點突出,數(shù)據(jù)準確,便于理解和比較分析。具體要求如下:下一張
主頁
退出
上一張
1.統(tǒng)計表的結構
××.××┋┋×.××××.××縱標目總標目(單位)××.××××××××合計┋┋┋┋┋┋┋┋×.××××××┋××.××××××××橫標目縱標目縱標目縱標目總標目橫標目的總標目備注:表號標題(包括何時、何地、何事)第二章資料的整理與基本分析下一張
主頁
退出
上一張
1、標題標題要簡明扼要、準確地說明表的內容,有時須注明時間、地點。2、標目標目分橫標目和縱標目兩項。橫標目列在表的左側,用以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統(tǒng)計指標內容,并注明計算單位,如%、kg、cm等等。2.統(tǒng)計表的要求
第二章資料的整理與基本分析下一張
主頁
退出
上一張
3、數(shù)字一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。4、線條表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線。第二章資料的整理與基本分析(二)統(tǒng)計表的種類
下一張
主頁
退出
上一張
統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復合表兩類。
1、簡單表由一組橫標目和一組縱標目組成,縱橫標目都未分組。此類表適于簡單資料的統(tǒng)計,如表2-9。第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
2、復合表由兩組或兩組以上的橫標目與一組縱標目結合而成,或由一組橫標目與兩組或兩組以上的縱標目結合而成,或由兩組或兩組以上的橫、縱標目結合而成。此類表適用于復雜資料的統(tǒng)計,如表2-10。第二章資料的整理與基本分析表2-10幾種動物性食品的營養(yǎng)成分下一張
主頁
退出
上一張
豬場
消化道疾病發(fā)病數(shù)其它情況黃白痢腸炎寄生蟲病水腫病甲乙丙丁35113023812043821714423652426225317712684113212合計83910351316535第二章資料的整理與基本分析下一張
主頁
退出
上一張
常用的統(tǒng)計圖有長條圖(barchart)、園圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖
(broken-linechart)等。一般情況下,計量資料采用直方圖和折線圖,計數(shù)資料、半定量(等級)資料常用長條圖、線圖或園圖。二、統(tǒng)計圖第二章資料的整理與基本分析
1、標題簡明扼要,列于圖的下方。2、縱、橫兩軸應有刻度,注明單位。3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。4、圖中需用不同顏色或線條代表不同事物時,應有圖例說明。下一張
主頁
退出
上一張
(一)統(tǒng)計圖繪制的基本要求第二章資料的整理與基本分析(二)常用統(tǒng)計圖及其繪制方法軟件繪制,直接輸出,很方便!下一張
主頁
退出
上一張
統(tǒng)計學第二章資料的整理與基本分析y下一張
主頁
退出
上一張
1、直方圖(柱形圖,矩形圖)直方圖(histogram)適用于表示連續(xù)性變數(shù)的次數(shù)分布。
橫軸為各組組限,縱軸為分布次數(shù)(f)橫坐標與縱坐標的長度要有合適的比例(一般為5:4或6:5為好),繪成的圖形能明顯表明次數(shù)分布情況。第二章資料的整理與基本分析次數(shù)(f)圖2-1126基礎母羊體重的次數(shù)分布柱形圖下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
圖2-3水稻雜種二代植株米粒分離情況的次數(shù)分布條形圖性狀次數(shù)(f)3、條形圖條形圖(bardiagram)適用于間斷性變數(shù)和屬性變數(shù)資料。一般橫坐標表示間斷的組中值或分類性狀,縱坐標表示次數(shù)。第二章資料的整理與基本分析下一張
主頁
退出
上一張
餅圖
(piediagram)適用于間斷性和屬性資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察值個數(shù)中的百分比。4、餅圖第二章資料的整理與基本分析第四節(jié)數(shù)據(jù)資料的特征值分析下一張
主頁
退出
上一張
統(tǒng)計學
離散性特征值
集中性特征值第二章資料的整理與基本分析生物學數(shù)據(jù)資料(觀測值)的分布具有兩個重要的特征:
集中性
離散性
觀測值向中心位置聚集的趨勢。
反映數(shù)據(jù)資料集中性的特征值是平均數(shù),包括算術平均數(shù)、幾何平均數(shù)、調和平均數(shù)、中位數(shù)和眾數(shù)等。觀測值偏離中心位置的分散情況。
反映數(shù)據(jù)資料離散性的特征值是極差、方差、標準差和變異系數(shù)等。下一張
主頁
退出
上一張
第二章資料的整理與基本分析一集中性特征值平均數(shù)(mean)是統(tǒng)計學中最常用的統(tǒng)計量,用來表明數(shù)據(jù)中各觀測值相對集中較多的中心位置,反映了一組觀察值的平均水平,是一組數(shù)據(jù)資料的代表值。
可以用來說明一組數(shù)據(jù)資料的平均水平或集中趨勢,具有典型性
可以用來進行組間比較,以判斷一組數(shù)據(jù)資料與另一組數(shù)據(jù)資料的差別,具有代表性平均數(shù)的作用:下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析【例】某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數(shù)。由于Σx=500+520+535+560+58+600+480+510+505+49=5285,n=10下一張
主頁
退出
上一張
直接法:主要用于樣本含量n≤30以下、未經分組資料平均數(shù)的計算第二章資料的整理與基本分析1.3重要性質
樣本各觀測值與平均數(shù)之差的和為0,即離均差之和為0
證明下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析1.4加權平均數(shù)對于樣本容量≥30且已分組的資料,可以在次數(shù)分布表的基礎上采用加權法計算平均數(shù)。xi—第i組的組中值
fi—第i組的次數(shù)
k—組數(shù)
采用加權法計算得到的平均數(shù)就稱為加權平均數(shù)(weightedmean)
加權平均數(shù)不具備算術平均數(shù)的兩個性質下一張
主頁
退出
上一張
第二章資料的整理與基本分析組別組中值(x)次數(shù)fx10-1534520-25615030-352691040-4530135050-5524132060-65852070-753225合計1004520【例】將100頭仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權數(shù)平均數(shù)。仔豬一月窩重次數(shù)分布表下一張
主頁
退出
上一張
第二章資料的整理與基本分析利用式得:即這100頭長白母豬仔豬一月齡平均窩重為45.2kg。計算若干個來自同一總體的樣本平均數(shù)的平均數(shù)時,如果樣本含量不等,也應采用加權法計算。
下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析幾何平均數(shù)(geometricmean):n個觀測值相乘之積的n次方根■利率、畜禽數(shù)的增長率、藥物的效價、抗體的滴度等非線性數(shù)據(jù),采用幾何平均數(shù)比用算術平均數(shù)更能代表其平均水平。例1為研究人群中流感的抗體水平,測得12名兒童的血清對流感病毒的血凝抑制抗體效價的倒數(shù)為:5,5,5,5,5,5,5,10,10,10,20,40,試計算平均血凝抑制抗體效價。解:
答:平均血凝抑制抗體效價約為1∶8平均血凝抑制抗體效價約為1∶10
2.幾何平均數(shù)下一張
主頁
退出
上一張
第二章資料的整理與基本分析3.調和平均數(shù)調和平均數(shù)(harmonicmean):資料中各觀測值倒數(shù)的算術平均數(shù)的倒數(shù)。■調和平均數(shù)主要適用于速度類的資料,或有個別極端大觀測值的數(shù)據(jù)資料。
主要用于反映畜群不同階段的平均增長率或畜群不同規(guī)模的平均規(guī)模。下一張
主頁
退出
上一張
第二章資料的整理與基本分析當觀測值的個數(shù)是偶數(shù)時,以中間兩個觀測值的平均數(shù)作為中位數(shù)
■數(shù)據(jù)資料呈偏態(tài)分布或分布情況不清楚時,中位數(shù)的代表性優(yōu)于算術平均數(shù)4.中位數(shù)中位數(shù)(median):將資料中所有觀測值按從小到大依次排列,位于中間位置的那個觀測值,簡稱為中數(shù)下一張
主頁
退出
上一張
(1)未分組資料中位數(shù)的計算方法
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析下一張
主頁
退出
上一張
第二章資料的整理與基本分析(2)已分組資料中位數(shù)的計算方法
【例】某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間整理成次數(shù)分布表如下表所示,求中位數(shù)。下一張
主頁
退出
上一張
第二章資料的整理與基本分析5.眾數(shù)
眾數(shù)(mode):在數(shù)據(jù)資料中出現(xiàn)次數(shù)最多的一個觀測值或次數(shù)最多一組的組中值
有的資料可出現(xiàn)多個眾數(shù),有的資料則沒有眾數(shù)下一張
主頁
退出
上一張
所列出的次數(shù)分布表中,57—71這一組次數(shù)最多,其組中值為64天,則該資料的眾數(shù)為64天。第二章資料的整理與基本分析總結對于同一資料:算術平均數(shù)>幾何平均數(shù)>調和平均數(shù)上述五種平均數(shù),最常用的是算術平均數(shù)。第二章資料的整理與基本分析二離散性特征值平均數(shù)主要是用來說明數(shù)據(jù)的集中趨勢和集中程度的,是一組數(shù)據(jù)的代表值。平均數(shù)的代表性如何,還要看數(shù)據(jù)的變異情況:
數(shù)據(jù)越是集中,
則平均數(shù)的代表性就越強
僅用平均數(shù)對一個數(shù)據(jù)資料的特征進行統(tǒng)計描述是不完善的,還必須要有另外一個統(tǒng)計量來衡量數(shù)據(jù)變異程度的大小、說明平均數(shù)的代表性。
數(shù)據(jù)越是分散(離散),則平均數(shù)的代表性就越差
用來衡量數(shù)據(jù)變異程度的統(tǒng)計量有很多,常用的有:極差、方差、標準差和變異系數(shù)。下一張
主頁
退出
上一張
第二章資料的整理與基本分析1.極差(全距)極差(range):數(shù)據(jù)資料中最大觀測值與最小觀測值之間的差■極差主要用來說明傳染病和食物中毒的最短、最長潛伏期(1)沒有充分利用數(shù)據(jù)中全部觀測值的信息
優(yōu)點:極差是衡量數(shù)據(jù)資料變異程度大小的最簡便的統(tǒng)計量
缺點:(2)不能準確反映數(shù)據(jù)中各觀測值的分布狀況
(3)樣本之間難以進行比較
(4)極差的抽樣誤差較大,不穩(wěn)定下一張
主頁
退出
上一張
第二章資料的整理與基本分析2.方差
極差:僅用全部觀測值中較為特殊的兩個點值,比較粗糙充分利用數(shù)據(jù)資料中的每一個觀測值,將每一觀測值都和某一個特定的值相比,可以求出每一個觀測值與平均數(shù)的差值,即離均差
有多少個觀測值就可以得到多少個離均差,還是不能說明整個數(shù)據(jù)資料的變異程度
將各個離均差相加是最簡單的方法,
■可以用離均差平方和來衡量數(shù)據(jù)的變異程度僅僅進行簡單地相加,還是不能反映數(shù)據(jù)資料中所有觀測值的總偏離程度
最理想的特定值就是平均數(shù)下一張
主頁
退出
上一張
第二章資料的整理與基本分析離均差平方和簡稱為平方和(sumofsquares),用SS表示
樣本平方和:總體平方和:用平方和衡量數(shù)據(jù)的變異程度:
離均差平方和消除了離均差正、負值的影響
離均差平方和的大小除了與變異程度有關外,還隨樣本容量的大小而改變?yōu)榱讼龢颖救萘看笮〉挠绊?,可以取其平均?shù),即用平方和除以樣本容量,即
下一張
主頁
退出
上一張
第二章資料的整理與基本分析平方和的平均數(shù)稱為方差(variance)
在求離均差平方和的平均數(shù)時,分母不用樣本容量n,而用自由度n-1
樣本方差:
總體方差:
下一張
主頁
退出
上一張
為了使所得統(tǒng)計量是相應總體參數(shù)的無偏估計值,統(tǒng)計學證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量,而必須用自由度.第二章資料的整理與基本分析注意用方差衡量數(shù)據(jù)的變異程度:■同類資料進行比較時,方差越大就意味著數(shù)據(jù)資料的變異程度越大,因此方差是衡量數(shù)據(jù)資料變異程度的一個重要指標■方差是通過平方求和得來的,在對觀測值進行平方的同時,它的單位也相應地進行了平方,因此在實際應用時很不方便。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版企業(yè)人力資源總監(jiān)職責與權益合同3篇
- 武漢體育學院《地下水數(shù)值模擬基礎與應用》2023-2024學年第一學期期末試卷
- 武漢傳媒學院《現(xiàn)代分析檢驗技術應用》2023-2024學年第一學期期末試卷
- 二零二五年度建筑工地安全文明施工評估合同3篇
- 二零二五版兒童樂園開業(yè)慶典承包合同范本3篇
- 2024陶瓷廠勞務外派工作合同模板3篇
- 2025版大型工程船舶租賃合同6篇
- 威海職業(yè)學院《數(shù)值計算與仿真》2023-2024學年第一學期期末試卷
- 二零二五年度酒店會議場地預訂與策劃服務合同3篇
- 天津城市職業(yè)學院《工程光學》2023-2024學年第一學期期末試卷
- 南充化工碼頭管網(wǎng)施工方案(初稿)
- 2023年消防接警員崗位理論知識考試參考題庫(濃縮500題)
- GB/T 30285-2013信息安全技術災難恢復中心建設與運維管理規(guī)范
- 魯濱遜漂流記閱讀任務單
- 第一章 運營管理概論1
- 《創(chuàng)意繪畫在小學美術教育中的應用(論文)6000字》
- 主體結構驗收匯報材料T圖文并茂
- 管理學原理(南大馬工程)
- 過一個有意義的寒假課件
- 施工現(xiàn)場裝配式集裝箱活動板房驗收表
- 電力業(yè)擴工程竣工驗收單
評論
0/150
提交評論