版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章統(tǒng)計數據的描述第一節(jié)數據的計量與類型第二節(jié)品質數據的整理與顯示第三節(jié)數值型數據的整理與顯示第四節(jié)統(tǒng)計表學習目標了解數據的計量尺度與數據的類型掌握品質數據整理與顯示的方法掌握數值型數據整理與顯示的方法用Excel作頻數分布表和圖形總體、個體、特征與數據總體:所研究對象的全體個體或成分:組成總體的元素——研究總體是對其個體的某些特征(當然也是總體的特征)感興趣;我們決不會研究沒有任何特征信息的空洞的個體或總體。變量或指標:表征總體或個體特征的量指標向量或變量向量:用以聯(lián)合考察總體或個體的多個特征變量值(指標值)或數據:在研究一個總體時,所要研究的每個特征(指標或變量)、在每個個體上的具體描述(可以是數字,也可以是文字)第一節(jié)數據的計量與類型一.數據的計量尺度二.數據的類型和分析方法三.統(tǒng)計指標及其類型數據的計量尺度數據的直觀分類:定性型數據定量型數據四種計量尺度數據的計量尺度定類尺度定序尺度定距尺度定比尺度定類尺度
(列名尺度_NominalScale)計量層次最低對事物進行平行的分類各類別可以指定數字代碼表示使用時必須符合類別窮盡和互斥的要求數據表現為“類別”——名義級數據具有=或的數學特性——例:性別分類,民族分類等定序尺度
(順序尺度_OrdinalScale)對事物分類的同時給出各類別的順序比定類尺度精確未測量出類別之間的準確差值數據表現為“類別”,且有序——序次級數據(允許順序中出現循環(huán)的情況)具有>或<的數學特性——例:學歷等級,體育比賽中的循環(huán)制等定距尺度
(間隔尺度_IntervalScale)1. 對事物的準確測度2. 比定序尺度精確,且杜絕了出現循環(huán)順序的可能數據表現為“數值”——刻度級數據沒有絕對零點——零點人為制定具有+或-的數學特性——如:某些省市高考計分中所采用的標準分、智力測驗的得分等。定比尺度
(比例尺度_RatioScale)1. 對事物的準確測度:某件事情的發(fā)生率(或百分比)是比僅僅對發(fā)生次數做計數更為有效的度量。2. 與定距尺度處于同一層次,差別很小,有些學者將其歸為一類數據表現為“數值”——刻度級數據有絕對零點——零點不是人為制定的,如長度的0米,熱力學的0度等5. 具有或的數學特性四種計量尺度的比較四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度
分類(=,≠)排序(<,>)
間距(+,-)比值(×,÷)√√√√√√√√√√計量尺度數學特性“√”表示該尺度所具有的特性數據類型和分析方法在統(tǒng)計分析中,不同測度類型的數據扮演的角色不同。如:定類數據通常是樣本分類的依據;定序數據可以用來計算等級相關系數;定距數據可以用來計算均值;定比數據可以用來做回歸分析;等一般來說,等級高的數據,可以兼有等級低的數據的功能;而等級低的數據,不能兼有等級高的數據的功能。數據的不同類型,也決定了變量的不同類型。數據類型與統(tǒng)計方法數據類型與統(tǒng)計方法定類數據定序數據品質數據(定性數據)數量數據(定量數據)定距數據定比數據參數方法非參數方法第二節(jié)品質數據的整理與顯示一.定類數據的整理與顯示二.定序數據的整理與顯示一、定類數據的整理與顯示定類數據的整理與顯示
(基本問題)必須弄清所面對的數據類型,因為不同類型的數據,所采取的處理方式和方法是不同的對定類數據和定序數據主要是做分類整理對定距數據和定比數據則主要是做分組整理適合于低層次數據的整理和顯示方法也適合于高層次的數據;但適合于高層次數據的整理和顯示方法并不適合于低層次的數據定類數據的整理
(基本過程)1. 列出各類別2.計算各類別的頻數3.制作頻數分布表4.用圖形顯示數據定類數據的整理
(可計算的指標)1.頻數:落在各類別中的數據個數2.比例:某一類別數據占全部數據的比值3.頻率(百分比):將對比的基數作為100而計算的比例值4.比率:不同類別數值的比值EXCEL工具:對定類數據的頻數統(tǒng)計可用COUNT()函數(數值)或COUNTIF()函數(文本)定類數據整理—頻數分布表
(實例)【例2.1】為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調查,其中的一個問題是“您比較關心下列哪一類廣告?”1.金融廣告;2.服務廣告;3.商品廣告;4.房地產廣告;5.招生招聘廣告;6.其他廣告。表2-1某城市居民關注廣告類型的頻數分布
廣告類型人數(人)比例頻率(%)金融廣告服務廣告商品廣告房地產廣告招生招聘廣告其他廣告951112161020.0450.2550.5600.0800.0500.0104.525.556.08.05.01.0合計2001100問題:頻數與頻率的表達效果哪個好?定類數據的圖示—柱(條)形圖
(由Excel繪制的柱形圖)圖2-1某城市居民關注不同類型廣告的人數分布問題:該柱圖顯示數據服從正態(tài)分布嗎?注意:
正態(tài)分布只適用于連續(xù)型的數量數據
定類數據的圖示—圓形圖
(由Excel繪制的圓形圖)
其他廣告1.0%
房地產廣告8.0%
商品廣告56.0%
金融廣告4.5%
服務廣告25.5%
招生招聘廣告5.8%圖2-2某城市居民關注不同類型廣告的人數構成定類數據的圖示—圓形圖
(圓形圖的制作)也稱餅圖,是用圓形及園內扇形的面積來表示數值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用在繪制圓形圖時,總體中各部分所占的百分比用園內的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的例如,關注服務廣告的人數占總人數的百分比為25.5%,那么其扇形的中心角度就應為3600×25.5%=91.80,其余類推練習一研究機構統(tǒng)計出了美國電視歷史上收視率最高的50個節(jié)目,并整理了制做這些節(jié)目的電視網。通過下列數據,分析在提供收視率最高的電視節(jié)目方面,ABC、CBS、NBC等電視網哪個做得最好?NetworkABCABCABCNBCCBSABCCBSABCABCNBCNBCNBCCBSABCNBCCBSABCCBSNBCABCCBSNBCNBCCBSNBCCBSCBSCBSNBCNBCFOXCBSCBSABCNBCABCABCCBSNBCNBCNBCCBSNBCCBSCBSABCCBSABCNBCABC定序數據的整理與顯示定序數據的整理
(可計算的指標)1.頻數:落在各類別中的數據個數2.比例:某一類別數據占全部數據的比值3.頻率(百分比):將對比的基數作為100而計算的比例值4.比率:不同類別數值的比值1.累計頻數:將各類別的頻數逐級累加2.累計頻率:將各類別的頻率(百分比)逐級累加定序數據頻數分布表
(實例)【例2.2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?
1.非常不滿意;
2.不滿意;
3.一般;
4.滿意;
5.非常滿意。
表2-2甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)向上累積
向下累積
戶數(戶)百分比(%)戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————定序數據頻數分布表
(實例)表2-3乙城市家庭對住房狀況評價的頻數分布回答類別乙城市戶數(戶)百分比(%)向上累積
向下累積
戶數(戶)百分比(%)戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————定序數據的圖示—累計頻數分布圖
(由Excel繪制的累計頻數分布圖)243001322252700100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(戶)(a)向上累積27616830300750100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(戶)(b)向下累積圖2-3甲城市家庭對住房狀況評價的累積頻數分布品質數據的圖示—環(huán)形圖
(由Excel繪制的環(huán)形圖)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
圖3-4甲乙兩城市家庭對住房狀況的評價品質數據的圖示—環(huán)形圖
(作業(yè):環(huán)形圖的制作)環(huán)形圖中間有一個“空洞”,總體中的每一部分數據用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環(huán)環(huán)形圖可用于進行比較研究環(huán)形圖可用于展示定類和定序的數據第三節(jié)數值型數據的整理與顯示一.數據的分組二.數值型數據的圖示三.頻數分布的類型頻數分布表的編制編制頻數分布表的步驟確定組數編制頻數分布表的步驟確定組距計算頻數編制表格頻數分布表的編制
(實例)【例2.3】某生產車間50名工人日加工零件數如下(單位:個)。試采用單變量值對數據進行分組。
單變量值分組:(1)將數據輸入單元格范圍H4:Q8(2)先確定分組數目和每組的上限值,然后將”每組上限值“輸入H14:H45(3)用鼠標選定I14:I45(放運算結果用),鍵入“=FREQUENCY(H4:Q8,H14:H45)”(4)按Ctrl+Shift+Enter組合鍵,即可在I14:I45得到相應的頻數。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組
(要點)1.將一個變量值作為一組2.適合于離散變量適合于變量值較少的情況注意:如果變量值過多,單值分組反而會掩蓋數據內在的規(guī)律性。單變量值分組表
(實例)表2-4某車間50名工人日加工零件數分組表零件數(個)頻數(人)零件數(個)頻數(人)零件數(個)頻數(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組
(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~組距分組
(步驟)確定組數:組數的確定應以能夠顯示數據的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges
提出的經驗公式來確定組數K確定各組的組距:組距(ClassWidth)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即
組距=(最大值-最小值)÷組數
根據分組整理成頻數分布表
注意:(1)組距大小必須適當,否則會掩蓋數據內在的規(guī)律性。(2)分組一般控制在5-15組的范圍內,最多不超過20組。組距分組
(幾個概念)1.下限:一個組的最小值2.上限:一個組的最大值3.組距:上限與下限之差4.組中值:下限與上限之間的中點值下限值+上限值2組中值=等距分組表
(上下組限重疊)表2-5某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100等距分組表
(上下組限間斷)表2-6某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計50100等距分組表
(使用開口組)表2-7某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計50100一般采用等距分組原則——不等距分組必須考慮特殊變換以表現頻數分布上的差異等距分組(即:各組數據的上界與下界之差相等)各組頻數的分布不受組距大小的影響可直接根據絕對頻數來觀察頻數分布的特征和規(guī)律不等距分組各組頻數的分布受組距大小不同的影響各組絕對頻數的多少不能反映頻數分布的實際狀況需要用頻數密度(頻數密度=頻數/組距)反映頻數分布的實際狀況分組數據—直方圖
(直方圖的制作)用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布在直角坐標中,用橫軸表示數據分組,縱軸表示頻數(或頻率),各組與相應的頻數(或頻率)就形成了一個矩形,這一圖形即為頻數(或頻率)直方圖(Histogram)用Excel作直方圖(需在Excel“工具”菜單中選“加載宏”調用“分析工具庫”)以下圖形均由計算機繪制!ExcelSTATISTICA繪制直方圖:(1)選擇“工具=》數據分析=》直方圖”(2)在“輸入區(qū)域”框中選擇原數據所在區(qū)域H4:Q8(2)在“接受區(qū)域”框中選擇組上限所在區(qū)域H14:H45(3)在“輸出區(qū)域”框中選擇輸出數據所在區(qū)域I14:I45(放運算結果用)(4)單擊確定使用Excel頻數函數(FREQUENCY)Excel的“直方圖”工具的缺陷是:頻數分布和直方圖沒有與數據聯(lián)系起來,這樣,如果你改變任何一個數據,頻數分布表和直方圖不會跟著改變使用Excel中的統(tǒng)計函數“FREQUENCY”來創(chuàng)建頻數分布表和直方圖,可解決這一問題。創(chuàng)建頻數分布表的步驟是:確定輸入數據所在的單元格范圍確定分組數目和每組的上限值,并將“組上限值”輸入作為接受區(qū)域選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數分布表輸出的區(qū)域選擇統(tǒng)計函數中的“FREQUENCY”函數在對話框Date-array后輸入數據區(qū)域,在Bins-array后輸入接受區(qū)域同時按下ctrl-shift-Enter組合鍵,即得到頻數分布,然后作柱圖依據頻數分布,可用公式將其轉換為頻率分布統(tǒng)計函數—FREQUENCY分組數據—直方圖
(直方圖的繪制)頻數(人)1512963105110115120125130135140日加工零件數(個)圖3-5某車間工人日加工零件數的直方圖我一眼就看出來了,大多數人的日加工零件數在120~125之間!分組數據—直方圖
(直方圖與條形圖的區(qū)別)直方圖與條形圖的本質差異在于:直方圖要對數據分組(或者說,按照一定的刻度范圍,把相鄰的數據并為一組;條形圖不對數據分組,要想達到直方圖的效果,必須借助于Excel頻數函數(FREQUENCY)條形圖可以被視為直方圖的特例:即,只要區(qū)間足夠小,使得每個不重復的樣本值處于不同的區(qū)間中,這時的直方圖,就是條形圖。一般而言,條形圖更適用于分類數據,而直方圖更適用于刻度級數據。原始數據探索——莖葉圖
(直方圖與莖葉圖的區(qū)別)莖葉圖與直方圖一樣可以展現數據的分布特征,其主要的區(qū)別在于:直方圖要對數據分組,而分組后,原始數據的信息大量損失;莖葉圖在保留原始數據完整性的基礎上,來展現數據的分布特征,主要用于對原始數據的初步探索。樹莖樹葉7880223477788890012222333344466777889013344579910111213數據個數3132410莖葉圖類似橫置的直方圖未分組數據—莖葉圖
(莖葉圖的制作)圖3-7某車間工人日加工零件數的莖葉圖未分組數據—莖葉圖
(擴展的莖葉圖)樹莖樹葉10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78802234577788890012222333344455667778890133445799樹莖樹葉10*10.11*11.12*12.13*13.78802234577788890012222333344455667778890133445799圖3-8圖3.7擴展后的莖葉圖時間序列數據—線圖
(線圖的制作)繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數據繪在縱軸圖形的長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數據下端應從“0”開始,以便于比較。數據與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數據—線圖
(實例)【例3.5】已知1991~1998年我國城鄉(xiāng)居民家庭的人均收入數據如表3-11。試繪制線圖¥$
表3-111991~1998年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0時間序列數據
(由Excel繪制的線圖)020004000600019911992199319941995199619971998城鎮(zhèn)居民農村居民收入
(元)
圖3-14城鄉(xiāng)居民家庭人均收入雷達圖(RadarChart)是顯示多個變量的常用圖示方法在顯示或對比各變量的數值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數據—雷達圖設有n組樣本S1,S2,…Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的雷達圖,其具體做法是多變量數據—雷達圖
(雷達圖的制作)先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖多變量數據—雷達圖
(實例)【例3.6】1997年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出數據如表3-12。試繪制雷達圖。今天的主食是面包表3-121997年城鄉(xiāng)居民家庭平均每人生活消費支出項
目城鎮(zhèn)居民農村居民食品
衣著
家庭設備用品及服務
醫(yī)療保健
交通通訊
娛樂教育文化服務
居住
雜項商品與服務1942.59520.91316.89179.68232.90448.38358.64185.65
890.28109.4185.4162.4553.92148.18233.2334.27合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《阿爾茨海默病湯穎》課件
- 養(yǎng)老院老人生活照料規(guī)范制度
- 養(yǎng)老院老人健康飲食營養(yǎng)師培訓制度
- 政府委托課題項目合同(2篇)
- 斷絕關系協(xié)議書
- 2024年度衛(wèi)生紙品牌授權與區(qū)域代理銷售合同3篇
- 2025年陜西貨運從業(yè)資格證實操考試題
- 2025年浙江貨運從業(yè)資格證500道題目和答案大全
- 2025年臨汾貨運員初級考試題庫
- 《腸桿菌科細菌鑒定》課件
- 結核病的診斷流程圖解
- 餐飲公司股權合同模板
- 工程力學知到智慧樹章節(jié)測試課后答案2024年秋湖南工學院
- 廣東省廣州市越秀區(qū)2023-2024學年八年級上學期期末道德與法治試題(含答案)
- 第七屆重慶市青少年科學素養(yǎng)大賽考試題庫(含答案)
- 地理2024-2025學年人教版七年級上冊地理知識點
- 2024年人教部編版語文小學四年級上冊復習計劃及全冊單元復習課教案
- 四大名著之西游記經典解讀28
- 2024年城市園林苗木移植合同范例
- 醫(yī)院培訓課件:《新進護士職業(yè)規(guī)劃》
- 園林綠化安全生產培訓
評論
0/150
提交評論