版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
圖并沒有說謊,是說謊者在畫圖。——本杰明·迪斯雷利項目三
用圖表展示數據任務一任務二任務三任務四數據的預處理數值型數據的整理與展示品質數據的整理與展示合理使用圖表知識目標:1.能理解統(tǒng)計數據的圖表展示意義。2.能描述數據的類型和質量要求,理解不同數據的分類方法。3.能描述數據來源、數據收集方法和統(tǒng)計調查方式。技能目標:1.能根據所給數據編制統(tǒng)計表。2.能根據所給數據繪制各種統(tǒng)計圖表。知識結構:案例:某市就電腦輔助應用軟件在本市各建筑施工企業(yè)的應用進行了調研,供采集了50家建筑施工企業(yè)的數據,反饋的有效數據為48組。任務1數據的預處理3.1.1數據審核數據審核就是檢查數據中是否有錯誤。對于通過調查取得的原始數據(rawdata),主要從完整性和準確性兩個方面去審核。完整性審核主要是檢查的單位或個體是否有遺漏,所有的調查項目是否填寫齊全等。準確性審核主要是檢查數據是否有錯誤,是否存在異常值等。對于異常值要仔細進行鑒別:如果異常值屬于記錄時的錯誤,在分析之前應予以糾正;如果異常值是一個正確的值,則應予以保留。對于通過其他渠道取得的二手數據,應著重審核數據的適用性和時效性。例3.1.1表3-1是10名學生6門課程的考試成績數據(單位:分)。試找出商品學等于70分的學生,管理學成績最高的前三名學生,六門課程都大于70分的學生。第1步:【數據】菜單,并選擇【篩選】命令。如果要篩選出滿足給定條件的數據,可使用【自動篩選】命令
第2步:在下拉箭頭框內選擇要篩選出的數據。3.1.3數據排序數據排序是按一定順序將數據排列,以便研究者通過瀏覽數據發(fā)現一些明顯的特征或趨勢,找到解決問題的線索,除此之外,排序還有助于對數據檢查糾錯以及為重新歸類或分組提供方便。美國的《財富》雜志每年都要在全世界范圍內排出五百強企業(yè),通過這一信息不僅可以了解自己企業(yè)所處的地位,還可以從一個側面了解到競爭對手的狀況,有效制定企業(yè)的發(fā)展規(guī)劃和戰(zhàn)略目標。拓展閱讀3-1:《財富》世界500強排行榜一直是衡量全球大型公司的最著名、最權威的榜單,被譽為“終極榜單”,由《財富》雜志每年發(fā)布一次。3.1.4數據透視表為了從復雜的數據中提取有用的信息,可以利用Excel提供的【數據透視表】(pivottable)工具。利用數據透視表,可以對數據表的重要信息按使用者的習慣或分析要求進行匯總和作圖,形成一個符合要求的交叉表(列聯表)。在利用數據透視表時,數據源表中的首行必須有列標題。例:在某大學隨機抽取20名學生,調查他們的性別、民族、家庭所在地、平均月生活費、月愿意支付攝影費用、影響攝影的因素等,得到的數據如表3—2所示。試建立一個數據透視表,在表的行變量中給出性別平均月生活費和月愿意支付攝影費用,在列變量中給出學生的家庭所在地區(qū),對影響攝影的因素進行交叉匯總。數據透視表創(chuàng)建步驟第一步:從“插入”菜單欄中選取“數據透視表”第二步:“數據透視表”對話窗口的設置“數據透視表”字段選擇思考3.1:什么是統(tǒng)計圖?解析:統(tǒng)計圖(StatisticalDiagram/StatisticalGraph),是指利用幾何圖形或具體事物的形象和地圖等形式來表現社會經濟現象數量特征和數量關系的圖形。為了使市場調研資料的表達直觀生動、通俗易懂、便于分析比較等,可以利用統(tǒng)計圖進行市場調研分析、預測和分析現象之間的數量關系及變化發(fā)情情況。任務2品質數據的整理與展示數據經過預處理后,可根據需要進一步做分類或分組。在對數據進行整理時,首先要弄清楚所面對的是什么類型的數據,因為不同類型的數據,所采取的處理方式和所適用的處理方法是不同的。對品質數據主要是做分類整理,對數值型數據則主要是做分組整理。品質數據包括分類數據和順序數據,它們整理和圖形展示的方法上大多上是相同的,但也有些微小差異。1)頻數與頻數分布頻數(frequency)是落在某一特定類別或組中的數據個數。把個別類別及落在其中的相應頻數全部列出,并用表格形式表現出來,稱為頻數分布(frequencydistribution)。例:為研究性別與愿意和誰一起拍照,進行了抽樣調查。下表是調查員隨機調查的100名學生愿意一起合拍對象及性別的記錄。生成頻數分布表,合拍對象和性別的分布狀況,并進行描述性分析。使用數據透視表進行技術和匯總。具體做法是:在【數據透視】對話框中,依次將“合拍對象”加入“行”(或列)區(qū)域,將“性別”加入到“列”(或行)區(qū)域,將“合拍對象”加入“數據”區(qū)域。使用【數據分析】工具中(Excel【數據分析】工具安裝。Excel【數據分析】工具提供了一些常用統(tǒng)計方法的程序。如果你的及其還沒有安裝此項功能,需要安裝后才能使用。步驟如下:第一步:在Excel工作表界面中點擊【工具】下拉菜單,找到【加載宏】選項并單擊。第二步:在【可用加載宏】選項中選中【分析工具庫】,然后單擊【確定】,系統(tǒng)會提示你安裝。第三步:將office安裝盤插入光驅,然后單擊【確定】即可?!局狈綀D】命令也可以生成頻數分布表。“行”是“合拍對象”變量,“列”是“性別”變量(當然,行和列可以交換,也可以生成只含一個變量的頻數分布表)。這種由兩個或兩個以上變量交叉分類的頻數分布表也稱為列聯表(contingencytable)。二維的列聯表(兩個變量交叉分類)也稱為交叉表(crosstable)。分類數據圖示如果用圖形來顯示頻數分布,就會更形象和直觀。一張好的統(tǒng)計圖表,往往勝過冗長的文字表述。統(tǒng)計圖的類型有很多,多數統(tǒng)計圖除了可以繪制而為平面圖,還可以繪制三維立體圖。圖形的制作均可由計算機來完成。這里首先介紹分類數據的圖示方法,其中包括條形圖、帕累托圖、餅圖等。如果有兩個總體或兩個樣本的分類相同問題且問題可比,還可以繪制環(huán)形圖。(1)條形圖條形圖(barchart)是用寬度相同的條形的高度或長度來表示數據多少的圖形。條形圖可以橫置或縱置,縱置時也可以稱為柱形圖(columnchart)。此外,條形圖有簡單條形圖、復式條形圖等形式。(2)帕累托圖帕累托圖(paretochart)是以意大利經濟學家V.Pareto的名字命名的,該圖是按照類別數據出現的頻數多少排序后繪制的條形圖。通過對條形的排序,容易看出哪類數據出現的多,哪類數據出現的少。(3)餅圖餅圖(piechart)是用圓形及圓內扇形的角度來表示數值大小的圖形,它主要用于表示一個樣本(或總體)中各組成的數據占全部數據的比例,對于研究結構性問題十分有用。比較男女合拍對象的構成狀況,可以繪制復式餅圖。它是簡單餅圖的嵌套,主要用于展示兩個或多個分類變量的構成比較,比如,在男女分類的基礎上又增加了合拍對象的分類。(4)環(huán)形圖簡單餅圖只能顯示一個樣本各部分所占的比例。比如,把5個地區(qū)的人口分別按高收入,中等收入和低收入劃分成3部分,要比較5個地區(qū)不同收入的人口構成,則需要繪制5個餅圖,這種做法既不經濟也不便于比較。能否用一個圖形比較出5個地區(qū)不同收入的人口構成呢?把餅圖疊在一起,挖去中間的部分就可以了,這就是環(huán)形圖(doughnutchart)。環(huán)形圖與餅圖類似,但又有區(qū)別。環(huán)形圖中有一個“空洞”,每個樣本用一個環(huán)來表示,樣本中的每一部分數據用環(huán)中的一段表示。因此環(huán)形圖可顯示多個樣本各部分所占的相應比例,從而有利于構成比較研究。順序數據的整理與圖示上面介紹的分類數據的頻數分布表和圖示方法,如頻數、比例、百分比、比率、條形圖和餅圖等,也都適用于對順序數據的整理與顯示。但適用于順序數據的整理和顯示方法,還可以計算累積頻數和累積頻率(百分比)。累積頻數(cumulatiefrequencies)是將各有序類別或組的頻數逐級累加起來得到的頻數,頻數的累積方法有兩種:一是從類別順序的開始一方向類別順序的最后一方累加頻數(數值型分組則是從變量值小的一方向變量值大的一方累加頻數),稱為向上累積;二是從類別順序的最后一方向類別順序的開始一方累加頻數(數值型分組數據則是從變量值大的一方向變量值小的一方累加頻數),稱為向下累積。通過累積頻數,可以很容易看出某一類別(或數值)以下或某一類別(或數值)以上的頻數之和。例:在一項有關校師生對學校教學設備評價、管理水平和質量評價研究中,研究人員調查在校師生200名,一個問題是:“您對學校管理水平和質量評價是否滿意?”要求回答的類別依次如下:1.非常不滿意;2.不滿意;3.一般;4.滿意;5非常滿意。另一個問題是:“您對學校教學設備評價是什么?”要求回答的類別依次是:⒈非常齊全;2齊全.;3.一般;4.不齊全;5.非常不齊全回答類別人數(人)頻率(%)向上累計向下累計人數(人)頻率(%)人數(人)頻率(%)非常不齊全84.0084.00200100.00不齊全189.002613.0019296.00一般12361.5014974.5017487.00齊全4422.0019396.505125.50非常齊全73.50200100.0073.50合計200100.00----回答類別人數(人)頻率(%)向上累計向下累計人數(人)頻率(%)人數(人)頻率(%)非常不滿意63.0063.00200100.00不滿意126.00189.0019297.00一般14070.0015879.0018291.00滿意3417.0019296.004221.00非常滿意84.00200100.0084.00合計200100.00----任務3數值型數據的整理與展示3.3.1數據分組數據分組是根據統(tǒng)計研究的需要,將原始數據按照某種標準化分成不同的組別,分組后的數據稱為分組數據(groupeddata)。數據分組的主要目的是觀察數據的分布特征。數據經分組后再計算出各組中數據出現的頻數,就形成了一張頻數分布表。數據分組的方法有單變量值分組和組距分組兩種。單變量分組單變量分組數列,簡稱單項數列,它是指數列中每一個組的變量值只有一個,即一個變量值代表一個組。單變量值分組是把每一個變量值作為一組,這種分組通常只適合離散變量,且在變量值較少的情況下使用。有20個工人看管機器臺數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4。如按以上資料編制頻數分布表。工人看管機器情況頻數分布表看管機器(臺)人數(人)頻率向上累積向下累計人數(人)頻率人數(人)頻率2420%420%20100%3420%840%1680%4945%1785%1260%5210%1995%315%615%20100%15%合計20100%————————組距式分組組距式分組變量數列,簡稱組距數列,它是指每個組是用兩個變量值所確定的一個區(qū)間范圍來表示,在連續(xù)變量或變量值較多的離散變量情況下,通常采用組距分組。它是將全部變量值依次劃分為若干個區(qū)間,并將這一區(qū)間的變量值作為一組。如果各組的組距相等,就叫等距數列。若不等就叫做非等距數列。我國第五次人口普查我國大陸人口年齡分布學生按成績分組成績(分)人數(人)頻率60——7038%70——802768%80——90820%90——10025%合計40100%1、組限:在組距分組中,一個組的最小值稱為下限(lowerlimit):一個組的最大值稱為上限(upperlimit)。A、組限的表示方法有:(1)重疊組限:如:10——2020——30…歸下原則:當某個標志值剛好是相鄰兩組上下限數值時,一般把此值歸并到下限組。(2)不重疊組限(只適用于離散變量):如:10——2021——30…B.組的表示方法:(1)閉口組:上、下限都有(2)開口組:上、下限有一缺一組距式分組的有關概念組距式分組的有關概念2、組距計算公式:組距(i)=上限–下限種類:根據各組組距是否相等,組距數列可分為:等距數列、非等距數列表示方法:一般用5.10、20、50、100等類似數字表示。另一相似的概念:全距(R)=最大變量值–最小變量值組距式分組的有關概念3.組中值概念:每組中點的數值計算公式:對于開口組,需先假定其所缺的上限或下限(假設開口組的組距與其相鄰組的組距相等)。(缺上限)組中值=下限+鄰組組距/2(缺下限)組中值=上限-鄰組組距/24.組數(K)組數、組距、全距之間存在如下關系:
可用經驗公式來確定:K=1+3.322lgn但最佳決定還是依據常識和數列使用的目的而定。一般情況下,不應少于5組且不多于15組。組距式分組的有關概念3.3.2數值型數據的圖示上面介紹的條形圖、餅圖、環(huán)形圖及累積分布圖等都適用于顯示數值型數據。此外,對數值型數據還有下面的一些圖示方法,這些方法并不適用于分類數據和順序數據。(一)分組數據:直方圖用圖形來展示數據的分布會更形象、直觀。顯示分組數據頻數分布特征的圖形直方圖、直線圖和曲線圖。直方圖(histogram)是用來展示分組數據分布的一種圖形,它是用矩形的寬度和高度(即面積)來表示頻數分布的。繪制該圖時,在平面直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,這樣,各組與相應的頻數就形成了一個矩形,即直方圖。例如,根據表3—7中的分組數據用Excel繪制的直方圖如圖3—17所示。直方圖與條形圖不同。首先,條形圖條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或頻率,寬度則表示各組的組距,因此其高度與寬度均有意義。其次,由于分組數據具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。最后,條形圖主要用于展示分類數據,而直方圖則主要用于展示數值型數據。(二)未分組數據:莖葉圖1.莖葉圖莖葉圖(stem-and-leafdisplay)是反映原始數據分布的圖形。它由莖和葉兩部分構成,其圖形是有數字組成的。通過莖葉圖,可以看出數據的分布形狀以及數據的離散狀況,比如,分布是否對稱,數據是否集中,是否有離群點,等等。繪制莖葉圖的關鍵是設計好莖。制作莖葉圖時,首先把一個數字分成兩部分,通常是以該數據的高位數值作為樹莖,而且葉上只保留該數值的最后一個數字。2.箱線圖。箱線圖(boxplot)是由一組數據的最大值(maximum)、最小值(mini-mum)、中位數(mediam)、兩個四分位數(quartiles)這五個特征值繪制而成的,它主要用于反映原始數據分布的特征,還可以進行多組數據分布特征的比較。箱線圖的繪制方法是:先找出一組數據的最大值、最小值、中位數和兩個四分位數;然后,連接兩個四分位數畫出箱子,再把最大值和最小值相連,中位數放在箱子中間。(三)時間序列數據:線圖如果數值型數據是在不同時間上取得的,即時間序列數據,則可以繪制線圖。線圖(lineplot)主要于反映現象隨時間變化的特征。(四)多變量數據的圖示上面介紹的一些圖形描述的都是單變量數據。當有兩個或兩個以上變量時,可以采用多變量的圖示方法,常見的有散點圖、氣泡圖、雷達圖等。1.散點圖散點圖(scatterdiagram)是用二維坐標展示兩個變量之間關系的一種圖形。它是用坐標橫軸代表變量x,縱軸代表變量y,每組數據(xⅰ,yⅰ)在坐標系中用一個點表示,n組數據在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數據圖稱為散點。2.雷達圖(radarchart)是顯示多個變量的常用圖示方法,也稱為蜘蛛圖(spiderchart)。設有n組樣本S1,S2,…….Sn,每個樣本測得P個變量X1,X2,……..Xn,要繪制這P個形成的變量的雷達圖,其具體做法是:先畫一個圓,然后將圓P平等分,得到P個點,令P個點分別對應P個變量,再將這P個點與圓心連線,得到P個輻射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心得距離表示,再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一張雷達圖。雷達圖顯示或對比各變量的數值總和時十分有用。假定各變量的取值具有相同的正負號,則總的絕對值與圖形所圍成的區(qū)域成正比。此外,利用雷達圖也可以研究多個樣本之間的相似度。2006年我國西部地區(qū)城鎮(zhèn)居民生活消費支出(元)項目支出食品2770.24衣著818.14家庭設備460.85醫(yī)療保健513.88交通通信900.74教育娛樂1021.43居住756.42雜項262.7任務4合理使用圖表統(tǒng)計圖和統(tǒng)計表是展示數據的兩種方式。在生活中,閱讀報紙雜志,或者在看電視、查閱計算機網絡時,我們都能看到大量的統(tǒng)計圖表。統(tǒng)計表把雜亂的數據有條理地組織在一張簡明的表格內。在對某些實際問題進行研究時,也經常要使用統(tǒng)計表和統(tǒng)計圖。正確地使用統(tǒng)計表和統(tǒng)計圖是做好分析的最基本技能。3.4.1.鑒別圖形優(yōu)劣的準則一張精心設計的圖形是展示數據的有效工具。上面介紹了用圖形來展示數據的方法,借助計算機可以繪制出漂亮的圖表。但是注意的是,初學者往往會在圖形的修飾上花費時間和精力,這樣做得不嘗失,或許會畫蛇添足。精心設計的圖形可以準確表達數據所要傳遞的信息。設計圖形時,應繪制得盡可能簡潔。塔夫特指出,一張好的圖形具有以下的基本特征:(1)顯示數據。(2)把注意力集中在圖形的內容上,而不是在制作圖形的程序上。(3)避免歪曲。(4)強調數據間比較。(5)服務于明確的目的。(6)對圖形的統(tǒng)計描述和文字說明。五條鑒別圖形優(yōu)劣的準則:(1)一張好圖應當精心設計,有助于觀察問題
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 購銷合同協(xié)議書范本的實踐經驗總結
- 個人提供保險代理勞務合同
- 積極向上完成軍訓
- 遲到保證書寫什么內容
- 貨物采購合同權益
- 質量保證書范例設計指南匯編
- 學生過失承諾
- 二手房屋買賣合同按揭貸款問題
- 技術開發(fā)協(xié)議書格式模板
- 消防設施安裝勞務合作
- 湖北省新中考語文現代文閱讀技巧講解與備考
- 幼兒園故事課件:《胸有成竹》
- (完整版)康復科管理制度
- 深度千分尺校準記錄表
- GB/T 10000-2023中國成年人人體尺寸
- 電工安全用具課件
- 北師大版四年級數學上冊《不確定性》評課稿
- 模板銷售合同模板
- 對越自衛(wèi)反擊戰(zhàn)專題培訓課件
- 小學生簡筆畫社團活動記錄
- 出境竹木草制品公司原輔料采購驗收制度
評論
0/150
提交評論