《描述統(tǒng)計學(xué)》課件_第1頁
《描述統(tǒng)計學(xué)》課件_第2頁
《描述統(tǒng)計學(xué)》課件_第3頁
《描述統(tǒng)計學(xué)》課件_第4頁
《描述統(tǒng)計學(xué)》課件_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《描述統(tǒng)計學(xué)》描述統(tǒng)計學(xué)是統(tǒng)計學(xué)的一個分支,它側(cè)重于數(shù)據(jù)的整理、分析和描述。它主要用于收集、整理、分析和展示數(shù)據(jù),以發(fā)現(xiàn)數(shù)據(jù)中的模式和規(guī)律。課程大綱11.描述統(tǒng)計學(xué)概述介紹描述統(tǒng)計學(xué)的概念、意義和應(yīng)用。22.數(shù)據(jù)收集方法探討各種數(shù)據(jù)收集方法,包括隨機抽樣、分層抽樣、系統(tǒng)抽樣和聚類抽樣。33.數(shù)據(jù)整理與展示講解數(shù)據(jù)整理和展示的技巧,包括頻數(shù)分布、直方圖、箱線圖和散點圖。44.中心趨勢測量介紹算術(shù)平均數(shù)、中位數(shù)和眾數(shù)等中心趨勢測量指標。55.數(shù)據(jù)離散程度探討極差、方差、標準差和變異系數(shù)等數(shù)據(jù)離散程度指標。66.數(shù)據(jù)偏斜性講解偏度和峰度等數(shù)據(jù)偏斜性指標。77.相關(guān)分析介紹皮爾遜相關(guān)系數(shù)和斯皮爾曼等級相關(guān)系數(shù)等相關(guān)分析方法。什么是描述統(tǒng)計學(xué)描述統(tǒng)計學(xué)是統(tǒng)計學(xué)的一個分支,它主要關(guān)注數(shù)據(jù)的收集、整理、分析和描述。它使用各種圖表、表格和指標來總結(jié)和解釋數(shù)據(jù),以便我們能夠更好地理解數(shù)據(jù)背后的含義。數(shù)據(jù)收集與分類1數(shù)據(jù)來源確定數(shù)據(jù)來源,例如問卷調(diào)查、公開數(shù)據(jù)、數(shù)據(jù)庫等。2數(shù)據(jù)收集根據(jù)數(shù)據(jù)來源設(shè)計收集方法,并進行實際收集。3數(shù)據(jù)整理對收集到的數(shù)據(jù)進行清洗、轉(zhuǎn)換、格式化等操作。4數(shù)據(jù)分類將數(shù)據(jù)按特征或?qū)傩赃M行分類,方便后續(xù)分析。數(shù)據(jù)收集是統(tǒng)計學(xué)的基礎(chǔ),分類有助于更好地理解數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)整理與展示1數(shù)據(jù)可視化直觀地展示數(shù)據(jù)特征2數(shù)據(jù)分類將數(shù)據(jù)按照類別進行分組3數(shù)據(jù)清洗處理缺失值和異常值4數(shù)據(jù)收集從各種來源獲取數(shù)據(jù)數(shù)據(jù)整理和展示是描述統(tǒng)計學(xué)的重要環(huán)節(jié),旨在將原始數(shù)據(jù)轉(zhuǎn)化為易于理解和分析的信息。通過數(shù)據(jù)清洗、分類、可視化等步驟,可以揭示數(shù)據(jù)的特征、趨勢和規(guī)律,為后續(xù)的統(tǒng)計分析提供基礎(chǔ)。集中趨勢平均數(shù)平均數(shù)是數(shù)據(jù)集中趨勢的常用指標,它代表所有數(shù)據(jù)值的平均水平。中位數(shù)中位數(shù)是指將數(shù)據(jù)按大小順序排列后處于中間位置的數(shù)值,不受極端值影響。眾數(shù)眾數(shù)是指數(shù)據(jù)集中出現(xiàn)次數(shù)最多的數(shù)值,反映數(shù)據(jù)分布中的集中趨勢。數(shù)據(jù)分散程度數(shù)據(jù)離散程度數(shù)據(jù)離散程度是指數(shù)據(jù)點在中心值周圍分散的程度,反映數(shù)據(jù)的波動性。極差極差是最簡單的數(shù)據(jù)離散程度測量指標,指最大值與最小值之間的差值。方差與標準差方差是數(shù)據(jù)點與平均值之間平方差的平均值,而標準差是方差的平方根。變異系數(shù)變異系數(shù)是標準差與平均值的比率,用于比較不同數(shù)據(jù)組的離散程度。數(shù)據(jù)偏斜性偏度偏度衡量數(shù)據(jù)分布的對稱性。正偏度表示數(shù)據(jù)向右傾斜,負偏度表示數(shù)據(jù)向左傾斜。峰度峰度衡量數(shù)據(jù)分布的集中程度。高峰度表示數(shù)據(jù)更集中在中心,低峰度表示數(shù)據(jù)更分散。相關(guān)分析分析數(shù)據(jù)之間關(guān)系相關(guān)分析用于研究兩個或多個變量之間是否存在關(guān)系,以及關(guān)系的強度和方向。度量線性關(guān)系常見的相關(guān)系數(shù)包括皮爾遜相關(guān)系數(shù)和斯皮爾曼等級相關(guān)系數(shù),用于衡量線性關(guān)系的程度。預(yù)測和解釋相關(guān)分析可以幫助預(yù)測一個變量的變化對另一個變量的影響,并解釋變量之間的相互作用。2.數(shù)據(jù)收集方法數(shù)據(jù)收集方法是描述統(tǒng)計學(xué)的基礎(chǔ),它決定了數(shù)據(jù)的質(zhì)量和代表性。收集數(shù)據(jù)的方法多種多樣,不同的方法適用不同的場景。本章將介紹常見的幾種數(shù)據(jù)收集方法,并分析其優(yōu)缺點。隨機抽樣定義隨機抽樣是一種從總體中隨機選取樣本的方法,確保每個樣本被選中的概率相等。這保證樣本能夠充分代表總體,減少樣本偏差,提高研究結(jié)果的可靠性。方法常見的隨機抽樣方法包括簡單隨機抽樣,系統(tǒng)抽樣,分層抽樣,以及整群抽樣。根據(jù)研究目的和總體特點選擇合適的抽樣方法,可以提高數(shù)據(jù)質(zhì)量,確保研究結(jié)果的有效性。分層抽樣11.分組將總體劃分為若干個互不重疊的子集,稱為層。22.隨機抽樣從每個層中獨立地進行隨機抽樣,抽取的樣本組成最終樣本。33.比例每個層中的樣本數(shù)應(yīng)與該層在總體中的比例成正比。44.代表性確保每個層在樣本中得到充分的代表性,反映總體的結(jié)構(gòu)特征。系統(tǒng)抽樣選擇起點從總體中隨機選擇一個起點。抽樣間隔確定一個固定的抽樣間隔,并按照間隔選取樣本。實際應(yīng)用廣泛應(yīng)用于人口普查、市場調(diào)查等領(lǐng)域。聚類抽樣定義將總體分成若干個互不相交的子總體,每個子總體稱為一個“類”,然后從每個“類”中隨機抽取一定數(shù)量的樣本,最終將所有抽取的樣本組合成樣本總體,這種抽樣方法被稱為“聚類抽樣”。優(yōu)點聚類抽樣操作簡單、成本較低,特別適合總體分布范圍廣闊的情況。缺點如果子總體之間存在較大差異,則可能導(dǎo)致樣本代表性不足,影響研究結(jié)果的準確性。適用場景例如,調(diào)查全國的居民收入水平,可以將全國劃分成若干個省份,然后從每個省份隨機抽取一定數(shù)量的居民進行調(diào)查。數(shù)據(jù)整理與展示數(shù)據(jù)整理與展示是數(shù)據(jù)分析的第一步,通過對數(shù)據(jù)的整理和可視化,可以更好地理解數(shù)據(jù)背后的規(guī)律和趨勢,為后續(xù)的分析提供基礎(chǔ)。頻數(shù)分布頻數(shù)分布表統(tǒng)計每個數(shù)值出現(xiàn)的次數(shù),并以表格形式展示。頻數(shù)分布圖使用直方圖或條形圖直觀地呈現(xiàn)頻數(shù)分布。相對頻數(shù)計算每個數(shù)值占總體的比例,更方便進行比較。直方圖直方圖是一種常用的數(shù)據(jù)可視化工具,用于展示數(shù)據(jù)分布情況。它將數(shù)據(jù)分成若干個組,每個組對應(yīng)一個矩形,矩形的寬度代表組距,高度代表組內(nèi)數(shù)據(jù)頻數(shù)。直方圖可以直觀地展示數(shù)據(jù)的集中趨勢、離散程度和偏斜性。箱線圖箱線圖是一種直觀的圖形化展示數(shù)據(jù)分布特征的方法。它將數(shù)據(jù)分成四個部分,分別是最大值、最小值、第一四分位數(shù)、第二四分位數(shù)(中位數(shù))和第三四分位數(shù)。箱線圖可以清晰地顯示數(shù)據(jù)的中心趨勢、離散程度和異常值,有助于快速了解數(shù)據(jù)的分布情況。它在統(tǒng)計分析中被廣泛應(yīng)用于描述性分析、異常值檢測和數(shù)據(jù)比較。散點圖散點圖是一種常用的數(shù)據(jù)可視化工具,用于展示兩個變量之間的關(guān)系。通過觀察散點圖,可以直觀地了解變量之間的線性關(guān)系、非線性關(guān)系、相關(guān)性以及異常值。散點圖在統(tǒng)計學(xué)、數(shù)據(jù)分析、機器學(xué)習(xí)等領(lǐng)域有著廣泛的應(yīng)用,例如股票價格分析、天氣預(yù)報、疾病診斷等等。中心趨勢測量中心趨勢測量用于描述數(shù)據(jù)集中趨勢的統(tǒng)計指標。它幫助我們了解數(shù)據(jù)的典型值,并提供對數(shù)據(jù)分布的概括性信息。算術(shù)平均數(shù)算術(shù)平均數(shù)公式算術(shù)平均數(shù)是最常用的集中趨勢測度方法之一,它代表數(shù)據(jù)集中所有數(shù)值的平均值。數(shù)據(jù)計算將數(shù)據(jù)集中所有數(shù)值相加,然后除以數(shù)據(jù)集中數(shù)值的個數(shù),得到算術(shù)平均數(shù)。應(yīng)用場景算術(shù)平均數(shù)廣泛應(yīng)用于各種統(tǒng)計分析中,例如計算平均收入、平均氣溫等。中位數(shù)定義中位數(shù)是指將數(shù)據(jù)按大小順序排列后,位于中間位置的數(shù)值。意義中位數(shù)不受極端值的影響,可以更準確地反映數(shù)據(jù)的集中趨勢。應(yīng)用中位數(shù)常用于描述收入、房價等受極端值影響較大的數(shù)據(jù)。眾數(shù)定義數(shù)據(jù)集中出現(xiàn)次數(shù)最多的數(shù)值稱為眾數(shù)。眾數(shù)反映數(shù)據(jù)集中最常出現(xiàn)的值,適用于描述數(shù)據(jù)集中典型特征。特點一個數(shù)據(jù)集中可能存在多個眾數(shù),也可能不存在眾數(shù)。眾數(shù)不受極端值影響,適用于描述離散型數(shù)據(jù)或數(shù)據(jù)存在多個峰值的情況。5.數(shù)據(jù)離散程度數(shù)據(jù)離散程度指的是數(shù)據(jù)分布的離散程度,反映數(shù)據(jù)圍繞中心值的分散程度。離散程度指標可以幫助我們了解數(shù)據(jù)分布的規(guī)律,進而判斷數(shù)據(jù)是否集中,以及數(shù)據(jù)變異程度的大小。極差11.定義極差是數(shù)據(jù)集中最大值和最小值之間的差值,是最簡單的離散程度度量。22.計算極差可以通過直接從數(shù)據(jù)集中找出最大值和最小值,然后相減得到。33.應(yīng)用極差可以快速了解數(shù)據(jù)的范圍,但容易受到極端值的影響,不適合用來比較不同數(shù)據(jù)集的離散程度。方差度量分散程度衡量數(shù)據(jù)點相對于平均值的離散程度。計算方法將每個數(shù)據(jù)點與平均值的差值平方,求和再除以數(shù)據(jù)點個數(shù)減1。圖形表示方差通常與標準差一起使用,來評估數(shù)據(jù)的離散程度。標準差定義標準差是衡量數(shù)據(jù)分散程度的指標,它反映了數(shù)據(jù)點與平均值的平均距離。計算標準差的計算公式為方差的平方根,即方差的正向平方根。用途標準差可用于比較不同數(shù)據(jù)集的離散程度,以及判斷數(shù)據(jù)點的離群程度。變異系數(shù)變異系數(shù)公式變異系數(shù)是標準差與平均數(shù)的比率,用于比較不同數(shù)據(jù)集的離散程度。變異系數(shù)應(yīng)用變異系數(shù)不受數(shù)據(jù)單位影響,適用于不同單位數(shù)據(jù)的比較。變異系數(shù)解讀變異系數(shù)越大,數(shù)據(jù)離散程度越高,反之則越低。數(shù)據(jù)偏斜性數(shù)據(jù)偏斜性是指數(shù)據(jù)分布的非對稱性。偏斜性可以告訴我們數(shù)據(jù)分布的形狀,以及平均值、中位數(shù)和眾數(shù)之間的關(guān)系。偏度11.偏度概念偏度是指數(shù)據(jù)分布的傾斜程度,反映了數(shù)據(jù)分布的對稱性。22.偏度計算偏度可以通過數(shù)學(xué)公式計算得出,正偏度表示數(shù)據(jù)分布向右傾斜,負偏度表示數(shù)據(jù)分布向左傾斜。33.偏度應(yīng)用偏度可以幫助我們了解數(shù)據(jù)分布的形狀,判斷數(shù)據(jù)是否偏斜。44.偏度類型偏度分為正偏度、負偏度和零偏度三種類型,分別對應(yīng)數(shù)據(jù)分布的右偏、左偏和對稱。峰度定義峰度是指數(shù)據(jù)分布曲線形狀的陡峭程度。它反映了數(shù)據(jù)集中程度的特征。峰度可以通過計算數(shù)據(jù)的四階中心矩來衡量。類型峰度可以分為三種:尖峰、平峰和中等峰度。尖峰是指數(shù)據(jù)分布曲線比較陡峭,數(shù)據(jù)集中程度高。平峰是指數(shù)據(jù)分布曲線比較平緩,數(shù)據(jù)集中程度低。中等峰度是指數(shù)據(jù)分布曲線介于尖峰和平峰之間。7.相關(guān)分析相關(guān)分析是研究兩個或多個變量之間關(guān)系的一種統(tǒng)計方法。它可以幫助我們了解變量之間是否存在聯(lián)系,以及聯(lián)系的程度和方向。皮爾遜相關(guān)系數(shù)線性關(guān)系皮爾遜相關(guān)系數(shù)衡量兩個變量之間的線性關(guān)系。方向系數(shù)為正值表示正相關(guān),負值表示負相關(guān)。強度系數(shù)范圍為-1到+1,接近1表示強相關(guān),接近0表示弱相關(guān)。斯皮爾曼等級相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論