統(tǒng)計法-第1-8章課件011導論_第1頁
統(tǒng)計法-第1-8章課件011導論_第2頁
統(tǒng)計法-第1-8章課件011導論_第3頁
統(tǒng)計法-第1-8章課件011導論_第4頁
統(tǒng)計法-第1-8章課件011導論_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計學Statistics

共享郵箱:

什么是統(tǒng)計學?什么是統(tǒng)計學?

(statistics)統(tǒng)計學是收集、分析、表述和解釋數(shù)據(jù)的科學(不列顛百科全書)統(tǒng)計是一門收集、分析、解釋和提供數(shù)據(jù)的科學(韋伯斯特國際辭典第3版)統(tǒng)計指的是一組方法,用來設計實驗、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎上組織、概括、演示、分析、解釋和得出結論(MarioF.Triola,《初級統(tǒng)計學》)

統(tǒng)計是一套有關收集、處理、分析、解釋和從數(shù)據(jù)中得出的結論的方法(教材)應用案例:制定宏觀經(jīng)濟政策

例如:政府制定各項經(jīng)濟政策要知道:未來的就業(yè)形勢?經(jīng)濟增長前景?物價形勢?國際收支狀況?這些信息都需要大量的統(tǒng)計支持(數(shù)據(jù)收集、趨勢預測、政策效果的評價等等)。

應用案例:抽樣調(diào)查2008年11月2日各民意調(diào)查機構對美國大選的兩位候選人的支持率調(diào)查結果(選民票得票率)

馬里斯特:奧巴馬50,麥凱恩43.

拉斯馬森:奧巴馬51,

麥凱恩47.

蓋洛普:奧巴馬52,麥凱恩43.

佐格比:奧巴馬50,麥凱恩43.

迪亞喬:奧巴馬48,麥凱恩41.

戰(zhàn)場:

奧巴馬49,

麥凱恩45.

IBD:

奧巴馬48,

麥凱恩44.實際結果:奧巴馬和麥凱恩的選民票得票率分別為52%和46%。統(tǒng)計數(shù)據(jù)無處不在舉例1:統(tǒng)計局:今年5月份CPI同比增長5.5%

舉例2:期末全班同學的高等代數(shù)的平均分為75,最高分為92,最低分為40,不及格率為5%舉例3:挪威公共衛(wèi)生研究所的科學家調(diào)查表明,每天吸煙1到4支的人罹患缺血性心臟病的幾率是不吸煙者的3倍,少量吸煙的男性罹患肺癌的風險比不吸煙男性高2倍,女性少量吸煙則會使罹患肺癌的風險增加4倍。

統(tǒng)計數(shù)據(jù)無處不在舉例4:1981年,首屆國際《紅樓夢》研討會在美國召開,威斯康星大學講師陳炳藻獨樹一幟,宣讀了題為《從詞匯上的統(tǒng)計論〈紅樓夢〉作者的問題》的論文。他從字、詞出現(xiàn)頻率入手,通過計算機進行統(tǒng)計、處理、分析,對《紅樓夢》后40回系高鶚所作這一流行看法提出異議,認為120回均系曹雪芹所作。統(tǒng)計學是一系列從數(shù)據(jù)中獲取有用信息以幫助決策的原理和方法。統(tǒng)計的各步驟

(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):整理與圖表展示分析數(shù)據(jù):利用統(tǒng)計方法研究數(shù)據(jù)數(shù)據(jù)解釋:統(tǒng)計結果的說明得到結論:從數(shù)據(jù)中提取有用的信息得出結論收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結論的科學

統(tǒng)計方法數(shù)據(jù)分析的統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗描述統(tǒng)計

(descriptivestatistics)描述統(tǒng)計

—用表格、圖形和數(shù)字來概括、顯示數(shù)據(jù)特征的統(tǒng)計方法內(nèi)容整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105描述統(tǒng)計舉例例1:2005年我國出生人口性別比(男:女)已經(jīng)升高到119.92,與正常值106相比有嚴重的偏離。例2:中國經(jīng)濟增長的起伏推斷統(tǒng)計

(inferentialstatistics)推斷統(tǒng)計—研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法內(nèi)容參數(shù)估計假設檢驗目的對總體特征作出推斷樣本總體推斷統(tǒng)計舉例例1:2003年人口變動抽樣調(diào)查以全國為總體,在全國抽取了990個縣(市、區(qū))、3734個鄉(xiāng)(鎮(zhèn)、街道)、6544個調(diào)查小區(qū)的126萬人。根據(jù)調(diào)查結果推算,2003年末全國總人口為129227萬人,出生人口為1599萬人,死亡人口為825萬人,凈增人口為774萬人。例2:一家大公司的會計部門會從所有的發(fā)票中選擇一部分來檢查公司所有發(fā)票的準確性。描述統(tǒng)計與推斷統(tǒng)計的關系總體內(nèi)在的數(shù)量規(guī)律性推斷

統(tǒng)計概率論與數(shù)理統(tǒng)計描述

統(tǒng)計

總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計的應用領域經(jīng)濟學管理學醫(yī)學工程學社會學…

統(tǒng)計學

由于大部分學科都涉及數(shù)據(jù)分析工作,因此統(tǒng)計學幾乎可以與任何一個學科結合起來……統(tǒng)計的應用領域actuarialwork

(精算)

agriculture

(農(nóng)業(yè))animalscience

(動物學)

anthropology

(人類學)archaeology(考古學)

auditing(審計學)crystallography(晶體學)

demography(人口統(tǒng)計學)dentistry(牙醫(yī)學)

ecology

(生態(tài)學)econometrics(經(jīng)濟計量學)

education(教育學)electionforecastingandprojection

(選舉預測和策劃)engineering(工程)

epidemiology(流行病學)finance(金融)fisheriesresearch

(水產(chǎn)漁業(yè)研究)gambling(賭博)

genetics(遺傳學)geography(地理學)

geology(地質(zhì)學)historicalresearch

(歷史研究)

humangenetics

(人類遺傳學)統(tǒng)計的應用領域hydrology(水文學)

industry

(工業(yè))linguistics

(語言學)

literature(文學)manpowerplanning

(勞動力計劃)managementscience

(管理科學)marketing(市場營銷學)

medicaldiagnosis

(醫(yī)學診斷)meteorology(氣象學)

militaryscience

(軍事科學)nuclearmaterialsafeguards

(核材料安全管理)ophthalmology(眼科學)

pharmaceutics(制藥學)physics

(物理學)

politicalscience

(政治學)psychology(心理學)

psychophysics(心理物理學)qualitycontrol

(質(zhì)量控制)

religiousstudies

(宗教研究)sociology

(社會學)

surveysampling

(調(diào)查抽樣)taxonomy(分類學)

weathermodification

(氣象改善)統(tǒng)計無處不在見教材P3:統(tǒng)計在工商管理中的應用。

統(tǒng)計學的分支理論統(tǒng)計學

—把研究對象一般化、抽象化,以數(shù)學中的概率論為基礎,從純理論的角度,對統(tǒng)計方法加以推導論證。應用統(tǒng)計學—從所研究的領域或?qū)iT問題出發(fā),視研究對象的性質(zhì)采用適當?shù)慕y(tǒng)計方法,解決所需研究的問題。應用統(tǒng)計學通常具有邊緣交叉學科的性質(zhì)第1章導論1.1

統(tǒng)計及其應用領域1.2統(tǒng)計數(shù)據(jù)的類型1.3統(tǒng)計中的幾個基本概念1.1統(tǒng)計及其應用領域1.1.1什么是統(tǒng)計學1.1.2統(tǒng)計的應用領域“數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!”他不耐煩地喊道,“我不能做無米之炊!”

—Sherlock·福爾摩斯數(shù)據(jù)是做統(tǒng)計分析的基礎1.2.1分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)1.2.2觀測數(shù)據(jù)和實驗數(shù)據(jù)1.2.3截面數(shù)據(jù)和時間序列數(shù)據(jù)1.2統(tǒng)計數(shù)據(jù)的類型統(tǒng)計數(shù)據(jù)的分類統(tǒng)計數(shù)據(jù)的分類按計量尺度分類的數(shù)據(jù)順序的數(shù)據(jù)數(shù)值型數(shù)據(jù)按時間狀況截面的數(shù)據(jù)時序的數(shù)據(jù)按收集方法觀察的數(shù)據(jù)實驗的數(shù)據(jù)統(tǒng)計數(shù)據(jù)的分類

(按計量尺度分)分類數(shù)據(jù)(categoricaldata)

(定類尺度/名義尺度)定義:只能歸于某一類別的數(shù)據(jù),可用文字來表述或用數(shù)字代碼表示(教材P5描述有誤)特征:各類別無順序,比率和差運算均無意義例如,性別(男、女)、民族、職業(yè)

順序數(shù)據(jù)(rankdata)

(定序尺度/序數(shù)尺度)定義:只能歸于某一有序類別的數(shù)據(jù),可用文字來表述或數(shù)字代碼表示特征:數(shù)據(jù)有順序,但比率和差運算均無意義例如,質(zhì)量等級(一等品、二等品、三等品、次品等),收入級別(高、中、低)。統(tǒng)計數(shù)據(jù)的分類

(按計量尺度分)數(shù)值型數(shù)據(jù)(metricdata)

(比率尺度)定義:按數(shù)字尺度測量的觀察值,特點:數(shù)據(jù)存在自然順序,且比率和差運算(加減乘除)均有意義,0值代表“沒有”或”不存在“例如:身高為175cm、168cm、183cm間距數(shù)據(jù)(intervaldata)

(定距尺度)定義:對現(xiàn)象類別或次序之間間距測度的數(shù)值型數(shù)據(jù)。特點:數(shù)據(jù)存在自然順序,差運算有意義,比率運算無意義。0值只是尺度上的一個點,不代表”不存在“例如:溫度間距數(shù)據(jù)與數(shù)值數(shù)據(jù)區(qū)別間距數(shù)據(jù)中“0”表示一個具體數(shù)值,不表示“沒有”或“不存在”,定比尺度中“0”表示“沒有”或“不存在”。間距數(shù)據(jù)

0℃

-

273.15℃-123.15℃26.85℃數(shù)值數(shù)據(jù)

0K

150K300K

定距尺度與定比尺度區(qū)別(續(xù))

在實際應用中間距數(shù)據(jù)與數(shù)值型差別不大,往往不作區(qū)分。例如在某些統(tǒng)計軟件中(SPSSStatistics軟件),數(shù)據(jù)的計量尺度被分為3類(本教材也如此):分類(Nominal)順序(Ordinal)數(shù)值型(Scale

)四種計量尺度的比較1、四種尺度所包含的信息量是依次遞增的,級別由低到高。2、根據(jù)較高層次的計量尺度可以獲得較低層次的計量尺度。3、不同的尺度數(shù)據(jù)對應著不同數(shù)據(jù)顯示方法和分析方法。低高分類順序間距數(shù)值型數(shù)據(jù)類型:例子分類數(shù)據(jù)順序數(shù)據(jù)間距數(shù)據(jù)數(shù)值數(shù)據(jù)精確程度良好1980134公斤中國國籍:健康狀況:出生年份:體重:練習P11:二練習題1.1(講)統(tǒng)計數(shù)據(jù)的分類

(按收集方法分)觀測的數(shù)據(jù)(observationaldata)

定義:在沒有對事物人為控制的條件下,通過調(diào)查或觀測而收集到的數(shù)據(jù)例如:2010年城鎮(zhèn)居民消費支出和可支配收入數(shù)據(jù)有關社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)實驗的數(shù)據(jù)(experimentaldata)

定義:在實驗中控制實驗對象而收集到的數(shù)據(jù)例如:對一種新藥療效的實驗,對一種新的農(nóng)作物品種的實驗等自然科學領域的數(shù)據(jù)大多數(shù)都為實驗數(shù)據(jù)統(tǒng)計數(shù)據(jù)的分類

(按時間狀況分)截面數(shù)據(jù)(cross-sectionaldata)

定義:多個事物在相同或近似相同的時間點上收集的數(shù)據(jù)描述不同事物在某一時刻的變化情況舉例:2005年我國各省份的國內(nèi)生產(chǎn)總值數(shù)據(jù)

2006年各地區(qū)城鎮(zhèn)居民家庭人均全年可支配收入和消費支出數(shù)據(jù)(見下表)統(tǒng)計數(shù)據(jù)的分類

(按時間狀況分)時間序列數(shù)據(jù)(timeseriesdata)

定義:同一個事物在不同時期或時間點上收集到的數(shù)據(jù)描述事物隨時間變化的情況舉例:2000年至2005年國內(nèi)生產(chǎn)總值數(shù)據(jù)

1990~2006年中國居民總量消費支出數(shù)據(jù)。統(tǒng)計數(shù)據(jù)的分類

(按時間狀況分)面板數(shù)據(jù)(PanelData)定義:多個事物在某不同時期或時間點上進行測量得到的數(shù)據(jù)兼有時間序列和截面數(shù)據(jù)舉例:2005-2006年各地區(qū)城鎮(zhèn)居民家庭人均全年消費支出

1.3統(tǒng)計中的幾個基本概念1.3.1總體和樣本1.3.2參數(shù)和統(tǒng)計量1.3.3變量總體總體(population)定義:所研究的全部個體(數(shù)據(jù))的集合,其中的每一個個體也稱為元素舉例:(1)要研究臺灣選民對當前兩位候選領導人馬英九和蔡英文的支持度。則總體是臺灣所有選民對兩人的支持情況。(2)要檢測某批產(chǎn)品的合格率,則該批次所有產(chǎn)品就是總體??傮w分類總體(population)分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的無限總體所包括的元素是無限的,不可數(shù)的區(qū)分有限和無限總體主要是為了判別在抽樣中每次抽取是否獨立,對無限總體,每次抽取一個單位并不影響下一次的抽樣結果,而對有限總體,每次抽取是不獨立的。(但當總體數(shù)量較大時,常將有限總體中的抽樣也看作是獨立的。)總體通??梢钥醋魇且粋€隨機變量,統(tǒng)計推斷中通常是針對無限總體。樣本樣本(sample)定義:從總體中抽取的一部分元素的集合構成樣本的元素的數(shù)目稱為樣本容量或樣本量(samplesize)舉例:(1)從臺灣所有選民中抽取出500位進行民意調(diào)查,則這500位選民是一個樣本(2)從所有要檢測批次的產(chǎn)品中抽出100件進行檢測,則這100件產(chǎn)品就是一個樣本。參數(shù)參數(shù)(parameter)定義:描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值總體參數(shù)通常用希臘字母表示所關心的參數(shù)主要有總體均值()、標準差()、總體比例()等總體數(shù)據(jù)常常是未知的,總體參數(shù)也是未知的,因此需要根據(jù)樣本來估計總體參數(shù)。統(tǒng)計量統(tǒng)計量(statistic)定義:用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)所關心的樣本統(tǒng)計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等基本樣本統(tǒng)計量樣本統(tǒng)計量通常用小寫英文字母來表示還有一些為統(tǒng)計分析而構造的統(tǒng)計量:z統(tǒng)計量、t統(tǒng)計量、x2統(tǒng)計量、F統(tǒng)計量等。變量

(variable)

變量—說明現(xiàn)象某種特征的概念例如:商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等特點:從一次觀察到下一次觀察結果會呈現(xiàn)出差別或變化變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)變量

(基本分類)

分類變量(categoricalvariable)

:用于表示事物類別的名稱如:性別、行業(yè)等變量順序變量(rankvariable):用于表示事物有序類別的名稱如:產(chǎn)品等級、受教育程度變量數(shù)值型變量(metricv

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論