《應用統(tǒng)計學》第一章_第1頁
《應用統(tǒng)計學》第一章_第2頁
《應用統(tǒng)計學》第一章_第3頁
《應用統(tǒng)計學》第一章_第4頁
《應用統(tǒng)計學》第一章_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第一章緒論引導案例大數(shù)據(jù)時代帶來的大變革國際數(shù)據(jù)公司定義了大數(shù)據(jù)的特征:海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、動態(tài)的數(shù)據(jù)體系、多樣的數(shù)據(jù)類型和巨大的數(shù)據(jù)價值。僅從海量的數(shù)據(jù)規(guī)模來看,全球IP流量達到1EB所需的時間,在2001年需要1年,在2013年僅需1天,到2016年則僅需半天。全球新產(chǎn)生的數(shù)據(jù)年增40%,全球信息總量每兩年就可翻番。而根據(jù)2012年互聯(lián)網(wǎng)絡數(shù)據(jù)中心發(fā)布的《數(shù)字宇宙2020》報告,2011年全球數(shù)據(jù)總量已達到1.87ZB(1ZB=10萬億億字節(jié)),如果把這些數(shù)據(jù)刻成DVD,排起來的長度相當于從地球到月亮一個來回的距離,并且數(shù)據(jù)以每兩年翻一番的速度飛快增長。預計到2020年,全球數(shù)據(jù)總量將達到35~40ZB。需要強調(diào)的是,所謂大數(shù)據(jù)并不僅僅是指海量數(shù)據(jù),而更多的是指這些數(shù)據(jù)都是非結構化的、殘缺的、無法用傳統(tǒng)方法進行處理的數(shù)據(jù)?;诨ヂ?lián)網(wǎng)技術而發(fā)展起來的大數(shù)據(jù)應用,將會對人們的生產(chǎn)過程和商品交換過程產(chǎn)生顛覆性的影響。大數(shù)據(jù)的本質(zhì)是基于互聯(lián)網(wǎng)基礎的信息化應用,其真正的“魔力”在于信息化與工業(yè)化的融合,使工業(yè)生產(chǎn)效率得到大規(guī)模提升。肯尼思?庫克耶和維克托?邁爾?舍恩伯格指出,數(shù)據(jù)出現(xiàn)了三大變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求;第三,人們通過對大數(shù)據(jù)的處理,放棄對因果關系的渴求,轉(zhuǎn)而關注相互聯(lián)系。這一切代表著人類告別總是試圖了解世界運轉(zhuǎn)方式背后深層原因的態(tài)度,而走向僅僅需要弄清現(xiàn)象之間的聯(lián)系并利用這些信息來解決問題。我們急需擁有從各種數(shù)據(jù)中快速獲得有價值的信息的能力,統(tǒng)計學就是培養(yǎng)這種能力的學科。第一節(jié)統(tǒng)計指數(shù)概述第三節(jié)統(tǒng)計學的基本概念第二節(jié)統(tǒng)計數(shù)據(jù)的類型第一節(jié)統(tǒng)計指數(shù)概述第三節(jié)統(tǒng)計學的基本概念第二節(jié)統(tǒng)計數(shù)據(jù)的類型一、統(tǒng)計與統(tǒng)計學的概念統(tǒng)計學是指收集、處理、分析、解釋數(shù)據(jù),并從數(shù)據(jù)中得出結論的科學。統(tǒng)計學是關于數(shù)據(jù)的科學,統(tǒng)計研究的是來自各領域的數(shù)據(jù)。大量觀察法(一)二、統(tǒng)計學的研究方法所謂大量觀察法,是指對所研究的事物的全部或足夠多的數(shù)量進行觀察的方法。社會現(xiàn)象或自然現(xiàn)象都受到各種社會規(guī)律或自然規(guī)律的相互交錯作用的影響。在現(xiàn)象總體中,個別單位往往受偶然因素的影響,如果任選其中之一進行觀察,其結果不足以代表總體的一般特征。只有觀察全部或足夠多的單位并加以綜合,影響個別單位的偶然因素才會相互抵消,現(xiàn)象的一般特征才能顯示出來。實驗設計法(二)實驗設計法是指根據(jù)統(tǒng)計研究的目的,事先設計合理的實驗程序,在實驗過程中排除可控因素的差異,顯示出不可控(隨機)因素的差異,使得收集到的統(tǒng)計數(shù)據(jù)符合統(tǒng)計分析方法的要求,以便有效地揭示客觀現(xiàn)象的特征。實驗設計法主要適用于工程技術、生物醫(yī)藥、心理學、教育學、管理學等領域的統(tǒng)計數(shù)據(jù)的收集。321與匹配原則隨機化原則重復性原則統(tǒng)計分組法(三)統(tǒng)計分組法是指根據(jù)統(tǒng)計研究的目的和統(tǒng)計總體的內(nèi)在特點,按一定的統(tǒng)計標志將總體劃分為性質(zhì)不同的組或類的方法。統(tǒng)計總體的變異性是統(tǒng)計分組的前提條件,由于研究現(xiàn)象本身的復雜性、差異性及多層次性,需要對研究現(xiàn)象進行分組或分類研究,以期在同質(zhì)的基礎上探求不同組或類之間的差異性。綜合指標法(四)綜合指標法是指運用各種統(tǒng)計指標來反映和研究客觀總體現(xiàn)象的一般數(shù)量特征和數(shù)量關系的方法。統(tǒng)計研究現(xiàn)象的數(shù)量方面的特征是通過統(tǒng)計綜合指標來反映的。通過綜合指標的計算,可以顯示出現(xiàn)象在具體時間和地點條件下的總量規(guī)模、相對水平、集中趨勢、變異程度,并進一步從動態(tài)上研究現(xiàn)象的發(fā)展趨勢和變化規(guī)律。如何最真實客觀地記錄、描述和反映所研究現(xiàn)象的數(shù)量特征和數(shù)量關系,是統(tǒng)計指標理論研究的一大課題。指數(shù)分析法(五)指數(shù)分析法主要用于描述和分析事物數(shù)量方面的相對變化程度。由于現(xiàn)象的總體非常復雜,發(fā)展變動受其構成要素變動的影響,而這些構成要素往往具有不同的性質(zhì)而不可以直接相加,因此不能進行直接的比較觀察。指數(shù)分析法正是通過同度量因素,把不能直接相加的要素轉(zhuǎn)化為可以相加的現(xiàn)象總量,并計算出指數(shù)來反映復雜現(xiàn)象的總量的變動。另外,還可以對現(xiàn)象的各個構成要素進行因素分析,以顯示它們的變動對總體變動的影響程度和方向。抽樣推斷法(六)統(tǒng)計學在研究現(xiàn)象的總體數(shù)量特征時,需要了解的總體對象的范圍往往是很大的,有時甚至是無限的。而由于經(jīng)費、時間和精力等各方面的原因,以致在客觀上難以實現(xiàn),往往只能對部分單位或有限單位進行計算和分析,根據(jù)局部觀察結果來推斷總體。統(tǒng)計模型法(七)在以統(tǒng)計指標反映所研究現(xiàn)象的數(shù)量特征的同時,還需要經(jīng)常對相關現(xiàn)象之間的數(shù)量變動關系進行定量研究,以了解某一(些)現(xiàn)象數(shù)量變動與另一(些)現(xiàn)象數(shù)量變動之間的關系及變動的影響程度。統(tǒng)計模型法是綜合指標法的擴展,是指根據(jù)一定的理論和假定條件,用數(shù)學方程模擬客觀現(xiàn)象相互關系的一種研究方法。

統(tǒng)計學與數(shù)學的關系(一)三、統(tǒng)計學與其他學科的關系統(tǒng)計學與數(shù)學有著密切的關系。由于現(xiàn)代統(tǒng)計學用到了較多數(shù)學知識,研究理論統(tǒng)計學的人需要有較深的數(shù)學功底,應用統(tǒng)計方法的人也要具備良好的數(shù)學基礎,這就給人造成了一種錯覺,似乎統(tǒng)計學是數(shù)學的一個分支,這種理解是不妥當?shù)摹嶋H上,數(shù)學只是為統(tǒng)計理論和統(tǒng)計方法的發(fā)展提供了數(shù)學基礎,而統(tǒng)計學的主要特征是研究數(shù)據(jù);另一方面,統(tǒng)計方法與數(shù)學方法一樣,并不能獨立地直接研究和探索客觀現(xiàn)象的規(guī)律,而是給各學科提供了一種研究和探索客觀規(guī)律的數(shù)量方法。

統(tǒng)計學與會計學的關系(二)統(tǒng)計學和會計學都是具有典型計量特征的應用科學,二者都是以數(shù)據(jù)為語言,揭示其研究對象的特征,并實行有效的監(jiān)督或管理。但是,會計學主要應用于社會經(jīng)濟領域,而統(tǒng)計學的應用領域更為廣闊。社會經(jīng)濟的數(shù)量信息主要分為會計信息和統(tǒng)計信息兩大類,會計學主要提供貨幣尺度方面或價值指標的信息,統(tǒng)計學則提供多種指標尺度方面的信息。但是,統(tǒng)計學中所處理的貨幣方面的信息,又是由會計學提供的;會計學中所用的實物量指標等,又是由統(tǒng)計學提供的。第一節(jié)統(tǒng)計指數(shù)概述第三節(jié)統(tǒng)計學的基本概念第二節(jié)統(tǒng)計數(shù)據(jù)的類型一、按所采用的計量尺度劃分分類數(shù)據(jù)是指只能歸于某一類別的非數(shù)字型數(shù)據(jù),是對事物進行分類的結果。分類數(shù)據(jù)表現(xiàn)為類別,是用文字表述的。順序數(shù)據(jù)是指只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。順序數(shù)據(jù)也是對事物進行分類的結果,且這些類別具有順序。(一)分類數(shù)據(jù)(二)順序數(shù)據(jù)數(shù)值型數(shù)據(jù)是指使用自然或度量衡單位對事物進行計量的結果,其結果表現(xiàn)為具體的數(shù)值。(三)數(shù)值型數(shù)據(jù)二、按數(shù)據(jù)收集方法劃分觀測數(shù)據(jù)是指通過調(diào)查或觀測而收集到的數(shù)據(jù)。有關社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物進行人為控制的條件下得到的。實驗數(shù)據(jù)是指通過在實驗中控制實驗對象而收集到的數(shù)據(jù)。自然科學領域的數(shù)據(jù)大多都是實驗數(shù)據(jù),如生物實驗數(shù)據(jù)、產(chǎn)品性能實驗數(shù)據(jù)、藥物實驗數(shù)據(jù)等。隨著實驗方法在其他領域的拓展,心理學、教育學、經(jīng)濟學、管理學等領域也出現(xiàn)了實驗數(shù)據(jù)。(一)觀測數(shù)據(jù)(二)實驗數(shù)據(jù)三、按描述對象與時間的關系劃分截面數(shù)據(jù)是指在相同或近似相同的時間點上收集的數(shù)據(jù),它所描述的是現(xiàn)象在某一時刻的變化情況。例如,2016年我國各地區(qū)的地區(qū)生產(chǎn)總值就是截面數(shù)據(jù)。時間序列數(shù)據(jù)是指在不同時間點上收集到的數(shù)據(jù),它所描述的是現(xiàn)象隨時間變化而變化的情況。例如,2010~2016年我國城鎮(zhèn)和農(nóng)村居民年平均收入就是時間序列數(shù)據(jù)。(一)截面數(shù)據(jù)(二)時間序列數(shù)據(jù)第一節(jié)統(tǒng)計指數(shù)概述第三節(jié)統(tǒng)計學的基本概念第二節(jié)統(tǒng)計數(shù)據(jù)的類型一、總體和樣本總體(一)總體又稱樣本空間,是指包含研究者感興趣的全部個體(數(shù)據(jù))的集合。總體通常由所研究的許多個體組成,組成總體的每一個元素稱為個體??傮w是隨著統(tǒng)計研究目的的不同而確定的不同集合。例如,研究某企業(yè)生產(chǎn)的十萬只燈泡的使用壽命,那么這十萬只燈泡就是一個總體,這十萬只燈泡中的每一只為一個個體;如果想進行某種科學實驗從而得到某個結論,那么所有的實驗數(shù)據(jù)就是一個總體,而每一次的實驗數(shù)據(jù)就是一個個體。樣本(二)樣本是與總體相對應的概念,幾乎所有的統(tǒng)計理論和方法都是建立在樣本之上,而統(tǒng)計實踐研究現(xiàn)象的數(shù)據(jù)也總是由樣本開始的。所謂樣本,是指從總體中按隨機原則抽取的一部分個體的集合,也稱子樣。構成樣本的個體的數(shù)目稱為樣本量。從理論上看,樣本可以大到與總體容量相同,也可以小到只包括一個個體。但在實踐中,樣本大小總是處于總體容量和1之間,因此,樣本是一個來自總體的有限小總體。一般來說,當樣本量達到30時,稱為大樣本;若樣本量小于30,則稱為小樣本。總體和樣本的關系(三)首先,總體是要觀測的全部數(shù)據(jù)的集合,而樣本是要觀測的部分數(shù)據(jù)的集合。統(tǒng)計數(shù)據(jù)的規(guī)律性著眼于總體,但由于多數(shù)情況下不可能或沒必要進行全面觀測,所以只能從樣本著手,期望通過樣本的數(shù)據(jù)特征來認識總體的數(shù)據(jù)特征,也就是通過樣本來研究總體。其次,樣本是用來推斷總體的。對樣本進行觀測的目的是要對總體特征進行估計和判斷,即通常所說的用樣本來估計和推斷總體。最后,總體和樣本的角色是可以改變的。根據(jù)不同的研究目的,一個總體也可以成為另一個研究意義上某個總體的一個樣本。二、參數(shù)和統(tǒng)計量參數(shù)是用來描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值。研究者所關心的參數(shù)主要有總體均值、總體標準差、總體比例等。在統(tǒng)計中,總體參數(shù)通常用希臘字母表示。例如,總體均值用表示,總體標準差用表示,總體比例用表示。

參數(shù)(一)統(tǒng)計量是用來描述樣本特征的概括性數(shù)字度量,是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)。研究者所關心的樣本統(tǒng)計量有樣本均值、樣本標準差、樣本比例等。在統(tǒng)計中,樣本統(tǒng)計量通常用小寫英文字母表示。例如,樣本均值用表示,樣本標準差用s表示,樣本比例用p表示。

統(tǒng)計量(二)三、標志和指標每個個體都有許多獨特的特征和屬性,而標志就是說明個體特征和屬性的名稱。例如,A市一家民營企業(yè)作為個體,其企業(yè)性質(zhì)、企業(yè)類型、生產(chǎn)能力、年產(chǎn)值、銷售收入、職工人數(shù)、工資總額等都是標志。

標志(一)標志的分類11)按性質(zhì)劃分按性質(zhì)劃分,標志可分為品質(zhì)標志和數(shù)量標志。品質(zhì)標志:是說明個體屬性特征的名稱。品質(zhì)標志只能用文字表示,而不能用數(shù)值表示。數(shù)量標志:是說明個體數(shù)量特征的名稱。數(shù)量標志既可以用文字表示,也可以用數(shù)值表示。2)按總體中各單位表現(xiàn)劃分按總體中各單位表現(xiàn)劃分,標志可分為不變標志和可變標志。標志表現(xiàn)2標志表現(xiàn)是指在標志名稱后面所表明的屬性或數(shù)值。標志表現(xiàn)可分為品質(zhì)標志表現(xiàn)和數(shù)量標志表現(xiàn)。因為數(shù)量標志表現(xiàn)都是用數(shù)值表示的,所以又稱為標志值。例如,某職工的性別是“女”,婚姻狀況是“已婚”,這里的“女”和“已婚”分別是品質(zhì)標志“性別”和“婚姻狀況”的屬性。又如,某職工的年齡是20歲,則“20歲”就是數(shù)量標志“年齡”的數(shù)值表現(xiàn)。指標(二)指標的構成1單就指標本身而言,其由指標名稱和指標數(shù)值兩部分構成。由于社會經(jīng)濟現(xiàn)象中的事物都是具體的,都是在一定的地點、時間、條件下發(fā)生的,其量的表現(xiàn)就必然帶有特定場合和特定歷史的痕跡。所以,一個完整的統(tǒng)計指標除了包括指標名稱和指標數(shù)值外,還應包括計量單位、時間范圍、空間范圍及計算方法等要素。指標的分類2(1)按對象性質(zhì)劃分按對象性質(zhì)劃分,統(tǒng)計指標可分為實體指標和行為指標。(2)按取值依據(jù)劃分按取值依據(jù)劃分,統(tǒng)計指標可分為客觀指標和主觀指標。(3)按功能劃分按功能劃分,統(tǒng)計指標可分為描述指標、評價指標和預警指標。(4)按內(nèi)容劃分按內(nèi)容劃分,統(tǒng)計指標可分為數(shù)量指標和質(zhì)量指標。

標志與指標的關系(三)區(qū)別1(1)標志是說明個體特征的,而指標是說明總體特征的。(2)標志中的數(shù)量標志可以用數(shù)值表示,品質(zhì)標志不能用數(shù)值表示;而所有的指標都是用數(shù)值表示的,不存在不能用數(shù)值表示的指標。(3)標志中的數(shù)量標志不一定經(jīng)過匯總,可以直接取得;而指標是由數(shù)量標志匯總得來的。(4)標志一般不具備時間、地點等條件;而一個完整的統(tǒng)計指標一定要有時間、地點、范圍。聯(lián)系2(1)有許多統(tǒng)計指標的數(shù)值是從個體數(shù)量標志值匯總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論