2025年中級(jí)統(tǒng)計(jì)師統(tǒng)計(jì)業(yè)務(wù)知識(shí)打印版統(tǒng)計(jì)方法_第1頁
2025年中級(jí)統(tǒng)計(jì)師統(tǒng)計(jì)業(yè)務(wù)知識(shí)打印版統(tǒng)計(jì)方法_第2頁
2025年中級(jí)統(tǒng)計(jì)師統(tǒng)計(jì)業(yè)務(wù)知識(shí)打印版統(tǒng)計(jì)方法_第3頁
2025年中級(jí)統(tǒng)計(jì)師統(tǒng)計(jì)業(yè)務(wù)知識(shí)打印版統(tǒng)計(jì)方法_第4頁
2025年中級(jí)統(tǒng)計(jì)師統(tǒng)計(jì)業(yè)務(wù)知識(shí)打印版統(tǒng)計(jì)方法_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

記錄學(xué)是一門研究數(shù)據(jù)的科學(xué),按大百科全書的定義:記錄學(xué)是用以搜集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和措施。記錄分析數(shù)據(jù)分兩種:描述記錄和推斷記錄描述記錄是研究數(shù)據(jù)搜集、處理和描述的記錄學(xué)措施。其內(nèi)容包括怎樣獲得研究所需要的數(shù)據(jù),怎樣用圖表形式對(duì)數(shù)據(jù)進(jìn)行處理和展示,怎樣通過對(duì)數(shù)據(jù)的綜合、概括與分析,得出所關(guān)懷的數(shù)據(jù)特性。記錄描述是指對(duì)由試驗(yàn)或調(diào)查而得到的數(shù)據(jù)進(jìn)行登記、審核、整頓、歸類、計(jì)算出多種能反應(yīng)總體數(shù)量特性的綜合指標(biāo),并加以分析,從中抽出有用的信息,用表格或圖像把它表達(dá)出來。是記錄研究的基礎(chǔ)。它通過對(duì)分散無序的原始資料的整頓歸納,運(yùn)用分組法和綜合指標(biāo)法得到現(xiàn)象總體的數(shù)量特性,揭發(fā)客觀事物內(nèi)在數(shù)量規(guī)律性,到達(dá)認(rèn)識(shí)的目的。分組法是研究總體內(nèi)部差異的重要措施,通過度組可以研究總體中不一樣類型的性質(zhì)以及它們的分布狀況綜合指標(biāo)法是指運(yùn)用多種記錄指標(biāo)來反應(yīng)和研究客觀總體現(xiàn)象的一般數(shù)量特性和數(shù)量關(guān)系的措施記錄模型法是綜合指標(biāo)法的擴(kuò)展。它是根據(jù)一定的理論和假定條件,用數(shù)學(xué)方程去模擬現(xiàn)實(shí)客觀現(xiàn)象互相關(guān)系的一種研究措施。推斷記錄則是研究怎樣運(yùn)用樣本數(shù)據(jù)來推斷總體特性的記錄學(xué)措施,內(nèi)容包括參數(shù)估計(jì)和假設(shè)檢查兩大類。所謂記錄推斷就是以一定的置信原則規(guī)定,根據(jù)樣本數(shù)據(jù)來判斷總體數(shù)量特性的歸納推理的措施。記錄推斷是邏輯歸納法在記錄推理的應(yīng)用,因此稱為歸納推理的措施。(1)參數(shù)估計(jì)法:當(dāng)總體的界線已劃定,總體某一數(shù)量特性(如總體平均數(shù)、方差等)的數(shù)值就是唯一確定的,因此把總體的數(shù)量特性稱為總體參數(shù)。不過總體參數(shù)一般不懂得,這就需要通過樣本數(shù)據(jù)計(jì)算樣本記錄量,并以此作為總體參數(shù)的估計(jì)量來估計(jì)總體參數(shù)的取值或取值區(qū)間,這種措施稱之為參數(shù)估計(jì)法。(2)假設(shè)檢查法:假設(shè)檢查的特點(diǎn)是,由于對(duì)總體的變化狀況不理解,不妨先對(duì)總體的狀況作某種假設(shè),然後根據(jù)樣本實(shí)際觀測(cè)的資料對(duì)所作假設(shè)進(jìn)行檢查,來判斷這種假設(shè)的真?zhèn)?,以決定行動(dòng)的取舍。假設(shè)檢查的措施是記錄推斷常用的措施。一.變量與數(shù)據(jù)變數(shù)或變量,是指沒有固定的值,可以變化的數(shù)。變量的詳細(xì)數(shù)值稱為變量值,即數(shù)據(jù)。記錄數(shù)據(jù)就是記錄變量的詳細(xì)體現(xiàn)。二.?dāng)?shù)據(jù)類型(一)定性變量(數(shù)據(jù))與定量變量(數(shù)據(jù))1.定性變量:反應(yīng)“職業(yè)”、“教育程度”等現(xiàn)象的屬性特點(diǎn)的變量,不能闡明詳細(xì)量的大小和差異。分類變量:沒有量的特性,只有分類特性。這種只反應(yīng)現(xiàn)象分類特性的變量又稱分類變量。分類變量的觀測(cè)成果就是分類數(shù)據(jù)。闡明事物類別的一種名稱。如“性別”就是一種分類變量。次序變量:假如類別具有一定的次序,如,“教育類別”,這樣的變量稱為次序變量,對(duì)應(yīng)的觀測(cè)成果就是次序數(shù)據(jù)。闡明事物有序類別的一種名稱,此類變量的詳細(xì)體現(xiàn)就是次序數(shù)據(jù)。2.數(shù)值(定量)變量:反應(yīng)“天氣溫度”、“月收入”等變量可以用數(shù)值表達(dá)其觀測(cè)成果,并且這些數(shù)值具有明確的數(shù)值含義,不僅能分類并且能測(cè)量出來詳細(xì)大小和差異。這些變量就是定量變量也稱數(shù)值變量,定量變量的觀測(cè)成果成為定量數(shù)據(jù)。闡明事物數(shù)字特性的一種名稱。分類變量沒有數(shù)值特性,因此不能對(duì)其數(shù)據(jù)進(jìn)行數(shù)學(xué)運(yùn)算。分類數(shù)據(jù)只能用來辨別事物,而不能用來表明實(shí)物之間的大小、優(yōu)劣關(guān)系。次序變量比分類變量向前深入,它不僅能用來辨別客觀現(xiàn)象的不一樣類別,并且還可以表明現(xiàn)象之間的大小、高下、優(yōu)劣關(guān)系。顯然,次序數(shù)據(jù)的功能比分類數(shù)據(jù)要強(qiáng)某些,對(duì)事物的劃分也更精細(xì)某些。但次序數(shù)據(jù)的數(shù)據(jù)之間雖然可以比較大小,卻無法計(jì)算互相之間的大小、高下或優(yōu)劣的距離。只是反應(yīng)事物在性質(zhì)上的差異,而不能用來反應(yīng)事物在數(shù)量上的差異。因此,從本質(zhì)上,次序數(shù)據(jù)仍然是定性數(shù)據(jù)中的一種。數(shù)值型數(shù)據(jù)作為記錄研究的重要資料,其特性在于它們都是以數(shù)值的形式出現(xiàn)的,有些數(shù)值型數(shù)據(jù)只可以計(jì)算數(shù)據(jù)之間的絕對(duì)差,而有些數(shù)值型數(shù)據(jù)不僅可以計(jì)算數(shù)據(jù)之間的絕對(duì)差,還可以計(jì)算數(shù)據(jù)之間的相對(duì)差。其計(jì)量精度遠(yuǎn)遠(yuǎn)高于定性數(shù)據(jù)。在記錄學(xué)研究中,對(duì)數(shù)值型數(shù)據(jù)的研究是定量分析的重要內(nèi)容。從上述三種數(shù)據(jù)的基本特點(diǎn)可以看出,這三類數(shù)據(jù)對(duì)事物的描述是由定性到定量、由低級(jí)到高級(jí),從粗略到精細(xì)。在記錄研究中,需要明確多種數(shù)據(jù)所合用的記錄措施,對(duì)的的選擇和應(yīng)用,這是對(duì)的進(jìn)行記錄研究的基本規(guī)定。(二)觀測(cè)數(shù)據(jù)和試驗(yàn)數(shù)據(jù)按獲取數(shù)據(jù)的措施不一樣,可分為觀測(cè)數(shù)據(jù)和試驗(yàn)數(shù)據(jù)。觀測(cè)數(shù)據(jù)也許是全面數(shù)據(jù)也也許是樣本數(shù)據(jù)(局部),試驗(yàn)數(shù)據(jù)一般都是樣本數(shù)據(jù)。觀測(cè)數(shù)據(jù)。觀測(cè)數(shù)據(jù)是對(duì)客觀現(xiàn)象進(jìn)行實(shí)地觀測(cè)所獲得的數(shù)據(jù),在數(shù)據(jù)獲得的過程中一般沒有認(rèn)為的控制和條件約束。在社會(huì)經(jīng)濟(jì)問題研究中,觀測(cè)是獲得數(shù)據(jù)最重要的措施。試驗(yàn)數(shù)據(jù)。試驗(yàn)數(shù)據(jù)一般是在科學(xué)試驗(yàn)環(huán)境下獲得的數(shù)據(jù)。在試驗(yàn)中,試驗(yàn)環(huán)境是受到嚴(yán)格控制的,數(shù)據(jù)的產(chǎn)生一定是某一約束條件下的成果。在自然科學(xué)研究中試驗(yàn)的措施應(yīng)用非常普遍。一.?dāng)?shù)據(jù)的來源數(shù)據(jù)的直接來源——原始數(shù)據(jù)搜集數(shù)據(jù)最基本的形式就是進(jìn)行記錄調(diào)查或進(jìn)行試驗(yàn)活動(dòng),記錄調(diào)查或進(jìn)行試驗(yàn)就是記錄數(shù)據(jù)的直接來源。記錄調(diào)查記錄調(diào)查是指根據(jù)記錄研究預(yù)定的目的、規(guī)定和任務(wù),運(yùn)用科學(xué)的措施,有計(jì)劃、有組織地向客觀實(shí)際搜集資料的過程。通過記錄調(diào)查得到的數(shù)據(jù),一般稱為觀測(cè)數(shù)據(jù)。試驗(yàn)法試驗(yàn)法是直接獲得記錄數(shù)據(jù)的又一重要來源。通過試驗(yàn)法得到的數(shù)據(jù)就是試驗(yàn)數(shù)據(jù)。試驗(yàn)法不僅是一種搜集數(shù)據(jù)的方式,也是一種重要的研究方式。它是通過故意識(shí)地變化或控制某些輸入變量,觀測(cè)其他輸出變量的變化,從而到達(dá)對(duì)事物本質(zhì)或互相聯(lián)絡(luò)的認(rèn)識(shí)。未來觀測(cè)對(duì)輸入變量的控制與否導(dǎo)致了輸出變量的變化,在試驗(yàn)中,往往需要將研究對(duì)象分為兩個(gè)組,一種是試驗(yàn)組,一種是對(duì)照組,對(duì)試驗(yàn)組的輸入變量加以控制或變化,而對(duì)照組則不加控制,根據(jù)兩組的輸出成果,可以看到輸入變量對(duì)輸出變量的影響。運(yùn)用試驗(yàn)法要注意的是:首先,試驗(yàn)組和對(duì)照組的產(chǎn)生應(yīng)當(dāng)是隨機(jī)的,研究對(duì)象的不一樣單位應(yīng)當(dāng)被隨機(jī)地分派到試驗(yàn)組或?qū)φ战M,而不應(yīng)是通過故意識(shí)的挑選的。另一方面,試驗(yàn)組和對(duì)照組還應(yīng)當(dāng)匹配的,也就是研究對(duì)象的背景資料應(yīng)當(dāng)是大體相似的,至少不要差異太大。不管是記錄調(diào)查還是試驗(yàn),所搜集的數(shù)據(jù)都是原始數(shù)據(jù),這是記錄數(shù)據(jù)最基本的來源。(二)數(shù)據(jù)的間接來源——次級(jí)數(shù)據(jù)次級(jí)數(shù)據(jù)是指由其他人搜集和整頓得到的記錄數(shù)據(jù)。這種來自他人調(diào)查整頓基礎(chǔ)上的數(shù)據(jù)我們把它稱為數(shù)據(jù)的間接來源。數(shù)據(jù)的間接來源有:(1)公開出版的記錄數(shù)據(jù),重要來自官方的記錄部門和政府、組織、學(xué)校、科研機(jī)構(gòu)。(2)尚未公開刊登的記錄數(shù)據(jù),如各企業(yè)的經(jīng)營報(bào)表數(shù)據(jù)、專業(yè)調(diào)查征詢機(jī)構(gòu)為公開公布的調(diào)查成果數(shù)據(jù)。需注意的是,假如公開引用未公開刊登的數(shù)據(jù)需要征得數(shù)據(jù)所有者的同意,同步要為自已公布的數(shù)據(jù)負(fù)責(zé)。恰當(dāng)?shù)剡\(yùn)用間接數(shù)據(jù)在實(shí)際中往往可以節(jié)省時(shí)間和費(fèi)用,獲得很好的成果和效益,因此,成為許多記錄研究人員在進(jìn)行實(shí)證分析時(shí)的首選數(shù)據(jù)來源。但在應(yīng)用時(shí)要注意:(1)與否理解并對(duì)的理解了間接數(shù)據(jù)中變量的含義、計(jì)算口徑、計(jì)算措施,以防止誤用、錯(cuò)用他人的數(shù)據(jù)。(2)引用間接數(shù)據(jù)時(shí)要注明數(shù)據(jù)來源,尊重他人的勞動(dòng)成果和知識(shí)產(chǎn)權(quán)。二.搜集數(shù)據(jù)的措施記錄調(diào)查是根據(jù)調(diào)查的目的與規(guī)定,運(yùn)用科學(xué)的調(diào)查措施,有計(jì)劃、有組織第搜集記錄數(shù)據(jù)資料的過程。常用的記錄調(diào)查種類有:普查普查:普查是專門組織一次性的全面調(diào)查,用來調(diào)查屬于一定期點(diǎn)或時(shí)期內(nèi)的社會(huì)經(jīng)濟(jì)現(xiàn)象的總量。它合用于搜集某些不能或不合適于定期的全面記錄報(bào)表搜集的記錄資料,以摸清重大的國情、國力。如,人口普查、農(nóng)業(yè)普查、經(jīng)濟(jì)普查、全國第三產(chǎn)業(yè)普查等。普查的特點(diǎn):它是一種全面調(diào)查,具有資料包括范圍全面、詳盡、系統(tǒng)的長處;它是一次性的專門調(diào)查,由于普查的工作量大,耗資也多,時(shí)間周期較長,一般不適宜常常舉行。普查要遵照如下幾點(diǎn):a.確定普查的原則時(shí)間:普查的原則時(shí)間是指登記調(diào)查單位項(xiàng)目所根據(jù)的記錄時(shí)點(diǎn)。所有的調(diào)查資料都必須是反應(yīng)這一時(shí)點(diǎn)上的狀況。例如,我國第四人口普查,1990年7月1曰零時(shí)為普查登記的原則時(shí)點(diǎn)。但凡在這個(gè)時(shí)點(diǎn)此前死亡和這個(gè)時(shí)點(diǎn)後來出生的,都不能計(jì)入這次普查的人口數(shù)內(nèi)。這樣才可防止所登記反復(fù)或遺漏。b.普查的登記工作應(yīng)在整個(gè)普查范圍內(nèi)同步進(jìn)行,以保證普查資料的實(shí)效性、精確性,防止資料的搜集工作拖的太久c.同類普查的內(nèi)容和時(shí)間在歷次普查中應(yīng)盡量保持連貫性。普查的組織形式有兩種:一種是組織專門的普查機(jī)構(gòu),派專門的調(diào)查人員對(duì)被調(diào)查單位直接進(jìn)行登記;另一種是運(yùn)用一定的組織系統(tǒng),由被調(diào)查單位根據(jù)本單位的原始記錄和實(shí)際狀況,填寫調(diào)查表,然後上報(bào)。抽樣調(diào)查抽樣調(diào)查:抽樣調(diào)查是按隨機(jī)原則,從總體中抽取一部分單位作為樣本來進(jìn)行觀測(cè),并根據(jù)其觀測(cè)的成果來推斷總體數(shù)量特性的一種非全面調(diào)查措施。抽樣調(diào)查具有的特點(diǎn):第一,樣本單位按隨機(jī)原則抽取,排除了主觀原因?qū)x用樣本單位的影響。第二,可以根據(jù)部分調(diào)查的實(shí)際資料對(duì)調(diào)查對(duì)象的總體的數(shù)量特性進(jìn)行推斷,從而到達(dá)對(duì)調(diào)查總體的認(rèn)識(shí)。第三,在抽樣調(diào)查中會(huì)存在抽樣誤差,不過這個(gè)誤差可以事先計(jì)算并加以控制。隨機(jī)抽樣一般是指每個(gè)總體單位均有同等被抽中的機(jī)會(huì),不過在實(shí)際調(diào)查中,并不完全是這種狀況。一般采用的抽樣組織形式重要有如下幾種:a.簡樸隨機(jī)抽樣:又稱純隨機(jī)抽樣,它是指對(duì)總體不作任何處理,不進(jìn)行分類也不進(jìn)行排除,而是完全按隨機(jī)的原則,直接從總體中抽取樣本單位加以觀測(cè)。從理論上說,是最符合抽樣調(diào)查的隨機(jī)原則,是抽樣調(diào)查的最基本形式。詳細(xì)措施有:直接抽選法、抽簽法和隨機(jī)數(shù)表法。b.分層抽樣:又稱類型抽樣或分類抽樣。是先將總體各單位按重要標(biāo)志加以分層,而後在各層中按隨機(jī)的原則抽取若干樣本單位,由各層的樣本單位構(gòu)成一種樣本。c.等距抽樣:又稱機(jī)械抽樣或系統(tǒng)抽樣。它是將總體所有單位按某一標(biāo)志排隊(duì),而後按固定的次序和相等間隔在總體中抽取若干樣本單位,構(gòu)成一種容量為n的樣本。d.整群抽樣:是將總體各單位劃分為若干群,然後以群為單元,從總體中隨機(jī)抽取一部分群,對(duì)被抽中的群內(nèi)所有單位進(jìn)行全面調(diào)查。整群抽樣對(duì)總體劃分群的基本規(guī)定是:第一,群與群之間不重疊,即總體中的任一單位只能屬于某個(gè)群;第二,所有總體單位毫無遺漏,即總體中的任一單位必須屬于某個(gè)群。e.多階段抽樣:當(dāng)總體很大時(shí),可把抽樣過程提成幾種過渡階段,到最終才詳細(xì)抽到樣本單位。記錄報(bào)表記錄報(bào)表制度:它是按照國家統(tǒng)一規(guī)定的調(diào)查規(guī)定與文獻(xiàn)(指標(biāo)、表格形式、計(jì)算措施等)自下而上的提供記錄資料的一種報(bào)表制度。在官方記錄的常常調(diào)查中目前仍然發(fā)揮著一定的作用。按照?qǐng)?bào)送范圍,記錄報(bào)表分為全面報(bào)表和非全面報(bào)表。按報(bào)送周期,記錄報(bào)表重要有月報(bào)、季報(bào)、年報(bào)構(gòu)成,月報(bào)內(nèi)容簡樸,時(shí)效性強(qiáng),年報(bào)則內(nèi)容比較全面。記錄報(bào)表的內(nèi)容包括表式和填表闡明。對(duì)于大型、國有企業(yè)來說,運(yùn)用記錄報(bào)表搜集數(shù)據(jù),具有時(shí)間快、成本低的長處,但對(duì)于大量的小型、非國有經(jīng)濟(jì)單位,則難以全面采用記錄報(bào)表調(diào)查。重點(diǎn)調(diào)查重點(diǎn)調(diào)查:是一種非全面調(diào)查,它是在調(diào)查對(duì)象中選擇一部分對(duì)全局具有決定性作用的重點(diǎn)單位進(jìn)行調(diào)查。合用于調(diào)查任務(wù)只規(guī)定掌握調(diào)查總體的基本狀況,調(diào)查標(biāo)志比較單一,調(diào)查標(biāo)志表目前數(shù)量上集中于少數(shù)單位,而這些少數(shù)單位的標(biāo)志值之和在總體中又占絕對(duì)優(yōu)勢(shì)的狀況。重點(diǎn)調(diào)查組織方式有兩種:一是專門組織的一次性調(diào)查;另一種是運(yùn)用定期記錄報(bào)表常常性地對(duì)某些重點(diǎn)單位進(jìn)行調(diào)查。其長處是花費(fèi)較少人力、物力,在較少時(shí)間內(nèi)及時(shí)獲得有關(guān)的基本狀況。經(jīng)典調(diào)查經(jīng)典調(diào)查:根據(jù)調(diào)查的目的與規(guī)定,在對(duì)被調(diào)查對(duì)象進(jìn)行全面分析的基礎(chǔ)上,故意識(shí)地選擇若干具有經(jīng)典意義的或有代表性的單位進(jìn)行調(diào)查,重要作用是:第一,補(bǔ)充全面調(diào)查的局限性;第二,在一定條件下可以驗(yàn)證全面調(diào)查數(shù)據(jù)的真實(shí)性。其長處是靈活機(jī)動(dòng)、通過少數(shù)經(jīng)典即可獲得深入詳實(shí)的記錄資料,缺陷是受“故意識(shí)地選出若干有代表性”的限制,易受人們主觀認(rèn)識(shí)上的影響,必須同其他調(diào)查結(jié)合起來使用,才能防止出現(xiàn)片面性。表一各類記錄調(diào)查措施的特點(diǎn)調(diào)查范圍調(diào)查時(shí)間搜集資料的措施普查全面一次采訪、匯報(bào)或空間遙感抽樣調(diào)查非全面常?;蛞淮沃苯佑^測(cè)或采訪記錄報(bào)表全面或非全面常常匯報(bào)重點(diǎn)調(diào)查非全面常常或一次匯報(bào)經(jīng)典調(diào)查非全面一次采訪餅圖條形圖環(huán)形圖生成頻數(shù)分布表餅圖條形圖環(huán)形圖生成頻數(shù)分布表定性數(shù)據(jù)的圖形表達(dá)用圖表展示定性數(shù)據(jù)數(shù)據(jù)描述數(shù)據(jù)描述直方圖折線圖散點(diǎn)圖生成頻數(shù)分布表定量數(shù)據(jù)的圖形表達(dá)直方圖折線圖散點(diǎn)圖生成頻數(shù)分布表定量數(shù)據(jù)的圖形表達(dá)用圖表展示定量數(shù)據(jù)用登記表來表達(dá)數(shù)據(jù)用登記表來表達(dá)數(shù)據(jù)水平的度量差異的度量定性數(shù)據(jù)的數(shù)字特性定量數(shù)據(jù)的數(shù)字特性水平的度量差異的度量定性數(shù)據(jù)的數(shù)字特性定量數(shù)據(jù)的數(shù)字特性用數(shù)字來概括數(shù)據(jù)一.生成頻數(shù)分布表定性數(shù)據(jù)自身是對(duì)事物的一種分類,因此,只要先把所有的類別都列出來,然後記錄出每一類別的頻數(shù),就是一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)。頻數(shù)分布包括了諸多有用的信息,通過它可以觀測(cè)不一樣類型數(shù)據(jù)的分別狀況。二.定性數(shù)據(jù)的圖形表達(dá)定性數(shù)據(jù)(分類數(shù)據(jù)和次序數(shù)據(jù))可以描繪出它們各類的比例,常用餅圖和條形圖表達(dá)。餅圖餅圖又稱圓餅圖、圓形圖等,它是運(yùn)用圓形及圓內(nèi)扇形面積來表達(dá)數(shù)值大小的圖形。餅圖重要用于總體中各構(gòu)成部分所占比重的研究。條形圖條形圖是用寬度相似的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀測(cè)不一樣類別數(shù)據(jù)的多少或分布狀況。繪制時(shí),各類別可以放在縱軸,也可以放在橫軸。環(huán)形圖餅圖只能顯示一種變量(如年齡變量)各部分所占的比重。假如我們想比較不一樣變量之間的構(gòu)造差異,就可以通過環(huán)形圖來實(shí)現(xiàn)。首先,運(yùn)用產(chǎn)生頻數(shù)表的措施先做出分性別的年齡分布表然後,根據(jù)上表再繪制出環(huán)形圖。第二節(jié)用圖表展示定量數(shù)據(jù)定性數(shù)據(jù)的圖示表達(dá)措施,也都合用于定量數(shù)據(jù)。但定量數(shù)據(jù)尚有某些特定的圖示措施,它們并不合用于定性數(shù)據(jù)。一.生成頻數(shù)分別表生成定量數(shù)據(jù)的頻數(shù)分布表時(shí),首先是將數(shù)據(jù)進(jìn)行分組,然後再記錄出各組別的數(shù)據(jù)頻數(shù)即可。首先,要對(duì)數(shù)據(jù)進(jìn)行分組,一般的分組個(gè)數(shù)在5—15之間。另一方面,要確定組距。所謂組距是指每個(gè)組變量值中的最大值與最小值之差。每組最大值稱為該組上限,最小值稱為該組下限。則組距等于上限與下限之差,即組距=上限-下限在確定組距是,一般應(yīng)掌握的原則:一是要考慮各組的劃分與否能辨別總體內(nèi)部各個(gè)構(gòu)成部分的性質(zhì)差異。假如不能對(duì)的反應(yīng)各部分質(zhì)的差異,必須重新分組。二是要能精確地清晰地反應(yīng)總體單位的分布特性。在確定組距時(shí),在研究的現(xiàn)象變動(dòng)比較均勻的狀況下,可以采用等距分組;而當(dāng)研究的現(xiàn)象變動(dòng)很不均勻時(shí),例如急劇的增長或急劇的下降,波動(dòng)的幅度很大時(shí),則一般采用不等距分組。在實(shí)際工作中,要結(jié)合實(shí)際狀況確定各組的組距。最終,記錄出各組的頻數(shù)及頻數(shù)分布表。在記錄各組頻數(shù)時(shí),恰好等于某一組的組限時(shí),則采用上限不在內(nèi)的原則,即將該頻數(shù)計(jì)算在與下限相似的組內(nèi)。二.定量數(shù)據(jù)的圖形表達(dá)常用來表述定量數(shù)據(jù)記錄圖形有:直方圖、折線圖和散點(diǎn)圖。直方圖對(duì)于一種定量數(shù)據(jù),直方圖是一種常見的并且非常重要的圖形。它的橫坐標(biāo)代表變量分組,縱指標(biāo)代表各變量值出現(xiàn)的頻數(shù),這樣,各組與對(duì)應(yīng)的頻數(shù)就形成了一種矩形,即直方圖。折線圖折線圖是運(yùn)用線段的升降來闡明現(xiàn)象變動(dòng)的一種記錄圖,它重要用于表達(dá)現(xiàn)象的分派狀況、現(xiàn)象在時(shí)間上的變化和兩個(gè)現(xiàn)象之間的依存關(guān)系等。散點(diǎn)圖散點(diǎn)圖能反應(yīng)兩個(gè)變量的關(guān)系,判斷其變化的方向與否相似應(yīng)尤其注意多種圖表的生成方式和運(yùn)用。第三節(jié)用登記表來表達(dá)數(shù)據(jù)登記表和記錄圖是顯示記錄數(shù)據(jù)的兩種方式。在現(xiàn)實(shí)生活中,登記表和記錄圖形同樣充斥在我們的生活總。它通過對(duì)枯燥數(shù)據(jù)的整頓,運(yùn)用某些簡樸的表格,讓我們一目了然地理解某些事物的現(xiàn)象。登記表是一種用密集的形式歸納數(shù)據(jù)的措施,它重要運(yùn)用行和列中的數(shù)據(jù)來表述現(xiàn)象特性。人們運(yùn)用登記表的重要目的有:一是在文章中使用它以支持自已的觀點(diǎn);二是運(yùn)用它組織數(shù)據(jù)。把整頓匯總得出的記錄數(shù)據(jù)資料,按照一定的構(gòu)造和次序,有系統(tǒng)地排列在一定的表格內(nèi),就形成一張登記表。登記表的重要長處是:能使記錄資料條理化、系統(tǒng)化,能清晰的體現(xiàn)記錄資料的內(nèi)容,且簡要易懂、節(jié)省篇幅,便于對(duì)表中資料進(jìn)行對(duì)比,并易于檢查數(shù)字的完整性和對(duì)的性。登記表的構(gòu)造登記表一般由五個(gè)部分構(gòu)成,即表頭、行標(biāo)題、列標(biāo)題、數(shù)字資料和表外附加構(gòu)成。①總標(biāo)題:登記表的名稱。簡要扼要,一般放在表格上方中間位置②橫行標(biāo)題和縱欄標(biāo)題:縱欄:表明標(biāo)志和指標(biāo)的名稱,一般置于表格上方;橫行標(biāo)題:表明調(diào)查單位和分組的名稱,一般置于表格左邊。③記錄數(shù)字(指標(biāo)數(shù)值)。主詞欄:表中資料所闡明的對(duì)象,位于表的左邊;賓詞欄:多種指標(biāo),位于表的右側(cè)。(2)登記表的種類①按用途不一樣分類a.

調(diào)查表:用來搜集記錄資料的表格;b.

整頓表:用于匯總或整頓調(diào)查資料,以及體現(xiàn)記錄匯總或整頓成果的表格;c.

分析表:用于對(duì)整頓所得的記錄資料進(jìn)行定量分析的表格。②按總體分組不一樣分類a.

簡樸表:對(duì)總體未經(jīng)任何分組,僅是簡樸地列出記錄資料所屬時(shí)間或單位的表格。b.

簡樸分組表:對(duì)總體僅按一種標(biāo)志進(jìn)行分組的登記表。c.

復(fù)合分組表:對(duì)總體按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行層疊分組。③按記錄資料的時(shí)間和空間分類a.

空間數(shù)列表:指同一時(shí)間條件下,不一樣空間范圍的登記表。它闡明在靜態(tài)條件下,客觀社會(huì)經(jīng)濟(jì)現(xiàn)象在不一樣空間范圍的分布狀況。b.

時(shí)間數(shù)列表:指同一空間條件下,不一樣步間范圍的登記表。它闡明在動(dòng)態(tài)條件下,客觀社會(huì)經(jīng)濟(jì)現(xiàn)象發(fā)展變動(dòng)狀況。c.

時(shí)空結(jié)合表:是同步反應(yīng)社會(huì)經(jīng)濟(jì)現(xiàn)象在不一樣空間和不一樣步間內(nèi)的數(shù)量分布的登記表。(3)登記表的設(shè)計(jì)總的規(guī)定:簡潔、明確、實(shí)用、美觀,便于比較。①登記表設(shè)計(jì)應(yīng)注意事項(xiàng)a.

登記表應(yīng)設(shè)計(jì)成由縱橫交叉線條構(gòu)成的長方形表格,長與寬之間保持合適的比例。b.

線條繪制。表的上下端應(yīng)以粗線繪制,表內(nèi)縱橫線以細(xì)線繪制。表格左右兩端一般不劃線,采用“開口式”。c.

合計(jì)欄的設(shè)置。登記表各縱列若須合計(jì)時(shí),一般應(yīng)將合計(jì)列在最終一行,各橫行若須要合計(jì)時(shí),可將合計(jì)列在最前一欄或最終一欄。d.

欄數(shù)的編號(hào)。假如欄數(shù)較多,應(yīng)當(dāng)按次序編號(hào),習(xí)慣上主詞欄以“甲、乙、丙、丁……”為序號(hào),賓詞欄編以(1)、(2)、(3)、(4)……為序號(hào)。②登記表內(nèi)容設(shè)計(jì)應(yīng)注意事項(xiàng)a.

標(biāo)題設(shè)計(jì):標(biāo)題簡要扼要。b.

指標(biāo)數(shù)值:數(shù)字填寫整潔,對(duì)準(zhǔn)位數(shù)。當(dāng)數(shù)字因小可略而不計(jì)時(shí),可寫上“0”;當(dāng)缺某項(xiàng)數(shù)字資料時(shí),可用“…”表達(dá);不應(yīng)有數(shù)字時(shí)用符號(hào)“-”表達(dá)。c.

計(jì)量單位:當(dāng)全表只有一種計(jì)量單位時(shí),可以把它寫在表頭的右上方。假如表中各欄的指標(biāo)數(shù)值計(jì)量單位不一樣,可以橫行標(biāo)題後添一列計(jì)量單位。d.

注解或資料來源。第四節(jié)用數(shù)字來概括數(shù)據(jù)針對(duì)一組數(shù)據(jù)的分布特性,我們可以從兩個(gè)方面來考察它:一是該組數(shù)據(jù)的集中趨勢(shì),即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度。二是該組數(shù)據(jù)的離散程度,它反應(yīng)的是該組數(shù)據(jù)的各個(gè)數(shù)值遠(yuǎn)離其中心的趨勢(shì)和程度。一.定性數(shù)據(jù)的數(shù)字特性由于定性數(shù)據(jù)重要是計(jì)數(shù),比較簡樸,對(duì)定性數(shù)據(jù)的集中趨勢(shì)常用的措施就是計(jì)算比例、比例、中位數(shù)和眾數(shù)。中位數(shù)是將總體各單位標(biāo)志值按大小次序排列,處在中間位置的那個(gè)數(shù)(假如樣本量為奇數(shù)),或者中間兩個(gè)數(shù)目的平均(假如樣本量為偶數(shù))。眾數(shù)就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中,由于記錄的是頻數(shù),因此眾數(shù)用得多些。二.定量數(shù)據(jù)的數(shù)字特性反應(yīng)定量數(shù)據(jù)特性的記錄量常用的有:反應(yīng)數(shù)據(jù)集中趨勢(shì)的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等反應(yīng)數(shù)據(jù)離散程度的差異度量:極差、四分位差、原則差和方差水平的度量平均數(shù)平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進(jìn)行算術(shù)平均,用以表述某一事物的平均水平,它在記錄中叫做均值。簡樸平均數(shù):把一種變量的所有觀測(cè)值相加再除以觀測(cè)值的數(shù)目加權(quán)平均數(shù):假如原始數(shù)據(jù)為分組數(shù)據(jù),則采用加權(quán)平均數(shù)公式計(jì)算,其中的權(quán)數(shù)f為各組的頻數(shù)。求法:用Excel中的【AVERAGE】函數(shù)求平均數(shù)。中位數(shù)數(shù)字按次序排列後,處在中間位置的數(shù)即是。如總位數(shù)為奇數(shù),中間數(shù)即是;若為偶數(shù),則是中間兩位數(shù)的平均值。求法:用Excel中的【MEDIAN】函數(shù)求中位數(shù)。眾數(shù)數(shù)組中出現(xiàn)次數(shù)最多的數(shù)。求法:用Excel中的【MODE】函數(shù)求眾數(shù)用哪個(gè)值代表一組數(shù)據(jù)平均數(shù)、中位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的三個(gè)重要記錄量,要合理使用則需要理解它們的不一樣特點(diǎn)和應(yīng)用場(chǎng)所。平均數(shù)易為多數(shù)人理解和接受,實(shí)際中用的也較多,但重要缺陷是更輕易受少數(shù)極端數(shù)值的影響,對(duì)于嚴(yán)重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。中位數(shù)和眾數(shù)提供的信息不像平均數(shù)那樣多,但它們也有長處,例如不受極端值的影響,具有記錄上的穩(wěn)健性,當(dāng)數(shù)據(jù)為偏態(tài)分布,尤其是偏斜程度較大時(shí),可以考慮選擇中位數(shù)和眾數(shù),這時(shí)它們的代表性要比平均數(shù)好。差異的度量對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象不僅需要對(duì)現(xiàn)象的集中趨勢(shì)進(jìn)行分析(平均數(shù)、中位數(shù)、眾數(shù)),并且還需要進(jìn)行差異程度分析即離散程度分析。研究事物現(xiàn)象的差異性,從差異性的事物現(xiàn)象中,尋求處理差異性的某些措施。極差(Range)極差又稱全距,是最簡樸的離散指標(biāo),它是一組數(shù)據(jù)中的最大值和最小值之差。計(jì)算極差非常簡樸,含義也很直觀。不過,它僅僅受最大值和最小值的影響,不能反應(yīng)一組數(shù)據(jù)分布的狀況,并且它非常輕易受數(shù)據(jù)中極端值的影響。因此,它不能精確地描述數(shù)據(jù)的分散程度。求法:運(yùn)用Excel中的求最大值函數(shù)【MAX】得到最大值,再運(yùn)用求最小值函數(shù)【MIN】得到最小值,最終運(yùn)用公式:極差=最大值-最小值,得到極差。方差和原則差為了反應(yīng)數(shù)據(jù)中的每一種觀測(cè)值與平均水平的差異程度就必須引入方程和原則差的概念。方差:將各個(gè)變量值和其均值離差平方的平均數(shù),作為樣本數(shù)據(jù),它反應(yīng)了樣本中各個(gè)觀測(cè)值到其均值的平均離散程度。其計(jì)算公式為:未分組的計(jì)算公式:分組的計(jì)算公式:原則差是方差的平方根,它與方差相比更具量綱性,并且與變量值的計(jì)量單位相似,使用的范圍比方差更廣泛。其計(jì)算公式為:未分組的計(jì)算公式:分組的計(jì)算公式:式中是總體原則差,s為樣本原則差??傮w自由度為n,樣本自由度為n-1,兩種有差異,是由于,自由度是指一組數(shù)據(jù)中可以自由取值的個(gè)數(shù),當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),其樣本均值是確定的,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一種數(shù)據(jù)不能自由取值。因此,樣本的原則差只能除以n-1,而不能除以n.在一種記錄樣本中,其原則差越大,闡明它的各個(gè)觀測(cè)值分布的越分散,它的趨中程度就越差。反之,其原則差越小,闡明它的各個(gè)觀測(cè)值分布的越集中,它的趨中程度就越好。求法:運(yùn)用Excel中的方差函數(shù)【VAR】得到方差,再運(yùn)用原則差函數(shù)【STDEV】得到原則差。離散系數(shù)離散系數(shù)也稱變異系數(shù)、原則差系數(shù),它是將一組數(shù)據(jù)的原則差除以其均值,用來測(cè)度數(shù)據(jù)離散程度的相對(duì)數(shù)。其計(jì)算公式為:總體數(shù)據(jù)的離散系數(shù):樣本數(shù)據(jù)的離散系數(shù):原則分?jǐn)?shù)原則分?jǐn)?shù)也稱原則化值或Z分?jǐn)?shù),它是變量值與其平均數(shù)的離差除以原則差後的值,用以測(cè)定某一種數(shù)據(jù)在該組數(shù)據(jù)中的相對(duì)位置。其計(jì)算公式為:原則分?jǐn)?shù)最大的用途是可以把兩組數(shù)據(jù)中的兩個(gè)不一樣均值,不一樣原則差的數(shù)據(jù)進(jìn)行對(duì)比,以鑒定它們?cè)诟鹘M中的位置。見書本P271例題.原則分?jǐn)?shù)對(duì)比的兩個(gè)數(shù)據(jù)在各自數(shù)組中的相對(duì)位置。第三章參數(shù)估計(jì)根據(jù)樣本數(shù)據(jù)對(duì)總體數(shù)據(jù)特性進(jìn)行估計(jì)、判斷的過程是記錄推斷,記錄推斷重要包括參數(shù)估計(jì)和假設(shè)檢查。第一節(jié)抽樣分布一.總體分布與總體參數(shù)總體分布是總體中所有觀測(cè)值所形成的分布。總體參數(shù)是對(duì)總體特性的某個(gè)概括性的度量。一般有總體平均數(shù)()、總體方差()、總體比例()等。二.記錄量和抽樣分布總體參數(shù)是未知的,但可以運(yùn)用樣本信息來推斷。記錄量是根據(jù)樣本數(shù)據(jù)計(jì)算的用于推斷總體的某些量,是對(duì)樣本特性的某個(gè)概括性度量。記錄量是樣本的函數(shù),如樣本均值()、樣本方差()、樣本比例(p)等。構(gòu)成記錄量的函數(shù)中不能包括未知原因。由于樣本是從總體中隨機(jī)抽取的,樣本具有隨機(jī)性,由樣本數(shù)據(jù)計(jì)算出的記錄量也就是隨機(jī)的。抽樣分布是樣本記錄量所形成的概率分布,如樣本均值的分布、樣本比例的分布等。在現(xiàn)實(shí)中,一種樣本的記錄量我們可以觀測(cè)到,但不能觀測(cè)到所有也許的記錄量值,抽樣分布是一種理論分布。記錄量的取值是根據(jù)樣本而變化的,不一樣的樣本可以計(jì)算出不一樣的記錄量值。那么,根據(jù)記錄量來推斷總體參數(shù)就必然具有某種不確定性。但我們可以給出這種推斷的可靠性,而度量這種可靠性的根據(jù)是記錄量的概率分布,并且我們確知這種分布的某些性質(zhì)。因此,記錄量的概率分布提供了該記錄量長遠(yuǎn)而穩(wěn)定的信息,它構(gòu)成了推斷總體參數(shù)的理論基礎(chǔ)。(一)樣本均值的抽樣分布設(shè)總體共有N個(gè)元素,從中隨機(jī)抽取一種容量為n的樣本,在重置抽樣時(shí),共有Nn種抽法,即可以構(gòu)成Nn不一樣的樣本,在不反復(fù)抽樣時(shí),共有個(gè)也許的樣本。每一種樣本都可以計(jì)算出一種均值,這些所有也許的抽樣均值形成的分布就是樣本均值的分布。但現(xiàn)實(shí)中不也許將所有的樣本都抽取出來,因此,樣本均值的概率分布實(shí)際上是一種理論分布。數(shù)理記錄學(xué)的有關(guān)定理已經(jīng)證明:即樣本均值的均值就是總體均值。在重置抽樣時(shí),樣本均值的方差為總體方的1/n,即在不重置抽樣時(shí),樣本均值的方差為其中,為修正系數(shù),對(duì)于無限總體進(jìn)行不重置抽樣時(shí),可以按照重置抽樣計(jì)算,當(dāng)總體為有限總體,N比較大而n/N≥5%時(shí),修正系數(shù)可以簡化為1-n/N,當(dāng)N比較大,而n/N<5%時(shí),修正系數(shù)可以近似為1,即可以按重置抽樣計(jì)算。當(dāng)總體服從正態(tài)分布時(shí),樣本均值一定服從正態(tài)分布,即有X~N(,)時(shí),~N(,)若總體為未知的非正態(tài)分布時(shí),只要樣本容量n足夠大(一般規(guī)定n≥30),樣本均值仍會(huì)靠近正態(tài)分布。樣本分布的期望值為總體均值,樣本方差為總體方差的1/n。這就是記錄上著名的中心極限定理。該定理可以表述為:從均值為,方差為的總體中,抽取樣本量為n的隨機(jī)樣本,當(dāng)n充足大時(shí)(一般規(guī)定n≥30),樣本均值的分布近似服從均值為,方差為的正態(tài)分布。假如總體不是正態(tài)分布,當(dāng)n為小樣本時(shí)(一般n<30),樣本均值的分布則不服從正態(tài)分布。(二)樣本比例的抽樣分布比例是指具有某種屬性的單位占所有單位數(shù)的比重。總體比例(一般用表達(dá))是總體中具有某種屬性的單位數(shù)占所有總體單位數(shù)的比例,是一種參數(shù),一般是未知的,也是我們想通過抽樣得到的闡明總體特性的數(shù)據(jù)。樣本比例(一般用p表達(dá))是隨機(jī)抽取的樣本中具有某種屬性的單位數(shù)占樣本所有單位數(shù)的比例,是一種樣本記錄量,是隨機(jī)變量,對(duì)于一種已經(jīng)抽取出來的樣本來講,是可以觀測(cè)到的。描述所有也許樣本比例的概率分布就是樣本比例的抽樣分布。當(dāng)樣本容量比較大時(shí),樣本比例p近似服從正態(tài)分布,且有p的數(shù)學(xué)期望就是總體比率,即而P的方差與抽樣措施有關(guān),在重置抽樣下為,在不重置抽樣下為即在重置抽樣時(shí),p的分布為p~N(,)在不重置抽樣時(shí),p的分布為p~N(,)一般講,當(dāng)np≥5,并n(1-p)≥5時(shí),就可以認(rèn)為樣本容量足夠大。對(duì)于無限總體進(jìn)行不重置抽樣時(shí),可以按照重置抽樣計(jì)算,當(dāng)總體為有限總體,當(dāng)N比較大,而n/N5%時(shí),修正系數(shù)可以近似為1,這時(shí)也可以按重置抽樣計(jì)算。從上述分析可以看出,伴隨樣本容量的增大,樣本比例的方差愈來愈小,闡明樣本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。三.記錄量的原則誤差記錄量的原則誤差也稱為原則誤,是指樣本記錄量分布的原則差。可用于衡量樣本記錄量的離散程度。在參數(shù)估計(jì)中,它是用于衡量樣本記錄量與總體參數(shù)之間差距的一種重要尺度。樣本均值的原則誤計(jì)算公式為:當(dāng)總體原則差未知時(shí),可用樣本原則差s替代計(jì)算,這時(shí)計(jì)算的原則誤差稱為估計(jì)原則誤差。對(duì)應(yīng)地,樣本比例的原則誤計(jì)算公式為同樣,當(dāng)總體比例的方差未知時(shí),可用樣本比例的方差p(1-p)替代。參數(shù)估計(jì)參數(shù)估計(jì)是用樣本記錄量去估計(jì)總體的參數(shù)。用樣本記錄量來估計(jì)總體參數(shù)有兩種措施:點(diǎn)估計(jì)和區(qū)間估計(jì)一.點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn)估計(jì),是用樣本記錄量的實(shí)現(xiàn)值來近似對(duì)應(yīng)的總體參數(shù)。區(qū)間估計(jì),是根據(jù)估計(jì)可靠程度的規(guī)定,運(yùn)用隨機(jī)抽取的樣本的記錄量確定可以覆蓋總體參數(shù)的也許區(qū)間的一種估計(jì)措施。區(qū)間估計(jì)是包括樣本記錄量在內(nèi)(有時(shí)是以記錄量為中心)的一種區(qū)間,該區(qū)間一般是由樣本記錄量加減估計(jì)原則誤差得到的。與點(diǎn)估計(jì)不一樣,進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本記錄量的抽樣分布,可以對(duì)記錄量與總體參數(shù)的靠近程度給出一種概率度量。原則正態(tài)分布為N(0,1)分布,將概率分布原則化的公式為:=將z所對(duì)應(yīng)的概率稱為置信度或置信水平,將表達(dá)的范圍稱為置信區(qū)間。以68.73%的置信水平推斷總體參數(shù)推斷總體參數(shù)的置信區(qū)間為(z=1)()以95.45%的置信水平推斷總體參數(shù)推斷總體參數(shù)的置信區(qū)間為(z=2)()以99.73%的置信水平推斷總體參數(shù)推斷總體參數(shù)的置信區(qū)間為(z=3)()二.評(píng)價(jià)估計(jì)量的原則用于估計(jì)總體參數(shù)的估計(jì)量可以有諸多,怎樣選擇估計(jì)效果最佳的那種估計(jì)量,評(píng)價(jià)估計(jì)量的好壞的原則詳細(xì)有:1.無偏性,是指估計(jì)量抽樣分布的期望值等于被估計(jì)的總體參數(shù)。無偏估計(jì)量的定義。設(shè)總體參數(shù)為,所選擇的估計(jì)量為,假如E()=,則稱為的無偏估計(jì)量。,p,分別是總體均值、總體比例、總體方差的無偏估計(jì)量。2.有效性,是指估計(jì)量的方差盡量小。有效性是指估計(jì)量的方差盡量小。對(duì)同一種總體參數(shù)的兩個(gè)無偏估計(jì)量,有更小方差的估計(jì)量更有效。3.一致性,是指伴隨樣本量的增大,點(diǎn)估計(jì)量的值越來越靠近被估計(jì)總體的參數(shù)。即大樣本給出的估計(jì)量要比一種小樣本給出的估計(jì)量更靠近總體的參數(shù)。從這個(gè)意義上說,樣本均值是總體均值的一種一致估計(jì)量。三.一種總體均值的區(qū)間估計(jì)在對(duì)總體均值進(jìn)行區(qū)間估計(jì)時(shí),需要考慮總體與否為正態(tài)分布、總體方差與否已知,用于估計(jì)的樣本是大樣本還是小樣本等狀況。但不管哪種狀況,總體均值的置信區(qū)間都是由樣本均值加減估計(jì)誤差得到的。一般將置信水平表達(dá)為1-,記錄量分布兩側(cè)面積各為/2的分為數(shù)值,它取決于事先所規(guī)定的置信度(或可靠程度)。因此總體均值在1-置信水平下的置信區(qū)間可一般性地體現(xiàn)為:(-分為數(shù)值*的原則誤差,+分為數(shù)值*的原則誤差)(一)大樣本的估計(jì)大樣本(n≥30)狀況下,當(dāng)總體方差已知時(shí),總體均值在1-置信水平下的置信區(qū)間為()式中:為事先確定的一種概率值,它是總體均值不包括在置信區(qū)間的概率;1-為置信水平;為原則正態(tài)分布上兩側(cè)面積各為/2時(shí)的z值;為估計(jì)誤差。大樣本狀況下,當(dāng)總體方差未知時(shí),上式中的可以用樣本方差替代,總體均值在1-置信水平下的置信區(qū)間為()例題見P284【例3.3續(xù)】(二)小樣本的估計(jì)小樣本(n<30)狀況下,對(duì)總體均值的估計(jì)都是建立在總體服從正態(tài)分布的假定前提下。當(dāng)總體方差已知時(shí),樣本均值通過原則化後仍服從原則正態(tài)分布,此時(shí)總體均值在1-置信水平下的置信區(qū)間仍為()假如總體方差未知時(shí),樣本均值通過原則化後仍服從自由度為(n-1)的t分布,即。T分布也是對(duì)稱分布,只不過計(jì)算出來的t值對(duì)應(yīng)的概率要查t分布概率表??傮w均值在1-置信水平下的置信區(qū)間為()總體均值的置信區(qū)間是由樣本均值和估計(jì)誤差兩部分構(gòu)成的。四.一種總體比例的區(qū)間估計(jì)在大樣本(n≥30)狀況下,當(dāng)總體比例已知時(shí),在1-置信水平下,總體比例的置信區(qū)間為(,)在大樣本(n≥30)狀況下,當(dāng)總體比例未知時(shí),在1-置信水平下,總體比例的置信區(qū)間為()總體比例的置信區(qū)間是由樣本比例和估計(jì)誤差兩部分構(gòu)成的。樣本量確實(shí)定在進(jìn)行參數(shù)估計(jì)時(shí),樣本量要合適。樣本量過大會(huì)增長調(diào)查費(fèi)用,花費(fèi)更多的人力;樣本量過小,樣本沒有足夠的代表性,記錄量的原則誤差會(huì)增大,對(duì)總體參數(shù)的估計(jì)會(huì)不精確。一.估計(jì)總體均值時(shí),樣本量確實(shí)定在重置抽樣條件下,設(shè)E代表容許的估計(jì)誤差,則樣本量計(jì)算公式為:假如總體原則差未知,可以用樣本原則差s來替代;也可以用試驗(yàn)調(diào)查的措施,選擇一種初始樣本,以該樣本的原則差s作為總體原則差的估計(jì)值。樣本量與置信水平成正比,與總體方差成反比,與容許的估計(jì)誤差的平方成反比。例題見P287【例3.5】二.估計(jì)總體比例時(shí)樣本量確實(shí)定在重置抽樣條件下,設(shè)E代表容許的估計(jì)誤差,則樣本量計(jì)算公式為:樣本量越大,估計(jì)誤差就越小,估計(jì)的精度就越高。估計(jì)誤差由使用者預(yù)先確定。大多數(shù)狀況下,估計(jì)誤差的取值一般應(yīng)不不小于0.1.假如總體比例的值不懂得,可以用樣本比例s來替代,或者取=0.5,使得(1-)到達(dá)最大。例題見P288【例3.6】第四章假設(shè)檢查假設(shè)檢查是記錄推斷的另一項(xiàng)重要內(nèi)容,它與參數(shù)估計(jì)類似,只是角度不一樣。參數(shù)估計(jì)是用樣本記錄量估計(jì)總體參數(shù)的措施。而假設(shè)檢查是先對(duì)總體參數(shù)或分布形式提出某種假設(shè),然後運(yùn)用樣本信息和有關(guān)記錄量的分布特性檢查這個(gè)假設(shè)做出與否拒絕本來假設(shè)的結(jié)論。第一節(jié)假設(shè)檢查的基本原理假設(shè)檢查是先對(duì)總體參數(shù)或分布形式提出某種假設(shè),然後運(yùn)用樣本信息和有關(guān)記錄量的分布特性去檢查這個(gè)假定,做出與否拒絕本來假設(shè)的結(jié)論。一.為何要進(jìn)行假設(shè)檢查進(jìn)行假設(shè)檢查是為了找出樣本均值與總體均值之間存在誤差的原因。二.怎樣進(jìn)行假設(shè)檢查運(yùn)用小概率事件來檢查。小概率事件是指在一次事件中幾乎不也許發(fā)生的事件,一般稱為“明顯性水平”,用來表達(dá)。明顯性水平一般取值為=0.05或=5%。三.假設(shè)檢查的過程1.提出原假設(shè)和替代假設(shè)(備擇假設(shè))。在記錄學(xué)中,把需要通過樣本去推斷其對(duì)的與否的命題稱為原假設(shè)(零假設(shè)),用表達(dá)。例如,p292頁例中:與原假設(shè)相對(duì)立的就是備擇假設(shè),用表達(dá)。例如,p292頁例中:(雙尾檢查)(單尾檢查)對(duì)于任何一種假設(shè)檢查問題,其所有的成果都應(yīng)包括在這兩個(gè)假設(shè)范圍內(nèi)。因此,在和中,總有一種假設(shè),且只能有一種假設(shè)成立。接受,就表明否認(rèn)了,反之亦然。2.確定合適的檢查記錄量。用于檢查假設(shè)問題的記錄量稱為檢查記錄量。如同在參數(shù)估計(jì)中同樣,需要借助于樣本記錄量進(jìn)行記錄推斷。在大樣本中,檢查記錄量服從正態(tài)分布,用z記錄量。在小樣本中,檢查記錄量服從t分布,用t記錄量。這和參數(shù)估計(jì)的考慮狀況是同樣的。3.確定明顯性水平。根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設(shè)的概率應(yīng)不不小于0.05,當(dāng)然也也許是0.01,0.005等。明顯性水平就是容許的小概率水平,但小概率并不能闡明不會(huì)發(fā)生,僅僅是發(fā)生的概率很小罷了。記錄推斷中的假設(shè)檢查是根據(jù)樣本的數(shù)據(jù)信息對(duì)有關(guān)總體參數(shù)的某種假設(shè)進(jìn)行的判斷,由于樣本的信息與總體參數(shù)的真實(shí)狀況不完全一致,無論我們做出的拒絕或不拒絕原假設(shè)的結(jié)論,均有也許出錯(cuò)誤。第一類錯(cuò)誤:棄真錯(cuò)誤,即H0本來對(duì)的,卻拒絕了它,犯此類錯(cuò)誤的概率不超過,即:假設(shè)檢查中的兩類錯(cuò)誤4.根據(jù)數(shù)據(jù)計(jì)算檢查記錄量值和與這個(gè)記錄量值對(duì)應(yīng)的概率P值,并進(jìn)行決策。根據(jù)明顯性水平和記錄量的分布,可以找出接受域和拒絕域的臨界點(diǎn),用計(jì)算出來的檢查記錄量的值和臨界點(diǎn)的值相比較,就可以做出接受還是拒絕原假設(shè)的記錄決策。總結(jié)上述的檢查決策準(zhǔn)則:雙側(cè)檢查:∣記錄量的值∣>臨界值,或P≤時(shí),拒絕原假設(shè);左側(cè)檢查:記錄量的值<臨界值,或P≤時(shí),拒絕原假設(shè);右側(cè)檢查:記錄量的值>臨界值,或P≤時(shí),拒絕原假設(shè);對(duì)假設(shè)檢查的總結(jié):假設(shè)檢查根據(jù)的是小概率原理。小概率原則在抽樣前依需要確定。假設(shè)檢查的成果只能是拒絕或不拒絕本來假設(shè),而不能證明原假設(shè)成立。記錄假設(shè)檢查的成果不是絕對(duì)對(duì)的?!纠}】某工廠生產(chǎn)的固體燃料推進(jìn)器的燃燒率服從正態(tài)分布N(),=40cm/s,=2cm/s.目前用新措施生產(chǎn)了一批推進(jìn)器。從中隨機(jī)取n=25只,測(cè)得燃燒率的樣本均值為=41.25cm/s。設(shè)在新措施下總體均方差仍為2cm/s,問這批推進(jìn)器的燃燒率與否較以往生產(chǎn)推進(jìn)器的燃燒率有明顯的提高?取明顯性水平=0.05.通過假設(shè)可以判斷是一種右邊檢查問題,其拒絕域?yàn)椋旱诙?jié)總體均值的假設(shè)檢查對(duì)于總體均值進(jìn)行假設(shè)檢查時(shí),采用什么檢查記錄量取決于所抽取的樣本是大樣本還是小樣本,還需要考慮總體與否為正態(tài)分布、總體方差與否已知等。一.大樣本(n≥30)檢查:當(dāng)總體方差已知時(shí),總體均值檢查的記錄量為當(dāng)總體方差未知時(shí),總體均值檢查的記錄量為例題見書本P294例4.2二.小樣本(n<30)檢查:當(dāng)總體方差已知時(shí),總體均值檢查的記錄量為當(dāng)總體方差未知時(shí),總體均值檢查的記錄量為第三節(jié)總體比例的假設(shè)檢查在抽樣分布和參數(shù)的區(qū)間估計(jì)中,都講到比例的問題,同樣假設(shè)檢查也有總體比例的檢查,總體比例的檢查與總體均值的檢查基本相似,只是檢查的參數(shù)和檢查記錄量的體現(xiàn)形式不一樣。我們生活中常常需要對(duì)總體的某些比例進(jìn)行檢查,以證明某種觀點(diǎn)能否被否認(rèn)。一種總體比例的檢查,基本形式有三種:雙側(cè)檢查:左側(cè)檢查:右側(cè)檢查:在大樣本時(shí),樣本比例會(huì)近似服從正態(tài)分布,因此,檢查記錄量仍用Z記錄量,其基本形式為:例題見書本P298-299頁,【例4.4】、【例4.5】注:根據(jù)明顯性水平=0.05,由Excel中的【NORMSINV】函數(shù)可求得臨界值,即雙側(cè)檢查的臨界值=NORMSINV(0.05/2)=-1.96即和NORMSINV(1-0.05/2)=1.96.第五章有關(guān)分析與回歸分析有關(guān)分析是研究兩個(gè)或兩個(gè)以上變量之間有關(guān)關(guān)系的措施論,而回歸分析是研究變量之間有關(guān)關(guān)系類型,進(jìn)而掌握其發(fā)展變化規(guī)律,預(yù)測(cè)未來的措施論。第一節(jié)有關(guān)關(guān)系一.有關(guān)關(guān)系在現(xiàn)實(shí)世界中,任何事物或現(xiàn)象都不是孤立存在的,而是互相聯(lián)絡(luò)、互相制約、互相依存的。當(dāng)某些現(xiàn)象發(fā)生變化時(shí),另一現(xiàn)象也會(huì)隨之發(fā)生變化。如商品價(jià)格的變化會(huì)刺激或克制商品銷售量的變化;勞動(dòng)力素質(zhì)的高下會(huì)影響企業(yè)的效益;直接材料、直接人工的價(jià)格變化會(huì)對(duì)產(chǎn)品銷售成本有直接的影響;居民收入的高下會(huì)影響對(duì)該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對(duì)經(jīng)搜集、整頓過的記錄數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地記錄提供根據(jù)?,F(xiàn)象間的依存關(guān)系大體可以提成兩種類型:一類是函數(shù)關(guān)系,另一類是有關(guān)關(guān)系。(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴(yán)格確實(shí)定性的依存關(guān)系。體現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,并且有確定的值與之相對(duì)應(yīng)。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表達(dá),到期本息用y表達(dá),則y=x+1.98%x(不考慮利息稅);(2)有關(guān)關(guān)系。有關(guān)關(guān)系是指客觀現(xiàn)象之間確實(shí)存在的,但數(shù)量上不是嚴(yán)格對(duì)應(yīng)的依存關(guān)系。在這種關(guān)系中,對(duì)于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對(duì)應(yīng)。例如成本的高下與利潤的多少有親密關(guān)系,但某一確定的成本與相對(duì)應(yīng)的利潤的數(shù)量關(guān)系卻是不確定的。這是由于影響利潤的原因除了成本外,尚有價(jià)格、供求平衡、消費(fèi)嗜好等原因以及其他偶爾原因的影響有關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)絡(luò)。有些函數(shù)關(guān)系往往由于有觀測(cè)或測(cè)量誤差以及多種隨機(jī)原因的干擾等原因,在實(shí)際中常常通過有關(guān)關(guān)系體現(xiàn)出來;而在研究有關(guān)關(guān)系時(shí),當(dāng)對(duì)其數(shù)量間的規(guī)律性理解得越深刻的時(shí)候,其有關(guān)關(guān)系就越有也許轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來體現(xiàn)。(3)有關(guān)關(guān)系的兩個(gè)特點(diǎn)①現(xiàn)象之間確實(shí)存在著數(shù)量上的依存關(guān)系。就是說,一種現(xiàn)象發(fā)生數(shù)量上的變化,另一種現(xiàn)象也會(huì)對(duì)應(yīng)地發(fā)生數(shù)量上的變化。②現(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一種現(xiàn)象發(fā)生數(shù)量上的變化,另一種現(xiàn)象會(huì)有幾種也許值與之對(duì)應(yīng),而不是唯一確定的值。有關(guān)分析的重要內(nèi)容:(1)確定現(xiàn)象之間有無關(guān)系。(2)確定有關(guān)關(guān)系的體現(xiàn)形式,運(yùn)用對(duì)應(yīng)的回歸分析措施深入分析現(xiàn)象之間的數(shù)量依存關(guān)系。用一種數(shù)學(xué)體現(xiàn)式,來反應(yīng)有有關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一種或若干個(gè)自變量的數(shù)值推斷出因變量的也許值,這種分析稱為回歸分析。有關(guān)分析與回歸分析既有區(qū)別又有聯(lián)絡(luò),兩種分析構(gòu)成了有關(guān)關(guān)系分析的基本內(nèi)容。(3)測(cè)定有關(guān)關(guān)系的親密程度。二.有關(guān)關(guān)系的描述---散點(diǎn)圖對(duì)于兩個(gè)變量x和y,通過觀測(cè)或試驗(yàn),我們可以得到若干組數(shù)據(jù),記為(xi,yi)(i=1,2,…,n)將這些數(shù)據(jù)按x值由大到?。ɑ蛴尚〉酱螅┮孕蛄斜肀磉_(dá),即構(gòu)成有關(guān)表。將一一對(duì)應(yīng)的(xi,yi)描點(diǎn)于坐標(biāo)軸上,即構(gòu)成散點(diǎn)圖,又稱有關(guān)圖。通過散點(diǎn)圖所反應(yīng)出的坐標(biāo)點(diǎn)的分布狀況可以直觀地判斷變量之間與否存在有關(guān)關(guān)系,以及有關(guān)的形態(tài)、方向。散點(diǎn)圖是有關(guān)關(guān)系的一種描述措施,它直觀、形象,通過散點(diǎn)圖可以觀測(cè)到現(xiàn)象的關(guān)系類型以及有關(guān)方向、程度。有關(guān)的形態(tài)按照有關(guān)形式不一樣分為:線性有關(guān)和非線性有關(guān)。線性有關(guān)——又稱直線有關(guān),是指當(dāng)一種變量變動(dòng)時(shí),另一變量隨之發(fā)生大體均等的變動(dòng),從圖形上看,其觀測(cè)點(diǎn)的分布近似地體現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平一般呈線性關(guān)系。非線性有關(guān)——一種變量變動(dòng)時(shí),另一變量也隨之發(fā)生變動(dòng),但這種變動(dòng)不是均等的,從圖形上看,其觀測(cè)點(diǎn)的分布近似地體現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線有關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界線內(nèi),產(chǎn)量增長,但一旦超過一定程度,產(chǎn)量反而也許下降,這就是一種非線性關(guān)系。有關(guān)的方向按照有關(guān)的方向不一樣分為:正有關(guān)和負(fù)有關(guān)。正有關(guān)——當(dāng)一種變量的值增長或減少,另一種變量的值也隨之增長或減少。如工人勞動(dòng)生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增長;居民的消費(fèi)水平隨個(gè)人所支配收入的增長而增長。負(fù)有關(guān)——當(dāng)一種變量的值增長或減少時(shí),另一變量的值反而減少或增長。如商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的減少而增長。三.有關(guān)程度的測(cè)定:在直線有關(guān)的類型中,人們使用有關(guān)系數(shù)測(cè)定變量之間的有關(guān)關(guān)系。有關(guān)系數(shù)的計(jì)算有關(guān)系數(shù)是測(cè)定變量之間關(guān)系親密程度的量。對(duì)兩個(gè)變量之間的線性有關(guān)程度的度量稱為單有關(guān)系數(shù)。一般以r表達(dá)樣本的有關(guān)系數(shù)。樣本的有關(guān)系數(shù)的定義公式為:或化簡為:計(jì)算該有關(guān)系數(shù)時(shí),假定兩個(gè)變量之間是線性關(guān)系,并且兩個(gè)變量都是隨機(jī)變量。此外,樣本數(shù)據(jù)中不應(yīng)有極端值,否則會(huì)對(duì)有關(guān)系數(shù)的值有較大影響。有關(guān)系數(shù)的性質(zhì)如下:有關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1。當(dāng)r>0時(shí),表達(dá)兩變量正有關(guān),當(dāng)r<0時(shí),表達(dá)兩變量為負(fù)有關(guān)。當(dāng)|r|=1時(shí),表達(dá)兩變量為完全線性有關(guān)即函數(shù)關(guān)系。當(dāng)r=1時(shí),稱為完全正有關(guān),而當(dāng)r=-1時(shí),稱為完全負(fù)有關(guān)。當(dāng)r=0時(shí),表達(dá)兩變量間無線性有關(guān)關(guān)系。r具有對(duì)稱性。X與y之間的有關(guān)系數(shù)rxy和y與x之間的有關(guān)系數(shù)ryx相等。r數(shù)值大小與x和y的數(shù)據(jù)原點(diǎn)及計(jì)量尺度無關(guān)。變化x和y的數(shù)據(jù)原點(diǎn)和計(jì)量尺度,并不變化r數(shù)值的大小。r僅僅是x與y之間線性關(guān)系的一種度量,它不能用于描述非線性關(guān)系。r雖然是兩個(gè)變量之間線性關(guān)系的一種度量,卻不一定意味著x與y一定有因果關(guān)系。當(dāng)︱r︱≥0.8時(shí),可視為高度有關(guān);當(dāng)0.5≤︱r︱<0.8時(shí),可視為中度有關(guān);當(dāng)0.3≤︱r︱<0.5時(shí),視為低度有關(guān);當(dāng)︱r︱<0.3時(shí),闡明兩個(gè)變量之間的有關(guān)程度極弱。(二)有關(guān)系數(shù)的檢查:檢查有關(guān)系數(shù)是由于兩個(gè)變量均為隨機(jī)變量,計(jì)算有關(guān)系數(shù)時(shí)使用的是它們的隨機(jī)抽樣值,因此不能斷定總體變量值也存在著這樣的有關(guān)關(guān)系,需要通過明顯性檢查加以確定。在實(shí)際的客觀分析中,有關(guān)系數(shù)一般都是運(yùn)用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小其可信度就越差,因此也需要進(jìn)行檢查。有關(guān)系數(shù)的明顯性檢查問題是對(duì)總體的有關(guān)系數(shù)與否等于0進(jìn)行檢查。數(shù)學(xué)上可以證明,在隨機(jī)變量X和Y都服從正態(tài)分布,并且又有的條件下,可以采用t檢查法來確定r的明顯性。有關(guān)系數(shù)的檢查環(huán)節(jié)如下:①提出假設(shè):②計(jì)算檢查記錄量t的值:③在給定的明顯性水平下,查找t分布表中對(duì)應(yīng)的臨界值④判斷,若,表明r在記錄上是明顯的,拒絕H0;若,表明r在記錄上是不明顯的,接受H0。注:可用Excel中的[CORREL]函數(shù)或【PEARSON】函數(shù)都可以計(jì)算兩組數(shù)據(jù)的有關(guān)系數(shù)。第二節(jié)一元線性回歸分析回歸是分析變量之間關(guān)系類型的措施,按照變量之間的關(guān)系,回歸分析分為:線性回歸分析和非線性回歸分析。本節(jié)研究的是線性回歸,即怎樣通過記錄模型反應(yīng)兩個(gè)變量之間的線性依存關(guān)系。回歸分析的重要內(nèi)容:從樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式;估計(jì)回歸模型參數(shù);對(duì)確定的關(guān)系式進(jìn)行多種記錄檢查,并從影響某一特定變量的諸多變量中找出影響明顯的變量。一、一元線性回歸模型:一元線性模型是指兩個(gè)變量x、y之間的直線因果關(guān)系。(一)理論回歸模型:理論回歸模型中的參數(shù)是未知的,不過在觀測(cè)中我們一般用樣本觀測(cè)值估計(jì)參數(shù)值,一般用分別表達(dá)的估計(jì)值,即稱回歸估計(jì)模型:二、模型參數(shù)估計(jì):用最小二乘法估計(jì):【例3】實(shí)測(cè)某地四面歲至拾一歲女孩的七個(gè)年齡組的平均身高(單位:厘米)如下表所示某地女孩身高的實(shí)測(cè)數(shù)據(jù)建立身高與年齡的線性回歸方程。根據(jù)上面公式求出b0=80.84,b1=4.68.[注:可用Excel進(jìn)行回歸分析。詳細(xì)環(huán)節(jié)見P308]三.回歸系數(shù)的含義(2)回歸方程中的兩個(gè)回歸系數(shù),其中b0為回歸直線的啟動(dòng)值,在有關(guān)圖上變現(xiàn)為x=0時(shí),縱軸上的一種點(diǎn),稱為y截距;b1是回歸直線的斜率,它是自變量(x)每變動(dòng)一種單位量時(shí),因變量(y)的平均變化量。(3)回歸系數(shù)b1的取值有正負(fù)號(hào)。假如b1為正值,則表達(dá)兩個(gè)變量為正有關(guān)關(guān)系,假如b1為負(fù)值,則表達(dá)兩個(gè)變量為負(fù)有關(guān)關(guān)系。四.回歸方程的評(píng)價(jià)與檢查:當(dāng)我們得到一種實(shí)際問題的經(jīng)驗(yàn)回歸方程後,還不能立即就進(jìn)行分析與預(yù)測(cè)等應(yīng)用,在應(yīng)用之前還需要運(yùn)用記錄措施對(duì)回歸方程進(jìn)行評(píng)價(jià)與檢查。進(jìn)行評(píng)價(jià)與檢查重要是基于如下理由:第一,在運(yùn)用樣本數(shù)據(jù)估計(jì)回歸模型時(shí),首先是假設(shè)變量y與x之間存在著線性關(guān)系,但這種假設(shè)與否存在需要進(jìn)行檢查;第二,估計(jì)的回歸方程與否真正描述了變量y與x之間的記錄規(guī)律性,y的變化與否通過模型中的解釋變量去解釋需要進(jìn)行檢查等。一般進(jìn)行檢查的內(nèi)容有:1.經(jīng)濟(jì)意義的檢查:運(yùn)用有關(guān)的經(jīng)濟(jì)學(xué)原理及我們所積累的豐富的經(jīng)驗(yàn),對(duì)所估計(jì)的回歸方程的回歸系數(shù)進(jìn)行分析與判斷,看其能否得到合理的解釋。2.回歸方程的記錄檢查:包括回歸方程的明顯性檢查(F檢查)和對(duì)回歸系數(shù)的檢查(t檢查)。(1)線性回歸方程的明顯性檢查——F檢查線性回歸方程的明顯性檢查即方差分析檢查法,它是對(duì)所有參數(shù)感愛好的一種明顯性檢查。其檢查環(huán)節(jié)為:第一步:提出假設(shè)。原假設(shè)備擇假設(shè)第二步:構(gòu)造F記錄量在H0成立的條件下,有:第二自由度為n-2,其中n為樣本容量。(2)回歸系數(shù)的明顯性檢查——t檢查回歸系數(shù)的明顯性檢查是檢查解釋變量x對(duì)因變量y的影響與否明顯。首先:提出假設(shè)。原假設(shè)備擇假設(shè)假如H0成立,則因變量y對(duì)解釋變量x之間并沒有真正的線性關(guān)系,即x的變化對(duì)y并沒有明顯的線性影響。另一方面:計(jì)算檢查記錄量t,并得出對(duì)應(yīng)的概率值(伴隨概率)。檢查記錄量:(為回歸系數(shù)的原則差)最終:根據(jù)伴隨概率進(jìn)行判斷:假如伴隨概率(sig.值)不不小于我們事先確定的明顯性水平時(shí),拒絕原假設(shè),接受備擇假設(shè),即解釋變量x對(duì)y的線性效果明顯。否則,不能拒絕原假設(shè),認(rèn)為x對(duì)y的線性效果不明顯。一元線性回歸分析時(shí),由于只有一種解釋變量,因此t檢查與F檢查的成果是一致的。3.回歸方程的評(píng)價(jià)——擬合程度分析:擬合程度是指估計(jì)的回歸方程與否很靠近因變量,即估計(jì)的精確度。而估計(jì)的精確度怎樣取決于回歸方程對(duì)觀測(cè)數(shù)據(jù)的擬合程度。最常用的指標(biāo)就是——鑒定系數(shù)。1.鑒定系數(shù)鑒定系數(shù)是用來闡明回歸方程對(duì)觀測(cè)數(shù)據(jù)擬合程度的一種度量值,以一元線性回歸方程為例,若各觀測(cè)值數(shù)據(jù)(xi,yi)在坐標(biāo)系上形成的散點(diǎn)都落在一條直線上,那么這條直線就是對(duì)數(shù)據(jù)的完全擬合,直線充足代表了各個(gè)點(diǎn),此時(shí),用x估計(jì)y是沒有誤差的。各觀測(cè)點(diǎn)越是緊密圍繞直線,闡明直線對(duì)觀測(cè)數(shù)據(jù)的擬合程度越好,鑒定系數(shù)越高,反之則越差,鑒定系數(shù)越小??傋兤椒胶?回歸平方和+殘差平方和鑒定系數(shù)的取值范圍在【0,1】,=1時(shí),擬合是完全的,即所有觀測(cè)值都在直線上。若x與y無關(guān),x完全無助于解釋y的變差,此時(shí),則=0.可見,越靠近于1,表明回歸平方和占總變差平方和的比重越大,回歸直線與各觀測(cè)點(diǎn)越靠近,回歸直線的擬合程度就越好。反之,越靠近0,回歸直線的擬合程度越差。2.估計(jì)原則誤差估計(jì)原則誤差是殘差平方和的均方根,用表達(dá)。其計(jì)算公式為:從實(shí)際意義看,反應(yīng)了用估計(jì)的回歸方程預(yù)測(cè)因變量y時(shí)預(yù)測(cè)誤差的大小,越小,闡明根據(jù)回歸方程進(jìn)行預(yù)測(cè)也就越精確;若各觀測(cè)點(diǎn)所有落在直線上,則=0,此時(shí)用自變量來預(yù)測(cè)因變量是沒有誤差的??梢娨矎牧硪环N角度闡明了回歸直線的擬合程度。第三節(jié)多元線性回歸分析1.多元線性回歸模型假如我們將n組實(shí)際觀測(cè)數(shù)據(jù)(yi,xi1,xi2,…xik)(i-1,2,。。。,n)代入上式中可得到下列方程:以采用一般最小平措施進(jìn)行參數(shù)估計(jì),使所有觀測(cè)值yt與回歸值的殘差平方和最小,雖然2.多元線性回歸模型的檢查(1)復(fù)有關(guān)系數(shù)檢查(擬合優(yōu)度檢查法)(2)回歸方程的明顯性檢查(F檢查法)第一步:提出假設(shè)或5%第四步:做出記錄決策第六章時(shí)間序列分析時(shí)間序列是指經(jīng)濟(jì)現(xiàn)象準(zhǔn)時(shí)間次序排列形成的數(shù)列。時(shí)間序列分析就是根據(jù)這樣的數(shù)列分析經(jīng)濟(jì)現(xiàn)象的發(fā)展規(guī)律,進(jìn)而預(yù)測(cè)其未來水平。發(fā)展水平增長量平均增長量發(fā)展水平增長量平均增長量增長量分析增長率分析增長量分析增長率分析發(fā)展速度增長速度平均發(fā)展速度和平均增長速度發(fā)展速度增長速度平均發(fā)展速度和平均增長速度和時(shí)間序列的分析指標(biāo)時(shí)間序列分析時(shí)間序列分析時(shí)間數(shù)列影響原因的分解長期趨勢(shì)分析長期趨勢(shì)分析時(shí)間數(shù)列影響原因的分解長期趨勢(shì)分析長期趨勢(shì)分析不考慮長期趨勢(shì)不考慮長期趨勢(shì)——季節(jié)指數(shù)法考慮長期趨勢(shì)——回歸方程法消除法季節(jié)變動(dòng)分析季節(jié)變動(dòng)分析時(shí)間序列的分析指標(biāo)時(shí)間數(shù)列是記錄學(xué)中一種非常重要的數(shù)據(jù)類型,是一種以時(shí)間為坐標(biāo)軸的動(dòng)態(tài)數(shù)列。一.時(shí)間數(shù)列的概念時(shí)間數(shù)列是一種記錄數(shù)列,它是將反應(yīng)某一現(xiàn)象的記錄指標(biāo)在不一樣步間上的數(shù)值準(zhǔn)時(shí)間先後次序排列所形成的數(shù)列。體現(xiàn)了現(xiàn)象在時(shí)間上的動(dòng)態(tài)變化,故又稱為動(dòng)態(tài)數(shù)列。從上表看出,一種完整的時(shí)間數(shù)列包括兩個(gè)基本要素:一是被研究現(xiàn)象或指標(biāo)所屬的時(shí)間;另一種是該現(xiàn)象或指標(biāo)在此時(shí)間坐標(biāo)下的指標(biāo)值。同一時(shí)間數(shù)列中,一般規(guī)定各指標(biāo)值的時(shí)間單位和時(shí)間間隔相等,如無法保證相等,在計(jì)算某些指標(biāo)時(shí)就波及到“權(quán)”的概念。研究時(shí)間數(shù)列的意義:理解與預(yù)測(cè)。二.增長量分析(水平分析)1.水平指標(biāo)水平指標(biāo)是用來反應(yīng)社會(huì)經(jīng)濟(jì)現(xiàn)象在某一時(shí)期或時(shí)點(diǎn)上發(fā)展變化的水平,它包括發(fā)展水平、平均發(fā)展水平、增長量等指標(biāo)。(1)發(fā)展水平發(fā)展水平是指客觀現(xiàn)象在一定期期內(nèi)(或時(shí)點(diǎn)上)發(fā)展所到達(dá)的規(guī)模、水平。在絕對(duì)數(shù)時(shí)間數(shù)列中,發(fā)展水平就是絕對(duì)數(shù);在相對(duì)數(shù)時(shí)間數(shù)列中,發(fā)展水平就是相對(duì)數(shù)或平均數(shù)。幾種概念:期初水平a0,期末水平an,期間水平(a1,a2,….an-1);匯報(bào)期水平(研究時(shí)期水平),基期水平(作為對(duì)比基礎(chǔ)的水平)(2)增長量增長量是匯報(bào)期發(fā)展水平與基期發(fā)展水平之差,增長量的指標(biāo)數(shù)值可正可負(fù),它反應(yīng)的是匯報(bào)期相對(duì)基期增長或減少的絕對(duì)數(shù)量,用公式表達(dá)為:增長量=匯報(bào)期水平-基期水平根據(jù)基期的不一樣確定措施,增長量可分為逐期增長量和合計(jì)增長量。a.逐期增長量:是匯報(bào)期水平與前一期水平之差,用公式表達(dá)為:(i=1,2,…,n)b.合計(jì)增長量:是匯報(bào)期水平與某一固定期期水平(一般是時(shí)間序列最初水平)之差,用公式表達(dá)為:(i=1,2,…,n)(3)平均增長量平均增長量是時(shí)間序列中的逐期增長量的序時(shí)平均數(shù),它表明現(xiàn)象在一定期段內(nèi)平均每期增長(減少)的數(shù)量。用記號(hào)表達(dá),其計(jì)算公式為:(i=1,2,…,n)式中,n表達(dá)逐期增長量項(xiàng)數(shù)。根據(jù)逐期增長量與合計(jì)增長量之間的數(shù)量關(guān)系,平均增長量還可以用下式體現(xiàn):式中,n為時(shí)間序列項(xiàng)數(shù)。三.增長率分析(速度指標(biāo))1.發(fā)展速度發(fā)展速度是以相對(duì)數(shù)形式表達(dá)的兩個(gè)不一樣步期發(fā)展水平的比值,表明匯報(bào)期水平已發(fā)展到基期水平的幾分之幾或若干倍。計(jì)算公式為:由于基期選擇的不一樣,發(fā)展速度有定基與環(huán)比之分?;l(fā)展速度定基發(fā)展速度是匯報(bào)期水平與某一固定期期水平(一般是最初水平)的比值,用表達(dá),則有:它闡明社會(huì)經(jīng)濟(jì)現(xiàn)象相對(duì)于某個(gè)基礎(chǔ)水平,在一定期期內(nèi)總的發(fā)展速度。②環(huán)比發(fā)展速度環(huán)比發(fā)展速度是匯報(bào)期水平與其前一其期水平的比值,用表達(dá),則有:它闡明所研究現(xiàn)象相鄰兩個(gè)時(shí)期(逐期)發(fā)展變化的程度。定基發(fā)展速度與環(huán)比發(fā)展速度的關(guān)系有:第一,定基發(fā)展速度等于對(duì)應(yīng)時(shí)期內(nèi)各環(huán)比發(fā)展速度的連乘積:第二,兩個(gè)相鄰時(shí)期定基發(fā)展速度的比率等于對(duì)應(yīng)時(shí)期的環(huán)比發(fā)展速度;實(shí)際工作中,常常運(yùn)用上述關(guān)系式對(duì)發(fā)展速度指標(biāo)進(jìn)行推算或換算。③年距發(fā)展速度它消除了季節(jié)變動(dòng)的影響,表明本期水平相對(duì)于上年同期水平發(fā)展變化的方向與程度,是實(shí)際記錄分析中常常應(yīng)用的指標(biāo)。2.增長速度增長速度是匯報(bào)期增長量與基期水平的比值,表明匯報(bào)期水平比基期增長(或減少)了百分之幾或若干倍。計(jì)算公式:由于基期選擇不一樣,增長速度也有定基與環(huán)比之分。定基增長速度若增長量為合計(jì)增長量,則計(jì)算的定基增長速度,用表達(dá),有:②環(huán)比增長速度若增長量為逐期增長量,則計(jì)算的環(huán)比增長速度,用表達(dá),就有:3.平均發(fā)展速度和平均增長速度平均發(fā)展速度和平均增長速度是兩個(gè)非常重要的平均速度指標(biāo)。平均發(fā)展速度反應(yīng)現(xiàn)象在一定期期內(nèi)逐期發(fā)展變化的一般程度;平均增長速度反應(yīng)現(xiàn)象在一定期期內(nèi)逐期增長(減少)變化的一般程度。平均增長速度=平均發(fā)展速度-1目前計(jì)算平均增長速度的措施重要有幾何平均法。幾何平均法也稱水平法。采用這一措施的原理是:一定期期內(nèi)現(xiàn)象發(fā)展的總速度等于各期環(huán)比發(fā)展速度的連乘積。則令:或第七章記錄指數(shù)記錄指數(shù)的概念及種類知識(shí)構(gòu)造:記錄指數(shù)的概念及種類記錄指數(shù)記錄指數(shù)拉氏指數(shù)派氏指數(shù)綜合指數(shù)拉氏指數(shù)派氏指數(shù)綜合指數(shù)居民消費(fèi)價(jià)格指數(shù)股票價(jià)格指數(shù)幾種常用的價(jià)格指數(shù)居民消費(fèi)價(jià)格指數(shù)股票價(jià)格指數(shù)幾種常用的價(jià)格指數(shù)第一節(jié)記錄指數(shù)的概念和種類一.記錄指數(shù)的概念指數(shù)是用于經(jīng)濟(jì)分析的一種特殊記錄措施,它重要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論