多元統(tǒng)計分析-第三章多元正態(tài)分布_第1頁
多元統(tǒng)計分析-第三章多元正態(tài)分布_第2頁
多元統(tǒng)計分析-第三章多元正態(tài)分布_第3頁
多元統(tǒng)計分析-第三章多元正態(tài)分布_第4頁
多元統(tǒng)計分析-第三章多元正態(tài)分布_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章 多元正態(tài)分布多元正態(tài)分布是一元正態(tài)分布在多元情形下的直接推廣,一元正態(tài)分布在統(tǒng)計學(xué)理論和應(yīng)用方面有著十分重要的地位,同樣,多元正態(tài)分布在多元統(tǒng)計學(xué)中也占有相當(dāng)重要的地位。多元分析中的許多理論都是建立在多元正態(tài)分布基礎(chǔ)上的,要學(xué)好多元統(tǒng)計分析,首先要熟悉多元正態(tài)分布及其性質(zhì)。第一節(jié) 一元統(tǒng)計分析中的有關(guān)概念多元統(tǒng)計分析涉及到的都是隨機向量或多個隨機向量放在一起組成的隨機矩陣,學(xué)習(xí)多元統(tǒng)計分析,首先要對隨機向量和隨機矩陣有所把握,為了學(xué)習(xí)的方便,先對一元統(tǒng)計分析中的有關(guān)概念和性質(zhì)加以復(fù)習(xí),并在此基礎(chǔ)上推廣給出多元統(tǒng)計分析中相應(yīng)的概念和性質(zhì)。一、隨機變量及概率分布函數(shù)(一)隨機變量隨機變量是

2、隨機事件的數(shù)量表現(xiàn),可用、等表示。隨機變量有兩個特點:一是取值的隨機性,即事先不能夠確定取哪個數(shù)值;二是取值的統(tǒng)計規(guī)律性,即完全可以確定取某個值或在某個區(qū)間取值的概率。(二)隨機變量的概率分布函數(shù)隨機變量的概率分布函數(shù),簡稱為分布函數(shù),其定義為:隨機變量有離散型隨機變量和連續(xù)型隨機變量,相對應(yīng)的概率分布就有離散型概率分布和連續(xù)型概率分布。1、離散型隨機變量的概率分布若隨機變量在有限個或可列個值上取值,則稱為離散型隨機變量。設(shè)為離散型隨機變量,可能取值為,取這些值的概率分別為,記為()稱()為離散型隨機變量的概率分布。離散型隨機變量的概率分布具有兩個性質(zhì):(1),(2)2、連續(xù)型隨機變量的概率分

3、布若隨機變量的分布函數(shù)可以表示為對一切都成立,則稱為連續(xù)型隨機變量,稱為的概率分布密度函數(shù),簡稱為概率密度或密度函數(shù)。連續(xù)型隨機變量的概率密度函數(shù)具有兩個性質(zhì):(1)(2)二、隨機變量的數(shù)字特征(一)離散型隨機變量的數(shù)字特征若為離散型隨機變量,其概率分布為,則的數(shù)學(xué)期望(或稱均值)和方差分別定義為: (二)連續(xù)型隨機變量的數(shù)字特征若為連續(xù)型隨機變量,其密度函數(shù)為,則的數(shù)學(xué)期望和方差分別定義為:方差的一個簡便計算公式為(三)數(shù)學(xué)期望的數(shù)學(xué)性質(zhì)1、設(shè)是常數(shù),則2、設(shè)是隨機變量,是常數(shù),則3、設(shè)、是任意兩個隨機變量,則4、設(shè)、是任意兩個相互獨立的隨機變量,則(四)方差的數(shù)學(xué)性質(zhì)1、設(shè)是常數(shù),則2、設(shè)

4、是隨機變量,是常數(shù),則3、設(shè)、是任意兩個相互獨立的隨機變量,則三、一些重要的一元分布1、二項分布重復(fù)進行次相互獨立的試驗,若每次實驗僅有兩個可能結(jié)果,每次實驗成功的概率均為,設(shè)為次獨立實驗中成功出現(xiàn)的次數(shù),則離散型隨機變量的分布律為:, 其中,為自然數(shù),稱服從二項分布。二項分布中,方差為。2、超幾何分布若個產(chǎn)品中有個不合格品,從中隨機不放回地抽取個進行調(diào)查,為出現(xiàn)的不合格品數(shù),則離散型隨機變量的分布律為:,則稱服從超幾何分布。當(dāng)很大,相對較少時,超幾何分布近似于二項分布。3、泊松分布若離散型隨機變量的分布律為:, 其中,則稱X服從泊松分布。泊松分布中,。在恒定的條件下,當(dāng)趨于無窮,趨于零時,二

5、項分布趨向于泊松分布。4、正態(tài)分布若連續(xù)型隨機變量的概率密度函數(shù)為:,則稱服從正態(tài)分布,記作,其中參數(shù)、分別是隨機變量的數(shù)學(xué)期望和方差。當(dāng),時,隨機變量的分布為標準正態(tài)分布。當(dāng)很大,和都不太大時,二項分布可用正態(tài)分布近似計算。5、卡方分布設(shè)隨機變量皆服從,且相互獨立,則其平方和所服從的分布稱為卡方分布,記為:,為自由度,表示平方和中獨立隨機變量的個數(shù)。6、分布設(shè)隨機變量,且與相互獨立,則隨機變量的分布稱為分布。記為,為自由度。隨著自由度趨向于無窮大,分布以標準正態(tài)分布為極限。7、分布設(shè)隨機變量,且與相互獨立,則隨機變量服從第一自由度為、第二自由度為的分布,記為。第二節(jié) 多元統(tǒng)計分析中的基本概念

6、在社會、經(jīng)濟及自然科學(xué)等許多領(lǐng)域,常常需要同時研究多個指標,例如,要研究上市公司的盈利狀況,就涉及到公司的主營業(yè)務(wù)利潤、營業(yè)利潤、利潤總額和凈利潤等總量指標,主營業(yè)務(wù)利潤率、經(jīng)營凈利率、資產(chǎn)利潤率、資產(chǎn)凈利率、凈資產(chǎn)收益率、總資產(chǎn)報酬率等相對指標,每股收益、加權(quán)每股收益等平均指標。這些變量都是隨機變量,隨機變量之間往往存在一定的聯(lián)系,因而需要把這些隨機變量作為一個整體來研究。一、隨機向量及概率分布(一)隨機向量設(shè)有個隨機變量,且它們之間有一定的聯(lián)系,這些隨機變量組成的整體就是隨機向量,記為。在多元統(tǒng)計分析中,仍將所研究對象的全體稱為總體,它是由許多個體構(gòu)成的集合,如果構(gòu)成總體中的個體是有個觀測

7、指標的個體,稱這樣的總體為維總體,或元總體。由于從維總體中隨機抽到一個個體,其個指標觀測值不能事先精確知道,它依賴于被抽到的個體,因此,維總體可用維隨機向量來表示,這里的維或元表示共有幾個分量。(二)隨機向量的概率分布設(shè)是維隨機向量,它的多元概率分布函數(shù)定義為:,記為,其中:,表示維空間。1、離散型隨機向量的概率分布定義3.1:若是維隨機向量,若存在有限個或可列個維數(shù)向量記(),且滿足,則稱為離散型隨機向量,并稱()為離散型隨機向量的概率分布。2、連續(xù)型隨機向量的概率分布定義3.2:設(shè),若存在一個非負函數(shù),使得對一切都成立,則稱為連續(xù)型隨機向量,稱為分布密度函數(shù)。一個維變量的函數(shù)能作為中某個隨

8、機向量的分布密度函數(shù),當(dāng)且僅當(dāng)(1),(2) 例3.1:試證函數(shù), 為隨機向量的密度函數(shù)。證:只要驗證函數(shù)滿足密度函數(shù)的兩個條件即可。(1) 顯然,(2) =1二、邊際分布設(shè)是維隨機向量,由它的個分量組成的子向量的分布為的邊際(或邊緣)分布,相對的把的分布稱為聯(lián)合分布。通過變換中各分量的次序,總可假定正好是的前個分量,其余個分量為,即,相應(yīng)的取值也可以分為兩部分,即,當(dāng)?shù)姆植己瘮?shù)是時,的分布函數(shù)即邊際函數(shù)為: 所以的邊際密度為 例3.2:對例1中的求邊際密度函數(shù)。解: , , 三、多元變量的獨立性定義3.3:若個隨機變量的聯(lián)合分布等于各自邊際分布的乘積,稱個隨機變量相互獨立。由相互獨立可以推知

9、任何與()獨立,但反之不真。例3.3:例2中的和是否相互獨立?解: , ,所以,故和相互獨立。四、隨機向量的數(shù)字特征(一)隨機向量的數(shù)學(xué)期望定義3.4:設(shè),若存在且有限,則稱為的均值向量或數(shù)學(xué)期望,或者用表示,用表示。均值向量有以下性質(zhì):1、2、3、其中:、為隨機向量,、為適合運算的常數(shù)矩陣。(二)隨機向量的協(xié)方差陣定義3.5:設(shè),稱 為的協(xié)方差陣。通常將記為,記為,從而有。 (三)隨機向量和的協(xié)方差陣設(shè),稱 為和的協(xié)方差陣當(dāng)時,即為。協(xié)差陣有如下數(shù)學(xué)性質(zhì):1、,即的協(xié)差陣為非負定陣。2、對于常數(shù)向量,有3、設(shè)為常數(shù)矩陣,則4、其中,為適合運算的常數(shù)向量和矩陣。(四)隨機向量的相關(guān)系數(shù)矩陣 若

10、隨機向量的協(xié)方差陣存在,且每個分量的方差都大于零,則隨機向量的相關(guān)陣為其中: ,為與之間的相關(guān)系數(shù)(線性)。若,則與不相關(guān)。(五)協(xié)方差陣和相關(guān)系數(shù)矩陣的關(guān)系設(shè)標準離差陣為=則有,或在統(tǒng)計分析時為了克服由于指標的量綱不同對統(tǒng)計分析的影響,往往在使用某種統(tǒng)計分析方法之前,對每個指標進行標準差標準化處理,處理后的指標均值為0,方差為1,這時,隨機向量的協(xié)方差矩陣和其相關(guān)系數(shù)矩陣完全相同。例3.4:2003年河南省31家上市公司年報數(shù)據(jù)中的相應(yīng)資料如表31:表31 2003年河南省31家上市公司的有關(guān)數(shù)據(jù)主營業(yè)務(wù)利潤(萬元)營業(yè)利潤(萬元)利潤總額(萬元)凈利潤(萬元)中原高速48457.83416

11、14.7542088.0427126.34中原油氣84061.0769453.2260599.0052165.27安陽鋼鐵175514.79128972.69126422.2182439.22神火股份31436.5723968.0223842.2416289.60新鄉(xiāng)化纖31121.2322463.6922408.3619310.49安彩高科69994.7539903.3539315.6623036.17許繼電氣53048.4525881.1926769.4216877.17羚銳股份15639.45892.911842.921417.61華蘭生物9001.814241.094175.64354

12、9.03瑞貝卡11480.397222.467168.264723.31雙匯發(fā)展95295.7840315.5242493.9926368.50竹林眾生 8379.92921.841661.321477.24焦作萬方34086.9420451.5122562.6614290.03思達高科12769.173820.984308.773195.90鄭州煤電27296.3613007.4312863.378512.59天方藥業(yè)21449.068187.448068.435424.50白鴿股份13546.85456.404185.113960.40豫能控股12678.025721.656932.125

13、749.71中孚實業(yè)13716.8910393.5510327.717434.20宇通客車58220.5118669.5618442.5212825.46黃河旋風(fēng)10656.584819.594848.073240.43風(fēng)神股份40970.2412149.1511948.346370.63ST春都1428.16813.042490.762508.56豫光金鉛15356.329227.718843.465835.39銀鴿投資7685.473030.533098.093061.48焦作鑫安4246.311288.341306.64932.07平高電氣14101.742816.362933.0823

14、10.34神馬實業(yè)13159.932776.032262.73890.49ST冰熊1460.10-878.86-814.49-814.49蓮花味精13856.23-10310.32-13494.73-14537.71*ST洛玻 14014.60-27015.00-34021.80-34251.30資料來源:金融界數(shù)據(jù)中心,網(wǎng)址為根據(jù)資料計算:均值向量、協(xié)方差矩陣、相關(guān)系數(shù)矩陣、并驗證協(xié)方差矩陣和相關(guān)系數(shù)矩陣的關(guān)系。解:均值向量為: 協(xié)方差矩陣為:相關(guān)系數(shù)矩陣:標準離差陣: 第三節(jié) 多元正態(tài)分布的定義及基本性質(zhì)多元正態(tài)分布是一元正態(tài)分布的推廣,多元分析的主要理論都是直接或間接建立在多元正態(tài)總體基

15、礎(chǔ)上的,多元正態(tài)分布是多元分析的基礎(chǔ)。此外,在實際中遇到的隨機向量常常服從正態(tài)分布或近似服從正態(tài)分布。因此,現(xiàn)實世界許多實際問題的解決辦法都是以總體服從正態(tài)分布或近似服從正態(tài)分布為前提的。一、 多元正態(tài)分布的定義一元正態(tài)分布的密度函數(shù)(),可以改寫為,由于、均為一維的數(shù)字,轉(zhuǎn)置與否都相同。將一元正態(tài)分布的概率密度函數(shù)推廣,可得出多元正態(tài)分布的定義。定義3.6:若維隨機向量的密度函數(shù)為:()其中:,是維均值向量,則稱服從元正態(tài)分布 ,記為 。當(dāng)?shù)扔?時,元正態(tài)分布變成一元正態(tài)分布,也就是說一元正態(tài)分布是元正態(tài)分布的一個特例。上述定義實際上是在時給出的,當(dāng),不存在通常意義下的概率密度。當(dāng)時,也有正

16、態(tài)分布的定義。定義3.7:獨立標準正態(tài)變量的有限線性組合稱為維正態(tài)隨機向量,記為,其中,注意的分解一般不是唯一的。當(dāng)時,利用參數(shù)、可將二元正態(tài)分布的密度函數(shù)寫成:這是因為所以, 而 這與概率統(tǒng)計中的結(jié)果是一致的。二、多元正態(tài)變量的基本性質(zhì)在討論多元統(tǒng)計分析的理論和方法時,經(jīng)常用到多元正態(tài)變量的某些性質(zhì),利用這些性質(zhì)可使得正態(tài)分布的處理變得容易一些。1、若隨機向量,是對角陣,則相互獨立。2、設(shè),為階常數(shù)陣,為維常數(shù)向量,則 即多元正態(tài)隨機向量的任意線性變換仍然服從多元正態(tài)分布。3、若,將做如下剖析則,即多元正態(tài)分布隨機向量的任何一個分量子集的分布(邊際分布)仍然遵從正態(tài)分布。但是,若一個隨機向量

17、的任何邊際分布均為正態(tài)分布,并不能推導(dǎo)出該隨機向量是多元正態(tài)分布。例3.5:若,其中:,設(shè)則: (1)其中:即正態(tài)隨機向量的線性函數(shù)還是正態(tài)的。(2)記,則 ,即多元正態(tài)分布隨機向量的任何一個分量子集的分布仍然遵從正態(tài)分布。多元分析中的許多方法,大都假定數(shù)據(jù)來自多元正態(tài)總體。但要判斷已有的一批數(shù)據(jù)是否來自多元正態(tài)總體,是很困難的??墒欠催^來要肯定數(shù)據(jù)不是來自多元正態(tài)總體,比較容易,即如果,則它的每個分量必服從一元正態(tài)分布,因此把每個分量的個樣品值作成直方圖,如果斷定不是正態(tài)分布,就可以斷定隨機向量也不服從正態(tài)分布。三、條件分布和獨立性(一)條件分布若和是任意兩個事件,且,則稱為在事件發(fā)生的條件

18、下,事件發(fā)生的條件概率。由此可以引出條件分布這一概念。設(shè),將做如下剖析在給定時的條件分布仍服從正態(tài)分布,這個結(jié)論是通過下列定理給出的。定理3.1:設(shè),則其中:,該定理告訴我們,的分布與的分布均為正態(tài)分布,它們的協(xié)方差陣分別為和,由于,故。協(xié)方差陣是用來描述指標關(guān)系及散布程度的,說明在已知的條件下,的散布程度比不知道的情況要小,當(dāng)時,兩者相同。可以證明,等價于和相互獨立,這時。即使給出,對的分布也沒有影響。定理3.2:設(shè),將做如下剖析,則 其中 ;,。例3.6:在制定服裝標準時需抽樣進行人體測量,對某年齡段女子的測量結(jié)果如下:為身高,為胸圍,為腰圍,為上體長,為臀圍,已知,其中:,若取,則=而

19、可見利用條件協(xié)方差陣可以求出和的偏相關(guān)系數(shù)。定義3.8.:若給定時,和的偏相關(guān)系數(shù)為例6中,設(shè),則(二)獨立性定理3.3:設(shè),將做如下剖析,其中,則相互獨立,當(dāng)且僅當(dāng)時,對于一切。第四節(jié) 多元正態(tài)分布的參數(shù)估計在多元統(tǒng)計分析中,通常假定被研究的對象服從多元正態(tài)分布,但分布中的參數(shù)和往往是未知的,一般的做法是通過樣本指標對總體的參數(shù)進行估計。一、多元樣本的概念 設(shè)從多元總體中隨機抽取個個體,若相互獨立,且與總體同分布,則稱為該總體的一個多元隨機樣本。每個稱為一個樣品,為第個樣品對第個指標的觀測值,顯然每個樣品都是維向量,將個樣品對個指標都進行觀測,得到如下一個隨機矩陣(觀測矩陣、樣本資料陣):一

20、旦樣本觀測值取定,隨機矩陣就是一個數(shù)據(jù)矩陣。多元分析中的很多方法就是運用各種手段從觀測矩陣出發(fā)去提取有關(guān)信息。值得注意的是:1、多元樣本中的每個樣品,對個指標的觀測值往往是有相關(guān)關(guān)系的,但不同樣品之間的觀測值一定是相互獨立的。2、多元分析所處理的多元樣本觀測數(shù)據(jù)一般都屬于橫截面數(shù)據(jù),即在同一時間不同空間上的數(shù)據(jù)。二、多元樣本的數(shù)字特征定義3.9:設(shè)為來自元總體的樣本,則1、樣本均值向量為:2、樣本離差陣為: 3、樣本協(xié)差陣為:三、的最大似然估計及基本性質(zhì)通過樣本來估計總體參數(shù)叫參數(shù)估計,參數(shù)估計有各種不同的方法,各有其適用的場合。這里用最常用的且具有很多優(yōu)良性質(zhì)的最大似然法給出和的估計量。設(shè)來

21、自于正態(tài)總體樣本容量為的樣本,每個樣本觀察個指標,根據(jù)樣本資料陣,用最大似然估計法求出和的估計量分別為:的估計量具有如下性質(zhì)1、,即是的無偏估計; ,即不是的無偏估計,即是的無偏估計;2、分別是和的有效估計;3、或分別是和一致估計。 第五節(jié) 和的抽樣分布一、樣本均值向量的分布1、正態(tài)總體設(shè),是從總體中抽到的一個樣本,則樣本均值的分布服從正態(tài)分布,即2、非正態(tài)總體在實際問題中,總體分布能夠作正態(tài)近似的畢竟是少數(shù),更多的總體分布不能用正態(tài)近似,甚至我們對總體的情況一無所知,這時,可借助中心極限定理,給出的抽樣分布。中心極限定理:是來自總體的一個樣本,該總體有均值和有限協(xié)方差陣,則當(dāng)樣本容量很大且相

22、對于也很大時,樣本平均數(shù)的分布近似于正態(tài)分布,即二、樣本離差陣的分布樣本均值向量的分布服從正態(tài)分布,樣本離差陣的分布服從怎樣的分布呢?為解決這一問題,現(xiàn)給出維希特(Wishart)分布。維希特分布是統(tǒng)計學(xué)家Wishart在1928年推導(dǎo)出來的,維希特(Wishart)分布是用這位統(tǒng)計學(xué)家的名字命名的。定義3.10:設(shè)(),且相互獨立,則由組成的隨機矩陣:的分布稱為非中心Wishart分布,記為:。其中,為非中心參數(shù),當(dāng)時稱為中心Wishart分布,記為。當(dāng)=1時,此時有,可見Wishart分布是分布在維正態(tài)情況下的推廣。Wishart分布的基本性質(zhì):1、設(shè)(),且相互獨立,則樣本離差陣。2、若

23、,且相互獨立,則3、若,為非奇異矩,則第六節(jié) 上機操作利用Excel的宏功能可以很方便的實現(xiàn)隨機向量協(xié)方差陣和相關(guān)系數(shù)矩陣的計算。在利用描述統(tǒng)計宏功能之前,首先要加載“宏”,方法是:在Excel的“工具”菜單下,點擊“加載宏”,出現(xiàn)加載宏對話框,在該對話框中,用鼠標選擇可用的加載宏,確定后,在“工具”菜單下出現(xiàn)了“數(shù)據(jù)分析”,在數(shù)據(jù)分析對話框中,就可以實現(xiàn)隨機向量協(xié)方差陣和相關(guān)系數(shù)矩陣的計算。 圖3-1 加載宏對話框一、協(xié)方差陣的計算在Excel中實現(xiàn)以本章的例3.4為例加以說明。第一步:在Excel中輸入數(shù)據(jù)。 圖3-2 數(shù)據(jù)輸入第二步:在“工具”菜單下,單擊“數(shù)據(jù)分析”選項,在出現(xiàn)數(shù)據(jù)分析

24、對話框,如圖3-3所示。圖3-3 數(shù)據(jù)分析對話框第三步:在“分析工具”中選擇“協(xié)方差”,確定后出現(xiàn)如圖3-4的對話框。圖3-4 協(xié)方差對話框 第四步:在協(xié)方差對話框的“輸入?yún)^(qū)域”輸入數(shù)據(jù)區(qū)域“B2:E32”,在輸出選項中選擇“輸出區(qū)域”并輸入“f2”,表示在f2單元格輸出計算結(jié)果。待確定后,即可得出計算結(jié)果如圖3-5所示。 圖3-6 協(xié)方差的計算結(jié)果二、相關(guān)系數(shù)矩陣的計算在Excel中實現(xiàn)相關(guān)系數(shù)在Excel中實現(xiàn)的步驟如同協(xié)方差陣在Excel中實現(xiàn),這里從略。三、均值陣(向量)的計算在SPSS中實現(xiàn)利用SPSS數(shù)據(jù)分析軟件計算隨機向量的均值陣的比Excel方便一些。(一)SPSS軟件的簡單介

25、紹。SPSS的數(shù)據(jù)錄入和統(tǒng)計運算有窗口式和編程式兩種。窗口式直觀,與Excel的界面風(fēng)格相同,為一般用戶所熟悉,在這種方式下,可以實現(xiàn)絕大部分的統(tǒng)計運算和處理,后者則為高級用戶所知曉,通過它可以進行更為復(fù)雜或特殊的計算。本書僅在窗口方式下進行操作運算。建立SPSS數(shù)據(jù)文件的第一步就是定義變量,現(xiàn)仍以本章的例3.4為例加以說明。進入SPSS界面后,可以發(fā)現(xiàn)它有Data View(數(shù)據(jù)視窗)和Variable View(變量視窗)兩個界面。單擊Variable View來到變量視窗,如圖3-7。圖3-7 SPSS的變量視窗在Name(變量名稱)下輸入“公司名稱”,單擊Type(變量類型),出現(xiàn)如圖

26、3-8的變量類型對話框。、圖3-8 變量類型對話框在所列的Numeric(數(shù)值型)、Comma(帶逗號的數(shù)值型)、Dot(帶圓點的數(shù)值型)、Scientific notat(科學(xué)計數(shù)法)、Data(日期型)、Dollar(帶美元符號的數(shù)值型)、Custum currency(自定義型)、String(字符串型)中,一般場合多使用Numeric和String。由于公司名稱要用漢字表示,所以,選擇變量是String,按OK即可。而主營業(yè)務(wù)利潤、營業(yè)利潤、利潤總額和凈利潤皆為Numeric的變量類型。圖3-9 變量窗口對話框的內(nèi)容輸入對話框的Width(數(shù)據(jù)寬度)和Decimal(小數(shù)點位數(shù))的缺省

27、值分別為8和2,但可以改變數(shù)據(jù)寬度和小數(shù)點位數(shù)。接著可以定義Lable(變量標簽),因為SPSS的變量名長度為8個標準字符(4個漢字),因此,為了醒目和閱讀的需要,可給出變量名更具體的說明,它就是變量標簽。定義變量的下一個重要環(huán)節(jié)就是Values(變量值標簽)。變量值標簽實際上就是數(shù)據(jù)本身的含義,如果變量是主營業(yè)務(wù)利潤,其涵義自然就靠輸入的數(shù)值大小來表達,但若是性別之類的變量,如“性別”,為了錄入方便,就可以用“1”代表“男性”,“0”代表女性,此時就需要定義變量值標簽,單擊該變量名稱后面的“Values”單元格,出現(xiàn)圖3-10對話框。圖3-10 Value Labels對話框在上方的Value框中輸入1,在下方的Value中輸入男性,單擊“Add”,在大方框中就出現(xiàn)1=“男性”,照此定義0=“女性”。如果需要改變或刪除,單擊大方框中的輸入結(jié)果,分別選擇“Chang”和“Remove”即可。如果已經(jīng)定義了變量值標簽,在菜單“View”下選擇“Value Lable”起用變量值標簽即可。此外,定義變量還有Missing(缺失值)、Columns(變量的顯示寬度)、Align

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論