




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
本課內(nèi)容包含統(tǒng)計(jì)回顧方差分析主成分分析和因子分析聚類(lèi)分析判別分析典型相關(guān)分析對(duì)應(yīng)分析列聯(lián)表Logistic回歸Poisson對(duì)數(shù)線性模型時(shí)間序列分析。。。。統(tǒng)計(jì)基本概念回顧隨機(jī)性和規(guī)律性現(xiàn)實(shí)中的隨機(jī)性和規(guī)律性從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等等。但是在許多領(lǐng)域,很難用如此確定的公式或論述來(lái)描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個(gè)吸煙、喝酒、不鍛煉、而且一口長(zhǎng)葷的人可能比一個(gè)很少得病、生活習(xí)慣良好的人活得長(zhǎng)。因此,可以說(shuō),活得長(zhǎng)短是有一定隨機(jī)性的(randomness)。這種隨機(jī)性可能和人的經(jīng)歷、基因、習(xí)慣等無(wú)數(shù)說(shuō)不清的因素都有關(guān)系?,F(xiàn)實(shí)中的隨機(jī)性和規(guī)律性但是從總體來(lái)說(shuō),我國(guó)公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個(gè)人可能活過(guò)這個(gè)平均年齡,也可能活不到這個(gè)年齡,這是隨機(jī)的。但是總體來(lái)說(shuō),平均年齡的穩(wěn)定性,卻說(shuō)明了隨機(jī)之中有規(guī)律性。這種規(guī)律就是統(tǒng)計(jì)規(guī)律。概率和機(jī)會(huì)你可能經(jīng)常聽(tīng)到概率(probability)這個(gè)名詞。例如在天氣預(yù)報(bào)中會(huì)提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說(shuō)來(lái),概率描述了某件事情發(fā)生的機(jī)會(huì)。顯然,這種概率不可能超過(guò)百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個(gè)數(shù),說(shuō)明某事件發(fā)生的機(jī)會(huì)有多大。有些概率是無(wú)法精確推斷的比如你對(duì)別人說(shuō)你下一個(gè)周末去公園的概率是百分之八十。但你無(wú)法精確說(shuō)出為什么是百分之八十而不是百分之八十四或百分之七十八。其實(shí)你想說(shuō)的是你很可能去,但又沒(méi)有完全肯定。實(shí)際上,到了周末,你或者去,或者不去;不可能有分身術(shù)把百分之八十的你放到公園,而其余的放在別處。有些概率是可以估計(jì)的比如擲骰子。只要沒(méi)有人在骰子上做手腳,你得到6點(diǎn)的概率應(yīng)該是六分之一。得到其他點(diǎn)的概率也是一樣。得到6的概率或者機(jī)會(huì)是可以知道的,但擲骰子的結(jié)果還只可能是六個(gè)數(shù)目之一。這個(gè)已知的規(guī)律就反映了規(guī)律性,而得到哪個(gè)結(jié)果則反映了隨機(jī)性。如果你擲1000次骰子,那么,大約有六分之一的可能會(huì)得到6;這也是隨機(jī)性呈現(xiàn)有規(guī)律的一個(gè)體現(xiàn)。變量做任何事情都要有對(duì)象。比如一個(gè)班上注冊(cè)的學(xué)生有200人,這是一個(gè)固定的數(shù)目,稱(chēng)為常數(shù)(constant)或者常量。但是,如果猜測(cè)今天這個(gè)班有多少人會(huì)來(lái)上課,那就沒(méi)準(zhǔn)了。這有隨機(jī)性??赡苡姓?qǐng)病假或事假的,也可能有逃課的。這樣,就要來(lái)上課的人數(shù)是個(gè)變量(variable)。另外對(duì)于某項(xiàng)政策同意與否的回答,也有“同意”、“不同意”或者“不知道”三種可能值;這也是變量,只不過(guò)不是數(shù)量而已。變量當(dāng)變量按照隨機(jī)規(guī)律所取的值是數(shù)量時(shí)該變量稱(chēng)為定量變量或數(shù)量變量(quantitativevariable);因?yàn)槭请S機(jī)的,也稱(chēng)為隨機(jī)變量(randomvariable)。象性別,觀點(diǎn)之類(lèi)的取非數(shù)量值的變量就稱(chēng)為定性變量或?qū)傩宰兞炕蚍诸?lèi)變量(qualitativevariable,categoricalvariable)。這些定性變量也可以由隨機(jī)變量來(lái)描述,比如男性和女性的數(shù)目,同意某政策人數(shù)的比例等等。只有當(dāng)變量用數(shù)量來(lái)描述時(shí),才有可能建立數(shù)學(xué)模型,才可能使用計(jì)算機(jī)來(lái)分析。數(shù)據(jù)有了變量量的概念念,什么么是數(shù)據(jù)據(jù)呢?拿拿擲骰子子來(lái)說(shuō),,擲骰子子會(huì)得到到什么值值,是個(gè)個(gè)隨機(jī)變變量;而而每次取取得1至至6點(diǎn)中中任意點(diǎn)點(diǎn)數(shù)的概概率它在在理論上上都是六六分之一一(如果果骰子公公平)。。這依賴(lài)賴(lài)于在擲擲骰子背背后的理理論或假假定;而而在實(shí)際際擲骰子子過(guò)程中中,如果果擲100次,,會(huì)得到到100個(gè)由1至6點(diǎn)點(diǎn)組成的的數(shù)字串串;再擲擲100次,又又得到一一個(gè)數(shù)字字串,和和前一次次的結(jié)果果多半不不一樣。。這些試試驗(yàn)結(jié)果果就是數(shù)數(shù)據(jù)。所所以說(shuō),數(shù)據(jù)是關(guān)關(guān)于變量量的觀測(cè)測(cè)值.通過(guò)數(shù)據(jù)據(jù)可以驗(yàn)驗(yàn)證有關(guān)關(guān)的理論論或假定定(比如每每一次得得到每個(gè)個(gè)點(diǎn)的概概率是不不是1/6等等等)。對(duì)對(duì)于顧客客是否喜喜歡某種種飲品的的調(diào)查也也類(lèi)似,,但這里里不象擲擲骰子那那樣事先先可以大大致猜測(cè)測(cè)顧客喜喜歡與否否的概率率。在問(wèn)問(wèn)了1000人人之后,,可能有有364人說(shuō)喜喜歡,而而480人說(shuō)不不喜歡,,其余的的人可能能不回答答,或說(shuō)說(shuō)不知道道,或從從來(lái)沒(méi)有有喝過(guò)這這種飲料料。這些些數(shù)目就就是數(shù)據(jù)據(jù)。當(dāng)然然,它僅僅僅反映映了1000個(gè)個(gè)被問(wèn)到到的人的的觀點(diǎn);;但這對(duì)對(duì)于估計(jì)計(jì)整個(gè)消消費(fèi)群體體的觀點(diǎn)點(diǎn)還是有有用的。。統(tǒng)計(jì)和計(jì)計(jì)算機(jī)現(xiàn)代生活活越來(lái)越越離不開(kāi)開(kāi)計(jì)算機(jī)機(jī)了。最最早使用用計(jì)算機(jī)機(jī)的統(tǒng)計(jì)計(jì)當(dāng)然更更離不開(kāi)開(kāi)計(jì)算機(jī)機(jī)了。事實(shí)上,,最初的計(jì)計(jì)算機(jī)僅僅是為為科學(xué)計(jì)計(jì)算而建建造的。。大型計(jì)計(jì)算機(jī)的的最早一一批用戶戶就包含含統(tǒng)計(jì)。。而現(xiàn)在在統(tǒng)計(jì)仍仍然是進(jìn)進(jìn)行數(shù)字字計(jì)算最最多的用用戶。計(jì)算機(jī)現(xiàn)現(xiàn)在早已已脫離了了僅有計(jì)計(jì)算功能能的單一一模式,,而成為為百姓生活活的一部部分。計(jì)算機(jī)的的使用,,也從過(guò)過(guò)去必須須學(xué)會(huì)計(jì)計(jì)算機(jī)語(yǔ)語(yǔ)言到只只需要““傻瓜式式”地點(diǎn)點(diǎn)擊鼠標(biāo)標(biāo)。結(jié)果果也從單單純的數(shù)數(shù)字輸出出到包括括漂亮的的表格和和圖形的的各種形形式。統(tǒng)計(jì)軟件件統(tǒng)計(jì)軟件件的發(fā)展展,也使使得統(tǒng)計(jì)計(jì)從統(tǒng)計(jì)計(jì)學(xué)家的的圈內(nèi)游游戲變成成了大眾眾的游戲戲。只要要你輸入入你的數(shù)數(shù)據(jù),點(diǎn)點(diǎn)幾下鼠鼠標(biāo),做做一些選選項(xiàng),馬馬上就得得到令人人驚嘆的的漂亮結(jié)結(jié)果了。。你可能會(huì)會(huì)問(wèn),是是否傻瓜瓜式的統(tǒng)統(tǒng)計(jì)軟件件使用可可以代替替統(tǒng)計(jì)課課程了??當(dāng)然不是是。數(shù)據(jù)據(jù)的整理理和識(shí)別別,方法法的選用用,計(jì)算算機(jī)輸出出結(jié)果的的理解都都不象使使用傻瓜瓜相機(jī)那那樣簡(jiǎn)單單可靠。。統(tǒng)計(jì)軟件件有些諸如如法律和和醫(yī)學(xué)方方面的軟軟件都有有不少警警告,不不時(shí)提醒醒你去咨咨詢(xún)專(zhuān)家家。但統(tǒng)計(jì)軟軟件則不不那么負(fù)負(fù)責(zé)。只只要數(shù)據(jù)據(jù)格式無(wú)無(wú)誤、方方法不矛矛盾而且且不用零零作為除除數(shù)就一一定給你你結(jié)果,,而且沒(méi)有任何警警告。另外,統(tǒng)計(jì)計(jì)軟件輸出的結(jié)果果太多;即使是同同樣的方法法,不同軟軟件輸出的的內(nèi)容還不不一樣;有有時(shí)同樣的的內(nèi)容名稱(chēng)稱(chēng)也不一樣樣。這就使使得使用者者大傷腦筋筋。即使是是統(tǒng)計(jì)學(xué)家家也不一定定能解釋所所有的輸出出。因此,,就應(yīng)該特特別留神,,明白自己己是在干什什么。不要在得到到一堆毫無(wú)無(wú)意義的垃垃圾之后還還沾沾自喜喜。統(tǒng)計(jì)軟件統(tǒng)計(jì)軟件的的種類(lèi)很多多。有些功功能齊全,,有些價(jià)格格便宜;有有些容易操操作,有些些需要更多多的實(shí)踐才才能掌握。。還有些是是專(zhuān)門(mén)的軟軟件,只處處理某一類(lèi)類(lèi)統(tǒng)計(jì)問(wèn)題題。面對(duì)太太多的選擇擇往往給決決策帶來(lái)困困難。這里里介紹最常常見(jiàn)的幾種種。統(tǒng)計(jì)軟件SPSS::這是一個(gè)很很受歡迎的的統(tǒng)計(jì)軟件件;它容易易操作,輸輸出漂亮,,功能齊全全,價(jià)格合合理。對(duì)于于非統(tǒng)計(jì)工工作者是很很好的選擇擇。Excel:它嚴(yán)格說(shuō)來(lái)來(lái)并不是統(tǒng)統(tǒng)計(jì)軟件,,但作為數(shù)數(shù)據(jù)表格軟軟件,必然然有一定統(tǒng)統(tǒng)計(jì)計(jì)算功功能。而且且凡是有MicrosoftOffice的的計(jì)算機(jī),,基本上都都裝有Excel。。但要注意意,有時(shí)在在裝Office時(shí)時(shí)沒(méi)有裝數(shù)數(shù)據(jù)分析的的功能,那那就必須裝裝了才行。。當(dāng)然,畫(huà)畫(huà)圖功能是是都具備的的。對(duì)于簡(jiǎn)簡(jiǎn)單分析,,Excel還算方方便,但隨隨著問(wèn)題的的深入,Excel就不那么么“傻瓜””,需要使使用函數(shù),,甚至根本本沒(méi)有相應(yīng)應(yīng)的方法了了。多數(shù)專(zhuān)專(zhuān)門(mén)一些的的統(tǒng)計(jì)推斷斷問(wèn)題還需需要其他專(zhuān)專(zhuān)門(mén)的統(tǒng)計(jì)計(jì)軟件來(lái)處處理。SAS:這是功功能非非常齊齊全的的軟件件;盡盡管價(jià)價(jià)格不不菲,,許多多公司司還是是因?yàn)闉槠涔δ鼙姳姸嗪秃湍承┬┟绹?guó)國(guó)政府府機(jī)構(gòu)構(gòu)認(rèn)可可而使使用。。盡管管現(xiàn)在在已經(jīng)經(jīng)盡量量“傻傻瓜化化”,,仍然然需要要一定定的訓(xùn)訓(xùn)練才才可以以進(jìn)入入。對(duì)對(duì)于基基本統(tǒng)統(tǒng)計(jì)課課程則則不那那么方方便。。統(tǒng)計(jì)軟軟件S-plus:這是是統(tǒng)計(jì)計(jì)學(xué)家家喜愛(ài)愛(ài)的軟軟件。。不僅僅由于于其功功能齊齊全,,而且且由于于其強(qiáng)強(qiáng)大的的編程程功能能,使使得研研究人人員可可以編編制自自己的的程序序來(lái)實(shí)實(shí)現(xiàn)自自己的的理論論和方方法。。它也也在進(jìn)進(jìn)行““傻瓜瓜化””以爭(zhēng)爭(zhēng)取顧顧客。。但仍仍然以以編程程方便便為顧顧客所所青睞睞。R軟件件:這是一一個(gè)免費(fèi)的的,由志志愿者者管理理的軟軟件。。其編編程語(yǔ)語(yǔ)言與與S-plus所基基于的的S語(yǔ)語(yǔ)言一一樣,,很方方便。。還有有不斷斷加入入的各各個(gè)方方向統(tǒng)統(tǒng)計(jì)學(xué)學(xué)家編編寫(xiě)的的統(tǒng)計(jì)計(jì)軟件件包。。同時(shí)時(shí)從網(wǎng)網(wǎng)上可可以不不斷更更新和和增加加有關(guān)關(guān)的軟軟件包包和程程序。。這是是發(fā)展最最快的軟件件,受受到世世界上上統(tǒng)計(jì)計(jì)師生生的歡歡迎。。是用戶戶量增增加最最快的的統(tǒng)計(jì)計(jì)軟件件。對(duì)于于一般般非統(tǒng)統(tǒng)計(jì)工工作者者來(lái)說(shuō)說(shuō),主主要問(wèn)問(wèn)題是是它沒(méi)沒(méi)有““傻瓜瓜化””。統(tǒng)計(jì)軟軟件Minitab:這個(gè)軟軟件是是很方方便的的功能能強(qiáng)大大而又又齊全全的軟軟件,,也已已經(jīng)““傻瓜瓜化””,在在我國(guó)國(guó)用的的不如如SPSS與SAS那么么普遍遍。Statistica::也是功功能強(qiáng)強(qiáng)大而而齊全全的““傻瓜瓜化””的軟軟件,,在我我國(guó)用用的也也不如如SAS與與SPSS那么么普遍遍。Eviews::這是一一個(gè)主主要處處理回回歸和和時(shí)間間序列列的軟軟件。。GAUSS:這是一一個(gè)很很好用用的統(tǒng)統(tǒng)計(jì)軟軟件,,許多多搞經(jīng)經(jīng)濟(jì)的的喜歡歡它。。主要要也是是編程程功能能強(qiáng)大大。目目前在在我國(guó)國(guó)使用用的人人不多多。FORTRAN:這是應(yīng)應(yīng)用于于各個(gè)個(gè)領(lǐng)域域的歷歷史很很長(zhǎng)的的非常常優(yōu)秀秀的編編程軟軟件,,功能能強(qiáng)大大,也也有一一定的的統(tǒng)計(jì)計(jì)軟件件包。。計(jì)算算速度度比這這里介介紹的的都快快得多多。但但需要要編程程和編編譯。。操作作不那那么容容易。。MATLAB::這也是是應(yīng)用用于各各個(gè)領(lǐng)領(lǐng)域的的以編編程為為主的的軟件件,在在工程程上應(yīng)應(yīng)用廣廣泛。。編程程類(lèi)似似于S和R。但但是統(tǒng)統(tǒng)計(jì)方方法不不多。。統(tǒng)計(jì)軟軟件當(dāng)然,,還有有其他他的軟軟件,,沒(méi)有有必要要一一一羅列列。其其實(shí),,聰明明的讀讀者只只要學(xué)學(xué)會(huì)使使用一一種““傻瓜瓜式””軟件件,使使用其其他的的僅僅僅是舉舉一反反三之之勞;;最多多看看看幫助助和說(shuō)說(shuō)明即即可。。如果果只有有英文文幫助助,那那還可可以順順便提提高你你的英英文閱閱讀能能力。。想想看看舉出你你所知知道的的統(tǒng)計(jì)計(jì)應(yīng)用用例子子。舉出日日常生生活中中隨機(jī)機(jī)性和和規(guī)律律性的的例子子。你使用用過(guò)統(tǒng)統(tǒng)計(jì)軟軟件或或者利利用過(guò)過(guò)其他他軟件件中的的統(tǒng)計(jì)計(jì)功能能嗎??你有有什么么經(jīng)驗(yàn)驗(yàn)和體體會(huì)??數(shù)據(jù)的的收集集二手?jǐn)?shù)數(shù)據(jù)每天翻翻開(kāi)報(bào)報(bào)紙或或打開(kāi)開(kāi)電視視,就就可以以看到到各種種數(shù)據(jù)據(jù)。比比如高高速公公路通通車(chē)?yán)锢锍?、、物價(jià)價(jià)指數(shù)數(shù)、股股票行行情、、外匯匯牌價(jià)價(jià)、犯犯罪率率、房房?jī)r(jià)、、流行行病的的有關(guān)關(guān)數(shù)據(jù)據(jù)(確確診病病例、、疑似似病例例、死死亡人人數(shù)和和出院院人數(shù)數(shù)等等等);;當(dāng)然然還有有國(guó)家家統(tǒng)計(jì)計(jì)局定定期發(fā)發(fā)布的的各種種國(guó)家家經(jīng)濟(jì)濟(jì)數(shù)據(jù)據(jù)、海海關(guān)發(fā)發(fā)布的的進(jìn)出出口貿(mào)貿(mào)易數(shù)數(shù)據(jù)等等等。。從中中可以以選取取對(duì)自自己有有用的的信息息。這些間間接得得到的的數(shù)據(jù)據(jù)都是是二手?jǐn)?shù)數(shù)據(jù)。第一手手?jǐn)?shù)據(jù)據(jù)獲得第第一手手?jǐn)?shù)據(jù)據(jù)并不不象得得到二二手?jǐn)?shù)數(shù)據(jù)那那么輕輕松。。某些在在華的的外資資企業(yè)業(yè)每年年至少少要花花三四四千萬(wàn)萬(wàn)元來(lái)來(lái)收集集和分分析數(shù)數(shù)據(jù)。。他們調(diào)調(diào)查其其產(chǎn)品品目前前在市市場(chǎng)中中的狀狀況和和地位位并確確定其其競(jìng)爭(zhēng)爭(zhēng)對(duì)手手的態(tài)態(tài)勢(shì);;他們調(diào)調(diào)查不不同地地區(qū),,不同同階層層的民民眾對(duì)對(duì)其產(chǎn)產(chǎn)品的的認(rèn)知知程度度和購(gòu)購(gòu)買(mǎi)意意愿以以改進(jìn)進(jìn)產(chǎn)品品或推推出新新品種種爭(zhēng)取取新顧顧客;;他們還還收集集各地地方的的經(jīng)濟(jì)濟(jì)交通通等信信息以以決定定如何何保住住現(xiàn)有有市場(chǎng)場(chǎng)和開(kāi)開(kāi)發(fā)新新市場(chǎng)場(chǎng)。市市場(chǎng)信信息數(shù)數(shù)據(jù)對(duì)對(duì)企業(yè)業(yè)是至至關(guān)重重要的的。他們很很舍得得在這這方面面花錢(qián)錢(qián)。因因?yàn)檫@這是企企業(yè)生生存所所必需需的,,絕不不是可可有可可無(wú)的的。觀測(cè)數(shù)數(shù)據(jù)和試驗(yàn)數(shù)數(shù)據(jù)上面所所說(shuō)的的數(shù)據(jù)據(jù)是在在自然的的未被被控制制的條條件下下觀測(cè)測(cè)到的的,稱(chēng)稱(chēng)為觀觀測(cè)數(shù)數(shù)據(jù)(observationaldata)。。而對(duì)于于有些些問(wèn)題題,比如在在不同同的醫(yī)醫(yī)療手手段下下某疾疾病的的治療療結(jié)果果有什什么不不同、、不同同的肥肥料和和土壤壤條件件下某某農(nóng)作作物的的產(chǎn)量量有沒(méi)沒(méi)有區(qū)區(qū)別、、用什什么成成分可可以提提高某某物質(zhì)質(zhì)變成成超導(dǎo)導(dǎo)體的的溫度度等等等。這種在在人工工干預(yù)預(yù)和操操作情情況下下收集集的數(shù)數(shù)據(jù)就就稱(chēng)為為試驗(yàn)驗(yàn)數(shù)據(jù)據(jù)(experimentaldata)。??傮w和和樣本本要想了了解北北京市市民對(duì)對(duì)建設(shè)設(shè)北京京交通通設(shè)施施是以以包括括軌道道運(yùn)輸輸在內(nèi)內(nèi)的公公共交交通工工具為為主還還是以以小汽汽車(chē)為為主的的觀點(diǎn)點(diǎn),需需要進(jìn)進(jìn)行調(diào)調(diào)查;;調(diào)查對(duì)對(duì)象是是所有北北京市市民,調(diào)查查目的是希望望知道道市民民中對(duì)對(duì)這個(gè)個(gè)問(wèn)題題的不不同看看法各各自占占有的的比例。顯然,,不可能能去問(wèn)問(wèn)所有有的北北京市市民,,而只只能夠夠問(wèn)一一部分分;并且且根據(jù)據(jù)這一一部分分的觀觀點(diǎn)來(lái)來(lái)理解解整個(gè)個(gè)北京京市民民的總總體觀觀點(diǎn)。??傮w和和樣本本這種情情況下下,稱(chēng)稱(chēng)所有有(每每個(gè)))北京京市民民對(duì)這這個(gè)問(wèn)問(wèn)題的的觀點(diǎn)點(diǎn)為一一個(gè)總體(population),,而調(diào)調(diào)查時(shí)時(shí)問(wèn)到到的那那部分分市民民的觀觀點(diǎn)為為該總體體的一個(gè)樣樣本(sample)。。當(dāng)然,,也有有可能能調(diào)查查所有有的人人(比比如人人口普普查)),那那叫做做普查(census)。。總體是是包含含所有有要研研究的的個(gè)體體(element)的的集合合。而而樣本本是總總體中中選中中的一一部分分。隨機(jī)樣樣本在抽取取樣本本時(shí),,如果果總體體中的的每一一個(gè)體體都有有同等等機(jī)會(huì)會(huì)被選選到樣樣本中中,這這種抽抽樣稱(chēng)稱(chēng)為簡(jiǎn)簡(jiǎn)單隨機(jī)抽抽樣(simplerandomsampling),,而這樣樣得到到的樣樣本則則稱(chēng)為為隨機(jī)樣樣本(randomsample))。隨機(jī)樣樣本就北京京交通通問(wèn)題題的調(diào)調(diào)查為為例,,在隨隨機(jī)抽抽樣的的情況況下,,如果果樣本本量((samplesize,,也就就是樣樣本中中個(gè)體體的數(shù)數(shù)目))在總總體中中的比比例為為1/5000,那么,,無(wú)論論在東東城區(qū)區(qū)或者者在延延慶縣縣,無(wú)無(wú)論在在白領(lǐng)領(lǐng)階層層還是是藍(lán)領(lǐng)領(lǐng)階層層被問(wèn)問(wèn)到的的人的的比例例都應(yīng)應(yīng)該大大體是是1/5000。也就是是說(shuō),,這種種比比例例在在總總體體的的任任何何部部分分是是大大體體不不變變的的。。方便便樣樣本本在實(shí)實(shí)踐踐中中,,得得到到隨隨機(jī)機(jī)樣樣本本不不容容易易。。很很多多搞搞調(diào)調(diào)查查的的人人就就采采取取簡(jiǎn)單單的辦辦法法。。還以以北北京京的的交交通通問(wèn)問(wèn)題題的的調(diào)調(diào)查查為為例例。。假假定定按按照照隨隨機(jī)機(jī)選選出出的的電電話話號(hào)號(hào)碼碼進(jìn)進(jìn)行行調(diào)調(diào)查查。。這這樣樣肯肯定定節(jié)節(jié)省省時(shí)時(shí)間間和和資資源源,,但但這這樣樣得得到到的的就就不不是是一一個(gè)個(gè)隨隨機(jī)機(jī)樣樣本本了了。。如果果按按照照隨隨機(jī)機(jī)選選擇擇的的數(shù)數(shù)字字((無(wú)無(wú)論論號(hào)號(hào)碼碼本本上上有有沒(méi)沒(méi)有有))打打電電話話,,那那很很多多電電話話是是空空號(hào)號(hào)或或單單位位電電話話;;顯顯然然這這種種樣樣本本也也不不是是隨隨機(jī)機(jī)樣樣本本,,它它稱(chēng)稱(chēng)為為方方便便樣樣本本((conveniencesample))。。在調(diào)調(diào)查查中中,,即即使使選選擇擇對(duì)對(duì)象象的的確確是是隨隨機(jī)機(jī)的的,,最最理理想想的的情情況況所所得得到到的的樣樣本本也也只只代代表表那那些些愿愿意意回回答答問(wèn)問(wèn)題題人人的的觀觀點(diǎn)點(diǎn)所所組組成成的的總總體體;;沒(méi)有有回回答答問(wèn)問(wèn)題題的的人人的的觀觀點(diǎn)點(diǎn)永永遠(yuǎn)遠(yuǎn)不不會(huì)會(huì)被被這這種種調(diào)調(diào)查查的的樣樣本本所所代代表表。。方便便樣樣本本這種種不不回回答答的的問(wèn)問(wèn)題題是是抽抽樣樣調(diào)調(diào)查查特特有有的的問(wèn)問(wèn)題題。。在其其他他問(wèn)問(wèn)題題中中,,也也有有使使用用方方便便樣樣本本的的情情況況。。比比如如在在肺肺癌癌研研究究中中,,人人們們往往往往看看到到吸吸煙煙和和肺肺癌癌的的關(guān)關(guān)系系的的數(shù)數(shù)據(jù)據(jù);;這這些些數(shù)數(shù)據(jù)據(jù)并并不不是是整整個(gè)個(gè)人人群群中中采采集集的的隨隨機(jī)機(jī)樣樣本本;;它它們們可可能能只只是是醫(yī)醫(yī)院院中中的的病病人人記記錄錄中中得得到到的的。。在雜雜志志和和報(bào)報(bào)紙紙上上也也有有問(wèn)問(wèn)卷卷,,但但得得到到的的只只是是擁?yè)碛杏羞@這份份報(bào)報(bào)刊刊,,而而且且愿愿意意回回答答的的人人的的觀觀點(diǎn)點(diǎn)。。誤差差假定定在在某某一一職職業(yè)業(yè)人人群群中中女女性性占占的的比比例例為為60%。。如如果果在在這這個(gè)個(gè)人人群群中中抽抽取取一一些些隨隨機(jī)機(jī)樣樣本本,,這這些些隨隨機(jī)機(jī)樣樣本本中中女女性性的的比比例例并并不不一一定定是是剛剛好好60%%,,可可能能稍稍微微多多些些或或稍稍微微少少些些。。這這是是很很正正常常的的,,因因?yàn)闉闃訕颖颈镜牡奶靥卣髡鞑徊灰灰欢ǘê秃涂偪傮w體完完全全一一樣樣。。這這種種差差異異不不是是錯(cuò)錯(cuò)誤誤,,而而是是必必然然會(huì)會(huì)出出現(xiàn)現(xiàn)的的抽樣樣誤誤差差(samplingerror))。。剛才才提提到到在在抽抽樣樣調(diào)調(diào)查查中中,,一一些些人人因因?yàn)闉榉N種種種原原因因沒(méi)沒(méi)有有對(duì)對(duì)調(diào)調(diào)查查作作出出反反映映((或或回回答答)),,這這種種誤誤差差稱(chēng)稱(chēng)為為未響響應(yīng)應(yīng)誤誤差差(nonresponseerror))。。而另另有有一一些些人人因因?yàn)闉楦鞲鞣N種原原因因回回答答時(shí)時(shí)并并沒(méi)沒(méi)有有真真實(shí)實(shí)反反映映他他們們的的觀觀點(diǎn)點(diǎn),,這這稱(chēng)稱(chēng)為為響應(yīng)應(yīng)誤誤差差(responseerror))。。和抽抽樣樣誤誤差差不不一一樣樣,,未未響響應(yīng)應(yīng)誤誤差差和和響響應(yīng)應(yīng)誤誤差差都都會(huì)會(huì)影影響響對(duì)對(duì)真真實(shí)實(shí)世世界界的的了了解解;;應(yīng)應(yīng)該該在在設(shè)設(shè)計(jì)計(jì)調(diào)調(diào)查查方方案案時(shí)時(shí)盡盡量量避避免免。。抽樣樣調(diào)調(diào)查查的的一一些些常常用用方方法法在抽抽樣樣調(diào)調(diào)查查時(shí)時(shí),,最最理理想想的的樣樣本本是是前前面面提提到到的的隨隨機(jī)機(jī)樣樣本本。。但是是由于于實(shí)實(shí)踐踐起起來(lái)來(lái)不不方方便便,在在大大規(guī)規(guī)模模調(diào)調(diào)查查時(shí)時(shí)一一般般不不用用這這種種全全部部隨隨機(jī)機(jī)抽抽樣樣的的方方式式,,而而只只是是在在局局部部采采用用隨隨機(jī)機(jī)抽抽樣樣的的方方法法。。下面面介介紹紹幾幾種種抽抽樣樣方方法法。。這這里里沒(méi)沒(méi)有有深深?yuàn)W奧的的理理論論;;讀讀者者完完全全可可以以根根據(jù)據(jù)常常識(shí)識(shí)判判斷斷在在什什么么情情況況下下簡(jiǎn)簡(jiǎn)單單的的隨隨機(jī)機(jī)樣樣本本不不方方便便以以及及下下面面的的每每個(gè)個(gè)方方法法有有什什么么好好處處和和缺缺陷陷。。對(duì)對(duì)于于它它們們具具體體的的設(shè)設(shè)計(jì)計(jì)、、實(shí)實(shí)施施與與數(shù)數(shù)據(jù)據(jù)分分析析,,有有許許多多專(zhuān)專(zhuān)門(mén)門(mén)的的書(shū)書(shū)籍籍,,就就不不在在這這里里贅贅述述了了。。一些些抽抽樣樣方方法法1..分層層抽抽樣樣(stratifiedsampling))。。這這是是先先把把要要研研究究的的總總體體按按照照某某些些性性質(zhì)質(zhì)分分類(lèi)類(lèi)((stratum)),,再再在在各各類(lèi)類(lèi)中中分分別別抽抽取取樣樣本本。。在在每每類(lèi)類(lèi)中中調(diào)調(diào)查查的的人人數(shù)數(shù)通通常常是是按按照照這這該該類(lèi)類(lèi)人人的的比比例例,,但但出出于于各各種種考考慮慮,,也也可可能能不不按按照照比比例例,,也也可可能能需需要要加加權(quán)權(quán)((加加權(quán)權(quán)就就是是在在求求若若干干項(xiàng)項(xiàng)的的和和時(shí)時(shí),,對(duì)對(duì)各各項(xiàng)項(xiàng)乘乘以以不不同同的的系系數(shù)數(shù),,這這些些系系數(shù)數(shù)的的和和通通常常為為1))。。比如如可可以以按按照照教教育育程程度度把把要要訪訪問(wèn)問(wèn)的的人人群群分分成成幾幾類(lèi)類(lèi);;再再在在每每一一類(lèi)類(lèi)中中調(diào)調(diào)查查和和該該類(lèi)類(lèi)成成比比例例數(shù)數(shù)目目的的人人。。這樣樣就就確確保保了了每每一一類(lèi)類(lèi)都都有有成成比比例例的的代代表表。。一些抽樣方法法2.整群抽樣(clustersampling)。這是是先把總體劃劃分成若干群群(cluster),,再(通常是是隨機(jī)地)從從這些群中抽抽取幾群;然然后再在這些些抽取的群中中對(duì)個(gè)體進(jìn)行行抽樣。比如,在在某縣進(jìn)進(jìn)行調(diào)查查,首先先在所有有村中選選取若干干村子,,然后只只對(duì)這些些村子的的人進(jìn)行行調(diào)查。。顯然,如如果各村村情況差差異不大大,這種種抽樣還還是方便便的。否否則就會(huì)會(huì)增大誤誤差了。。一些抽樣樣方法3.多級(jí)抽樣樣(multistagesampling)。。在群體體很大時(shí)時(shí),往往往在抽取取若干群群之后,,再在其其中抽取取若干子子群,甚甚至再在在子群中中抽取子子群,等等等。最最后只對(duì)對(duì)最后選選定的最最下面一一級(jí)進(jìn)行行調(diào)查。。比如在全全國(guó)調(diào)查查時(shí),先先抽取省省,再抽抽取市地地,再抽抽取縣區(qū)區(qū),再抽抽取鄉(xiāng)、、村直到到戶。在多級(jí)抽抽樣中的的每一級(jí)級(jí)都可能能采取各各種抽樣樣方法。。因此,,整個(gè)抽抽樣計(jì)劃劃可能比比較復(fù)雜雜,也稱(chēng)稱(chēng)為多級(jí)級(jí)混和型型抽樣。。一些抽樣樣方法4.系統(tǒng)抽樣樣(systematicsampling)。。這是先先把總體體中的每每個(gè)單元元編號(hào),,然后隨隨機(jī)選取取其中之之一作為為抽樣的的開(kāi)始點(diǎn)點(diǎn)進(jìn)行抽抽樣。如如果編號(hào)號(hào)是隨機(jī)機(jī)選取的的,則這這和簡(jiǎn)單單隨機(jī)抽抽樣是等等價(jià)的。。在選取取開(kāi)始點(diǎn)點(diǎn)之后,,通常從從開(kāi)始點(diǎn)點(diǎn)開(kāi)始按按照編號(hào)號(hào)進(jìn)行所所謂等距距抽樣;;也就是是說(shuō),如如果開(kāi)始始點(diǎn)為5號(hào),““距離””為10,則下下面的調(diào)調(diào)查對(duì)象象為15號(hào)、25號(hào)等等等。抽樣方法法的選擇擇不能一一概而論論實(shí)際上每每個(gè)抽樣樣通常都都可能是是各種抽抽樣方法法的組合合。既要要考慮精精確度,,還要根根據(jù)客觀觀情況考考慮方便便性、可可行性和和經(jīng)濟(jì)性性。不能能一概而而論。計(jì)算機(jī)中中常用的的數(shù)據(jù)形形式數(shù)據(jù)是由由一些變變量和它它們的觀觀測(cè)值所所組成。。下面就就是調(diào)查查人們對(duì)對(duì)某個(gè)問(wèn)問(wèn)題觀點(diǎn)點(diǎn)的一個(gè)個(gè)數(shù)據(jù)的的方陣形形式。其其中有6個(gè)變量量:觀點(diǎn)點(diǎn)(觀測(cè)測(cè)值為支支持、反反對(duì)和不不知道三三種)、、教育程程度(有有高中低低三種取取值,用用H、M、L表表示)、、月收入入(取值值為實(shí)際際數(shù)字))、性別別(取值值有男女女兩個(gè),,用M和和F表示示)以及及地區(qū)號(hào)號(hào)(用數(shù)數(shù)字1,,2,3,4表表示)等等。該表表一共有有1364個(gè)觀觀測(cè)值((問(wèn)卷回回答)。??梢钥纯闯鲞@些些變量有有定性((屬性))變量,,也有定定量(數(shù)數(shù)值)變變量。按按照這個(gè)個(gè)數(shù)據(jù)的的格式,,每一列列為一個(gè)個(gè)變量的的不同觀觀測(cè)值;;而每一一行則稱(chēng)稱(chēng)為一個(gè)個(gè)觀測(cè)值值,它是是個(gè)由數(shù)數(shù)量值和和屬性值值組成的的向量,,每一個(gè)個(gè)值相應(yīng)應(yīng)于一個(gè)個(gè)變量。。思考1.舉舉出一一些觀測(cè)測(cè)數(shù)據(jù)和和試驗(yàn)數(shù)數(shù)據(jù)的例例子。2.舉舉出簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本的的例子。。3.根根據(jù)你你的經(jīng)驗(yàn)驗(yàn),舉出出總體和和樣本的的一些具具體例子子。4.舉舉出調(diào)調(diào)查抽樣樣時(shí)可能能發(fā)生的的各種影影響調(diào)查查結(jié)果的的問(wèn)題,,并且提提出你認(rèn)認(rèn)為可以以減少或或避免這這些問(wèn)題題的建議議。5.根根據(jù)你你的直覺(jué)覺(jué),本章章提到的的幾種抽抽樣方法法的優(yōu)缺缺點(diǎn)是什什么?原原因何在在?6.舉舉出一一些書(shū)報(bào)報(bào)上發(fā)表表的數(shù)據(jù)據(jù)例子,,并指出出那些是是變量,,哪些是是觀測(cè)值值。數(shù)據(jù)的描描述如同給人人畫(huà)像一一樣直方圖比如某個(gè)個(gè)地區(qū)((地區(qū)1)學(xué)校校高三男男生的身身高;有有163個(gè)度量量如何用用圖形來(lái)來(lái)表示這這個(gè)數(shù)據(jù)據(jù),使人人們能夠夠看出這這個(gè)數(shù)據(jù)據(jù)的大體體分布或或“形狀狀”呢??一個(gè)辦辦法就是是畫(huà)一個(gè)個(gè)直方圖圖(histogram)。。盒型圖比直方圖圖簡(jiǎn)單一一些的是是盒形圖圖(boxplot,,又稱(chēng)箱箱圖、箱箱線圖、、盒子圖圖)。后后面圖的的左邊一一個(gè)是根根據(jù)地區(qū)區(qū)1高三三男生的的身高數(shù)數(shù)據(jù)所繪繪的盒形形圖;其其右邊的的圖代表表另一個(gè)個(gè)地區(qū)((地區(qū)2)的高高三學(xué)生生的身高高莖葉圖地區(qū)1高高三男生生身高數(shù)數(shù)據(jù)的莖莖葉圖HEIGHTStem-and-LeafPlotFrequencyStem&Leaf9.0015.00122334417.0015.5566666777889999920.0016.0111222222333333344435.0016.5555566666666777778888888888899999925.0017.000000001111222223333334424.0017.55566667777777777788889913.0018.011111112233311.0018.556677888994.0019.23332.0019.563.00Extremes(>=198)Stemwidth:10.00Eachleaf:1case(s)散點(diǎn)圖往往人們們得到的的數(shù)據(jù)有有兩個(gè)變變量的,,比如美美國(guó)男士士和女士士初婚年年限的數(shù)數(shù)據(jù)。該該數(shù)據(jù)描描述了自自1900年到1998年男女第第一次結(jié)結(jié)婚延續(xù)續(xù)的時(shí)間間的中位位數(shù)。當(dāng)當(dāng)然,不不可能將將所有人人的婚姻姻年限都都給出來(lái)來(lái)。所以以,每年年就取了了一個(gè)中中間的值值(中位數(shù))作為代表表。自1900到1960年是每十十年一個(gè)個(gè)值,以以后到1990是每五年年取一個(gè)個(gè)數(shù),1995年以后是是每年一一個(gè)數(shù)。。這里的的一個(gè)變變量為記記錄年份份,另一一個(gè)是結(jié)結(jié)婚時(shí)間間長(zhǎng)短。。由于分分男士和和女士,,因此有有兩二維維數(shù)據(jù)。。這時(shí)可可以以一一個(gè)變量量為橫坐坐標(biāo)(如如年份)),另一一個(gè)為縱縱坐標(biāo)((這里是是結(jié)婚年年限)來(lái)來(lái)點(diǎn)圖。。這種圖圖稱(chēng)為散散點(diǎn)圖((scatterplot)。還可可以看出出在二十十世紀(jì)六六十年代代婚姻年年限降低低,而后后來(lái)又升升高。而而男子的的年限平平均比女女性長(zhǎng)。。這個(gè)圖圖是用SPSS畫(huà)的。定性變量量的點(diǎn)圖圖定性變量量(或?qū)賹傩宰兞苛浚诸?lèi)類(lèi)變量))不能點(diǎn)點(diǎn)出直方方圖、散散點(diǎn)圖或或莖葉圖圖,但可可以描繪繪出它們們各類(lèi)的的比例。。下面用用SPSS繪的圖表表示了說(shuō)說(shuō)世界各各種主要要語(yǔ)言的的人數(shù)的的比例餅圖條形圖匯總統(tǒng)計(jì)計(jì)量或概括統(tǒng)計(jì)計(jì)量(summarystatistic)匯總統(tǒng)計(jì)計(jì)量(位位置)均值(mean)中位數(shù)(median)(第一,,第三)四分位位數(shù)(點(diǎn)點(diǎn))(firstquantile,thirdquantile)k-百分分位數(shù)(k-percentile)眾數(shù)(mode)匯總統(tǒng)計(jì)計(jì)量(尺尺度)(scalestatistic)極差(range)四分位間間距(四四分位極極差)(interquantilerange)標(biāo)準(zhǔn)差(standarddeviation)方差(variance)兩個(gè)尺度度不同的的數(shù)據(jù)的的直方圖圖,左邊邊的標(biāo)準(zhǔn)準(zhǔn)差大約約只有右右邊的一一半數(shù)據(jù)的標(biāo)標(biāo)準(zhǔn)得分分(standardscore)兩個(gè)水平平類(lèi)似的的班級(jí)((一班和和二班))上同一一門(mén)課,,但是由由于兩個(gè)個(gè)任課老老師的評(píng)評(píng)分標(biāo)準(zhǔn)準(zhǔn)不同,,使得兩兩個(gè)班成成績(jī)的均均值和標(biāo)標(biāo)準(zhǔn)差都都不一樣樣(數(shù)據(jù)據(jù):grade.sav)。。一班分分?jǐn)?shù)的均均值和標(biāo)標(biāo)準(zhǔn)差分分別為78.53和9.43,而二二班的均均值和標(biāo)標(biāo)準(zhǔn)差分分別為70.19和7.00。那么么得到90分的的一班的的張穎是是不是比比得到82分的的二班的的劉疏成成績(jī)更好好呢?怎怎么比較較才能合合理呢??雖然這這種均值值和標(biāo)準(zhǔn)準(zhǔn)差不同同的數(shù)據(jù)據(jù)不能夠夠直接比比較,但但是可以以把它們們進(jìn)行標(biāo)標(biāo)準(zhǔn)化,,然后再再比較標(biāo)標(biāo)準(zhǔn)化后后的數(shù)據(jù)據(jù)。一個(gè)個(gè)標(biāo)準(zhǔn)化化的方法法是把原原始觀測(cè)測(cè)值(亦亦稱(chēng)得分分,score)和均均值之差差除以標(biāo)標(biāo)準(zhǔn)差;;得到的的度量稱(chēng)稱(chēng)為標(biāo)準(zhǔn)準(zhǔn)得分(standardscore)。思考1.根根據(jù)你你的經(jīng)驗(yàn)驗(yàn),給出出定性和和定量變變量的例例子。2.對(duì)對(duì)于問(wèn)問(wèn)題1中中你的例例子,試試圖畫(huà)出出各種描描述性圖圖形并計(jì)計(jì)算匯總總統(tǒng)計(jì)量量。3.舉舉例說(shuō)說(shuō)明眾數(shù)數(shù)、中位位數(shù)和均均值的優(yōu)優(yōu)缺點(diǎn)。。4.舉舉例說(shuō)說(shuō)明尺度度統(tǒng)計(jì)量量說(shuō)明了了數(shù)據(jù)的的什么特特性。5.標(biāo)標(biāo)準(zhǔn)得分分實(shí)際上上是對(duì)原原始數(shù)據(jù)據(jù)的一種種標(biāo)準(zhǔn)化化。試舉舉出標(biāo)準(zhǔn)準(zhǔn)得分的的用處。。統(tǒng)計(jì)推斷斷從數(shù)據(jù)得得到對(duì)現(xiàn)現(xiàn)實(shí)世界界的結(jié)論論的過(guò)程程估計(jì)總體它代代表我們們所關(guān)心心的那部部分現(xiàn)實(shí)實(shí)世界。。而在利利用樣本本中的信信息來(lái)對(duì)對(duì)總體進(jìn)進(jìn)行推斷斷之前人人們一般般對(duì)代表表總體的的變量假假定了分分布族。。比如假假定人們們的身高高屬于正正態(tài)分布布族;對(duì)對(duì)抽樣調(diào)調(diào)查假定定了二項(xiàng)項(xiàng)分布族族等等。。這些模模型基本本上是根根據(jù)經(jīng)驗(yàn)驗(yàn)來(lái)假定定的,所所以?xún)H僅僅是對(duì)現(xiàn)現(xiàn)實(shí)世界界的一個(gè)個(gè)近似。。在假定定了總體體分布族族之后,,進(jìn)一步步對(duì)總體體的認(rèn)識(shí)識(shí)就是要要在這個(gè)個(gè)分布族族中選擇擇一個(gè)適適合于我我們問(wèn)題題的分布布;由于于分布族族成員是是由參數(shù)數(shù)確定的的,如果果參數(shù)能能夠估計(jì)計(jì),對(duì)總總體的具具體分布布就知道道得差不不多了。。估計(jì)一種是點(diǎn)點(diǎn)估計(jì)(pointestimation),,也就是是用估計(jì)計(jì)量的實(shí)實(shí)現(xiàn)值來(lái)來(lái)近似相相應(yīng)的總總體參數(shù)數(shù)。另一種是是區(qū)間估估計(jì)(intervalestimation);它它是包括括估計(jì)量量在內(nèi)((有時(shí)是是以估計(jì)計(jì)量為中中心)的的一個(gè)區(qū)區(qū)間;該該區(qū)間被被認(rèn)為很很可能包包含總體體參數(shù)。。點(diǎn)估計(jì)給給出一個(gè)個(gè)數(shù)字,,用起來(lái)來(lái)很方便便;而區(qū)區(qū)間估計(jì)計(jì)給出一一個(gè)區(qū)間間,說(shuō)起起來(lái)留有有余地;;不象點(diǎn)點(diǎn)估計(jì)那那么絕對(duì)對(duì)。無(wú)偏估計(jì)計(jì)(大樣樣本性質(zhì)質(zhì))區(qū)間估計(jì)計(jì)的置信信度(大大樣本性性質(zhì))估計(jì)注意置信信區(qū)間的的論述是是由區(qū)間間和置信信度兩部部分組成成。有些些新聞媒媒體報(bào)道道一些調(diào)調(diào)查結(jié)果果只給出出百分比比和誤差差(即置置信區(qū)間間),并并不說(shuō)明明置信度度,也不不給出被被調(diào)查的的人數(shù),,這是不不負(fù)責(zé)的的表現(xiàn)。。因?yàn)榻到档椭眯判哦瓤梢砸允怪眯判艆^(qū)間變變窄(顯顯得“精精確”)),有誤誤導(dǎo)讀者者之嫌。。如果給給出被調(diào)調(diào)查的人人數(shù),則則內(nèi)行可可以由推推算出置置信度((由后面面給出的的公式)),反之之亦然。。一個(gè)描述述性例子子一個(gè)有10000個(gè)人人回答的的調(diào)查顯顯示,同同意某種種觀點(diǎn)的的人的比比例為70%((有7000人人同意)),可以以算出總總體中同同意該觀觀點(diǎn)的比比例的95%置置信區(qū)間間為(0.691,0.709);;另一個(gè)個(gè)調(diào)查聲聲稱(chēng)有70%的的比例反反對(duì)該種種觀點(diǎn),,還說(shuō)總總體中反反對(duì)該觀觀點(diǎn)的置置信區(qū)間間也是((0.691,,0.709))。到底底相信誰(shuí)誰(shuí)呢?實(shí)實(shí)際上,,第二個(gè)個(gè)調(diào)查隱隱瞞了置置信度((等價(jià)于于隱瞞了了樣本量量)。如如果第二二個(gè)調(diào)查查僅僅調(diào)調(diào)查了50個(gè)人人,有35個(gè)人人反對(duì)該該觀點(diǎn)。。根據(jù)后后面的公公式可以以算出,,第二個(gè)個(gè)調(diào)查的的置信區(qū)區(qū)間的置置信度僅僅有11%。假設(shè)檢檢驗(yàn)在假設(shè)設(shè)檢驗(yàn)驗(yàn)中,,一般般要設(shè)設(shè)立一一個(gè)原原假設(shè)設(shè);而而設(shè)立立該假假設(shè)的的動(dòng)機(jī)機(jī)主要要是企企圖利利用人人們掌掌握的的反映映現(xiàn)實(shí)實(shí)世界界的數(shù)數(shù)據(jù)來(lái)來(lái)找出出假設(shè)設(shè)和現(xiàn)現(xiàn)實(shí)的的矛盾盾,從從而否否定這這個(gè)假假設(shè)。。在多多數(shù)統(tǒng)統(tǒng)計(jì)教教科書(shū)書(shū)中((除了了理論論探討討之外外)的的假設(shè)設(shè)檢驗(yàn)驗(yàn)都是是以否否定原原假設(shè)設(shè)為目目標(biāo)。。如果否否定不不了,,那就就說(shuō)明明證據(jù)據(jù)不足足,無(wú)無(wú)法否否定原原假設(shè)設(shè)。但但這不不能說(shuō)說(shuō)明原原假設(shè)設(shè)正確確。很很多教教科書(shū)書(shū)在這這個(gè)問(wèn)問(wèn)題上上不適適當(dāng)?shù)氐赜谩啊敖邮苁茉偌僭O(shè)””的說(shuō)說(shuō)法,,犯了了明顯顯的低低級(jí)邏邏輯錯(cuò)錯(cuò)誤。。假設(shè)檢檢驗(yàn)的的過(guò)程程和邏邏輯首先要要提出出一個(gè)個(gè)原假假設(shè),,比如如某正正態(tài)總總體的的均值值等于于5((m=5))。這這種原原假設(shè)設(shè)也稱(chēng)稱(chēng)為零零假設(shè)設(shè)(nullhypothesis),,記為為H0。與此同同時(shí)必必須提提出對(duì)對(duì)立假假設(shè),,比如如總體體均值值大于于5((m>5))。對(duì)對(duì)立假假設(shè)又又稱(chēng)為為備選選假設(shè)設(shè)或備備擇假假設(shè)((alternativehypothesis)記記為記記為H1或Ha。假設(shè)檢檢驗(yàn)的的過(guò)程程和邏邏輯根據(jù)零零假設(shè)設(shè)(不是是備選選假設(shè)設(shè)!)),我我們可可以得得到該該檢驗(yàn)驗(yàn)統(tǒng)計(jì)計(jì)量的的分布布;然后再再看這這個(gè)統(tǒng)統(tǒng)計(jì)量量的數(shù)數(shù)據(jù)實(shí)實(shí)現(xiàn)值值(realization)屬屬不屬屬于小小概率率事件件。也也就是是說(shuō)把把數(shù)據(jù)據(jù)代入入檢驗(yàn)驗(yàn)統(tǒng)計(jì)計(jì)量,,看其其值是是否落落入零零假設(shè)設(shè)下的的小概概率范范疇;;如果的的確是是小概概率事事件,,那么么我們們就有有可能能拒絕絕零假假設(shè),,否則則我們們說(shuō)沒(méi)沒(méi)有足足夠證證據(jù)拒拒絕零零假設(shè)設(shè)。假設(shè)檢檢驗(yàn)的的過(guò)程程和邏邏輯注意::零假設(shè)設(shè)和備備選假假設(shè)在在假設(shè)設(shè)檢驗(yàn)驗(yàn)中并并不對(duì)對(duì)稱(chēng)。因檢檢驗(yàn)統(tǒng)統(tǒng)計(jì)量量的分分布是是從零零假設(shè)設(shè)導(dǎo)出出的,,因此此,如如果發(fā)發(fā)生矛矛盾,,當(dāng)然然就對(duì)對(duì)零假假設(shè)不不利了了。不發(fā)生矛盾也也不說(shuō)明備選選假設(shè)有問(wèn)題題(因?yàn)楹蛡鋫溥x假設(shè)無(wú)關(guān)關(guān))。假設(shè)檢驗(yàn)的過(guò)過(guò)程和邏輯檢驗(yàn)統(tǒng)計(jì)量在在零假設(shè)下等等于這個(gè)樣本本的數(shù)據(jù)實(shí)現(xiàn)現(xiàn)值或更加極極端值的概率率稱(chēng)為p-值(p-value))。顯然得到很小小p-值意味著小小概率事件發(fā)發(fā)生了。如果果小概率事件件發(fā)生,是相相信零假設(shè),,還是相信數(shù)數(shù)據(jù)呢?當(dāng)然是相信數(shù)數(shù)據(jù)。于是就就拒絕零假設(shè)設(shè)。但小概率率并不能說(shuō)明明不會(huì)發(fā)生,,僅僅發(fā)生的的概率很小罷罷了。拒絕正確零假假設(shè)的錯(cuò)誤常常被稱(chēng)為第一一類(lèi)錯(cuò)誤(typeIerror)。假設(shè)檢驗(yàn)的過(guò)過(guò)程和邏輯有第一類(lèi)錯(cuò)誤誤,就有第二二類(lèi)錯(cuò)誤;那那是備選零假假設(shè)正確時(shí)反反而說(shuō)零假設(shè)設(shè)正確的錯(cuò)誤誤,稱(chēng)為第二二類(lèi)錯(cuò)誤(typeIIerror)。零假設(shè)和備選選假設(shè)哪一個(gè)個(gè)正確,這是是確定性的,,沒(méi)有概率可可言。而可能犯錯(cuò)誤
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)書(shū)主要觀點(diǎn)
- ??谡n題立項(xiàng)申報(bào)書(shū)
- 農(nóng)村磚房拆墻合同范本
- 【復(fù)習(xí)大串講】【中職專(zhuān)用】高二語(yǔ)文上學(xué)期期末期末綜合測(cè)試題(二)(職業(yè)模塊)(原卷版)
- 刀出售合同范本
- 吧臺(tái)設(shè)備采購(gòu)合同范例
- 醫(yī)療耗材oem合同范本
- 住房房屋裝修合同范本
- 老舊農(nóng)機(jī)淘汰更新工作方案
- 賣(mài)雞銷(xiāo)售合同范例
- 《無(wú)損檢測(cè)(第2版)》 課件緒論
- 腎上腺腫物的護(hù)理(演示模板)
- 2024年湖南工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)參考答案
- 電工流體 變壓器和開(kāi)關(guān)用的未使用過(guò)的礦物絕緣油
- 2024年安徽醫(yī)學(xué)高等專(zhuān)科學(xué)校單招職業(yè)適應(yīng)性測(cè)試題庫(kù)帶答案
- 聲門(mén)下分泌物引流的應(yīng)用專(zhuān)家講座
- 7.1.2全概率公式課件高二下學(xué)期數(shù)學(xué)人教A版選擇性
- 硝酸脂類(lèi)藥物的作用注意事項(xiàng)不良反應(yīng)
- 科普版小學(xué)英語(yǔ)六年級(jí)下冊(cè)全冊(cè)教案
- 腦梗合并心衰護(hù)理查房
- 婦聯(lián)普法知識(shí)競(jìng)賽參考試題庫(kù)300題(含答案)
評(píng)論
0/150
提交評(píng)論