第1章 多元分析概述課件_第1頁(yè)
第1章 多元分析概述課件_第2頁(yè)
第1章 多元分析概述課件_第3頁(yè)
第1章 多元分析概述課件_第4頁(yè)
第1章 多元分析概述課件_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

寧夏醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系郭忠琴guozq_第1章多元分析概述1推薦教材:本課程不指定專用教材,同學(xué)可自行選擇符合自己要求的教材:《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》,孫振球,人民衛(wèi)生出版社,2002《多元統(tǒng)計(jì)分析》,何曉群,中國(guó)人民大學(xué)出版社,2004《現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用》,何曉群,中國(guó)人民大學(xué)出版社,1999,研究生教材《實(shí)用多元統(tǒng)計(jì)分析》,RichardA.Johnson著,陸璇等譯,清華大學(xué)出版社,2001,MBA教材《應(yīng)用多元分析》,王學(xué)民,第二版,上海財(cái)經(jīng)大學(xué)出版社,2004《醫(yī)用多元統(tǒng)計(jì)方法》,張家放主編,華中科技出版社,2002年版《應(yīng)用多元統(tǒng)計(jì)分析》,高惠璇,北京大學(xué)出版社,2005第1章多元分析概述1本課程側(cè)重于介紹多元統(tǒng)計(jì)方法的實(shí)際應(yīng)用與動(dòng)手能力。第1章多元分析概述1小插曲:多元統(tǒng)計(jì)分析在文學(xué)研究中的應(yīng)用第1章多元分析概述1眾所周知,《紅樓夢(mèng)》一書(shū)共120回,一般認(rèn)為前80回為曹雪芹所寫(xiě),后40回為高鶚?biāo)m(xù),長(zhǎng)期以來(lái)對(duì)這個(gè)問(wèn)題一直有爭(zhēng)議。能否從數(shù)學(xué)上做出論證?

1985、1986復(fù)旦大學(xué)李賢平教授帶領(lǐng)他的學(xué)生作了這項(xiàng)有意義的工作,他們創(chuàng)造性想法是將120回看成是120個(gè)樣本,然后確定與情節(jié)無(wú)關(guān)的虛詞作為變量(所以要拋開(kāi)情節(jié),是因?yàn)樵谝话闱闆r下,同一情節(jié)大家描述的都差不多,但由于個(gè)人寫(xiě)作特點(diǎn)和習(xí)慣的不同,所用的虛詞是不會(huì)一樣的),計(jì)算出每一回里變量出現(xiàn)的次數(shù),用聚類分析法進(jìn)行分類,果然將120回分成兩類即前80回為一類,后40回為一類,很形象地證實(shí)了不是出自同一人的手筆。

之后,又進(jìn)一步分析前80回是否為曹雪芹所寫(xiě)?這時(shí)又找了一本曹雪芹的其它著作,做了類似計(jì)算,結(jié)果證實(shí)了用詞手法完全相同,斷定為曹雪芹一人手筆。而后40回是否為高鶚寫(xiě)的呢?論證結(jié)果推翻了“后40回是高鶚一個(gè)人所寫(xiě)。這個(gè)論證在紅學(xué)界轟動(dòng)很大,他們用多元統(tǒng)計(jì)分析方法支持了紅學(xué)界觀點(diǎn),使紅學(xué)界大為贊嘆。第1章多元分析概述1第一章多元分析概述第一節(jié)

引言第二節(jié)

應(yīng)用背景第三節(jié)

計(jì)算機(jī)在統(tǒng)計(jì)分析中的應(yīng)用第1章多元分析概述1第一節(jié)引言

在信息爆炸的今天,人們已經(jīng)意識(shí)到數(shù)據(jù)最值錢(qián)的時(shí)代已經(jīng)到來(lái)。隨著Internet的日益普及,各行各業(yè)都開(kāi)始采用計(jì)算機(jī)及相應(yīng)的信息技術(shù)進(jìn)行管理和決策,這使得各企事業(yè)單位生成、收集、存儲(chǔ)和處理數(shù)據(jù)的能力大大提高,數(shù)據(jù)量與日俱增,大量復(fù)雜信息層出不窮。但是,大量信息在給人們帶來(lái)方便的同時(shí)也帶來(lái)一系列問(wèn)題。比如:第1章多元分析概述1第一節(jié)引言

信息量過(guò)大,超過(guò)了人們掌握、消化的能力;一些信息真?zhèn)坞y辯,從而給信息的正確應(yīng)用帶來(lái)困難;信息組織形式的不一致性導(dǎo)致難以對(duì)信息進(jìn)行有效統(tǒng)一處理等等。第1章多元分析概述1這種變化使傳統(tǒng)的數(shù)據(jù)處理手段已經(jīng)不能滿足要求。近30年來(lái),隨著計(jì)算機(jī)應(yīng)用技術(shù)的發(fā)展和科研生產(chǎn)的迫切需要,多元統(tǒng)計(jì)分析技術(shù)被廣泛地應(yīng)用于地質(zhì)、氣象、水文、醫(yī)學(xué)、工業(yè)、農(nóng)業(yè)和經(jīng)濟(jì)等許多領(lǐng)域,已經(jīng)成為解決實(shí)際問(wèn)題的有效方法。多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)方法來(lái)研究解決多指標(biāo)問(wèn)題的理論和方法。第1章多元分析概述1多元統(tǒng)計(jì)分析起源于上世紀(jì)初,1928年Wishart發(fā)表論文《多元正態(tài)總體樣本協(xié)差陣的精確分布》,可以說(shuō)是多元分析的開(kāi)端。20世紀(jì)30年代R.A.Fisher、H.Hotelling、S.N.Roy、許寶騄等人作了一系列得奠基性工作,使多元分析在理論上得到了迅速得發(fā)展。20世紀(jì)40年代,多元統(tǒng)計(jì)分析在心理、教育、生物等方面有不少得應(yīng)用,但由于計(jì)算量大,使其發(fā)展受到影響,甚至停滯了相當(dāng)長(zhǎng)得時(shí)間。第1章多元分析概述120世紀(jì)50年代中期,隨著電子計(jì)算機(jī)得出現(xiàn)和發(fā)展,使多元分析方法在地質(zhì)、氣象、醫(yī)學(xué)、社會(huì)學(xué)等方面得到廣泛得應(yīng)用。20世紀(jì)60年代通過(guò)應(yīng)用和實(shí)踐又完善和發(fā)展了理論,由于新的理論、新的方法不斷涌現(xiàn)又促使它的應(yīng)用范圍更加擴(kuò)大。第1章多元分析概述120世紀(jì)70年代初期在我國(guó)受到各個(gè)領(lǐng)域的極大關(guān)注,并在多元統(tǒng)計(jì)分析的理論研究和應(yīng)用上也取得了很多顯著成績(jī),有些研究工作已達(dá)到國(guó)際水平。第1章多元分析概述1在20世紀(jì)末與本世紀(jì)初,人們獲得的數(shù)據(jù)正以前所未有的速度急劇增加,產(chǎn)生了很多超大型數(shù)據(jù)庫(kù),遍及超級(jí)市場(chǎng)銷售、銀行存款、天文學(xué)、粒子物理、化學(xué)、醫(yī)學(xué)以及政府統(tǒng)計(jì)等領(lǐng)域,多元統(tǒng)計(jì)與人工智能和數(shù)據(jù)庫(kù)技術(shù)相結(jié)合,已在經(jīng)濟(jì)、商業(yè)、金融、天文等行業(yè)得到了成功的應(yīng)用。第1章多元分析概述1為了讓人們更好的較為系統(tǒng)地掌握多元統(tǒng)計(jì)分析的理論與方法,本門(mén)課程重點(diǎn)介紹多元正態(tài)總體的參數(shù)估計(jì)和假設(shè)檢驗(yàn)以及常用的統(tǒng)計(jì)方法。這些方法包括方差分析、判別分析、聚類分析、主成分分析、因子分析、對(duì)應(yīng)分析、典型相關(guān)分析等。同時(shí),我們將利用在我國(guó)廣泛流行的SPSS統(tǒng)計(jì)軟件來(lái)實(shí)現(xiàn)實(shí)證分析,做到在理論的學(xué)習(xí)中體會(huì)應(yīng)用,在應(yīng)用的分析中加深理論。第1章多元分析概述1多元統(tǒng)計(jì)分析方法的應(yīng)用統(tǒng)計(jì)方法是科學(xué)研究的一種重要工具,其應(yīng)用頗為廣泛。特別地,多元統(tǒng)計(jì)分析方法常常被應(yīng)用于自然科學(xué)、社會(huì)科學(xué)等領(lǐng)域的問(wèn)題中。多元統(tǒng)計(jì)分析方法在經(jīng)濟(jì)管理、農(nóng)業(yè)、醫(yī)學(xué)、教育學(xué)、體育科學(xué)、生態(tài)學(xué)、地質(zhì)學(xué)、社會(huì)學(xué)、考古學(xué)、環(huán)境保護(hù)、軍事科學(xué)、文學(xué)等方面都有廣泛的應(yīng)用。這里我們例舉一些多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域,讓同學(xué)從感性上加深對(duì)多元統(tǒng)計(jì)分析的認(rèn)識(shí),請(qǐng)參看下表。第二節(jié)應(yīng)用背景第1章多元分析概述1表1.1統(tǒng)計(jì)方法和研究目的之間的關(guān)系問(wèn)題內(nèi)容方法數(shù)據(jù)或結(jié)構(gòu)性化簡(jiǎn)盡可能簡(jiǎn)單地表示所研究的現(xiàn)象,但不損失很多有用的信息,并希望這種表示能夠很容易的解釋。多元回歸分析、聚類分析、主成分分析、因子分析、相應(yīng)分析、多維標(biāo)度法、可視化分析分類和組合基于所測(cè)量到的一些特征,給出好的分組方法,對(duì)相似的對(duì)象或變量分組。判別分析、聚類分析、主成分分析、可視化分析變量之間的相關(guān)關(guān)系變量之間是否存在相關(guān)關(guān)系,相關(guān)關(guān)系又是怎樣體現(xiàn)。多元回歸、典型相關(guān)、主成分分析、因子分析、相應(yīng)分析、多維標(biāo)度法、可視化分析預(yù)測(cè)與決策通過(guò)統(tǒng)計(jì)模型或最優(yōu)準(zhǔn)則,對(duì)未來(lái)進(jìn)行預(yù)見(jiàn)或判斷。多元回歸、判別分析、聚類分析、可視化分析假設(shè)的提出及檢驗(yàn)檢驗(yàn)由多元總體參數(shù)表示的某種統(tǒng)計(jì)假設(shè),能夠證實(shí)某種假設(shè)條件的合理性。多元總體參數(shù)估計(jì)、假設(shè)檢驗(yàn)第1章多元分析概述1

常用多元統(tǒng)計(jì)學(xué)方法

假設(shè)檢驗(yàn)

回歸分析均向量比較多元方差分析線性回歸非線性回歸Logistic回歸COX模型第1章多元分析概述1

分類與歸類

相關(guān)分析判別分析聚類分析多維標(biāo)度法典型相關(guān)分析因子分析主成分分析第1章多元分析概述11、城鎮(zhèn)居民消費(fèi)水平通常用八項(xiàng)指標(biāo)來(lái)描述,如人均糧食支出、人均副食支出、人均煙酒茶支出、人均衣著商品支出、人均日用品支出、人均燃料支出、人均非商品支出。這八項(xiàng)指標(biāo)存在一定的線性關(guān)系。為了研究城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu),需要將相關(guān)強(qiáng)的指標(biāo)歸并到一起,這實(shí)際就是對(duì)指標(biāo)進(jìn)行聚類分析。第1章多元分析概述12、在醫(yī)學(xué)科學(xué)研究中經(jīng)常遇到多個(gè)指標(biāo)的問(wèn)題,指標(biāo)多了帶來(lái)了統(tǒng)計(jì)分析的復(fù)雜性。如評(píng)價(jià)兒童生長(zhǎng)發(fā)育,某研究者收集了一批兒童的身高、體重、胸圍、肺活量等12個(gè)指標(biāo)的資料,如何利用這12個(gè)指標(biāo)對(duì)兒童生長(zhǎng)發(fā)育作出評(píng)價(jià)。如何將這些具有錯(cuò)綜復(fù)雜關(guān)系的指標(biāo)綜合成幾個(gè)較少的因子,既有利于對(duì)問(wèn)題進(jìn)行分析和解釋,又能便于抓住主要矛盾做出科學(xué)的評(píng)價(jià)。可用主成分分析和因子分析法。第1章多元分析概述13、某一產(chǎn)品是用兩種不同原料生產(chǎn)的,試問(wèn)此兩種原料生產(chǎn)的產(chǎn)品壽命有無(wú)顯著差異?又比如,若考察某商業(yè)行業(yè)今年和去年的經(jīng)營(yíng)狀況,這時(shí)需要看這兩年經(jīng)營(yíng)指標(biāo)的平均水平是否有顯著差異以及經(jīng)營(yíng)指標(biāo)之間的波動(dòng)是否有顯著差異。可用多元正態(tài)總體均值向量和多變量方差分析的假設(shè)檢驗(yàn)。第1章多元分析概述14、按現(xiàn)行統(tǒng)計(jì)報(bào)表制度,農(nóng)村家庭純收入是指農(nóng)村常住居民家庭總收入中扣除從事生產(chǎn)和非生產(chǎn)經(jīng)營(yíng)用支出、稅款和上交承包集體任務(wù)金額以后剩余的、可直接用于進(jìn)行生產(chǎn)的、非生產(chǎn)性建設(shè)投資、生產(chǎn)性消費(fèi)的那一部分收入。如果我們收集某年各個(gè)省、自治區(qū)、直轄市農(nóng)民家庭人均純收入的數(shù)據(jù),可以用相應(yīng)分析,揭示全國(guó)農(nóng)民人均純收入的特征以及各省、自治區(qū)、直轄市與各收入指標(biāo)的關(guān)系。第1章多元分析概述15、某醫(yī)院已有100個(gè)分別患有胃炎、肝炎、冠心病、糖尿病等的病人資料,記錄了他們每個(gè)人若干項(xiàng)癥狀指標(biāo)數(shù)據(jù)。如果對(duì)于一個(gè)新的病人,當(dāng)也測(cè)得這若干項(xiàng)癥狀指標(biāo)時(shí),可以利用判別分析方法判定他患的是哪種病。6、有100種酒,品嘗家可以對(duì)每?jī)煞N酒進(jìn)行品嘗對(duì)比,給出一種相近程度的得分(越相近得分越高,相差越遠(yuǎn)得分越低),希望用這些得分?jǐn)?shù)據(jù)來(lái)了解這100種酒之間的結(jié)構(gòu)關(guān)系。這樣的問(wèn)題就可以用多維標(biāo)度法來(lái)解決。7、在地質(zhì)學(xué)中,常常要研究礦石中所含化學(xué)成分之間的關(guān)系。設(shè)在某礦體中采集了60個(gè)標(biāo)本,對(duì)每個(gè)標(biāo)本測(cè)得20個(gè)化學(xué)成分的含量。我們希望通過(guò)對(duì)這20個(gè)化學(xué)成分的分析,了解礦體的性質(zhì)和礦體形成的主要原因。第1章多元分析概述18、研究中國(guó)七星瓢蟲(chóng)在黃海、渤海的群聚與近期氣象條件的關(guān)系。對(duì)1000個(gè)類似的魚(yú)類樣本,如何根據(jù)測(cè)量的特征如體重、身長(zhǎng)、鰭數(shù)、鰭長(zhǎng)、頭寬等,我們可以利用聚類分析方法將這類魚(yú)分成幾個(gè)不同品種。9、考古學(xué)家使用判別分析對(duì)挖掘出來(lái)的人頭蓋骨的高、寬等特征來(lái)判斷是男或女,根據(jù)挖掘出的動(dòng)物牙齒的有關(guān)測(cè)試指標(biāo),判別它是屬于哪一類動(dòng)物牙齒、是哪一個(gè)時(shí)代的。10、在高考招生工作中,我們知道每個(gè)考生的基本情況,通過(guò)分析我們不僅可以了解到學(xué)生喜歡學(xué)習(xí)的科目,還可以進(jìn)一步從考生每門(mén)課程的成績(jī),分析出學(xué)生的邏輯思維能力、形象思維能力和記憶力等等對(duì)學(xué)習(xí)成績(jī)的影響。第1章多元分析概述1第三節(jié)計(jì)算機(jī)在多元統(tǒng)計(jì)分析中的應(yīng)用多元統(tǒng)計(jì)分析的數(shù)學(xué)計(jì)算比較復(fù)雜,如果不借助于計(jì)算機(jī),許多問(wèn)題根本無(wú)法解決。在多元統(tǒng)計(jì)分析的教學(xué)中,加強(qiáng)計(jì)算機(jī)的應(yīng)用教學(xué)就顯得尤為重要。因此,本課程在案例分析中,大部分采用國(guó)際上流行的通用統(tǒng)計(jì)軟件包SPSS來(lái)實(shí)現(xiàn),這樣不僅能體現(xiàn)多元統(tǒng)計(jì)分析方法的理論價(jià)值,而且能更好的顯示出其應(yīng)用價(jià)值。第1章多元分析概述1設(shè)計(jì)與應(yīng)用時(shí)應(yīng)注意的問(wèn)題:

A、樣本含量一般至少是研究因素個(gè)數(shù)5~10倍。B、指標(biāo)的變換與數(shù)量化,量化指標(biāo)要注意大小順序。C、按設(shè)計(jì)時(shí)確定的多元分析方法

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論