




已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)發(fā)展概覽由于人類的統(tǒng)計(jì)實(shí)踐是通過計(jì)算活動(dòng)實(shí)現(xiàn)的,統(tǒng)計(jì)發(fā)展史可以追溯到古代的原始社會(huì),即從現(xiàn)在開始足有5000多年的漫長歲月。但是可以將人類的統(tǒng)計(jì)實(shí)踐提高到理論上可以概括的水平。也就是說,開始成為系統(tǒng)的學(xué)問統(tǒng)計(jì)是近代的事情,離現(xiàn)在只有300多年前的短暫歷史了。統(tǒng)計(jì)發(fā)展的概述可以分為經(jīng)典記錄統(tǒng)計(jì)、現(xiàn)代技術(shù)統(tǒng)計(jì)、現(xiàn)代推理統(tǒng)計(jì)三種形式。一、經(jīng)典記錄統(tǒng)計(jì)古典記錄統(tǒng)計(jì)形成時(shí)間大約從17世紀(jì)中葉到19世紀(jì)中葉。統(tǒng)計(jì)在這個(gè)崛起階段仍然是意義和范圍不太明確的學(xué)科,在用文字或數(shù)字真實(shí)地記錄和分析國家社會(huì)經(jīng)濟(jì)狀況的過程中,初步建立了統(tǒng)計(jì)研究的方法和規(guī)則。概率理論引進(jìn)后,才成為越來越成熟的方法。第一次有效地將古典概率論引入統(tǒng)計(jì)學(xué)的是法國天文學(xué)家、數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家拉普拉斯(P.S. Laplace,1749-1827)。因此,比利時(shí)統(tǒng)計(jì)學(xué)家凱特勒指出,統(tǒng)計(jì)應(yīng)該從拉普拉斯開始。(a)拉普拉斯的主要貢獻(xiàn)1,開發(fā)概率論的研究拉氏概率論的最初表達(dá)發(fā)表于1774年。這是他的代表作,從1812年開始發(fā)行4版概率分析理論。在本書中,拉氏首次將數(shù)學(xué)分析方法系統(tǒng)地應(yīng)用于概率論研究,建立了嚴(yán)密的概率數(shù)學(xué)理論。這本書不僅總結(jié)了自己過去的研究,還總結(jié)了老一輩學(xué)者研究概率論的成果,成為古典概率論的集大成者。2、推進(jìn)概率論在統(tǒng)計(jì)中的應(yīng)用,由于拉普拉斯將天文學(xué)和物理學(xué)的研究結(jié)合起來從事概率研究,他可以指出,概率理論可以相當(dāng)自覺、相當(dāng)明確地應(yīng)用,并能解決一系列實(shí)際問題。他在實(shí)際振興中的成績多方面,主要表現(xiàn)在人口統(tǒng)計(jì)、觀測誤差理論及概率論在天文問題上的應(yīng)用。結(jié)合概率分布模型和中心極限思想,研究了最小二乘法的1809年至1812年,首次為統(tǒng)計(jì)中此后最廣泛使用的手段提供了理論依據(jù)。3,統(tǒng)計(jì)學(xué)的大量法則拉普拉斯認(rèn)為?!白鳛楝F(xiàn)象的原因,我們知道或知道的也是原因復(fù)雜,無法計(jì)算;發(fā)生原因被偶然因素或沒有一定規(guī)律的因素?cái)_亂,直到事物發(fā)展的變化,要長期廣泛觀察,才能求得發(fā)展的真法。概率理論可以研究造成這種發(fā)展變化的成分,并指明其成分的數(shù)量?!边@是他通過天文學(xué)上的研究獲得的經(jīng)驗(yàn)。他發(fā)現(xiàn),如果有足夠的時(shí)間觀察天體的運(yùn)動(dòng),就會(huì)出現(xiàn)使物體特征消失的傾向等現(xiàn)象。他指出,這不是偶然,而是其中一定有什么原因。4、在統(tǒng)計(jì)發(fā)展史上,試圖推斷大樣本,人口計(jì)算問題,可以成為統(tǒng)計(jì)學(xué)家多年的問題。拉普拉斯直到19世紀(jì)初才利用概率論的原理邁出了重要的一步。理論上,1781年拉普拉斯在“理論上概率論”一文中建立了概率積分,提供了計(jì)算區(qū)間誤差的強(qiáng)有力的手段。從1781年到1786年,提出了“拉普拉斯定理”(中心極限定理的一部分),初步確立了大樣本推理的理論基礎(chǔ)。實(shí)際上,拉普拉斯在1786年寫了一篇關(guān)于巴黎人口出生、結(jié)婚和死亡的文章,文章提出了根據(jù)法國特定地區(qū)的出生率估計(jì)全國人口的問題。他抽調(diào)了30個(gè)市縣,進(jìn)行了深入調(diào)查,估算了全國總?cè)丝跀?shù)。其方法和結(jié)果仍然相當(dāng)粗糙,但在統(tǒng)計(jì)發(fā)展史上,他利用樣本推斷出整體的思想方式,為后人開辟了抽樣調(diào)查的新途徑。對(duì)概率論與統(tǒng)計(jì)的結(jié)合研究做出貢獻(xiàn)的另一個(gè)人是德國偉大的數(shù)學(xué)家高斯(c.f .高斯,1777-1855)。(b)高斯的主要貢獻(xiàn)1、成立最小平方的學(xué)生時(shí)代,課程開始了最小平方研究。1794年,他讀了數(shù)學(xué)家蘭伯特(j . h . Lambert,1728 1777)的作品,討論了如何使用平均法確定觀察值(yi,Xi)中線性關(guān)系y= x的兩個(gè)系數(shù)。1795年,以殘差平方和西格瑪(I-a-bxi)2為最小值得到的a和b估計(jì)了和。1798年完成最小二乘法的整體思維結(jié)構(gòu)于1809年正式發(fā)表。2、發(fā)現(xiàn)高斯分布調(diào)查、觀察或測量的誤差是不可避免的,而且一般無法掌握??扑雇ㄟ^他豐富的天文觀測和從1821年到1825年測量土地的經(jīng)驗(yàn),發(fā)現(xiàn)了觀察值x和實(shí)際值的誤差變異,極大地服從了現(xiàn)代人最熟悉的正規(guī)分布。他利用最大似然法和其他數(shù)學(xué)知識(shí)推導(dǎo)了測量誤差的概率分布公式?!罢`差分布曲線”一詞是科斯莫斯提出的,后代為了紀(jì)念他,將此分布曲線稱為高斯分布曲線,即今天的正態(tài)分布曲線。高斯發(fā)現(xiàn)的一般誤差概率分布曲線及其所產(chǎn)生的天文觀測誤差的測量方法在理論上和應(yīng)用上都具有十分重要的意義。二、現(xiàn)代技術(shù)統(tǒng)計(jì)近代技術(shù)統(tǒng)計(jì)形成時(shí)期大約是19世紀(jì)中葉到20世紀(jì)上半葉。這種“描述”的特征最初是由研究生物進(jìn)化的學(xué)者組成的群體確定的,因此歷史上稱他們?yōu)樯锝y(tǒng)計(jì)學(xué)。生物統(tǒng)計(jì)學(xué)派的創(chuàng)始人是英國的戈登(F. Galton,1822-1911),隊(duì)長是戈登的學(xué)生比爾森(K.Pearson,1857-1936)。(a)戈登的主要貢獻(xiàn)1、為了研究早期生物統(tǒng)計(jì)學(xué)人類智能的遺傳問題,高利登仔細(xì)閱讀了300多人的傳記,初步確定了其中有多少人的親屬關(guān)系及關(guān)系大致緊密。然后在知名人士組個(gè)別調(diào)查,從整體上查明了智力遺傳學(xué)的規(guī)律性。為了獲得更多有關(guān)人的特性和能力的統(tǒng)計(jì)資料,高爾頓從1882年開始成立了“人體測量實(shí)驗(yàn)室”。連續(xù)6年測量了9337名“身高、體重、寬度、呼吸力、牽引力和壓力、掌摑速度、聽覺、視力、色覺和其他個(gè)人信息”,深入研究了這些數(shù)據(jù)中隱藏的內(nèi)在關(guān)系,得出了“祖先遺傳規(guī)律”。他努力探索描述和比較大量數(shù)據(jù)的方法和方法,引入了重要的統(tǒng)計(jì)概念和方法,如中數(shù)、百分位數(shù)、四分位數(shù)、四分位數(shù)、分布、相關(guān)性、回歸等。1901年,戈登和他的學(xué)生比爾森為生物計(jì)量學(xué) (Biometrika)雜志撰寫的創(chuàng)刊中,首次為他們使用的統(tǒng)計(jì)方法提出了“生物統(tǒng)計(jì)”(biology)一詞。戈登解釋說:“所謂的生物統(tǒng)計(jì)學(xué)是適用于生物界的現(xiàn)代統(tǒng)計(jì)方法?!笨锤甑呛碗S后的研究室,他們把生物統(tǒng)計(jì)看作應(yīng)用統(tǒng)計(jì)。其研究范圍是對(duì)生物科學(xué)的問題進(jìn)行統(tǒng)計(jì)研究,更重要的是開發(fā)生物科學(xué)應(yīng)用中的統(tǒng)計(jì)方法本身。2、對(duì)統(tǒng)計(jì)的貢獻(xiàn)(1)戈登首次統(tǒng)計(jì)接近變異是進(jìn)化論中的重要概念,并領(lǐng)導(dǎo)了英國生物統(tǒng)計(jì)學(xué)派的創(chuàng)立。1889年,戈登將整體定量測定法引入遺傳研究。戈登發(fā)現(xiàn),通過整體測量,可以確定對(duì)象或植物的每種類型的平均類型。在一個(gè)恒星中,所有的物體圍繞這個(gè)平均類型,以它為軸,向多方面變異。這就是他在遺傳的天賦這本書里提出的平均偏差法則。(2)“相關(guān)”統(tǒng)計(jì)相關(guān)法律是戈登制定的。首先,他測量了甜豌豆的大小,發(fā)現(xiàn)后代有遺傳后“回雙親”的現(xiàn)象。1877年收集了很多身體長度的數(shù)據(jù),計(jì)算了高個(gè)子和矮個(gè)子,高個(gè)子的父母的后代各有多少個(gè)高個(gè)子和矮個(gè)子的孩子,在一定程度上知道父母高個(gè)子,父母矮個(gè)子的后代矮個(gè)子的事實(shí),在父母和子女之間的長度上將其具體化為數(shù)量關(guān)系。1888年,戈登在相關(guān)與人體主要測量一文中充分論述了“相關(guān)”的統(tǒng)計(jì)重要性,并提出了戈?duì)柕窍嚓P(guān)函數(shù)(即目前常用的相關(guān)系數(shù))的計(jì)算公式。戈?duì)柕窃?870年研究人類身體長度的遺傳時(shí)發(fā)現(xiàn),高個(gè)子父母的子女傾向于低于父母的身體長度。相反,短父母的子女們的身體長度傾向于高于父母的長度。從整體來看,高個(gè)子的人“回歸”了一般身高的期待,矮個(gè)子的人則相反的“回歸”。這是統(tǒng)計(jì)上“回歸”的初始含義。1886年,戈登在論文中正式提出了“從遺傳的身體長度到中間身體長度的回歸”的概念。(b)比爾森的主要貢獻(xiàn)比爾森在生物統(tǒng)計(jì)學(xué)上傾注了心血,上升到了通用方法學(xué)的高度。比爾森的生活是統(tǒng)計(jì)學(xué)的一生,他對(duì)統(tǒng)計(jì)做出了巨大貢獻(xiàn):1、從可變數(shù)據(jù)處理生物統(tǒng)計(jì)中獲取的數(shù)據(jù)往往是無序的,很難知道原因。為此,比爾森首次探索了處理數(shù)據(jù)的方法,他開創(chuàng)的頻率分布圖和頻率分布圖現(xiàn)在成為統(tǒng)計(jì)方法最基本的手段之一。據(jù)悉,分布曲線的匹配在19世紀(jì)以前用頻率分布解釋了變異值,最終以正態(tài)分布曲線出現(xiàn)。但是比爾森注意到在生物統(tǒng)計(jì)學(xué)的經(jīng)驗(yàn)分布中,對(duì)很多生物的測量不是正態(tài)分布,而是經(jīng)常以偏法分布,甚至是坡度很多。都不是單峰,也不是單峰。說明“現(xiàn)狀”信念不可靠。1894年,他在一篇名為“不對(duì)稱頻率曲線的分解”的文章中,首先將不對(duì)稱觀測曲線分解成幾條規(guī)則曲線。他利用稱為“相對(duì)梯度”的方法獲得了12種分布函數(shù)類型:正態(tài)分布、矩形分布、j型分布、u型分布或貝爾分布。經(jīng)過r . fisher的進(jìn)一步研究,biersheng分布曲線、型出現(xiàn)在小樣本理論中。推導(dǎo)比爾森曲線系統(tǒng)的方法缺乏理論基礎(chǔ),但給了很多啟示。3.卡方檢察官于1900年獨(dú)立重新發(fā)現(xiàn)了比爾森的分布,并提出了著名的卡方檢驗(yàn)法(Test of)。比爾森得到了統(tǒng)計(jì):=(實(shí)際次數(shù)-理論數(shù))2/證明了當(dāng)理論數(shù)和觀測值足夠多時(shí)總是近似服從自由度為(k-1)的分布。其中k表示要拆分的組數(shù)。在自然現(xiàn)象的范圍內(nèi),檢驗(yàn)法被廣泛使用。由r .費(fèi)雪補(bǔ)充,小樣本成為推斷統(tǒng)計(jì)的早期方法之一。4、回歸及相關(guān)開發(fā)回歸及相關(guān),經(jīng)過birson的進(jìn)一步開發(fā),在這兩個(gè)概念生物統(tǒng)計(jì)學(xué)領(lǐng)域,它被推進(jìn)為一般統(tǒng)計(jì)方法的重要概念。1896年,他在進(jìn)化論的數(shù)學(xué)研究:回歸、遺傳、隨機(jī)配對(duì)一文中寫道,仍然廣泛使用的線性相關(guān)計(jì)算公式:比爾幸存的回歸計(jì)算公式:=a bx(其中a和b根據(jù)最小二乘法計(jì)算得出),回歸系數(shù)的計(jì)算公式:y隨著x的變化而變化,(如果x與y一起變更,則輸入(x-)/-(y-)2。比爾的生存從1897年到1905年,不僅發(fā)展了阿爾高登的理論,還在數(shù)學(xué)上發(fā)展了相關(guān)的相關(guān)、總相關(guān)、相關(guān)比例等概念。三、現(xiàn)代推理統(tǒng)計(jì)現(xiàn)代推斷統(tǒng)計(jì)形成時(shí)間大約是20世紀(jì)初葉到20世紀(jì)中葉。人類歷史進(jìn)入20世紀(jì)后,社會(huì)領(lǐng)域和自然領(lǐng)域?qū)y(tǒng)計(jì)的要求都更大。各種事物和現(xiàn)象之間復(fù)雜的數(shù)量關(guān)系和一系列未知的數(shù)量變化僅僅靠記錄或技術(shù)很難看到效果。因此,把握事物的整體真實(shí)關(guān)系,預(yù)測未來發(fā)展的“推論”方法層出不窮。從技術(shù)統(tǒng)計(jì)中學(xué)習(xí)推理是統(tǒng)計(jì)發(fā)展過程中的一大飛躍。統(tǒng)計(jì)發(fā)展的這一重大變化是在農(nóng)業(yè)現(xiàn)場試驗(yàn)領(lǐng)域進(jìn)行的。因此,歷史上被稱為農(nóng)業(yè)試驗(yàn)學(xué)。對(duì)確立現(xiàn)代推理統(tǒng)計(jì)的最大貢獻(xiàn)是英國統(tǒng)計(jì)學(xué)家戈塞特(W.S. Gosset,1876-1937年)和費(fèi)舍爾(r . a . fisher,1890-1962年)。(a)戈塞特的t檢驗(yàn)和小樣本思想1908年,戈塞特首次以學(xué)生的筆名在生物計(jì)量學(xué)雜志上發(fā)表了平均概率誤差。這篇文章提供了學(xué)生t檢驗(yàn)的依據(jù),因此很多統(tǒng)計(jì)學(xué)家認(rèn)為1908年是統(tǒng)計(jì)推理理論發(fā)展史上的里程碑。之后,高爾塞連續(xù)發(fā)表了相關(guān)系數(shù)的概率誤差(1909)、隨機(jī)樣本平均分布(1909)、來自無限總體隨機(jī)樣本平均的概率估計(jì)表(1917)等。他比較了這些論文中的第一、平均誤差和標(biāo)準(zhǔn)誤差兩種計(jì)算方法;其次,研究了泊松分布的樣本誤差問題。第三,建立了相關(guān)系數(shù)的抽樣分布。第四,帶來了“學(xué)生”分布,即t分布。這些論文的完成為“小樣本理論”奠定了基礎(chǔ)。之后為樣品數(shù)據(jù)的統(tǒng)計(jì)分析和解釋開辟了新的道路。由于戈塞特的理論,統(tǒng)計(jì)學(xué)開始從大標(biāo)本發(fā)展到小標(biāo)本,從描寫發(fā)展到推理,有些人把戈塞特譽(yù)為推理的先驅(qū)。(b) R .費(fèi)舍統(tǒng)計(jì)理論和方法費(fèi)雪一生寫了329篇論文。世界各國最普及的統(tǒng)計(jì)著作有:1925年出版的供研究人員用的統(tǒng)計(jì)方法,1930年出版的自然選擇的遺傳原理,1935年出版的試驗(yàn)設(shè)計(jì),1938年和耶特聯(lián)合出版的供生物學(xué)、農(nóng)學(xué)與醫(yī)學(xué)研究用的統(tǒng)計(jì)表,1938年出版的統(tǒng)計(jì)估計(jì)理論,1950年出版的對(duì)數(shù)理統(tǒng)計(jì)的貢獻(xiàn)當(dāng)時(shí)他在統(tǒng)計(jì)學(xué)上處于世界領(lǐng)先地位,他的貢獻(xiàn)是多方面的。1、通用方法r .費(fèi)雪強(qiáng)調(diào),統(tǒng)計(jì)學(xué)是對(duì)所有自然現(xiàn)象或社會(huì)生活現(xiàn)象的研究、統(tǒng)計(jì)方法及其計(jì)算方法“和其他數(shù)學(xué)科目一樣,對(duì)所有問題的研究應(yīng)用相同的公式”的一般方法。他指出:“統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)最重要的部分,可以看作是加工觀察到的材料的數(shù)學(xué)。”2、“無限假設(shè)”r .費(fèi)雪認(rèn)為,研究包括社會(huì)經(jīng)濟(jì)現(xiàn)象在內(nèi)的各種事物的現(xiàn)象時(shí),必須拋棄有關(guān)具體物質(zhì)內(nèi)容的信息,讓統(tǒng)計(jì)只涉及“統(tǒng)計(jì)總綱”。例如,“如果已經(jīng)有1萬名新兵的信息,統(tǒng)計(jì)調(diào)查的對(duì)象不是全體新兵,而是各種身體長度大小的總和。”.顯然,r .費(fèi)雪只對(duì)構(gòu)成整個(gè)統(tǒng)計(jì)元素的特定符號(hào)感興趣,而對(duì)每個(gè)元素本身沒有興趣。其目的是簡化問題,使其易于統(tǒng)計(jì)處理。他在1922年寫的理論統(tǒng)計(jì)學(xué)的數(shù)學(xué)基礎(chǔ)一書中提出了“無限總體假設(shè)”的重要概念?!凹僭O(shè)的無限總體,即現(xiàn)有數(shù)據(jù)就是那個(gè)隨機(jī)樣本?!?3,采樣分布r . fisher(r)從研究概率分布開始。1915年,他在統(tǒng)計(jì)方法和科學(xué)推斷雜志上發(fā)表了無限總體樣本相關(guān)系數(shù)值的頻率分布。這篇論文對(duì)相關(guān)系數(shù)的一般公式進(jìn)行了論證,對(duì)以后整體推理統(tǒng)計(jì)的發(fā)展將有所貢獻(xiàn)。這篇論文被稱為現(xiàn)代抽象統(tǒng)計(jì)的第一篇論文。1922年,r .皮雪導(dǎo)出了相關(guān)系數(shù)r的z分布,隨后還準(zhǔn)備了生物計(jì)量學(xué)。1924年,r .皮雪綜合研究了t .分布、分布、z .分布,使皮氏生的檢查也適用于小樣本。1938
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《肺癌內(nèi)科治療》課件
- 《茶文化研究》課件
- 《磚的分類》課件
- 北師大版小學(xué)三年級(jí)下冊(cè)書法教學(xué)設(shè)計(jì)直接打印
- 《真菌性鼻竇炎》課件:深入了解真菌性鼻竇炎的病因、癥狀及治療方法
- 《積極生活藝術(shù)》課件
- 江蘇省高郵市陽光雙語2025屆初三下學(xué)期期中考試語文試題理試題(普通班)含解析
- 天津體育職業(yè)學(xué)院《小企業(yè)融資》2023-2024學(xué)年第二學(xué)期期末試卷
- 《法理學(xué)》課件-法理學(xué) -
- 下肢淋巴水腫的臨床護(hù)理
- 游泳館租賃安全責(zé)任協(xié)議書
- 貴州省銅仁市2022-2023學(xué)年度六年級(jí)下學(xué)期期末質(zhì)量檢測科學(xué)試卷
- 行政復(fù)議法-形考作業(yè)4-國開(ZJ)-參考資料
- 塑造陽光心態(tài)班會(huì)省公開課一等獎(jiǎng)全國示范課微課金獎(jiǎng)?wù)n件
- 語文六年級(jí)下冊(cè)辯
- 煤礦+925東大巷掘進(jìn)作業(yè)規(guī)程
- 完整解讀2024年關(guān)于加強(qiáng)社區(qū)工作者隊(duì)伍建設(shè)的意見內(nèi)容課件
- 醫(yī)院護(hù)理培訓(xùn)課件:《改善患者就醫(yī)感受提高患者滿意度》
- 淺談抖音短視頻對(duì)大學(xué)生的影響
- 福建省海域使用補(bǔ)償辦法
- 數(shù)字經(jīng)濟(jì)概論課件:數(shù)字貿(mào)易
評(píng)論
0/150
提交評(píng)論