



免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
推薦一本概率統(tǒng)計(jì)的寫的比較好的書現(xiàn)在看來在中國,中文的教科書可不是越厚越好,似乎已經(jīng)成了一種和國外相反的趨勢,厚的書以盈利為目的,薄的書才可能是教書育人的。大學(xué)的那本概率統(tǒng)計(jì)書似乎就是這樣的一個(gè)很好的例子,忘了是哪個(gè)地方出的,反正好像很多大學(xué)都用的,很厚,封面有點(diǎn)淺藍(lán)色。Anyway,不爽的就讓它過去吧,雖然我花了很長時(shí)間在那本書上也沒搞清楚它在講什么?,F(xiàn)在隆重推出概率統(tǒng)計(jì),同濟(jì)大學(xué)工程數(shù)學(xué)教研室編,由同濟(jì)大學(xué)出版社出版,封面上還寫有函授自學(xué)教材。我手上的(圖書館借的)是99年的第一版,才14塊,絕對的劃算,書也不厚不薄,正好包含了它應(yīng)該有的內(nèi)容。這本書最出彩的是他第五章開始的數(shù)理統(tǒng)計(jì)的講解,和很多其它書不同,這本書抓住了統(tǒng)計(jì)的精要統(tǒng)計(jì)是用于實(shí)踐的。內(nèi)容處處與實(shí)踐相結(jié)合,顯示出了數(shù)學(xué)是實(shí)踐的強(qiáng)大工具。下面是我摘要的個(gè)人感覺講的比較好的地方(也是我以前看垃圾書一直搞不懂的地方,不過我考試確能很好的通過,這也是我搞不懂的地方,中國教育這個(gè)垃圾)。1,什么是數(shù)理統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)方法實(shí)際上就是數(shù)據(jù)處理的方法,與其它數(shù)學(xué)科目不同,它注重的是對實(shí)際工程中獲得的不理想的數(shù)據(jù)的處理,使其盡量理想化。比方說你想知道世界上是漂亮女人多還是丑的多,那么我們可以做這么一個(gè)實(shí)驗(yàn)。隨便找一天上街,然后把看到的所有年輕女人進(jìn)行你心目中的評分,然后計(jì)下來,下面是我做的這么一個(gè)實(shí)驗(yàn)數(shù)據(jù)(比較衰,這天沒看到幾個(gè)漂亮的),1表示完美,0表示極丑,0.5為中等。0.90.50.40.40.80.50.60.30.50.50.40.60.70.4對這組數(shù)據(jù)最簡單的處理就是取其平均值,不過在此之前,先看看數(shù)據(jù)的特性。數(shù)據(jù)值頻數(shù)0.000.100.200.310.440.540.620.710.810.911.00要注意,頻數(shù)和頻率在概率論里是兩個(gè)不同的概念,頻數(shù)是指其數(shù)據(jù)在實(shí)際實(shí)驗(yàn)中出現(xiàn)過的次數(shù),而頻率是理論或者實(shí)際試驗(yàn)后處理過的數(shù)據(jù)(工程中用頻數(shù)除以數(shù)據(jù)的總數(shù)作為頻率或者講概率的一個(gè)估計(jì))。有興趣的讀者可以用word把上面的數(shù)據(jù)作個(gè)條形圖看看數(shù)據(jù)的分布,很有趣的。O.K.現(xiàn)在我們看看我們的數(shù)據(jù)可以帶給我們什么樣的結(jié)果呢,對數(shù)據(jù)做和然后求平均,*(0.9+0.8+0.7+0.6*2+0.5*4+0.4*4+0.3)=0.536Well,結(jié)果似乎還是令人滿意的,說明對我來說這個(gè)世界的年輕女人長得還是可以的,不致于我要出家當(dāng)和尚(我要求是不是很低?。?。好了,上面就是我們所做的統(tǒng)計(jì)的最初之旅,有點(diǎn)簡單但是很實(shí)用。不過細(xì)心的讀者可能會發(fā)現(xiàn),實(shí)際上我的這個(gè)結(jié)論是極其不可靠的,因?yàn)槭紫任抑皇菍讉€(gè)女人進(jìn)行評價(jià),從而得出了一個(gè)對整個(gè)世界女人的評價(jià),即使這個(gè)方法是合理的,也頂多能判斷中國或者上海女人符合這個(gè)判斷。還有我采用的評價(jià)公式是否是合理的,為什么只取平均,而不是其它的值。很顯然統(tǒng)計(jì)這門學(xué)科就是要研究如何采集數(shù)據(jù),以及分析數(shù)據(jù),以及數(shù)據(jù)能對對象的什么特性進(jìn)行評價(jià)的一門學(xué)科。2,總體和樣本的概念說實(shí)話,在看到這本書之前(本科學(xué)這門課到研究生第二年,靠,考研顯然也是垃圾,我照搬公式就搞定了),我對這個(gè)概念一直是搞不清(我覺得不能怪我,責(zé)任都在我的大學(xué)體制和那本垃圾教科書)。但是這是要看懂后面概念所最基本的,這里我作個(gè)詳細(xì)介紹,當(dāng)然你也可以看我上面推薦的那本書。在數(shù)理統(tǒng)計(jì)中,我們把研究對象的全體稱作總體,而其中的每個(gè)成員看作個(gè)體。在上面的那個(gè)例子中,全世界的年輕女人就是總體,單個(gè)女人就是個(gè)體。一般來講,捕獲全體是不現(xiàn)時(shí)的,就像我不可能看過全世界的所有女人,所以個(gè)體就變得十分重要。好的個(gè)體能很好的包含總體的屬性,不過一般來講,個(gè)體總能包含總體的屬性,只是多和少罷了。在實(shí)際的工程中,我們常常只是把自己感興趣的指標(biāo)X視為總體,如上面例子,對總體的進(jìn)一步抽象就是全世界年輕女子的樣貌作為總體。在實(shí)際應(yīng)用中,常??梢钥吹絼e人使用了積分的一些表達(dá)式,這是因?yàn)閺慕y(tǒng)計(jì)的角度來說,人們更喜歡使用密度這個(gè)概念,這樣如果計(jì)算對象隨某一變量實(shí)時(shí)變化那么我們就可以用積分來計(jì)算這個(gè)對象了。這里我們把這個(gè)密度函數(shù)稱作分布函數(shù),一般對于總體X,叫做X的分布函數(shù),當(dāng)X是連續(xù)型的隨機(jī)變量時(shí),叫做總體密度函數(shù),如果是離散的,就叫概率函數(shù)。在實(shí)際工程中,總體的分布函數(shù)總是未知的(知道了就不要用統(tǒng)計(jì)了),但可能其分布類型為已知,而只是其中參數(shù)未知,那么通過樣本分析得到這些參數(shù)的統(tǒng)計(jì)推斷就構(gòu)成了參數(shù)統(tǒng)計(jì)的內(nèi)容,如果連分布類型都不知的化,那么就是非參數(shù)統(tǒng)計(jì)了,顯然后者更復(fù)雜一點(diǎn)。一般的,如果總體包含的個(gè)體個(gè)數(shù)很多時(shí),我們常常將其認(rèn)為是無限總體來進(jìn)行近似,比如上面那個(gè)例子中,全世界的年輕女人太多,就可以認(rèn)為是無限總體了。我們這里只討論無限總體,有限總體可以從中類比,因?yàn)橛邢薇容^簡單。為了對總體進(jìn)行分析,所要做的第一步就是從總體中抽出一些個(gè)體,這一過程稱作抽樣。在上面的例子中,那些數(shù)據(jù)就是從抽樣樣本的數(shù)字表示。一般把這些數(shù)字表現(xiàn)或者叫做樣本觀測值記為x1,x2,x3.xn,其中n叫做樣本大小或者樣本容量。顯然在抽樣前我們無法知道這些觀測的具體值,所以站在抽樣前的立場來看,它們也是隨機(jī)的變量,把他們表示為X1,X2,X3,.Xn,我們把(X1,X2,X3,.Xn)稱作樣本或子樣,抽樣后的具體值叫做樣本觀測值。自然而然,我們就會想到如何抽樣才能最好的體現(xiàn)總體的屬性,這屬于抽樣論的內(nèi)容,有興趣的讀者可以參考相關(guān)書籍。一般的,我們使用隨機(jī)抽樣就能很好的體現(xiàn)總體了,所以在實(shí)踐中人們常常使用簡單的隨機(jī)抽樣,我們這里也以這個(gè)作為前提。隨機(jī)抽樣的結(jié)果叫做簡單隨機(jī)樣本,它應(yīng)該具有下面兩個(gè)屬性:(1) 代表性:每個(gè)Xi與總體X有相同的分布。(2) 獨(dú)立性:X1.Xn相互獨(dú)立。后面就把簡單隨機(jī)樣本通稱為樣本。實(shí)際上上面的兩個(gè)屬性看似簡單,但實(shí)際上很多情況下都不滿足它的條件。以通信信號來作個(gè)例子,如果一個(gè)信號發(fā)生器的輸出是與時(shí)間相關(guān)的,那么顯然不滿足第一個(gè)條件,我們無法做這樣一個(gè)等效:對一個(gè)機(jī)器在一段時(shí)間的采樣n次同時(shí)對n臺機(jī)器在同一時(shí)刻采樣,但是如果信號輸出與時(shí)間無關(guān)(更一般的說與任何可變參數(shù)無關(guān)),就能夠滿足第一條,比如高斯白噪聲。第二個(gè)屬性有時(shí)也很難滿足,比如某種具有對實(shí)驗(yàn)對象具有破壞性的實(shí)驗(yàn),每采樣一次,就把采樣結(jié)果從實(shí)驗(yàn)對象中剔除,這樣顯然各次的樣本之間就不獨(dú)立了。3,統(tǒng)計(jì)量我們有了樣本實(shí)際上什么也干不了,更重要的是對樣本建立一個(gè)(X1,X2,X3,.Xn)函數(shù),然后用樣本觀測值來進(jìn)行統(tǒng)計(jì)推斷。例如要測一個(gè)美女的體重,為了滿足她對數(shù)字的精確性,我們對她一共量了n次,于是就有了樣本(X1,X2,X3,.Xn),顯然體重是我們這里的統(tǒng)計(jì)量,為此我們對樣本建立一個(gè)與體重有關(guān)的函數(shù),在實(shí)際測量工作做完后,我們將觀測值帶入這個(gè)樣本函數(shù)中,得到這個(gè)具體的數(shù)字,這樣我們就為美女提供了她精確的體重了。這里給出統(tǒng)計(jì)量的精確定義:如果樣本(X1,X2,X3,.Xn)的函數(shù)Foo(X1,X2,X3,.Xn)不包含總體分布中的任何未知參數(shù),那么這個(gè)函數(shù)就是統(tǒng)計(jì)量。說白了,就是如果把觀測值帶入函數(shù)后得到一個(gè)實(shí)際數(shù)字的函數(shù)就是統(tǒng)計(jì)量。常用的統(tǒng)計(jì)量有樣本均值,樣本方差,樣本標(biāo)準(zhǔn)差,樣本k階原點(diǎn)矩,樣本k階中心矩。一般我們通過這些統(tǒng)計(jì)量來近似總體分布中的一些未知參數(shù)(參數(shù)統(tǒng)計(jì)),4,統(tǒng)計(jì)量的分布上面的統(tǒng)計(jì)量實(shí)際上也是有分布的,具體的分布情況視其總體分布而定,具體可以查看我推薦的這本書。不過一般的有正態(tài)分布和波努力分布(通過大數(shù)和中心極限定理得到)。這里的這部分就很好的體現(xiàn)出了如果知道了總體的分布,再通過對觀測數(shù)據(jù)的分析就能知道某些事情的概率了(通過書上的例子可以體會)。5,參數(shù)點(diǎn)估計(jì)如果已經(jīng)知道了總體的分布類型,但是不知道其中的參數(shù),那么如何通過樣本作出對參數(shù)的估計(jì),就構(gòu)成了參數(shù)估計(jì)(參數(shù)統(tǒng)計(jì))。一般有兩種方法,點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)就好比是估計(jì)某個(gè)美女的年齡是23歲,而區(qū)間估計(jì)就是估計(jì)這個(gè)美女的年齡大約在2025歲左右。從理論上來講,點(diǎn)估計(jì)就是構(gòu)造一個(gè)統(tǒng)計(jì)量,而區(qū)間估計(jì)則是構(gòu)造兩個(gè)統(tǒng)計(jì)量從而形成一個(gè)區(qū)間。當(dāng)然,對于某一個(gè)未知參數(shù)可以有多個(gè)估計(jì)方法。下面先講點(diǎn)估計(jì)。如果是總體的一個(gè)未知參數(shù),那么與相關(guān)的統(tǒng)計(jì)量 (X1,X2,X3,.Xn)就稱為的點(diǎn)估計(jì)。理論上任何一個(gè)統(tǒng)計(jì)量都是的點(diǎn)估計(jì),但是這個(gè)統(tǒng)計(jì)量在實(shí)際工程上要被人接收就要有一定的物理理由。點(diǎn)估計(jì)法一般又分為兩種,矩估計(jì)和最大似然估計(jì)。矩估計(jì)就是講統(tǒng)計(jì)量表示成矩的形式,然后講觀測值帶入,得到未知參數(shù)的估計(jì)值。最大似然估計(jì)基于下面這樣一個(gè)假設(shè),如果P(B|A1) P(B|A2),這時(shí)如果得到B,那么我們認(rèn)為B是在A1條件下得到的比在A2下得到的概率大,所以我們判定實(shí)驗(yàn)結(jié)果是A1,顯然最大似然原理的思想源自經(jīng)驗(yàn)。更一般的,定義似然函數(shù)L()=f(xi;)其中xi為觀測值,顯然根據(jù)最大似然原則,的一個(gè)合理估計(jì)是能使得L()最大的那個(gè)值。再看前面的那個(gè)假設(shè),得到B,要對情況A作出估計(jì),顯然我們會選擇那個(gè)能使得B出現(xiàn)機(jī)會最大的那個(gè)A,于是我們選擇了A1。5,估計(jì)量的評選標(biāo)準(zhǔn)前面已經(jīng)提到,同一參數(shù)可以有多種估計(jì)方法,上面只是給出了最普遍的兩種點(diǎn)估計(jì)方法。但是哪個(gè)優(yōu)哪個(gè)劣,就需要有一套標(biāo)準(zhǔn)。(1) 無篇性如果對某一參數(shù)進(jìn)行多次實(shí)驗(yàn)估計(jì),我們就能得到估計(jì)值的一組數(shù),當(dāng)然由于樣本是隨機(jī)的,那么它也是隨機(jī)的,很自然的,我們就會希望這一組數(shù)與真正的被估計(jì)參量的平均誤差為0,即,E (X1,X2,X3,.Xn)- =0= E (X1,X2,X3,.Xn)這個(gè)就叫無偏估計(jì)。雖然一次估計(jì)不能保證誤差為0,但是多次使用后確能保證平均誤差為0,這樣的化就能取多次估計(jì)的平均數(shù)了。(2) 有效性仿照均值和方差的概念,有了上述無偏性的定義,自然就會想到,應(yīng)該還要定義一個(gè)估計(jì)和實(shí)際數(shù)之間的偏離程度。有效性就自然的成了比較各個(gè)估計(jì)方法的D (X1,X2,X3,.Xn)的大小了,當(dāng)然越小越有效。不過要注意,要比較D,因?yàn)槭莻€(gè)變量,那么比較的結(jié)果可能會隨不同而有所變化,比如D(1)=22 +,D(2)=2 +2時(shí),就無法比較了,因?yàn)楫?dāng)=1,D(1)= D(2);而當(dāng)=1,D(1)= D(2)。(3) 相和性它表示隨機(jī)的變量序列 (X1,X2,X3,.Xn)與的充分接近程度,定義方式有很多,依概率收斂就是其中之一。6,置信區(qū)間從上面的方法來看,點(diǎn)估計(jì)方便簡單,并且常用的最大似然法具有無偏性,一致性等,但是可以發(fā)現(xiàn),這些估計(jì)并沒有提供一個(gè)精度,比如估計(jì)值與被估計(jì)對象的真實(shí)值到底有多少誤差,顯然點(diǎn)估計(jì)不提供這個(gè)屬性,為了解決這一問題,人們使用了置信區(qū)間的方法,也就是判斷某一估計(jì)值成立的可能性有多大。這里要提一下,我們一般把1-稱作置信水平,通常這個(gè)值越接近1,那么所得的區(qū)間也就越大,而這個(gè)值越小,則區(qū)間長度也就越短。就好比我們估計(jì)某個(gè)美女的年齡是(0,150),盡管我們可以得到100%的置信水平,但是這個(gè)毫無意義,所以實(shí)際工程中根據(jù)情況一般取0.90或0.95或者0.99等。在實(shí)際問題中,有時(shí)只要估計(jì)未知參數(shù)的下限或者上限,那么可以將置信區(qū)間的上限取為+或者下限為-。這樣我們可以建立單側(cè)置信區(qū)間的概念。下面將雙側(cè)置信區(qū)間的具體求法概括:第一步:求的一個(gè)點(diǎn)估計(jì),通常用極大似然法。第二步:以(X1Xn)為基礎(chǔ),建立一個(gè)隨機(jī)變量:J=J(X1Xn; ),其中J只能包含一個(gè)未知參數(shù)。第三步:定出常數(shù)a,b,使得Pa=J=1- ,通常取a為/2,b為1-/2 。第四步:等價(jià)變形,使得P_(X1Xn)= =-(X1Xn)= Pa=J=1- 。單側(cè)區(qū)間的求法區(qū)別在第三步開始,a或者b為已知,其它都一樣。7,顯著性檢驗(yàn)在實(shí)際工程中,往往可能會需要對某些事進(jìn)行假設(shè),比如改進(jìn)后的技術(shù)優(yōu)于之前的技術(shù)。一般把H0:A=B(A優(yōu)于B),稱為原假設(shè),而H1:AB,稱為備擇假設(shè)。實(shí)際這兩種選哪個(gè)都是一樣的,一般取H0,因?yàn)榉奖阌?jì)算。很顯然采用上面的方法,有時(shí)會犯取錯(cuò)誤值的錯(cuò),這是無法避免的,畢竟我們這里討論的是概率和統(tǒng)計(jì),概率本身就代表了非100發(fā)生的事。這個(gè)錯(cuò)誤可以分為下面兩類:I:當(dāng)實(shí)際上H0成立,但做統(tǒng)計(jì)時(shí)確作出了拒絕H0的決定。II:當(dāng)實(shí)際上H0不成立,但做統(tǒng)計(jì)時(shí)確作出了接收H0的決定。自然而然的,我們會希望這兩類錯(cuò)誤都盡量的小,但目前的技術(shù)表明,如果確保第一類錯(cuò)誤出現(xiàn)的可能性小的化,那么第二類錯(cuò)誤的出現(xiàn)率就會上升,反之亦然。如何舍魚而取熊掌就要根據(jù)實(shí)際情況了。下面我舉兩個(gè)實(shí)際的例子來說明如何取舍。愛因斯坦的廣義相對論中指出了宇宙中重力波的存在,但是到目前為止,由于重力波即使存在,其值也難以測得,一直未被世人證明。那么物理工作者如果利用儀器來測量時(shí)就需要做對數(shù)據(jù)的假設(shè)檢驗(yàn)。顯然,由于重力波一直未被驗(yàn)證到,那么我們情愿接收即使是真的接收到了重力波而作出拒絕的決定,這樣可以保證如果證明了存在,那么這個(gè)證明的成功可能性比較大。這樣科學(xué)教會將出現(xiàn)第二類錯(cuò)誤的可能性減小,而放寬對第一類錯(cuò)誤的限制。而在醫(yī)院看病,醫(yī)生為了保證病人的生命安全,在觀察到某一現(xiàn)象時(shí)他們更傾向于作出有病的結(jié)論,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- VB開發(fā)流程的常見問題及答案
- 軟件考試試題及答案總結(jié)分享
- 開放源代碼軟件考試題目及答案
- 信息處理技術(shù)員考試題庫及答案
- 2025屆湖南省岳陽市汨羅市沙溪中學(xué)數(shù)學(xué)七下期末學(xué)業(yè)質(zhì)量監(jiān)測試題含解析
- 兒童活動中心安全防范措施計(jì)劃
- 明確任務(wù)分工的實(shí)施方案計(jì)劃
- 校內(nèi)交流與學(xué)習(xí)共享活動計(jì)劃
- 軟件水平考試信息處理試題及答案
- 教學(xué)日志撰寫要求計(jì)劃
- 經(jīng)營書院合作協(xié)議書
- 人教版五下-6.1 同分母分?jǐn)?shù)加減法(教學(xué)課件)
- 倉庫新員工入職培訓(xùn)模板
- 人工智能訓(xùn)練師(三級)職業(yè)技能鑒定理論考試題(附答案)
- 私人月嫂合同協(xié)議書下載
- 商標(biāo)基礎(chǔ)知識試題及答案
- 浙江開放大學(xué)2025年《行政復(fù)議法》形考作業(yè)2答案
- 消防改造協(xié)議書范本
- 職業(yè)心理健康課件
- 江蘇省南通市2025屆高三三模 地理試題(含答案)
- 年度安全生產(chǎn)月啟動講話稿材料
評論
0/150
提交評論