版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
緒論定量數(shù)據(jù)描述演示文稿當(dāng)前1頁,總共97頁。(優(yōu)選)緒論定量數(shù)據(jù)描述當(dāng)前2頁,總共97頁。3工作生活中常見的統(tǒng)計(jì)學(xué)問題明天是否下雨?體育彩票能否中獎(jiǎng)?(概率論)子女為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)人口普查、疾病調(diào)查是如何進(jìn)行的?(調(diào)查設(shè)計(jì),抽樣)如何判斷藥物的療效?(假設(shè)檢驗(yàn))統(tǒng)計(jì)學(xué)是對(duì)令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。當(dāng)前3頁,總共97頁。4統(tǒng)計(jì)
是一種對(duì)客觀現(xiàn)象數(shù)量方面進(jìn)行的調(diào)查研究和分析;是收集、整理、分析、推斷、判斷等認(rèn)識(shí)活動(dòng)的總稱。
當(dāng)前4頁,總共97頁。統(tǒng)計(jì)學(xué)(Statistics)的定義
Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata.——Webster’InternationalDictionary
關(guān)于數(shù)據(jù)收集、整理、表達(dá)、分析與推斷的普遍原理和方法。當(dāng)前5頁,總共97頁。統(tǒng)計(jì)學(xué)是工具學(xué)科,指導(dǎo)專業(yè)學(xué)科的學(xué)習(xí)和應(yīng)用統(tǒng)計(jì)學(xué)的發(fā)展史
源遠(yuǎn)流長統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域 日趨廣泛
當(dāng)前6頁,總共97頁。7醫(yī)學(xué)統(tǒng)計(jì)學(xué)
是應(yīng)用統(tǒng)計(jì)學(xué)基本原理和方法(概率論和數(shù)理統(tǒng)計(jì)學(xué)為主)研究生物醫(yī)學(xué)領(lǐng)域問題和現(xiàn)象的一門學(xué)科。當(dāng)前7頁,總共97頁。8 醫(yī)學(xué)統(tǒng)計(jì)方法在醫(yī)學(xué)研究中的運(yùn)用主要有三個(gè)方面:①以正確的方式收集數(shù)據(jù)(方法、工具)②描述數(shù)據(jù)的統(tǒng)計(jì)特征,如數(shù)據(jù)化簡(jiǎn)、統(tǒng)計(jì)指標(biāo)的選擇與計(jì)算、統(tǒng)計(jì)結(jié)果的表達(dá)等③統(tǒng)計(jì)分析及得出正確結(jié)論,如根據(jù)概率分布,對(duì)實(shí)驗(yàn)和觀察結(jié)果存在的差異和關(guān)聯(lián)作出統(tǒng)計(jì)推斷
當(dāng)前8頁,總共97頁。醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟科研設(shè)計(jì)(Designofstudy) 專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì);觀察性研究和實(shí)/試性驗(yàn)研究資料收集(Collectionofdata) 經(jīng)常性和一時(shí)性;準(zhǔn)確、及時(shí)、完整、規(guī)范原則資料整理(Classificationofdata) 系統(tǒng)化、條理化;質(zhì)分組和量分組資料分析(Analysisofdata) 統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷當(dāng)前9頁,總共97頁。10統(tǒng)計(jì)資料的類型基本概念:變量及變量值,研究者對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行觀察和測(cè)量,這種特征稱為變量,變量的測(cè)得值叫變量值(也叫觀察值),稱為資料。按變量值的性質(zhì)可將資料分為定量資料(計(jì)量資料、數(shù)值變量)和定性資料(計(jì)數(shù)資料、分類變量)。分類變量包括無序分類(二分類、多分類)資料及有序分類(等級(jí)變量)資料。當(dāng)前10頁,總共97頁。111.計(jì)量資料(定量數(shù)據(jù))定義:通過度量衡的方法,測(cè)量每一個(gè)觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):通常有單位(可沒有),數(shù)值大小衡量水平高低分為連續(xù)型和離散型例如:患者的身高(cm)、體重(kg)、血壓(mmHg)脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012/L)當(dāng)前11頁,總共97頁。12定義:將全體觀測(cè)單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個(gè)數(shù)。特點(diǎn):通常沒有度量衡單位,互不相容的類別和屬性。多為間斷性資料(沒有程度和順序上的差別),如膚色(黑、白)、血型(ABO)、職業(yè)(工、農(nóng)、醫(yī))、性別(男、女)
2.計(jì)數(shù)資料(定性數(shù)據(jù))當(dāng)前12頁,總共97頁。13定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過半定量方法測(cè)量得到。特點(diǎn):各組之間有性質(zhì)上的差別,程度上的增減關(guān)系。①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無效、死亡。③尿蛋白:,,++,+++及以上3.等級(jí)資料(有序分類)當(dāng)前13頁,總共97頁。判斷資料類型的標(biāo)準(zhǔn): 是否按屬性分類, 每個(gè)觀察對(duì)象是否有一個(gè)確切的值 有:計(jì)量 無:計(jì)數(shù)
當(dāng)前14頁,總共97頁。住院號(hào)年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學(xué)順產(chǎn)足月20256532216074.05無小學(xué)助產(chǎn)足月20258302515868.06管理員大學(xué)順產(chǎn)足月20225432316169.05無中學(xué)剖宮產(chǎn)足月20224662515962.011商業(yè)中學(xué)剖宮產(chǎn)足月20245352715768.02無小學(xué)順產(chǎn)早產(chǎn)20258342015866.04無中學(xué)助產(chǎn)早產(chǎn)20194642415870.53無中學(xué)助產(chǎn)足月20257832915457.07干部中學(xué)剖宮產(chǎn)足月Quantitativedata計(jì)量資料Qualitativedata計(jì)數(shù)資料變量觀察單位當(dāng)前15頁,總共97頁。16三類資料間關(guān)系
例:一組2040歲成年人血壓(100人)以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù)
<8低血壓
8
正常血壓
12
輕度高血壓
15
中度高血壓
17
重度高血壓計(jì)量資料等級(jí)資料計(jì)數(shù)資料當(dāng)前16頁,總共97頁。17資料的轉(zhuǎn)化(變量類型的轉(zhuǎn)化)
數(shù)值變量分類變量
例如:測(cè)得5人的白細(xì)胞(個(gè)/mm3)數(shù)如下:
300060005000800012000數(shù)值變量異常正常正常正常異常分類變量若按正常3人,異常2人分組→二分類變量若按過低(1人),正常(3人),過高(1人)分組→等級(jí)資料高級(jí)向低級(jí),高精度向低精度當(dāng)前17頁,總共97頁。復(fù)習(xí): 1、調(diào)查某地某年7歲正常男童的身高 2、觀察某人群脈搏數(shù)(次/分) 3、小鼠染毒后細(xì)胞轉(zhuǎn)化率分別為20%,50%,75%,…… 4、觀察某人群脈搏數(shù),定義脈搏數(shù)在 60次/分~100次/分為正常,<60次/分或>100次/分為異常,按“正常”與“異?!狈謩e清點(diǎn)人數(shù)得到的資料當(dāng)前18頁,總共97頁。統(tǒng)計(jì)學(xué)中的基本概念
(一)同質(zhì)與變異(二)總體與樣本(三)參數(shù)與統(tǒng)計(jì)量(四)誤差(五)概率與頻率當(dāng)前19頁,總共97頁。(一)同質(zhì)與變異
homogeneityandvariation
1、同質(zhì):是指符合研究目的所確定的納入對(duì)象和排除對(duì)象的條件組合。觀察單位性質(zhì)大致相同如:研究兒童的生長發(fā)育,規(guī)定的同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)的兒童。2、變異:同質(zhì)研究對(duì)象某種效應(yīng)指標(biāo)測(cè)量值的波動(dòng)性。性質(zhì)相同的同質(zhì)對(duì)象的某個(gè)或某幾個(gè)特征的差異,而使得測(cè)量結(jié)果不同。這種個(gè)體間的差異即為變異。當(dāng)前20頁,總共97頁。同質(zhì)與變異的舉例例1調(diào)查2006年重慶7歲男童的身高和體重同質(zhì):2006年、重慶市、7歲男童變異:身高和體重各不相同例2研究某降壓藥的療效同質(zhì):高血壓患者、用某藥治療變異:療效各不相同當(dāng)前21頁,總共97頁。(二)總體與樣本
populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象測(cè)量值的全體,其某種變量值的集合。分有限總體與無限總體樣本:從總體中隨機(jī)抽取的部分觀察單位,其實(shí)測(cè)值的集合。
當(dāng)前22頁,總共97頁。當(dāng)前23頁,總共97頁。樣本可靠性、代表性的條件隨機(jī)抽樣(隨機(jī)≠隨便)樣本含量:足夠數(shù)量構(gòu)成:樣本的分布與總體的分布一致當(dāng)前24頁,總共97頁。隨機(jī)抽樣
randomsampling隨機(jī)抽樣方法(在總體中每個(gè)個(gè)體具有相同的機(jī)會(huì)被抽到)。當(dāng)前25頁,總共97頁。樣本含量充足:根據(jù)一定條件計(jì)算樣本的結(jié)構(gòu)分布與總體的分布特征一致例如:欲研究重慶市7歲兒童的生長發(fā)育情況總體:男107:女100樣本:應(yīng)該接近或近似男107:女100當(dāng)前26頁,總共97頁。(三)參數(shù)與統(tǒng)計(jì)量
parameterandstatistic參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)
總體樣本抽取部分觀察單位統(tǒng)計(jì)量
參數(shù)
推斷inference統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為
。是參數(shù)附近波動(dòng)的隨機(jī)變量。當(dāng)前27頁,總共97頁。(四)誤差error誤差:實(shí)際觀察值與客觀真實(shí)值之間的差別,以及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。實(shí)際觀測(cè)過程中,在相同條件下,由受試對(duì)象、研究者、儀器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等原因(4ME)造成的測(cè)定值的波動(dòng)性和對(duì)真實(shí)值的偏離。根據(jù)性質(zhì)和來源分為(1)系統(tǒng)誤差(2)隨機(jī)誤差當(dāng)前28頁,總共97頁。(1)系統(tǒng)誤差systematicerror特點(diǎn):大小恒定、傾向性、周期性、累加性的偏離真值??梢酝ㄟ^嚴(yán)格的實(shí)驗(yàn)設(shè)計(jì)預(yù)防和技術(shù)措施消除當(dāng)前29頁,總共97頁。(2)隨機(jī)誤差randomerror排除系統(tǒng)誤差后尚存的誤差,受多種無法控制的因素的影響。特點(diǎn):大小方向不一的隨機(jī)變化,客觀不可避免。隨機(jī)測(cè)量誤差:由于偶然因素,對(duì)于同一樣本多次測(cè)定結(jié)果不完全一樣,結(jié)果有時(shí)偏大有時(shí)偏小,沒有傾向性,多次測(cè)量計(jì)算平均值可以減小甚至消除。隨機(jī)抽樣誤差:由抽樣造成(個(gè)體變異造成)的樣本統(tǒng)計(jì)量和總體參數(shù)間的差異。(1)改進(jìn)抽樣方法,增加樣本的代表性。
樣本量n相等的情況下:
整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標(biāo)當(dāng)前30頁,總共97頁。(五)概率與頻率
probabilityandfrequency
確定性現(xiàn)象:在某種條件下,一定會(huì)發(fā)生或一定不會(huì)發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。
隨機(jī)現(xiàn)象:在同樣條件下可能會(huì)出現(xiàn)多種結(jié)果,究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機(jī)事件。隨機(jī)事件的特征:①隨機(jī)性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:描述隨機(jī)事件發(fā)生的可能性大小的度量,用大寫的P
表示,是一個(gè)穩(wěn)定的值;取值[0,1]。當(dāng)前31頁,總共97頁。必然事件P=1不可能事件P=0隨機(jī)事件0<P<1小概率事件:P≤0.05(5%)或P≤0.01(1%)的隨機(jī)事件稱為小概率事件。小概率原理:在統(tǒng)計(jì)學(xué)上,小概率事件在一次抽樣或一次實(shí)驗(yàn)中當(dāng)作不發(fā)生。(結(jié)論有風(fēng)險(xiǎn))小概率事件當(dāng)前32頁,總共97頁。樣本的實(shí)際發(fā)生率稱為頻率,具有波動(dòng)性。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。頻率與概率間的關(guān)系:樣本頻率總是圍繞概率上下波動(dòng)重復(fù)次數(shù)越多,樣本含量越大,波動(dòng)幅度越小,頻率越接近概率。即概率可以用穩(wěn)定的頻率進(jìn)行解釋。頻率frequency當(dāng)前33頁,總共97頁。學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的問題1、統(tǒng)計(jì)學(xué)研究的是群體(總體)的數(shù)量特征;↑適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)2、學(xué)會(huì)統(tǒng)計(jì)學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性↑醫(yī)學(xué)專業(yè)知識(shí)解釋當(dāng)前34頁,總共97頁。學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的問題3、不要求公式來源、推導(dǎo),不要求復(fù)雜公式的記憶,但要了解其意義、用途和應(yīng)用條件4、不同資料類型采用不同統(tǒng)計(jì)方法進(jìn)行分析,因此一定要能正確區(qū)分統(tǒng)計(jì)資料的類型。5、正確理解統(tǒng)計(jì)學(xué)的基本概念當(dāng)前35頁,總共97頁。資料的統(tǒng)計(jì)描述當(dāng)前36頁,總共97頁。統(tǒng)計(jì)描述的意義社會(huì)活動(dòng)看似雜亂無章,對(duì)個(gè)體來說有很多不確定性,但總體上都是服從一些統(tǒng)計(jì)規(guī)律的。醫(yī)學(xué)工作有很多數(shù)據(jù),統(tǒng)計(jì)學(xué)描述就是對(duì)這些數(shù)據(jù)進(jìn)行加工和提煉,找出規(guī)律、預(yù)測(cè)未知。當(dāng)前37頁,總共97頁。 概念: 用適當(dāng)?shù)慕y(tǒng)計(jì)統(tǒng)計(jì)圖(表)和統(tǒng)計(jì)指標(biāo)對(duì)原始數(shù)據(jù)的分布規(guī)律及其數(shù)量特征進(jìn)行測(cè)定和描述。 特點(diǎn):
用直觀、簡(jiǎn)單的形式揭示數(shù)據(jù)資料蘊(yùn)含的內(nèi)在信息。是統(tǒng)計(jì)推斷的基礎(chǔ)。
當(dāng)前38頁,總共97頁。計(jì)量資料離散型計(jì)量資料:變量取值可一一列舉。如:正常人的脈搏次數(shù)、每個(gè)育齡婦女的現(xiàn)有子女?dāng)?shù)等。連續(xù)型計(jì)量資料:變量取值不能一一列舉,而是一定范圍內(nèi)的任意值。如人體身高、體重的變化、大氣中二氧化碳濃度等。當(dāng)前39頁,總共97頁。計(jì)量資料的統(tǒng)計(jì)描述方法:(單變量)1.通過頻數(shù)表描述數(shù)據(jù)特征2.用統(tǒng)計(jì)指標(biāo)描述數(shù)據(jù)的特征。
當(dāng)前40頁,總共97頁。頻數(shù)和頻數(shù)表頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù),即某個(gè)測(cè)量值的個(gè)(例)數(shù)。頻數(shù)分布表(frequencydistributiontable):
又稱頻數(shù)表,是將原始數(shù)據(jù)進(jìn)行適當(dāng)分組后得到各組的頻數(shù)而形成的表格。 通過頻數(shù)表可了解數(shù)據(jù)分布范圍、集中位置、分布形態(tài)等特征。編制方法:手工、軟件(如SAS、SPSS等)當(dāng)前41頁,總共97頁。離散型變量的頻數(shù)分布 例1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4等共96個(gè)數(shù)值當(dāng)前42頁,總共97頁。表1998年某地96名婦女產(chǎn)前檢查次數(shù)分布檢查次數(shù)頻數(shù)頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.561212.596100.0合計(jì)96100
制作要點(diǎn):分別清點(diǎn)每一種取值的個(gè)數(shù);也可以將尾部的多個(gè)取值作為一個(gè)組進(jìn)行計(jì)數(shù)。本例編制頻數(shù)表如下:當(dāng)前43頁,總共97頁。6當(dāng)前44頁,總共97頁。連續(xù)型變量的頻數(shù)分布 將數(shù)據(jù)分成適當(dāng)組段,計(jì)數(shù)每組的頻數(shù),編制成的頻數(shù)分布表,則能顯示出數(shù)據(jù)分布的特點(diǎn)。
例:某年某市120名12歲男童的身高(cm)資料如下,作統(tǒng)計(jì)描述。當(dāng)前45頁,總共97頁。142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9當(dāng)前46頁,總共97頁。1、求數(shù)據(jù)的極差(全距)(range):極差是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)變異的幅度。本例極差:
R=160.9-125.9=35cm當(dāng)前47頁,總共97頁。142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2
125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7
160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9當(dāng)前48頁,總共97頁。2、劃分組段(1)確定組數(shù):制作頻數(shù)表是為了簡(jiǎn)化資料,顯示數(shù)據(jù)的分布規(guī)律,因此組數(shù)不能太多。也不能太少,太少會(huì)掩蓋數(shù)據(jù)分布的規(guī)律。適宜的分組數(shù)與觀察值的個(gè)數(shù)n的多少有關(guān)。n在50以下,可分5~8組,n在50以上,可分9~15組,一般取10組左右。當(dāng)前49頁,總共97頁。(2)確定組距一般采取等距分組。組距=極差/組數(shù)取整數(shù),或根據(jù)專業(yè)習(xí)慣取整齊數(shù)值
本例組距=35/10=3.5≈4當(dāng)前50頁,總共97頁。(3)確定各組段的組限:下限(lowlimit):每個(gè)組段的起點(diǎn)上限(upperlimit):每個(gè)組段的終點(diǎn) 上限=下限+組距
第一組段必須包含最小值,其下限一般取包含最小值的較為整齊的數(shù)值。本例最小值為125.9,取125為第一組段的下限。其上限=125+4=129。各組段不能重疊,每一組段均為半開區(qū)間當(dāng)前51頁,總共97頁。3、統(tǒng)計(jì)頻數(shù)繪制頻數(shù)表當(dāng)前52頁,總共97頁。4、頻率與累計(jì)頻率頻率:頻數(shù)表中的各組頻數(shù)之和等于總例數(shù)n,將各組的頻數(shù)除以n所得的比值被稱為頻率。累計(jì)頻數(shù):某組段及前面各組段的頻數(shù)之和。累計(jì)頻率:累計(jì)頻數(shù)除以總例數(shù)。當(dāng)前53頁,總共97頁。125129133137141145149153157對(duì)稱分布當(dāng)前54頁,總共97頁。(二)頻數(shù)分布特征從頻數(shù)表,特別是頻數(shù)分布圖可以看到頻數(shù)分布有兩個(gè)特征:1、集中位置:數(shù)據(jù)向某個(gè)位置聚集或集中地傾向。大多數(shù)12歲男童的身高集中在中央部分;2、離散程度:數(shù)據(jù)分散性和變異程度。少數(shù)男童具有較低和較高身高,頻數(shù)向兩端逐漸減少。當(dāng)前55頁,總共97頁。(三)頻數(shù)分布的類型1、對(duì)稱分布:指集中位置在中間,左右兩側(cè)對(duì)稱。正態(tài)分布:中間組段頻數(shù)最多,兩側(cè)對(duì)稱,規(guī)律下降2、偏態(tài)分布:指集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱。 正偏態(tài):集中位置偏向數(shù)值較小一側(cè)(左側(cè))
負(fù)偏態(tài):集中位置偏向數(shù)值較大一側(cè)(右側(cè))當(dāng)前56頁,總共97頁。圖2-1
101名正常成年女性血清總膽固醇頻數(shù)分布
頻數(shù)血清總膽固醇對(duì)稱分布當(dāng)前57頁,總共97頁。圖2-259名鏈球菌咽喉炎患者潛伏期正偏態(tài)分布當(dāng)前58頁,總共97頁。
負(fù)偏態(tài)分布當(dāng)前59頁,總共97頁。(五)頻數(shù)分布表的用途1、揭示資料的分布特征及類型2、便于發(fā)現(xiàn)某些特大或特小的可疑值3、組段的頻率作為概率的估計(jì)4、便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理當(dāng)前60頁,總共97頁。4、某單位職工體檢101名正常成年女子的血清總膽固醇(mmol/L)5、某醫(yī)院1998年在某城區(qū)隨機(jī)調(diào)查了8589例60歲以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例,高血壓患病率為2823/8589*100/%=32.87% 總體與樣本、統(tǒng)計(jì)量與參數(shù)、系統(tǒng)誤差與抽樣誤差當(dāng)前61頁,總共97頁。計(jì)量資料描述統(tǒng)計(jì)指標(biāo)當(dāng)前62頁,總共97頁。一、描述集中位置的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(average)反映了資料的集中傾向(centraltendency)的位置和平均水平。作用:是一組計(jì)量數(shù)據(jù)平均水平的代表值;可作為不同組間的比較值。常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)
(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
當(dāng)前63頁,總共97頁。一、算術(shù)均數(shù)簡(jiǎn)稱均數(shù)
總體均數(shù)用表示
樣本均數(shù)用表示頻數(shù)為正態(tài)或近似正態(tài)分布的計(jì)量資料適用條件當(dāng)前64頁,總共97頁。1、直接法(樣本例數(shù)較少)將所有數(shù)據(jù)直接相加,再除以總例數(shù)n:當(dāng)前65頁,總共97頁。例如:測(cè)定了5名健康人第一小時(shí)末血沉,分別是6、3、2、9、10mm,求均數(shù)當(dāng)前66頁,總共97頁。2、加權(quán)法(樣本例數(shù)較多,近似計(jì)算) 觀察力數(shù)較多,編制頻數(shù)表后,用各組段的組中值代替該組段中的任一觀察值,該組段的頻數(shù)是f,即有f個(gè)組中值,則有組中值與頻數(shù)的乘積代替該組段的各個(gè)值相加。計(jì)算公式:當(dāng)前67頁,總共97頁。利用頻數(shù)表,將每組段的組中值,即(下限+上限)/2,代替該組段觀察值的實(shí)際取值,用加權(quán)法求算術(shù)平均數(shù)。在樣本例數(shù)較多的情況下,加權(quán)法與直接法算得的結(jié)果相差不大。見P10當(dāng)前68頁,總共97頁。均數(shù)的特征當(dāng)數(shù)據(jù)呈單峰對(duì)稱分布時(shí),位于分布的中心,它是頻數(shù)分布最集中的位置。但易受極端值影響各觀察值與均數(shù)之差的總和等于0各觀察值的離均差平方和最小
當(dāng)前69頁,總共97頁。均數(shù)的應(yīng)用:反應(yīng)一組同質(zhì)觀察值的平均水平作為樣本代表值與其他樣本比較適用于描述單峰對(duì)稱分布(正態(tài)或近似正態(tài))的集中位置當(dāng)前70頁,總共97頁。二、幾何均數(shù)(G,geometricmean) 適用于①原始數(shù)據(jù)分布不對(duì)稱,但經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料;②滴度資料(等比資料)。 如抗體滴度、細(xì)菌計(jì)數(shù)等。公式:當(dāng)前71頁,總共97頁。 例2.2測(cè)得10個(gè)人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。
當(dāng)前72頁,總共97頁。幾何均數(shù)是對(duì)數(shù)轉(zhuǎn)換后的數(shù)據(jù)的算術(shù)均數(shù)的反對(duì)數(shù)。對(duì)于每組相同觀察值較多的資料,也可用加權(quán)法計(jì)算幾何均數(shù):例2.3(頻數(shù)表資料)應(yīng)用:主要用于血清學(xué)和微生物學(xué)中。
當(dāng)前73頁,總共97頁。幾何均數(shù)應(yīng)用注意事項(xiàng):常用于等比資料和對(duì)數(shù)正態(tài)分布資料觀察值中不宜出現(xiàn)0和負(fù)值若觀察值全是負(fù)值,可先去掉負(fù)號(hào),得出結(jié)果后加上。當(dāng)前74頁,總共97頁。三、中位數(shù)(median)
中位數(shù)是指將一組觀察值從小到大排序后居于中間位置的那個(gè)數(shù)值,全部觀察值中,大于和小于中位數(shù)的觀察值個(gè)數(shù)相等。任何分布的定量數(shù)據(jù)均可用中位數(shù)描述其分布的集中位置。當(dāng)前75頁,總共97頁。直接法公式:
當(dāng)n為偶數(shù)時(shí) 當(dāng)n為奇數(shù)時(shí)當(dāng)前76頁,總共97頁。1.原始資料如測(cè)得5個(gè)人的VLDL中的apo_B的含量(mg/dl)為0.84、2.85、5.46、8.58、9.60,則
M=5.46(mg/dl)若測(cè)量結(jié)果:0.84、2.85、8.58、9.6,則
M=(2.85+8.58)/2=5.72(mg/dl)當(dāng)前77頁,總共97頁。
2.頻數(shù)表資料表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數(shù)累積頻數(shù)累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.6M1.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合計(jì)630--當(dāng)前78頁,總共97頁。L、iM、fM分別為M所在組段的下限、組距和頻數(shù),fL為M所在組段之前各組段的累積頻數(shù)。當(dāng)前79頁,總共97頁。連續(xù)型變量中位數(shù)的的計(jì)算可用公式:
組距中位數(shù)所在組前一組的累計(jì)頻數(shù)
中位數(shù)所在組下限中位數(shù)所在組的頻數(shù)下限值L上限值Ui
fm中位數(shù)Md當(dāng)前80頁,總共97頁。均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)當(dāng)前81頁,總共97頁。四、百分位數(shù)(percentile) 是一種位置指標(biāo),樣本的第X百分位數(shù)常記為PX(XPK),它是指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分成兩部分,在不包括PX的全部數(shù)據(jù)中有X%的數(shù)據(jù)小于PX
,有(100-X)%的數(shù)據(jù)大于PX
。當(dāng)前82頁,總共97頁。中位數(shù)是特殊的百分位數(shù),第50百分位數(shù),M=P50
。連續(xù)性變量頻數(shù)表資料百分位數(shù)計(jì)算公式:P12例子當(dāng)前83頁,總共97頁。百分位數(shù)的應(yīng)用1、中位數(shù)是百分位數(shù)的特例。其特點(diǎn)是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無確定數(shù)值數(shù)據(jù)的平均水平。2、多個(gè)百分位數(shù)相結(jié)合可以用來說明一特定的問題:離散程度、參考值范圍、把資料劃分等級(jí)當(dāng)前84頁,總共97頁。小結(jié):
集中位置的描述——平均數(shù)
平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。
不同的分布使用不同的指標(biāo)
(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)當(dāng)前85頁,總共97頁。二、描述離散程度的統(tǒng)計(jì)指標(biāo)
平均數(shù)并不能使我們?nèi)娴卣J(rèn)識(shí)事物,試看下例:例:
對(duì)甲、乙兩名高血壓患者連續(xù)觀察5天,測(cè)得的收縮壓分別為(mmHg):甲患者162145178142186(=162.6)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度鏟車租賃市場(chǎng)推廣合作合同3篇
- 2025年度食品安全管理體系認(rèn)證合同要求3篇
- 2024版融資租賃合同書模板
- 2025年度廚師職業(yè)保險(xiǎn)與福利保障服務(wù)合同3篇
- 二零二五版承臺(tái)施工節(jié)能減排合同2篇
- 二零二五版代收款與房地產(chǎn)銷售合同3篇
- 2025版綠化工程設(shè)計(jì)變更與施工管理合同4篇
- 二零二五年度網(wǎng)絡(luò)安全培訓(xùn)合同及技能提升方案3篇
- 2025版房地產(chǎn)租賃合同附家具及裝修改造條款3篇
- 二零二五版電商企業(yè)9%股權(quán)轉(zhuǎn)讓及增值服務(wù)合同3篇
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設(shè)備的選擇和安裝接地配置和保護(hù)導(dǎo)體
- 2025湖北襄陽市12345政府熱線話務(wù)員招聘5人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 計(jì)劃合同部部長述職報(bào)告范文
- 2025年河北省職業(yè)院校技能大賽智能節(jié)水系統(tǒng)設(shè)計(jì)與安裝(高職組)考試題庫(含答案)
- 人教版高一地理必修一期末試卷
- 2024年下半年鄂州市城市發(fā)展投資控股集團(tuán)限公司社會(huì)招聘【27人】易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- GB/T 29498-2024木門窗通用技術(shù)要求
- 《職業(yè)院校與本科高校對(duì)口貫通分段培養(yǎng)協(xié)議書》
- GJB9001C質(zhì)量管理體系要求-培訓(xùn)專題培訓(xùn)課件
- 人教版(2024)英語七年級(jí)上冊(cè)單詞表
- 二手車車主寄售協(xié)議書范文范本
評(píng)論
0/150
提交評(píng)論