第一章 緒論與基本概念課件_第1頁
第一章 緒論與基本概念課件_第2頁
第一章 緒論與基本概念課件_第3頁
第一章 緒論與基本概念課件_第4頁
第一章 緒論與基本概念課件_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第一章緒論與統(tǒng)計學基本概念

流行病統(tǒng)計學系韓少梅

第一章緒論與基本概念統(tǒng)計學的定義Pagano:Thestudyofstatisticsexploresthecollection,organization,analysis,andinterpretationofnumericaldata。kirkwood:Statisticsisthescienceofcollecting,summarizing,presenting,andinterpretingdata,andofusingthemtoestimatethemagnitudeofassociationsandtesthypotheses。第一章緒論與基本概念

統(tǒng)計學是數(shù)據(jù)收集、歸納整理、分析數(shù)據(jù)規(guī)律和解釋數(shù)據(jù)的科學,也是研究人員合理地、靈活地應用統(tǒng)計學原理和方法,充分提取信息,深入解釋事物客觀規(guī)律的一種手段?,F(xiàn)代統(tǒng)計學更重要的是根據(jù)現(xiàn)有資料的信息,做出科學的推斷和決策。第一章緒論與基本概念統(tǒng)計學的應用范圍

Pagano:Theconceptsofstatisticsmaybeappliedtoanumberoffieldsthatincludebusiness,psychology,andagriculture,Whenthefocusisonthebiologicalandhealthsciences,weusethetermbiostatistics。將統(tǒng)計學(statistics)基本原理和方法應用在生物醫(yī)學科學研究中,形成醫(yī)學統(tǒng)計學這一門學科。概率論和數(shù)理統(tǒng)計的基本原理和方法是醫(yī)學統(tǒng)計學的理論基礎。第一章緒論與基本概念

隨著生物醫(yī)學研究的不斷發(fā)展,運用統(tǒng)計學方法來認識、推斷和解釋生命過程中的各種現(xiàn)象也越來越廣泛。運用統(tǒng)計學方法可以幫助人們分析占有信息,達到去偽存真,去粗取精,正確認識世界的目的。第一章緒論與基本概念主要學習內(nèi)容1、統(tǒng)計描述(定量資料和分類資料的集中趨勢和離散趨勢指標、抽樣誤差和參數(shù)估計及常用統(tǒng)計圖表);2、常見的理論分布及其應用(正態(tài)分布、二項分布與Poisson分布);3、總體參數(shù)的估計(分總體均數(shù)、總體率和總體平均數(shù));4、假設檢驗(t檢驗、u檢驗、方差分析、相對數(shù)、二項分布及其應用、四格表及列聯(lián)表資料的卡方檢驗、秩和檢驗等);5、回歸與相關、多元線性回歸與logistic回歸;6、實驗設計和調(diào)查設計第一章緒論與基本概念研究對象醫(yī)學統(tǒng)計學的研究對象是人體及與人體有關的各種具有不確定性的醫(yī)學數(shù)據(jù)。第一章緒論與基本概念醫(yī)學統(tǒng)計學的主要內(nèi)容統(tǒng)計學基本原理和方法

包括資料的收集、整理和分析的基本原理和方法。醫(yī)學研究設計

包括觀察性研究中的現(xiàn)場調(diào)查、病例對照研究和隊列研究設計,實驗研究中的臨床試驗、動物實驗及實驗室研究設計等。統(tǒng)計學的應用

包括醫(yī)學人口統(tǒng)計、生命統(tǒng)計及疾病監(jiān)測與控制中常用的綜合評價方法。第一章緒論與基本概念醫(yī)學統(tǒng)計學的任務

結合專業(yè)知識和具體要求進行醫(yī)學科研設計;對收集到的資料進行整理,做統(tǒng)計描述;對資料進行統(tǒng)計分析和解釋。第一章緒論與基本概念醫(yī)學統(tǒng)計學的作用

保證調(diào)查和試驗設計的科學性和完整性;指標的確定應具有特異性、客觀性、靈敏性和精密度高;比如:要評價某種治療方法對某種惡性腫瘤的治療效果,所選用的評價指標應該是一年生存率、五年生存率等指標,而不應選用治愈率或死亡率等指標。樣本量足夠大,數(shù)據(jù)真實可靠;選用統(tǒng)計分析方法正確。第一章緒論與基本概念二、統(tǒng)計學的基本概念總體與樣本同質與變異隨機變量與研究資料的類型醫(yī)學研究中常用的測量尺度參數(shù)與統(tǒng)計量誤差頻率與概率第一章緒論與基本概念⑤總體、樣本與個體

總體(population):根據(jù)研究目的所確定的性質相同的所有觀察單位的某種變量值的集合。如:調(diào)查某地1999年正常成年男子的紅細胞數(shù),則觀察對象是該地1999年正常成年男子,總體就是該地1999年正常成年男子的血紅細胞數(shù)。根據(jù)總體中觀察單位數(shù)是否已知,分為:有限總體:有確定的時間、空間和有限個觀察單位,無限總體:沒有確定的時間、空間限制,觀察單位數(shù)為無限。個體(individual):可以是一個人、一個動物、一個家庭、一個地區(qū)、一份樣品等,是科學研究的基本觀察單位。第一章緒論與基本概念樣本(sample):

從總體中隨機抽取的部分觀察單位的某個變量的測量值所組成的集合。隨機抽樣(sampling):目的是用樣本信息來推斷總體特征,因此要保證樣本的可靠性和代表性,使樣本能夠充分地反映總體的真實情況。這就要求抽樣要遵守隨機化的原則,并保證足夠的樣本含量。隨機抽樣是保證總體中每一個觀察單位均有同等機會被抽取。樣本含量:指樣本中所包含的觀察單位數(shù)。

第一章緒論與基本概念①同質總體中的個體具有相同的性質稱為同質性(homogeneity),它是進行統(tǒng)計分析的前提。統(tǒng)計分析是在一定數(shù)量的觀察單位的基礎上進行的,這一定數(shù)量的觀察單位在研究的主要方面必須具有相同的性質。比如,研究某地高血壓病人的生活質量,研究對象必須是同質的,即都是同一地區(qū)的高血壓病人。如果不能滿足同質的要求,那么研究資料就是雜亂無章的,便不能得出有用的信息和結論。第一章緒論與基本概念②變異

同質是相對的,研究對象只是在某一方面是性質相同的,同類的觀察對象之間往往也存在著變異。比如,同一地區(qū)、同一年齡的男童的身高并非完全相同,而是千差萬別、參差不齊的,這種參差不齊的情況就是變異。

因個體差異引起的現(xiàn)象稱為變異(variation)與同質的相對性不同,變異是絕對的、客觀存在的,變異是生物界的基本特點,也是生物界隨機現(xiàn)象的根本原因,統(tǒng)計學就是通過對變異的研究來探討生物隨機現(xiàn)象內(nèi)在規(guī)律的一門科學。

第一章緒論與基本概念③變量與隨機變量變量是指我們觀察或測量到的每個觀察單位的特征或指標,對觀察單位的各個變量的觀察結果稱為變量值或觀察值,因為測量不同的觀察單位會得到不同的觀察結果,所以稱之為變量。變異是生物個體的共有特征,反映了生物個體的不確定性。在測量觀察單位的變量值之前,只知道變量值所在的可能范圍,并不知道其具體取值情況,比如只知道8歲男童的身高可能在50-150厘米的范圍內(nèi),但不能確定某個男童的具體身高,正是因為變量的這種不確定性,概率論中將其稱為隨機變量。第一章緒論與基本概念④醫(yī)學研究中常用的測量尺度名義尺度:指變量的結果是按事物屬性分類來進行的測量,如性別、職業(yè),所有符號與屬性一一對應,同一符號內(nèi)各變量值的本質相同。順序尺度:其變量值不但可以分類,而且各類之間有某種特征程度上的不同,可用數(shù)學上大于或小于來表達它們之間的關系,如治療結果、文化程度。第一章緒論與基本概念區(qū)間尺度:指用數(shù)量大小來度量某種特征,它不僅表示順序,而且可把兩次測量之間的相差表達出來。其變量值可以是實數(shù)軸上的一個連續(xù)區(qū)間,任意兩個取值之間可有無窮多個值,表現(xiàn)為連續(xù)型變量,也可以是整數(shù)范圍內(nèi)的隨機變量。比數(shù)尺度:指以比值、比例等來度量某種特征,如中性粒細胞占白細胞總數(shù)的百分比、體重指數(shù)等。第一章緒論與基本概念⑥參數(shù)和統(tǒng)計量在科研工作中,通過對樣本中的觀察單位的變量值進行統(tǒng)計分析所得到的統(tǒng)計指標稱為統(tǒng)計量。如:樣本均數(shù)、樣本回歸系數(shù)、樣本標準差、樣本率等。參數(shù)是反映總體特征的統(tǒng)計指標,如果樣本的代表性好,那么統(tǒng)計量與相應的參數(shù)的數(shù)值非常接近,就可以用樣本統(tǒng)計量來估計總體參數(shù),所以樣本的統(tǒng)計量也稱為參數(shù)的估計值,例如用樣本均數(shù)、樣本回歸系數(shù)和樣本率來估計總體均數(shù)、總體回歸系數(shù)和總體率。第一章緒論與基本概念⑦誤差

統(tǒng)計學研究中,將觀察值(實際值)與真實值(理論值)之差稱之為誤差,由于生物個體的變異性等原因使得誤差在醫(yī)學領域中廣泛存在。誤差按其產(chǎn)生的原因和性質可分為:過失誤差系統(tǒng)誤差隨機誤差不同的誤差應采取不同的方法進行處理。第一章緒論與基本概念1.過失誤差過失誤差是由于觀察者的錯誤造成的誤差,比如觀察者有意或無意的記錄錯誤,計算錯誤,數(shù)據(jù)核查、錄入錯誤,度量衡單位錯誤,甚至故意修改數(shù)據(jù)導致的錯誤。過失誤差在統(tǒng)計學研究中是不允許的,必須通過加強調(diào)查、錄入和分析人員的責任心,完善檢查核對制度等方法來避免和消除過失誤差,以保證數(shù)據(jù)和結果的真實性。第一章緒論與基本概念2.系統(tǒng)誤差系統(tǒng)誤差是由于設計人員、受試者、觀察者、研究者、儀器設備、研究方法及外部環(huán)境的非實驗因素等原因的影響造成的有一定的變化規(guī)律的誤差??偟膩碚f,系統(tǒng)誤差的產(chǎn)生原因復雜,而且不能通過適當?shù)慕y(tǒng)計方法來消除,所以對研究結果的影響很大。但是系統(tǒng)誤差一般是恒向、恒量的,且有其特定的變化規(guī)律,故可以通過嚴格、科學的實驗設計將其減小或控制在最小范圍之內(nèi)。第一章緒論與基本概念3.隨機誤差隨機誤差是排除過失誤差、系統(tǒng)誤差之后尚存在的誤差,它由多種無法控制的因素引起的,大小和方向是隨機變化的。盡管隨機誤差是不可避免的,但其以零為中心呈正態(tài)分布,所以可以利用概率統(tǒng)計學的方法對隨機誤差進行估計。隨機誤差包括抽樣誤差和隨機測量誤差兩類。第一章緒論與基本概念抽樣誤差是在隨機抽樣研究中,由于抽樣而引起的樣本統(tǒng)計量和總體參數(shù)之間的差異。抽樣誤差的大小主要取決于個體之間變異程度的大小和樣本含量的多少,變異程度越大,樣本含量越小,抽樣誤差就越大;反之亦然。隨機測量誤差指在同一條件下對同一觀察單位的同一指標進行重復測量所產(chǎn)生的誤差。由于醫(yī)學技術水平的限制,隨機測量誤差目前也是無法避免的,只能盡量提高儀器設備的準確性和精密性來控制隨機測量誤差在容許的范圍之內(nèi)。第一章緒論與基本概念⑧頻率與概率

頻率:某單位配蜂刺脫敏藥,陸續(xù)試用于被蜂刺的患者,共計200人,其中180人用藥后癥狀減輕。有效率80/200=0.90或90%。這個數(shù)字是從反復實驗與實際觀察得來的。那么對于另一個接受此治療的病人,預計脫敏得可能性約為90%。就是說若有蜂刺患者10人使脫敏藥,預計約9人可能有效。比值180/200是頻率。用數(shù)學語言來表示,在n次隨機試驗中,隨機事件A發(fā)生了k次,記fn(A)=k/n,則稱fn(A)為隨機事件A在n次試驗中出現(xiàn)的頻率。第一章緒論與基本概念實踐證明,當實驗次數(shù)n逐漸增多時,fn(A)在一個常數(shù)附近擺動。擺動的幅度隨著n的增大將愈來愈小,而逐漸穩(wěn)定下來。這個常數(shù)是客觀存在的,稱為事件A的概率,記作P(A),概率表示隨機事件發(fā)生可能性的大小。頻率穩(wěn)定性是定義事件的概率的客觀基礎,它揭示了隱藏在隨機現(xiàn)象中的規(guī)律性,這種規(guī)律性就是通常所說的統(tǒng)計規(guī)律性。實際應用中,常用n→∞時的頻率作為概率的估計值。第一章緒論與基本概念隨機事件概率的大小在0與1之間。P值越接近1,表示某事件發(fā)生的可能性越大,P值越接近0,表示某事件發(fā)生的可能性越小。P=1,表示事件必然發(fā)生,P=0,表示事件不可能發(fā)生,他們是確定性的,不是隨機事件,但可把他們看成隨機事件的特例。統(tǒng)計分析中的很多結論都是帶有概率性的。

習慣上將

P≤0.05,稱為小概率事件,表示在一次實驗或觀察中該事件發(fā)生的可能性很小,可以視為很可能不發(fā)生。

第一章緒論與基本概念二、統(tǒng)計工作的基本步驟

1.研究設計2.搜集資料3.整理資料4.分析資料第一章緒論與基本概念

由此看出:統(tǒng)計學是處理資料中變異性的科學和藝術,是在收集、歸類、分析和解釋大量數(shù)據(jù)的過程中獲取可靠結果的一門學科。這里強調(diào)了“過程”,但在實際工作中,許多人往往是忽略了設計、收集和歸類(整理),到了分析數(shù)據(jù)時才想到統(tǒng)計學,此時難免發(fā)生“悔之晚矣”的憾事。作為統(tǒng)計學的應用者應充分認識到這一點。第一章緒論與基本概念1.研究設計研究設計(design)是對整個研究過程的總體設想和安排,是統(tǒng)計工作和醫(yī)學科研工作的基礎。研究設計的質量直接影響著試驗結果的準確性、可靠性、嚴密性和代表性,一旦出現(xiàn)設計上的失誤或缺陷,可能會導致整個研究的失敗。第一章緒論與基本概念研究設計的主要內(nèi)容研究的目的、意義和預期結果;具體的研究內(nèi)容或調(diào)查項目;樣本含量的估計及研究對象的選擇;隨機抽樣的方法,觀察單位和分析指標的選??;數(shù)據(jù)庫的建立和維護,資料整理和分析的方法;數(shù)據(jù)庫軟件和統(tǒng)計分析軟件的選用;在資料的搜集、整理和分析的全過程中控制誤差的方法和具體措施;在研究的整個過程中需動用的人力、物力和財力;研究的進度和參與人員,等等。

第一章緒論與基本概念根據(jù)內(nèi)容可分為專業(yè)設計和統(tǒng)計設計專業(yè)設計要求運用醫(yī)學專業(yè)知識進行設計,它反映了研究者對醫(yī)學專業(yè)知識的掌握程度和能力;統(tǒng)計設計是運用統(tǒng)計學知識進行設計,是保證研究者正確運用統(tǒng)計學知識進行統(tǒng)計描述和統(tǒng)計推斷的前提。

第一章緒論與基本概念研究設計類型統(tǒng)計設計可按照在研究過程中是否對研究對象進行干預分為調(diào)查研究設計和實驗研究設計。調(diào)查設計是指研究者通過客觀地觀察、描述調(diào)查對象來搜集資料,未加任何的干預措施,比如:調(diào)查了解某地學齡前兒童的乙肝表面抗原的陽性率,某地新生兒出生缺陷的發(fā)生率等;實驗設計是指研究者根據(jù)研究假設主動地對研究對象加以干預措施,并觀察總結其結果,回答研究假設所提出的問題。第一章緒論與基本概念實例:調(diào)查設計

澳門老年人生活質量和需求的研究設計:研究目的是了解澳門特區(qū)老年人生活質量現(xiàn)狀并探討影響老年人生活質量的主要因素;研究方法是以問卷訪談方式來評價老年人的生活質量狀況;資料收集是由經(jīng)過專門培訓的調(diào)查員(護理學院的學生和教師)對老年人進行入戶訪問獲得;調(diào)查量表采用專門生活質量量表,并根據(jù)當?shù)氐膶嶋H情況進行適當?shù)男薷?;收集到的資料經(jīng)核查整理后建立數(shù)據(jù)庫,并用SPSS統(tǒng)計分析軟件進行相應的整理和分析。第一章緒論與基本概念實例:實驗設計研究脂健乳是否有降脂作用,首先假設脂健乳可以降低血脂,再將條件相似的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模型,然后將動物隨機分為實驗組和對照組,實驗組服用脂健乳,對照組單純服用豆奶,喂養(yǎng)一個月后觀察比較兩組之間各項血脂指標的差別有無統(tǒng)計學意義,進而得出脂健乳是否具有降低血脂的保健作用的結論。第一章緒論與基本概念2.搜集資料搜集資料是研究人員按照研究設計的具體要求,獲得準確、完整、可靠的原始數(shù)據(jù)。醫(yī)學統(tǒng)計資料主要來源于三方面:統(tǒng)計工作報表和報告卡

常規(guī)保存的工作記錄

專項調(diào)查和實驗研究資料第一章緒論與基本概念3.整理資料整理資料是按照研究設計的目的對資料進行分組歸納,使分散的數(shù)據(jù)條理化,系統(tǒng)化,為資料的進一步分析做準備。原始資料的人工檢查、核對

輸入計算機、建立數(shù)據(jù)庫

對數(shù)據(jù)庫資料進行計算機檢查

第一章緒論與基本概念4.分析資料分析資料是指計算有關的統(tǒng)計指標,以反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計描述是根據(jù)研究設計的要求,選用適當?shù)慕y(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及分布規(guī)律進行測定和描述。統(tǒng)計推斷是根據(jù)概率分布和抽樣的原理,在隨機變量的樣本信息基礎上推斷總體特征。統(tǒng)計推斷包括參數(shù)估計和假設檢驗。在進行統(tǒng)計分析時,要根據(jù)統(tǒng)計設計的目的和要求,選用正確的統(tǒng)計推斷方法,對樣本資料進行準確的描述和推斷,才能得到真實可靠的分析結果。第一章緒論與基本概念

統(tǒng)計學就是通過對變異的研究來探索生物隨機現(xiàn)象內(nèi)在規(guī)律的一門學科。第一章緒論與基本概念四、研究資料的類型定量變量、數(shù)值變量---計量資料定性變量、分類變量---計數(shù)資料順序變量、有序分類變量-等級資料第一章緒論與基本概念1.定量變量---計量資料定量變量是用儀器、工具或其它定量方法進行測定或衡量所取得的數(shù)據(jù)。其變量值是定量的,表現(xiàn)為大小不等的數(shù)值,可以由區(qū)間尺度、比數(shù)尺度測得。定量變量一般帶有度量衡單位,如身高(cm)、體重(kg)、白細胞計數(shù)(109/L)、血壓(kPa)、齲齒個數(shù)等。由一組同質的定量變量所組成的資料稱為計量資料,計量資料的各個觀察值之間有量的區(qū)別,沒有性質的不同。

第一章緒論與基本概念2.定性變量---計數(shù)資料其變量值是定性的,表現(xiàn)為無不相容的類別或屬性,一般由名義尺度測得。定性變量的屬性指標的分類是無序的,這是定性變量與順序變量的區(qū)別所在。由同質的定性變量組成的資料稱為計數(shù)資料,計數(shù)資料是按照事物的屬性分組,然后清點各組的觀察單位個數(shù)得到的資料,各觀察單位之間一般沒有量的區(qū)別,但有質的不同。計數(shù)資料的變量值只能代表事物的某些屬性或分類,不能反映程度上的差別。第一章緒論與基本概念定性變量的分類如果變量只有相互獨立的兩種屬性,稱為二分類變量,這是最簡單的數(shù)據(jù)類型,如性別有男或女;檢查乙肝表面抗原的攜帶情況,有陽性或陰性;給小白鼠注射藥物,其結局有生存或死亡等。如果變量的觀察結果表現(xiàn)為相互獨立的多種屬性,稱為多分類變量,比如血型分為相互獨立的四類:A型、B型、O型和AB型,肺癌可分為腺癌、鱗癌、腺鱗癌、未分化癌、類癌和支氣管腺癌等,各類之間只有性質的不同,沒有大小和程度上的差別。

第一章緒論與基本概念3.順序變量---等級資料順序變量的觀察結果由順序尺度測得。順序變量可以體現(xiàn)程度上的不同,但是不能精確地測量相鄰的兩個變量值之間的差別。由同質的順序變量組成的資料稱為等級資料,它是介于計量資料和計數(shù)資料之間的半定量觀察結果,通常有兩個以上的等級。等級資料也是先將觀察單位按照某種屬性或某個標志分組,然后清點各組觀察單位的數(shù)目得來的,但是所分的各組之間有等級的順序,各個類別之間存在著大小和程度上的差別,這一點不同于計數(shù)資料。第一章緒論與基本概念4.連續(xù)型資料和離散型資料連續(xù)型資料

理論上在任何兩個連續(xù)型數(shù)據(jù)之間都還有無窮多個數(shù)據(jù),只要測量儀器足夠精確,連續(xù)型數(shù)據(jù)可以精確到小數(shù)點后第無限位,比如體重,在60.1和60.2kg之間理論上存在著無限多個數(shù)據(jù)。離散型資料

往往是一種計數(shù),比如心率、脈搏、兒童齲齒個數(shù)、血小板數(shù)、某年某地交通事故死

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論