




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、關(guān)鍵術(shù)語統(tǒng)計學(xué)(Statistics)收收集、分析、表述和解釋數(shù)據(jù)的藝術(shù)和科學(xué)。數(shù)據(jù)( Data)收被收集、分析和解釋的事實與數(shù)字。數(shù)據(jù)集(Data set)收一特定研究中所有收集的數(shù)據(jù)。個體( Elements )收從中收集數(shù)據(jù)的實體。變量( Variable)收個體的某種令人感興趣的屬性。觀測值( Observation )收為單個個體獲取的度量集。品質(zhì)數(shù)據(jù)(Qualitative data)收為一個體的性質(zhì)提供標記或名稱的數(shù)據(jù)。品質(zhì)數(shù)據(jù)可能是非數(shù)值或數(shù)值型的。品質(zhì)變量(Qualitative variable)收有關(guān)品質(zhì)數(shù)據(jù)的變量。數(shù)量數(shù)據(jù)(Quantitative data)收表明某事
2、多少的數(shù)據(jù)。數(shù)量數(shù)據(jù)總是數(shù)值型的。數(shù)量變量(Quantitative variable)收有關(guān)數(shù)量數(shù)據(jù)的變量。截面數(shù)據(jù)(Cross-sectional data)收在同時或近似相同時點收集的數(shù)據(jù)。時間序列數(shù)據(jù)( Time series data)收在幾個連續(xù)期間收集的數(shù)據(jù)。描述統(tǒng)計學(xué)(Descriptive statistics)收用于匯總數(shù)據(jù)的表、圖和數(shù)值方法??傮w(Population )收一特定研究中所有感興趣個體的集合。樣本( Sample )收總體的一個子集。統(tǒng)計推斷(Statistical inference)收利用從一個樣本獲得的數(shù)據(jù)對總體性質(zhì)進行估計或假設(shè)檢驗的過程。頻數(shù)分布(
3、Frequency distribution) 對一數(shù)據(jù)集的表格匯總法,顯示若干無重疊組別中每一組的項目頻數(shù)(或個數(shù))。相對頻數(shù)分布(Relative frequency distribution) 一數(shù)據(jù)集的表格匯總法,顯示在若干無重疊組別中每一組的項目總數(shù)的相對頻數(shù),即分數(shù)或比例。百分數(shù)頻數(shù)分布(Percent frequency distribution) 一數(shù)據(jù)集的表格匯總法,顯示幾個無重疊組別中每一組的項目總數(shù)的百分率。條形圖(Bar graph) 一種圖形方法,描述在品質(zhì)數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)據(jù)分布或百分數(shù)頻數(shù)分布中表示的信息。餅形圖(Pie chart) 一種描述品質(zhì)數(shù)據(jù)匯總的
4、圖形方法,建立于把一個圓細分成與每一組的相對頻數(shù)相對應(yīng)的扇型的基礎(chǔ)上。直方圖(Histogram) 一種通過在橫軸上放置組間隔,在縱軸上放置頻數(shù)來描述數(shù)量數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)分布或百分數(shù)頻數(shù)分布。累積頻數(shù)分布(Cumulative frequency distribution) 對數(shù)量數(shù)據(jù)集的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項目數(shù)。累積相對頻數(shù)分布(Cumulative relative frequency distribution) 對數(shù)量數(shù)據(jù)的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項目分數(shù)或比例。累積百分數(shù)頻數(shù)分布(Cumulative percent frequen
5、cy distribution) 對數(shù)量數(shù)據(jù)的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項目的百分率。組中值(Class midpoint) 每一組中在組下限和組上限正中間的值。莖葉顯示(Stem-and-leaf display) 一種同時排列數(shù)量數(shù)據(jù)順序并提供分布形態(tài)的深入信息的探索性數(shù)據(jù)分析技術(shù)。交叉分組列表(Crosstabulation) 對兩個變量數(shù)據(jù)的表格匯總。一個變量的組用行來描述,另一變量的組用列來描述。散點圖(Scatter diagram) 表示兩個數(shù)量變量之間關(guān)系的圖形方法。一個變量列在橫軸上,另一個變量列在縱軸上??傮w參數(shù)(Population parameter)
6、 用來概括總體數(shù)據(jù)的量度的數(shù)值(如總體平均數(shù),總體方差2,總體標準差)。樣本統(tǒng)計量(Sample statistic) 用來概括樣本數(shù)據(jù)的量度的數(shù)值(如樣本平均數(shù),樣本方差s2,樣本標準差s)。平均數(shù)( Mean ) 衡量數(shù)據(jù)集中心位置的量度。用所有數(shù)據(jù)值相加的和除以項數(shù)計算。中位數(shù)( Median ) 衡量數(shù)據(jù)集中心位置的量度。中位數(shù)的值將所有的數(shù)據(jù)分為兩個相等部分,一部分的值都大于或等于它,而另一部分的值都小于或等于它。眾數(shù)( Mode ) 用以衡量數(shù)據(jù)的位置的量度,定義為發(fā)生頻數(shù)最高的數(shù)據(jù)值。百分位數(shù)(Percentile) 至少有p的數(shù)據(jù)項小于等于這個值,且至少有( 1 0 0-p)的
7、數(shù)據(jù)項大于等于這個值。第5 0百分位數(shù)即為中位數(shù)。四分位數(shù)( Quartiles ) 第2 5、第5 0和第7 5百分位數(shù)分別即為第1、第2、第3四分位數(shù)。四分位數(shù)將數(shù)據(jù)集分為4個部分,每一部分含有2 5的數(shù)據(jù)。臨界點( Hinges) 下端臨界點約等于第1四分位數(shù)或第2 5百分位數(shù)。上端臨界點約等于第3四分位數(shù)或第75百分位數(shù)。由于計算約定的不同,臨界點的值與四分位數(shù)的值會稍有不同。全距( Range ) 用以衡量變異程度的量度,定義為最大值減最小值的差。四分位點內(nèi)距(Interquartile range, IQR) 用以衡量變異程度的量度,定義為第3四分位數(shù)與第1個四分位數(shù)之差。方差(
8、Variance ) 用以衡量數(shù)據(jù)集變異程度的量度,是建立在距平均數(shù)離差的平方值的基礎(chǔ)上的。標準差(Standard deviation) 用以衡量數(shù)據(jù)集變異程度的量度,取方差的正的平方根。標準差系數(shù)( Coefficient of variation) 衡量數(shù)據(jù)集相對變異程度的量度,以標準差除以平均數(shù)再乘以100得到。Z分數(shù)(Z-score) 以距平均數(shù)的離差除以標準差s所得的值。Z分數(shù)是標準化的數(shù)值,指數(shù)據(jù)值xi距離平均數(shù)的標準差的個數(shù)。切貝謝夫定理( Chebyshers theorem) 這一定理可以用于任何數(shù)據(jù)集,用來描述與平均數(shù)的距離在特定數(shù)目個標準差范圍之內(nèi)的數(shù)據(jù)項的百分比。經(jīng)驗
9、法則(Empirical rule) 這一法則適用于山峰形或鐘形分布的數(shù)據(jù),用以描述與平均數(shù)的距離在1個、2個、3個標準差范圍之內(nèi)的數(shù)據(jù)項的百分比。異常值( outlier) 異常大或異常小的數(shù)據(jù)值。五數(shù)概括法(Five-number summary) 是一種探索性數(shù)據(jù)分析的技術(shù)。用五個數(shù)據(jù)值:最小值、第1四分位數(shù)、平均數(shù)、第3四分位數(shù)和最大值來概括數(shù)據(jù)集。盒形圖(Box plot) 一種用圖形概括數(shù)據(jù)的方法。用一個以第1和第3四分位數(shù)為邊界的方盒來表明在中心位置的5 0的數(shù)據(jù)。以一條橫線(稱為須線)從方盒兩側(cè)延伸以表明大于第3四分位數(shù)和小于第1四分位數(shù)的數(shù)據(jù)值的位置。所有異常值的位置也予以標
10、明。協(xié)方差( Covariance) 用以衡量兩變量間線性相關(guān)關(guān)系的數(shù)值量度。正值表示正相關(guān),負值表示負相關(guān)。相關(guān)系數(shù)(Correlation cofficient ) 用以衡量兩變量間線性相關(guān)關(guān)系的數(shù)值量度。其取值從- 1到+ 1。接近+ 1的值表示強的正線性相關(guān),接近- 1的值表示強的負線性相關(guān),接近零的值表示幾乎無線性相關(guān)關(guān)系。加權(quán)平均數(shù)( Weighted mean) 將每一個數(shù)據(jù)值予以一個權(quán)重以反映其在數(shù)據(jù)集中的重要程度。由此獲得的平均數(shù)即為加權(quán)平均數(shù)。分組數(shù)據(jù)(Grouped data) 將數(shù)據(jù)分為若干個組并配以頻數(shù)分布,而不記錄原始數(shù)據(jù)的個體值。概率( probability)衡
11、衡量某一事件發(fā)生可能性的數(shù)值量度。試驗( Experient)衡任何可以產(chǎn)生明確定義的結(jié)果的過程。試驗結(jié)果用符號Ei表示。樣本點(Sample point)衡單一的試驗結(jié)果。樣本空間(Sample space)衡所有可能的樣本點(試驗結(jié)果)的集合。樹形圖( Tree diagram)衡一種用于多步驟試驗樣本點的定義的輔助圖形工具。概率的基本條件(Basic requirements of probability)衡概率分配方式必須滿足兩個基本條件:a. 對于任意一個試驗結(jié)果Ei,必須有0P(Ei)1。b. 所有的k個試驗結(jié)果滿足P(Ei)= 1。古典法(Classical method)衡一種
12、概率分配的方法,它假設(shè)試驗結(jié)果都是等可能發(fā)生的。相對頻數(shù)法(Relative frequency method)衡一種以試驗或歷史數(shù)據(jù)為基礎(chǔ)的概率分配方法。主觀法(Subjective method)衡一種以主觀判斷為基礎(chǔ)的概率分配方法。事件( Event)衡一個樣本點的集合。事件A的補(Complement of event A)衡由所有不包含在A的樣本點構(gòu)成的事件。文氏圖( Venn diagram)衡一種抽象表明樣本空間和事件運算的輔助圖形工具。事件A和事件B的并(Union of A and B)衡所有的屬于A或B或同時屬于二者的樣本點構(gòu)成的事件。A和B的并記作AB。事件A和事件B的交
13、(Intersection of A and B)衡同時屬于A和B的樣本點構(gòu)成的事件。A和B的交記作AB。加法公式(Addition law)衡加法公式用于計算事件的并的概率,即P(AB)。公式為P(AB)=P(A)+P(B)-P(AB)。對于互斥事件,由于P(AB)= 0,該公式簡化為P(AB)=P (A)+P(B)。互斥事件(Mutually exclusive events)衡兩個事件沒有公共的樣本點;即AB為空且P(AB)= 0。條件概率(Conditional probability)衡給定其他事件發(fā)生的條件下某個事件發(fā)生的概率。給定事件B下A的概率為P(A | B)=P(AB)/P
14、(B)。獨立事件(Independent events)衡兩個事件A和B有P(A|B)=P(A)或P(B|A)=P(B);也就是說,事件間相互沒有影響。乘法公式(Multiplication law)衡用于計算兩事件交的概率P(AB)的概率公式??梢詫懗蒔 (AB)= P(A)P(B|A)或者P(AB)=P(B)P(A|B)。對于獨立事件,簡化為P(AB)= P(A)P(B)。先驗概率(Prior probabilities)衡事件的初始估計概率。后驗概率(Posterior probabilities)衡根據(jù)另外的信息而得到的事件的修正概率。貝葉斯定理( B a y e s theorem)
15、衡一種用來計算后驗概率的方法。隨機變量(Random variable)試試驗結(jié)果的數(shù)值性描述。離散型隨機變量(Discrete random variable)試可取一個有窮或無窮數(shù)列的值的隨機變量。連續(xù)型隨機變量(Continuous random variable)試可取一個區(qū)間或一系列區(qū)間的任何值的隨機變量。概率分布(Probability distribution)試一個表示概率怎樣在隨機變量可能值間分布的描述。概率函數(shù)(Probability function)試一個函數(shù),用f(x)標記,提供了離散型隨機變量x取特定值的概率。離散均勻概率函數(shù)(Discrete uniform pr
16、obability function)試用來定義具有相等概率的離散型概率分布的函數(shù)。數(shù)學(xué)期望(Expected value)試度量隨機變量平均值或中心位置的量度。方差( Variance )試度量隨機變量的差異性,或離散性的量度。標準差(Standard deviation)試方差的正平方根。二項試驗(Binomial experment)試具有5 . 4節(jié)中4個屬性的概率試驗。二項概率分布(Binomial probability distribution)試表示二項試驗中n次試驗有x次成功的概率分布。二項概率函數(shù)(Binomial probability function)試用來計算二項試
17、驗的概率的函數(shù)。泊松概率分布(Poisson probability distribution)試表示在一段特定時間或空間中一個事件發(fā)生x次的概率的概率分布。泊松概率函數(shù)(Poisson probability function)試用來計算泊松概率的函數(shù)。超幾何概率函數(shù)( Hypergeometric probability function)試用來計算在各次試驗非獨立時, n次試驗有x次成功的概率的函數(shù)。均勻概率分布(Uniform probability distribution)一一種連續(xù)型概率分布,其隨機變量在等長度的每一區(qū)間上取值的概率都相同。概率密度函數(shù)(Probability d
18、ensity function)一定義連續(xù)型隨機變量的概率分布的函數(shù)。正態(tài)概率分布(Normal Probability distribution)一一種連續(xù)型概率分布,其概率密度函數(shù)呈鐘型,由均值和標準差確定。標準正態(tài)概率分布(Standard normal probability distribution)均值為0、標準差為1的正態(tài)分布。連續(xù)修正因子(Continuity correction factor)一當(dāng)用連續(xù)正態(tài)概率分布來近似離散二項概率分布時,從x值加減的0.5值。指數(shù)概率分布(Exponential probability distribution)一一種連續(xù)型概率分布,在計
19、算一個事件兩次發(fā)生之間的時間或空間的概率時有用參數(shù)(Parameter) 總體的一個數(shù)值特征,如總體均值、總體標準差、總體比率p 等等。簡單隨機抽樣(Simple random sampling) 有限總體:選擇一個樣本, n個樣本點中每一個等概率被選到。無限總體:選取的樣本,其中每一個元素來自同一總體并且是獨立的。無放回抽樣(Sampling without replacement) 一個元素一旦選入樣本,就從總體中剔除,不能再次被選入。放回抽樣(Sampling with replacement) 一個元素一旦選入樣本,仍被放回總體中。先前被選入的元素可能再次被選,并且在樣本中可出現(xiàn)多次(
20、多于一次)。樣本統(tǒng)計量(Sample Statistic) 一種樣本特征,如:樣本均值,樣本標準差s,樣本比率等等。樣本統(tǒng)計量用于估計總體的參數(shù)值。抽樣分布(Sampling distribution) 樣本統(tǒng)計量所有可能值構(gòu)成的概率分布。點估計(Point estimate) 用做總體參數(shù)估計量的值。點估計量(Pointestimator) 提供總體參數(shù)點估計的樣本統(tǒng)計量,如: 、s 或。有限總體修正系數(shù)(Finite population correction factor) 對自有限總體而非無限總體抽樣時,系數(shù)用于和的公式中。經(jīng)驗法則是當(dāng)n /N0 . 0 5時,一般可忽略有限總體修正系
21、數(shù)。標準誤差(Standard error) 點估計量的標準差。中心極限定理(Central Limit theorem) 當(dāng)樣本容量大的時候,用正態(tài)概率分布近似和的抽樣分布。無偏性(Unbiasedness) 點估計量的一個性質(zhì),點估計量的數(shù)學(xué)期望等于所估總體參數(shù)的值。相對有效性(Relative efficiency) 對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的點估計量更有效。一致性(Consistency) 點估計量的一個性質(zhì),樣本容量越大,所得的點估計值與總體參數(shù)越接近。分層簡單隨機抽樣(Stratified simple random sampling) 一種概率抽樣方式,總體
22、先分成層,然后從每層中抽取簡單隨機樣本。整群抽樣(Cluster sampling) 一種概率抽樣方式,總體先分成群,然后從中抽取一個或更多個群。系統(tǒng)抽樣(Systematic sampling) 一種概率抽樣方式,從頭k 個元素中隨機選一個,然后依次往后選第k個元素。方便抽樣(Covenience sampling) 一種非概率抽樣方式,其中基于簡便選擇樣本中的元素。判斷抽樣(Judgement sampling) 一種非概率抽樣方式,其中基于研究人員的判斷選擇元素為樣本。區(qū)間估計(Interval estimate) 總體參數(shù)估計值的一個范圍,確信該范圍包括參數(shù)的值在內(nèi)。抽樣誤差(Samp
23、ling error) 無偏估計值(如樣本均值)與所估計的總體參數(shù)值(如樣本比率p)之差的絕對值??傮w均值的抽樣誤差為| - |,總體比率的抽樣誤差為| -p|。精度( Precision ) 抽樣誤差的概率解釋。置信水平(Confidence Level) 與區(qū)間估計相聯(lián)系的置信度。例如,如果某一區(qū)間估計程序所得出的全部區(qū)間中有95%包括總體參數(shù)在內(nèi),則我們稱該區(qū)間估計的構(gòu)造是基于95%的置信水平。其中,0.95稱作置信系數(shù)。邊際誤差(Margin error) 置信區(qū)間中從點估計值中所加上或減去的值。t分布(t Distribution) 概率分布的一族,當(dāng)總體是正態(tài)或者近似正態(tài)概率分布,并且總體標準差未知的情況下,對總體均值進行區(qū)間估計時常用到該分布。自由度(Degrees of freedom) t分布的參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《工作分析final》課件
- 鐵路旅客運輸服務(wù)車票知識課件
- 《廣東專升本計算機》課件
- 鐵道機車專業(yè)教學(xué)湖南鐵道左繼紅57課件
- 雙語客運值班員客運工作基本要求課件
- 鐵路工程安全技術(shù)石家莊鐵路87課件
- 鐵路客運站售票崗位作業(yè)李秀聰課件
- 中國書畫文化課件
- 中華文化課件黨課
- 電動車短期出租合同
- 分布式光伏高處作業(yè)專項施工方案
- 中華人民共和國突發(fā)事件應(yīng)對法
- 鞘內(nèi)注射化療護理課件
- 兒科護理質(zhì)量專項改善課件
- 郵政社區(qū)團購怎么做流程
- 錢大媽計劃書
- 建筑施工電動運輸車輛進場驗收表
- Unit2Let'sCelebrate!Developingideas作業(yè)設(shè)計-2023-2024學(xué)年高中英語(精修版)
- 《愛彌兒》讀書分享會
- 預(yù)后的研究與評價
- 中醫(yī)治療潰瘍性結(jié)腸炎的難點及優(yōu)勢課件
評論
0/150
提交評論