數(shù)理統(tǒng)計(jì):統(tǒng)計(jì)數(shù)據(jù)的理和描述_第1頁(yè)
數(shù)理統(tǒng)計(jì):統(tǒng)計(jì)數(shù)據(jù)的理和描述_第2頁(yè)
數(shù)理統(tǒng)計(jì):統(tǒng)計(jì)數(shù)據(jù)的理和描述_第3頁(yè)
數(shù)理統(tǒng)計(jì):統(tǒng)計(jì)數(shù)據(jù)的理和描述_第4頁(yè)
數(shù)理統(tǒng)計(jì):統(tǒng)計(jì)數(shù)據(jù)的理和描述_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章:統(tǒng)計(jì)資料的描述

概率論和數(shù)理統(tǒng)計(jì)是用來(lái)研究隨機(jī)現(xiàn)象的數(shù)量規(guī)律性的.由于隨機(jī)現(xiàn)象的普遍性,使得概率論和數(shù)理統(tǒng)計(jì)在工農(nóng)業(yè)生產(chǎn)、社會(huì)經(jīng)濟(jì)和現(xiàn)代科技各領(lǐng)域中具有極其廣泛的應(yīng)用.作為今后要為人類醫(yī)藥事業(yè)作出貢獻(xiàn)的大學(xué)生,應(yīng)該學(xué)好這門學(xué)科.

第一講統(tǒng)計(jì)資料的整理

一、統(tǒng)計(jì)資料的類型

1.計(jì)量資料(又稱定量數(shù)據(jù))

在實(shí)際工作中對(duì)每個(gè)觀察單位用定量的方法測(cè)定某項(xiàng)指標(biāo)量,所得數(shù)據(jù)稱為計(jì)量資料。整理資料時(shí)一般用單項(xiàng)分組或組距分組的方法。

2.計(jì)數(shù)資料(又稱定性數(shù)據(jù))

在實(shí)際工作中將每個(gè)觀察單位按某種屬性或類別分組,所得各組的觀察單位個(gè)數(shù),稱為計(jì)數(shù)資料。整理資料時(shí)一般用組距分組、單項(xiàng)分組或不分組的方法。在實(shí)際問(wèn)題中絕大多數(shù)數(shù)據(jù)資料是計(jì)量資料,本書所介紹的統(tǒng)計(jì)方法也主要用于計(jì)量資料的分析處理,只有非參數(shù)方法等用于計(jì)數(shù)資料的分析(不排除通過(guò)數(shù)量轉(zhuǎn)化而用計(jì)量資料的分析方法處理)。二、統(tǒng)計(jì)數(shù)據(jù)的整理和顯示

統(tǒng)計(jì)數(shù)據(jù)的整理是根據(jù)統(tǒng)計(jì)研究的目的和任務(wù),將收集的零亂的數(shù)據(jù)資料進(jìn)行科學(xué)的加工和匯總,

使數(shù)據(jù)資料條理化、系統(tǒng)化,以反映研究總體的數(shù)量特征、規(guī)律性和趨勢(shì)。統(tǒng)計(jì)數(shù)據(jù)的整理的一般步驟為:(1)對(duì)數(shù)據(jù)進(jìn)行審核;(2)對(duì)數(shù)據(jù)按某種屬性特征或數(shù)量特征進(jìn)行分組;(3)列出統(tǒng)計(jì)表、繪制統(tǒng)計(jì)圖。(一)定性數(shù)據(jù)的整理

定性數(shù)據(jù)是描述總體個(gè)體的屬性特征的。例:下表是根據(jù)2000年我國(guó)人口普查數(shù)據(jù)得到的,對(duì)我國(guó)6周歲以上人口按受教育程度(屬性特征)分組形成的頻數(shù)、頻率分布表。

2000年我國(guó)6周歲以上人口教育程度頻數(shù)、頻率分布表受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9我國(guó)6周歲以上人口受教育程度餅形圖(二)定量數(shù)據(jù)的整理和顯示

定量數(shù)據(jù)是描述總體的數(shù)量特征的。例:某高校某專業(yè)110名學(xué)生某門考試成績(jī)(分)如下表:764294977288559662839980817768906785696176738165518787938810089996561749762729149728298100735171996894828579745587498572789786537173908877808671968546736698559881798486748662747959969769898681788499459582916773898984743272試編制考試成績(jī)頻數(shù)、頻率分布表。學(xué)生考試成績(jī)統(tǒng)計(jì)圖表

解:(1)

計(jì)算極差R=最大值-最小值

=100-32=68

(2)確定組數(shù)k

▲經(jīng)驗(yàn)分組n<50k取5~6組

50<n<100k取7~10組n>100k取10~15組

▲公式分組k=1+

=7.781≈8

(3)確定組距(等距情形):d==8.5

為便于計(jì)算,組距一般取5或10的倍數(shù);第一組的下限要小于最小值,最后一組上限要大于最大值,本例取d=10,第一組的下限取30,最后一組的上限取100。本例實(shí)取7組。

確定組中值組中值=(4)分組計(jì)算頻數(shù)、頻率和累計(jì)頻率,列表10.7820.4910.2450.1090.0550.009累計(jì)頻率0.2180.2910.2450.1360.05450.0450.009頻率(f/n)24322715651頻數(shù)(f)90-10080-9070-8060-7050-6040-5030-40成績(jī)分組表

學(xué)生考試成績(jī)分布表(5)繪制頻數(shù)、頻率、累計(jì)頻率圖學(xué)生考試成績(jī)統(tǒng)計(jì)圖表三、數(shù)據(jù)分布特征的統(tǒng)計(jì)指標(biāo)描述(一)集中趨勢(shì)的測(cè)度

1.平均值(只介紹平均值,中位數(shù)、眾數(shù)自學(xué))(1)簡(jiǎn)單算術(shù)平均值(用于未分組數(shù)據(jù))

設(shè)觀測(cè)數(shù)據(jù)值為

則上例110名學(xué)生的平均成績(jī)?yōu)?

(2)加權(quán)算術(shù)平均數(shù)(用于分組數(shù)據(jù))

設(shè)原始數(shù)據(jù)共分為k組,各組的組中值為:

上例,由學(xué)生考試成績(jī)分布表的數(shù)據(jù):

成績(jī)分組

30-4040-5050-6060-7070-8080-9090-100

組中值(M)35455565758595

頻數(shù)(f)1 5 6 15 27 32 24

計(jì)算得:

由于組中值是該組的代表值,故用加權(quán)算術(shù)平均值公式計(jì)算的值為準(zhǔn)確值的近似值。

(3)平均值的數(shù)學(xué)性質(zhì):◆各觀測(cè)值與它們的均值的離差之和為零;

即◆各觀測(cè)值與它們的均值的離差的平方和最小。

上述性質(zhì)今后在計(jì)算或論證過(guò)程中將會(huì)用到。

(二)數(shù)據(jù)分布離散程度的測(cè)度平均值代表觀測(cè)值的整體水平,其代表性的好壞需要另外的指標(biāo)加以側(cè)度。即要考察各觀測(cè)數(shù)據(jù)偏離其平均值的程度或是數(shù)據(jù)的分散程度。一般地說(shuō)該測(cè)度值越小,平均值代表性越好,數(shù)據(jù)相對(duì)集中;相反,代表性差,數(shù)據(jù)相對(duì)分散。常用的測(cè)度值有極差、平均差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等,其中最重要的是方差和標(biāo)準(zhǔn)差。

1.極差

R=最大值-最小值(不分組)

或R=最后一組上限-第一組下限(分組)

極差簡(jiǎn)單易算,但只用了數(shù)據(jù)的兩個(gè)極端值,丟失的信息太多,不能反映中間數(shù)據(jù)的離散性,故不常用。

2.方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差是觀測(cè)數(shù)據(jù)離散程度最重要的測(cè)度。

(1)總體方差和標(biāo)準(zhǔn)差

設(shè)

則總體方差總體標(biāo)準(zhǔn)差為總體的全部觀測(cè)值,

(2)樣本方差和標(biāo)準(zhǔn)差

設(shè)從總體抽取的樣本數(shù)據(jù)為

,

則樣本方差

(不分組)

(分組)

樣本標(biāo)準(zhǔn)差

例:根據(jù)上例學(xué)生考試成績(jī)?cè)紨?shù)據(jù),已知n=110,

故樣本方差和樣本標(biāo)準(zhǔn)差分別為計(jì)算結(jié)果說(shuō)明每個(gè)學(xué)生的考試成績(jī)與平均成績(jī)78.10分相比,

平均相差別14.70分,成績(jī)分布不是很均勻。注:本例如果用分組的計(jì)算公式結(jié)果分別為本199.53和14.20

與準(zhǔn)確值215.98和14.70相差不多,但是計(jì)算量減少了。在實(shí)際計(jì)算時(shí)用下列簡(jiǎn)化公式(用計(jì)算器上的統(tǒng)計(jì)功能)=78.103.標(biāo)準(zhǔn)化變量

在對(duì)不同量綱的多個(gè)變量進(jìn)行統(tǒng)計(jì)分析時(shí),往往要對(duì)變量(或觀測(cè)值)進(jìn)行標(biāo)準(zhǔn)化處理。其公式為:

標(biāo)準(zhǔn)化值的絕對(duì)值一般不會(huì)超過(guò)3個(gè)標(biāo)準(zhǔn)差,僅只有0.3%的值超過(guò),這些數(shù)值稱為離群點(diǎn)。在第三章中將會(huì)詳細(xì)討論標(biāo)準(zhǔn)化變量有關(guān)性質(zhì)。

4.變異系數(shù)和樣本標(biāo)準(zhǔn)誤◆變異系數(shù)

×100%

它是一個(gè)無(wú)量綱的相對(duì)數(shù),主要用于比較總體水平差異較大或具有不同量綱的數(shù)據(jù)組的數(shù)據(jù)離散程度大小。

◆樣本標(biāo)準(zhǔn)誤

它是描述了各樣本平均值偏離總體平均值的平均程度(又稱為抽樣平均誤差)。例:(略)

第二講用excel進(jìn)行數(shù)據(jù)整理和作圖

一、excel數(shù)據(jù)分析程序的安裝在安裝excel時(shí)選擇完全安裝,進(jìn)入excel后:◆點(diǎn)擊“工具”菜單中的“加載宏”

◆在彈出的“加載宏”對(duì)話框中選擇“分析工具庫(kù)”◆點(diǎn)擊確定,完成安裝。(在excel“工具”的菜單就會(huì)出現(xiàn)“數(shù)據(jù)分析”的命令選項(xiàng)。二、統(tǒng)計(jì)作圖

例;根據(jù)下表的數(shù)據(jù);

2000年我國(guó)6周歲以上人口教育程度頻數(shù)、頻率分布表建立excel數(shù)據(jù)庫(kù),并制作統(tǒng)計(jì)條形圖。受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9

◆在excel中建立數(shù)據(jù)庫(kù)

◆在“插入”下拉菜單中選擇“圖表”子菜單,進(jìn)入圖表向?qū)?/p>

◆選擇圖表類型中的“柱形圖”,再單擊“下一步”◆進(jìn)入圖表數(shù)源數(shù)據(jù)窗口,確定用于制作圖表的數(shù)據(jù)區(qū)域,在“數(shù)據(jù)區(qū)域”欄中輸入“A2:F2”,在“系列產(chǎn)生在”欄選“行”.◆單擊上步的圖表中頂部“系列”標(biāo)簽,再點(diǎn)擊“分類(X)軸標(biāo)志”的空白區(qū)域的右邊的,會(huì)彈一個(gè)小條形框,再用鼠標(biāo)選定數(shù)據(jù)源的數(shù)據(jù)分類區(qū)域(B1:F1),再點(diǎn)擊小條形框右邊的按鈕。

單擊◆單擊“下一步”得下圖,并可選擇相關(guān)功能菜單◆單擊“完成”,得下圖◆對(duì)所得條形圖進(jìn)行編輯:將光標(biāo)移到要調(diào)整的區(qū)域,單擊右鍵進(jìn)入編輯窗口,對(duì)相關(guān)項(xiàng)目進(jìn)行重新選擇,得到如下圖形三、定量數(shù)據(jù)的頻數(shù)分布與直方圖的生成

例:以前面的110名學(xué)生的考試成績(jī)?yōu)槔幹祁l數(shù)分布表并生成直方圖.1.將考試數(shù)據(jù)輸入excel中,建立數(shù)據(jù)庫(kù);2.將數(shù)據(jù)按組距d=10分組,在空白列輸入各組的上限值(實(shí)為本組上限值-1);3.選擇“工具”下垃菜單的“數(shù)據(jù)分析”子菜單,用鼠標(biāo)雙擊對(duì)話框中的“直方圖”選項(xiàng),4.入進(jìn)“直方圖”對(duì)話框,其主要選項(xiàng)有:(1)在輸入?yún)^(qū)域里輸入(A1:A110);(2)在接收區(qū)域里輸入(C3:C9);(3)選擇“標(biāo)志”選項(xiàng);(4)選擇“累計(jì)百分率”選項(xiàng)(如果要作累計(jì)頻率折線圖的話);(5)選擇“圖表輸出”選項(xiàng)。按“確定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論