版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章:統(tǒng)計(jì)資料的描述
概率論和數(shù)理統(tǒng)計(jì)是用來(lái)研究隨機(jī)現(xiàn)象的數(shù)量規(guī)律性的.由于隨機(jī)現(xiàn)象的普遍性,使得概率論和數(shù)理統(tǒng)計(jì)在工農(nóng)業(yè)生產(chǎn)、社會(huì)經(jīng)濟(jì)和現(xiàn)代科技各領(lǐng)域中具有極其廣泛的應(yīng)用.作為今后要為人類醫(yī)藥事業(yè)作出貢獻(xiàn)的大學(xué)生,應(yīng)該學(xué)好這門學(xué)科.
第一講統(tǒng)計(jì)資料的整理
一、統(tǒng)計(jì)資料的類型
1.計(jì)量資料(又稱定量數(shù)據(jù))
在實(shí)際工作中對(duì)每個(gè)觀察單位用定量的方法測(cè)定某項(xiàng)指標(biāo)量,所得數(shù)據(jù)稱為計(jì)量資料。整理資料時(shí)一般用單項(xiàng)分組或組距分組的方法。
2.計(jì)數(shù)資料(又稱定性數(shù)據(jù))
在實(shí)際工作中將每個(gè)觀察單位按某種屬性或類別分組,所得各組的觀察單位個(gè)數(shù),稱為計(jì)數(shù)資料。整理資料時(shí)一般用組距分組、單項(xiàng)分組或不分組的方法。在實(shí)際問(wèn)題中絕大多數(shù)數(shù)據(jù)資料是計(jì)量資料,本書所介紹的統(tǒng)計(jì)方法也主要用于計(jì)量資料的分析處理,只有非參數(shù)方法等用于計(jì)數(shù)資料的分析(不排除通過(guò)數(shù)量轉(zhuǎn)化而用計(jì)量資料的分析方法處理)。二、統(tǒng)計(jì)數(shù)據(jù)的整理和顯示
統(tǒng)計(jì)數(shù)據(jù)的整理是根據(jù)統(tǒng)計(jì)研究的目的和任務(wù),將收集的零亂的數(shù)據(jù)資料進(jìn)行科學(xué)的加工和匯總,
使數(shù)據(jù)資料條理化、系統(tǒng)化,以反映研究總體的數(shù)量特征、規(guī)律性和趨勢(shì)。統(tǒng)計(jì)數(shù)據(jù)的整理的一般步驟為:(1)對(duì)數(shù)據(jù)進(jìn)行審核;(2)對(duì)數(shù)據(jù)按某種屬性特征或數(shù)量特征進(jìn)行分組;(3)列出統(tǒng)計(jì)表、繪制統(tǒng)計(jì)圖。(一)定性數(shù)據(jù)的整理
定性數(shù)據(jù)是描述總體個(gè)體的屬性特征的。例:下表是根據(jù)2000年我國(guó)人口普查數(shù)據(jù)得到的,對(duì)我國(guó)6周歲以上人口按受教育程度(屬性特征)分組形成的頻數(shù)、頻率分布表。
2000年我國(guó)6周歲以上人口教育程度頻數(shù)、頻率分布表受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9我國(guó)6周歲以上人口受教育程度餅形圖(二)定量數(shù)據(jù)的整理和顯示
定量數(shù)據(jù)是描述總體的數(shù)量特征的。例:某高校某專業(yè)110名學(xué)生某門考試成績(jī)(分)如下表:764294977288559662839980817768906785696176738165518787938810089996561749762729149728298100735171996894828579745587498572789786537173908877808671968546736698559881798486748662747959969769898681788499459582916773898984743272試編制考試成績(jī)頻數(shù)、頻率分布表。學(xué)生考試成績(jī)統(tǒng)計(jì)圖表
解:(1)
計(jì)算極差R=最大值-最小值
=100-32=68
(2)確定組數(shù)k
▲經(jīng)驗(yàn)分組n<50k取5~6組
50<n<100k取7~10組n>100k取10~15組
▲公式分組k=1+
=7.781≈8
(3)確定組距(等距情形):d==8.5
為便于計(jì)算,組距一般取5或10的倍數(shù);第一組的下限要小于最小值,最后一組上限要大于最大值,本例取d=10,第一組的下限取30,最后一組的上限取100。本例實(shí)取7組。
▲
確定組中值組中值=(4)分組計(jì)算頻數(shù)、頻率和累計(jì)頻率,列表10.7820.4910.2450.1090.0550.009累計(jì)頻率0.2180.2910.2450.1360.05450.0450.009頻率(f/n)24322715651頻數(shù)(f)90-10080-9070-8060-7050-6040-5030-40成績(jī)分組表
學(xué)生考試成績(jī)分布表(5)繪制頻數(shù)、頻率、累計(jì)頻率圖學(xué)生考試成績(jī)統(tǒng)計(jì)圖表三、數(shù)據(jù)分布特征的統(tǒng)計(jì)指標(biāo)描述(一)集中趨勢(shì)的測(cè)度
1.平均值(只介紹平均值,中位數(shù)、眾數(shù)自學(xué))(1)簡(jiǎn)單算術(shù)平均值(用于未分組數(shù)據(jù))
設(shè)觀測(cè)數(shù)據(jù)值為
則上例110名學(xué)生的平均成績(jī)?yōu)?
(2)加權(quán)算術(shù)平均數(shù)(用于分組數(shù)據(jù))
設(shè)原始數(shù)據(jù)共分為k組,各組的組中值為:
則
上例,由學(xué)生考試成績(jī)分布表的數(shù)據(jù):
成績(jī)分組
30-4040-5050-6060-7070-8080-9090-100
組中值(M)35455565758595
頻數(shù)(f)1 5 6 15 27 32 24
計(jì)算得:
由于組中值是該組的代表值,故用加權(quán)算術(shù)平均值公式計(jì)算的值為準(zhǔn)確值的近似值。
(3)平均值的數(shù)學(xué)性質(zhì):◆各觀測(cè)值與它們的均值的離差之和為零;
即◆各觀測(cè)值與它們的均值的離差的平方和最小。
即
上述性質(zhì)今后在計(jì)算或論證過(guò)程中將會(huì)用到。
(二)數(shù)據(jù)分布離散程度的測(cè)度平均值代表觀測(cè)值的整體水平,其代表性的好壞需要另外的指標(biāo)加以側(cè)度。即要考察各觀測(cè)數(shù)據(jù)偏離其平均值的程度或是數(shù)據(jù)的分散程度。一般地說(shuō)該測(cè)度值越小,平均值代表性越好,數(shù)據(jù)相對(duì)集中;相反,代表性差,數(shù)據(jù)相對(duì)分散。常用的測(cè)度值有極差、平均差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等,其中最重要的是方差和標(biāo)準(zhǔn)差。
1.極差
R=最大值-最小值(不分組)
或R=最后一組上限-第一組下限(分組)
極差簡(jiǎn)單易算,但只用了數(shù)據(jù)的兩個(gè)極端值,丟失的信息太多,不能反映中間數(shù)據(jù)的離散性,故不常用。
2.方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差是觀測(cè)數(shù)據(jù)離散程度最重要的測(cè)度。
(1)總體方差和標(biāo)準(zhǔn)差
設(shè)
則總體方差總體標(biāo)準(zhǔn)差為總體的全部觀測(cè)值,
(2)樣本方差和標(biāo)準(zhǔn)差
設(shè)從總體抽取的樣本數(shù)據(jù)為
,
則樣本方差
(不分組)
或
(分組)
樣本標(biāo)準(zhǔn)差
例:根據(jù)上例學(xué)生考試成績(jī)?cè)紨?shù)據(jù),已知n=110,
故樣本方差和樣本標(biāo)準(zhǔn)差分別為計(jì)算結(jié)果說(shuō)明每個(gè)學(xué)生的考試成績(jī)與平均成績(jī)78.10分相比,
平均相差別14.70分,成績(jī)分布不是很均勻。注:本例如果用分組的計(jì)算公式結(jié)果分別為本199.53和14.20
與準(zhǔn)確值215.98和14.70相差不多,但是計(jì)算量減少了。在實(shí)際計(jì)算時(shí)用下列簡(jiǎn)化公式(用計(jì)算器上的統(tǒng)計(jì)功能)=78.103.標(biāo)準(zhǔn)化變量
在對(duì)不同量綱的多個(gè)變量進(jìn)行統(tǒng)計(jì)分析時(shí),往往要對(duì)變量(或觀測(cè)值)進(jìn)行標(biāo)準(zhǔn)化處理。其公式為:
標(biāo)準(zhǔn)化值的絕對(duì)值一般不會(huì)超過(guò)3個(gè)標(biāo)準(zhǔn)差,僅只有0.3%的值超過(guò),這些數(shù)值稱為離群點(diǎn)。在第三章中將會(huì)詳細(xì)討論標(biāo)準(zhǔn)化變量有關(guān)性質(zhì)。
4.變異系數(shù)和樣本標(biāo)準(zhǔn)誤◆變異系數(shù)
×100%
它是一個(gè)無(wú)量綱的相對(duì)數(shù),主要用于比較總體水平差異較大或具有不同量綱的數(shù)據(jù)組的數(shù)據(jù)離散程度大小。
◆樣本標(biāo)準(zhǔn)誤
它是描述了各樣本平均值偏離總體平均值的平均程度(又稱為抽樣平均誤差)。例:(略)
第二講用excel進(jìn)行數(shù)據(jù)整理和作圖
一、excel數(shù)據(jù)分析程序的安裝在安裝excel時(shí)選擇完全安裝,進(jìn)入excel后:◆點(diǎn)擊“工具”菜單中的“加載宏”
◆在彈出的“加載宏”對(duì)話框中選擇“分析工具庫(kù)”◆點(diǎn)擊確定,完成安裝。(在excel“工具”的菜單就會(huì)出現(xiàn)“數(shù)據(jù)分析”的命令選項(xiàng)。二、統(tǒng)計(jì)作圖
例;根據(jù)下表的數(shù)據(jù);
2000年我國(guó)6周歲以上人口教育程度頻數(shù)、頻率分布表建立excel數(shù)據(jù)庫(kù),并制作統(tǒng)計(jì)條形圖。受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9
◆在excel中建立數(shù)據(jù)庫(kù)
◆在“插入”下拉菜單中選擇“圖表”子菜單,進(jìn)入圖表向?qū)?/p>
◆選擇圖表類型中的“柱形圖”,再單擊“下一步”◆進(jìn)入圖表數(shù)源數(shù)據(jù)窗口,確定用于制作圖表的數(shù)據(jù)區(qū)域,在“數(shù)據(jù)區(qū)域”欄中輸入“A2:F2”,在“系列產(chǎn)生在”欄選“行”.◆單擊上步的圖表中頂部“系列”標(biāo)簽,再點(diǎn)擊“分類(X)軸標(biāo)志”的空白區(qū)域的右邊的,會(huì)彈一個(gè)小條形框,再用鼠標(biāo)選定數(shù)據(jù)源的數(shù)據(jù)分類區(qū)域(B1:F1),再點(diǎn)擊小條形框右邊的按鈕。
單擊◆單擊“下一步”得下圖,并可選擇相關(guān)功能菜單◆單擊“完成”,得下圖◆對(duì)所得條形圖進(jìn)行編輯:將光標(biāo)移到要調(diào)整的區(qū)域,單擊右鍵進(jìn)入編輯窗口,對(duì)相關(guān)項(xiàng)目進(jìn)行重新選擇,得到如下圖形三、定量數(shù)據(jù)的頻數(shù)分布與直方圖的生成
例:以前面的110名學(xué)生的考試成績(jī)?yōu)槔幹祁l數(shù)分布表并生成直方圖.1.將考試數(shù)據(jù)輸入excel中,建立數(shù)據(jù)庫(kù);2.將數(shù)據(jù)按組距d=10分組,在空白列輸入各組的上限值(實(shí)為本組上限值-1);3.選擇“工具”下垃菜單的“數(shù)據(jù)分析”子菜單,用鼠標(biāo)雙擊對(duì)話框中的“直方圖”選項(xiàng),4.入進(jìn)“直方圖”對(duì)話框,其主要選項(xiàng)有:(1)在輸入?yún)^(qū)域里輸入(A1:A110);(2)在接收區(qū)域里輸入(C3:C9);(3)選擇“標(biāo)志”選項(xiàng);(4)選擇“累計(jì)百分率”選項(xiàng)(如果要作累計(jì)頻率折線圖的話);(5)選擇“圖表輸出”選項(xiàng)。按“確定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分公司合規(guī)聯(lián)系人工作實(shí)務(wù)講解
- 2.1《立在地球邊上放號(hào)》課件 2024-2025學(xué)年統(tǒng)編版高中語(yǔ)文必修上冊(cè)
- 河南省八市重點(diǎn)高中2025屆高三第五次模擬考試英語(yǔ)試卷含解析
- 北師大長(zhǎng)春附屬學(xué)校2025屆高考沖刺模擬數(shù)學(xué)試題含解析
- 甘肅省嘉峪關(guān)市2025屆高三第六次模擬考試英語(yǔ)試卷含解析
- 遼寧省清原中學(xué)2025屆高三第一次調(diào)研測(cè)試英語(yǔ)試卷含解析
- 四川省仁壽縣城北教學(xué)點(diǎn)2025屆高三第四次模擬考試數(shù)學(xué)試卷含解析
- 2025屆黑龍江省鶴崗市工農(nóng)區(qū)第一中學(xué)高三考前熱身英語(yǔ)試卷含解析
- 四川雙流棠湖中學(xué)2025屆高考語(yǔ)文必刷試卷含解析
- 江蘇省丹陽(yáng)市丹陽(yáng)高級(jí)中學(xué)2025屆高三第一次調(diào)研測(cè)試數(shù)學(xué)試卷含解析
- 安徽省蚌埠市聯(lián)考2024-2025學(xué)年七年級(jí)上學(xué)期12月期末考試英語(yǔ)試題(無(wú)答案)
- 心理健康課件教學(xué)課件
- 2024至2030年中國(guó)甲醚化氨基樹脂行業(yè)投資前景及策略咨詢研究報(bào)告
- 貴州省建筑工程施工資料管理導(dǎo)則
- 2024年度鋼模板生產(chǎn)與銷售承包合同3篇
- 2024-2025學(xué)年人教版八年級(jí)上學(xué)期數(shù)學(xué)期末復(fù)習(xí)試題(含答案)
- “感恩老師”教師節(jié)主題班會(huì)教案【三篇】
- 揚(yáng)塵防治(治理)監(jiān)理實(shí)施細(xì)則(范本)
- 《QHSE體系培訓(xùn)》課件
- 危險(xiǎn)化學(xué)品經(jīng)營(yíng)單位主要負(fù)責(zé)人考試練習(xí)題(含答案)
- 非ST段抬高型急性冠脈綜合征診斷和治療指南(2024)解讀
評(píng)論
0/150
提交評(píng)論