




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
BasicStatistic基本統(tǒng)計(jì)學(xué)2/5/2023數(shù)據(jù)的分類2/5/2023什么是數(shù)據(jù)數(shù)據(jù)是來(lái)自觀察的,由一個(gè)過(guò)程所搜集得來(lái)的數(shù)據(jù)可讓我們描繪過(guò)程,了解過(guò)程,改善過(guò)程甚至控制過(guò)程.Data數(shù)據(jù)驅(qū)動(dòng)決策和行動(dòng)2/5/2023數(shù)據(jù)在過(guò)程改善中的重要性InGodwetrust我們只相信上帝所有其他人請(qǐng)拿出數(shù)據(jù)來(lái)2/5/2023兩種主要數(shù)據(jù)類型(類項(xiàng)數(shù)據(jù))(測(cè)量數(shù)據(jù))(名目型)(連續(xù)型)(順序型)(計(jì)數(shù)型)離散數(shù)據(jù)變量數(shù)據(jù)2/5/2023練習(xí)一請(qǐng)標(biāo)出下列數(shù)據(jù)的類型,A代表計(jì)數(shù)型數(shù)據(jù),V代表計(jì)量型數(shù)據(jù)
顧客平均消費(fèi),電話待機(jī)時(shí)間
產(chǎn)品是否合格職員-Tom,Nancy,Howard.
支出與預(yù)算相符
輸入支出費(fèi)用的時(shí)間2/5/2023答案
顧客平均消費(fèi),電話待機(jī)時(shí)間
v
產(chǎn)品是否合格A
職員-Tom,Nancy,Howard.A
4)支出與預(yù)算相符A5)輸入支出費(fèi)用的時(shí)間v數(shù)據(jù)類型(VorA)2/5/2023小組討論(練習(xí)二)計(jì)量型數(shù)據(jù)
計(jì)量型數(shù)據(jù)的益處?
計(jì)量型數(shù)據(jù)的缺點(diǎn)?計(jì)數(shù)型數(shù)據(jù)計(jì)數(shù)型數(shù)據(jù)的益處?計(jì)數(shù)型數(shù)據(jù)的缺點(diǎn)?2/5/2023小組討論–答案計(jì)量型數(shù)據(jù)益處:1.能夠?yàn)槭褂孟鄬?duì)小范圍抽樣的過(guò)程提供詳細(xì)的信息2.適用于低缺陷率3.能夠預(yù)估發(fā)展趨勢(shì)和情況缺點(diǎn):1.通常較難得到數(shù)據(jù)2.分析更為復(fù)雜2/5/2023小組討論–答案計(jì)量型數(shù)據(jù)益處:容易得到數(shù)據(jù),并且計(jì)算方法簡(jiǎn)單2.數(shù)據(jù)容易理解3.數(shù)據(jù)隨時(shí)可得缺點(diǎn):1.無(wú)法顯示缺陷怎樣發(fā)生及過(guò)程如何變化2.不適合低缺陷率(需要大量的抽樣)3.不能預(yù)測(cè)發(fā)展趨勢(shì)和情況2/5/2023數(shù)據(jù)類型比較計(jì)量型數(shù)據(jù)計(jì)數(shù)型數(shù)據(jù)連續(xù)數(shù)據(jù)計(jì)數(shù)數(shù)據(jù)通常為正態(tài)分布通常為二項(xiàng)式分布或泊松分布實(shí)際數(shù)值合格/不合格實(shí)際定義嚴(yán)謹(jǐn)數(shù)據(jù)定義較差需少量抽樣需大量抽樣2/5/2023
知識(shí)水平1.沒有數(shù)據(jù),也沒有經(jīng)驗(yàn)–只有觀點(diǎn)2.沒有數(shù)據(jù)–只有經(jīng)驗(yàn)3.收集了數(shù)據(jù)-但只是看數(shù)字有多少4.分組的數(shù)據(jù)-圖表5.描述性統(tǒng)計(jì)數(shù)據(jù)–中數(shù)、標(biāo)準(zhǔn)差等等6.推理性統(tǒng)計(jì)–預(yù)測(cè)過(guò)程績(jī)效:能力分析,回歸和實(shí)驗(yàn)計(jì)劃法2/5/2023轉(zhuǎn)化計(jì)數(shù)型數(shù)據(jù)如可以,將計(jì)數(shù)型數(shù)據(jù)轉(zhuǎn)換為計(jì)量型數(shù)據(jù)能增加它的功能。計(jì)數(shù)型數(shù)據(jù)計(jì)量型數(shù)據(jù)轉(zhuǎn)換為2/5/2023VariableData計(jì)量型數(shù)據(jù)2/5/2023計(jì)量型數(shù)據(jù)–學(xué)習(xí)目的完成此階段學(xué)習(xí)后,學(xué)員能夠Ⅰ利用數(shù)據(jù)的分布形狀,中央趨勢(shì)和變異大小進(jìn)行特性化Ⅱ
如果數(shù)據(jù)是正態(tài)分布的,計(jì)算z數(shù)值,利用Z數(shù)值表確定超出某一數(shù)值的比例2/5/2023離散數(shù)據(jù)與連續(xù)數(shù)據(jù)連續(xù)數(shù)據(jù)的優(yōu)點(diǎn):離散=稀少的信息連續(xù)=豐富的信息2/5/2023統(tǒng)計(jì)學(xué)基本術(shù)語(yǔ)Population總體
想要測(cè)量對(duì)象的全部Parameter參數(shù)用總體的所有數(shù)據(jù)計(jì)算出的數(shù)值(如均值,
標(biāo)準(zhǔn)差),稱為總體的參數(shù)x參數(shù)總體平均值總體標(biāo)準(zhǔn)差總體σ2/5/2023統(tǒng)計(jì)學(xué)基本術(shù)語(yǔ)Sample樣本從總體抽出的部分?jǐn)?shù)據(jù)Statistics統(tǒng)計(jì)量用樣本的所有數(shù)據(jù)計(jì)算出的數(shù)值(如均值,
標(biāo)準(zhǔn)差),稱為樣本的統(tǒng)計(jì)量x統(tǒng)計(jì)量樣本平均值樣本標(biāo)準(zhǔn)差s總體樣本2/5/2023統(tǒng)計(jì)學(xué)基本術(shù)語(yǔ)Population總體已制造或?qū)⒁圃鞂?duì)象的全體集合,用所關(guān)注的特性描述我們究竟能否知道真正的整體參數(shù)?Sample樣本
統(tǒng)計(jì)研究中實(shí)際測(cè)量的目標(biāo)組樣本通常是整體的子集Σ=整體標(biāo)準(zhǔn)差S=樣本標(biāo)準(zhǔn)差Population整體sample樣本2/5/2023描述計(jì)量型數(shù)據(jù)集“報(bào)告上司:河水深度1.6M,士兵平均高度1.7M,過(guò)河沒有問(wèn)題”,但是..至于我們不能只看平均值,還需要利用其他統(tǒng)計(jì)量來(lái)分析……2/5/2023描述計(jì)量型數(shù)據(jù)集一組計(jì)量型數(shù)據(jù)能顯示以下3個(gè)特性:CentralTendency(Mean,Median,Mode)中央趨勢(shì)(均值,中值,眾數(shù))Variable(range,StandardDeviation,Variance)變異(全距,標(biāo)準(zhǔn)差,方差)Shape形狀2/5/2023參數(shù)和統(tǒng)計(jì)量符號(hào)Mean均值Variance方差StandardDeviation標(biāo)準(zhǔn)差Proportion比例總體(參數(shù))μσσπ樣本(統(tǒng)計(jì)量)
хs2sp2/5/2023位置測(cè)量(CentralTendency)中心趨勢(shì)Mean均值Median中值Mode眾數(shù)Quartiles四分值2/5/2023樣本均值若樣本(樣本量為n)的觀測(cè)值為x1,x2,…xn,則樣本均值為:
類似地,一個(gè)有著大量但限個(gè)(N個(gè))觀測(cè)值的總體,其總體均值為:Mean均值2/5/2023Mean均值練習(xí)三10個(gè)連接線的拉拔強(qiáng)度為:
230240236248252278265262拉拔強(qiáng)度的均值是多少?10個(gè)觀測(cè)值的均值為:2/5/2023Mean均值練習(xí)四199X年一個(gè)行動(dòng)中,戰(zhàn)機(jī)進(jìn)行了3000次戰(zhàn)斗,總共用時(shí)6900小時(shí)。那末每次戰(zhàn)斗平均用時(shí)多少?每次戰(zhàn)斗平均用時(shí)為:注意所使用的符號(hào)2/5/2023
均值的特性均值的計(jì)算使用了每個(gè)觀測(cè)值;每個(gè)觀測(cè)值對(duì)均值都有影響。所有觀測(cè)值對(duì)均值的偏差的總和為零。均值對(duì)極端的觀測(cè)值很敏感,極端值會(huì)導(dǎo)致均值向他偏移。Xxxxxxx6351274△6△2△42/5/2023Median中值
將一組觀測(cè)值按大小順序排列,位于中心的數(shù)值即為中值
若觀測(cè)值的個(gè)數(shù)為偶數(shù),則中值為中間2個(gè)數(shù)值的平均若觀測(cè)值的個(gè)數(shù)為奇數(shù),則位于中心的數(shù)值即中值2/5/2023Median中值樣本中值
假如x(1),x(2),…,x(n))是按大小排序的樣本值,則樣本中值為:中值的優(yōu)點(diǎn)是不受極端大或極端小的觀測(cè)值的影響。2/5/2023Median中值練習(xí)五假設(shè)一個(gè)樣本觀測(cè)值為:
3124786
樣本均值和樣本中值是多少?這2個(gè)值是測(cè)量數(shù)據(jù)中心趨勢(shì)的合理指標(biāo)嗎?2/5/2023Median中值(b)假如最后一個(gè)數(shù)值改變?yōu)椋?/p>
3124782680
則樣本平均值和樣本中值是多少?
據(jù)此你有何結(jié)論?2/5/2023Median中值MedianvsMean中值與均值
因?yàn)橹兄挡幌缶祵?duì)極端值敏感,因此,當(dāng)有極端大或極端小值時(shí),中值比均值更能代表數(shù)據(jù)的位置典型的例子是一個(gè)城市居民的收入中位值2/5/2023中值有時(shí)會(huì)有欺騙性50%-50%Rule?一半一半準(zhǔn)則?
以下一組數(shù)據(jù)的中值是多少?
2,2,2,2,2,2,90可以用一半一半準(zhǔn)則嗎?2/5/2023Mode眾數(shù)眾數(shù)是樣本中出現(xiàn)次數(shù)最多的觀測(cè)值。眾數(shù)可以是唯一的,也可以有不止一個(gè),有時(shí)并不存在眾數(shù)。2/5/2023Mode眾數(shù)練習(xí)六如果樣本觀測(cè)值為:(a)691358134613110136913581346131106256134372681眾數(shù)是什么?具有一個(gè)眾數(shù),兩個(gè)眾數(shù)或多于兩個(gè)眾數(shù)分布的數(shù)據(jù)分布叫什么?(單峰分布…)2/5/2023Mode眾數(shù)為何使用眾數(shù)?
當(dāng)觀測(cè)值為分類式(如名義數(shù)據(jù),序列數(shù)據(jù))時(shí).眾數(shù)是描述數(shù)據(jù)位置的最好的指標(biāo).典型的例子是,一個(gè)公司內(nèi)員工收入的眾數(shù)眾數(shù)的重要信息當(dāng)眾數(shù)不止1個(gè)時(shí),從中抽取樣本的總體通常是多個(gè)總體的混合2/5/2023均值、中值、眾數(shù)的比較MOMeMeMO正態(tài)分布偏上分布偏下分布MOMe≥≥MOMe==MOMe≤≤2/5/2023Quartiles四分值
將一組按大小順序排列的數(shù)據(jù)平均分為四部分,分界點(diǎn)即四分值.
第一四分值(低四分值),約25%的觀測(cè)值小于它.第二四分值,約50%的觀測(cè)值小于它,即中值.第三四分值(高分值),約75%的觀測(cè)值小于它.2/5/2023Quartiles四分值練習(xí)七
以下為20個(gè)電燈泡失效期間的觀測(cè)值,已按遞增順序排列.2102162523003664546247208169241216129613921488154224802856319235283710請(qǐng)確定三個(gè)四分值.計(jì)算方法:先確定位置再計(jì)算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/42/5/2023Quartiles四分值答案
Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75則:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.52/5/2023Quartiles四分值2/5/2023散布的測(cè)量(變異)Range極差Variance方差StandardDeviation標(biāo)準(zhǔn)差I(lǐng)nter-QuartileRange四分植極差2/5/2023Range極差樣本極差為樣本中最大和最小觀測(cè)值之間的差別,即:極差是測(cè)量數(shù)據(jù)散布或變異的最簡(jiǎn)單的方法但它忽略了最大和最小值之間的所有信息r=xmax-xmin2/5/2023Range極差試考慮以下的2個(gè)樣本:{102050607090}and{10,40,40,40,90}具有相同的極差(r=80)但是,第二個(gè)樣本的變異只是2個(gè)極端數(shù)值的變異,而在第1個(gè)樣本,中間的數(shù)值也有相當(dāng)大的變異.當(dāng)樣本量較小(n≤10)時(shí),極差丟失信息的問(wèn)題不是很嚴(yán)重2/5/2023方差與標(biāo)準(zhǔn)差若x1,x2,…,xn是一個(gè)具有N個(gè)觀測(cè)值的樣本,則樣本方差為:樣本標(biāo)準(zhǔn)差是樣本方差的算術(shù)平方根,即:2/5/2023方差計(jì)算練習(xí)八:計(jì)算下列觀測(cè)值的方差和標(biāo)準(zhǔn)差.305070901101302/5/2023方差計(jì)算ixixi-x(xi-x)2130-502500250-30900370-101004901010051103090061305025002/5/2023方差與標(biāo)準(zhǔn)差再考慮以下2個(gè)樣本.SampleA:102050607090SampleB:104040
40
4090
SampleASampleBRange極差8080Variance方差????StandardDeviation標(biāo)準(zhǔn)差????2/5/2023方差與標(biāo)準(zhǔn)差類似于樣本方差S2,用總體的所數(shù)據(jù)計(jì)算出總體變異—總體方差(σ2)總體的標(biāo)準(zhǔn)差(σ)是總體方差的算術(shù)平方根
對(duì)于包含N個(gè)數(shù)值的有限總體,其方差為:
σ2=2/5/2023方差特性
方差計(jì)算使用了所有觀測(cè)值,每個(gè)觀測(cè)值對(duì)方差都有影響
方差對(duì)極端值很敏感,因平方的緣故,極端大的觀測(cè)值會(huì)嚴(yán)重的放大方差。2/5/2023四分值極差
四分值極差是測(cè)量散布的另一指標(biāo):IQR=Q3-Q1
四分值極差不如極差對(duì)極端值敏感當(dāng)分布顯著不對(duì)稱時(shí),用它衡量散布會(huì)更好樣本(10,20,50,60,90)和(10,40,40,40,90)的四分值極差分別是40和0.2/5/2023TheNormalDistribution正態(tài)分布正態(tài)分布是一種具有特定的、非常有用的特性的數(shù)據(jù)分布
這些特性對(duì)我們理解所研究之過(guò)程的特性十分有用大部分自然現(xiàn)象和人造過(guò)程是正態(tài)分布或可有正態(tài)分布描述2/5/2023TheNormalDistribution正態(tài)分布特性1
:只需知道下述兩項(xiàng)參數(shù)就可完整描述正態(tài)分布均值標(biāo)準(zhǔn)差分布1分布2分布3此三項(xiàng)正態(tài)分布有何區(qū)別?2/5/2023正態(tài)曲線和概率特性2
:曲線下面的面積可用來(lái)估算某一特定事件發(fā)生的累積概率得到在兩個(gè)值之間的某個(gè)價(jià)值的累積概率99.73%95%68%離均值的標(biāo)準(zhǔn)差數(shù)目樣本值的概率40%-30%-20%-10%-0%-2/5/2023標(biāo)準(zhǔn)差的經(jīng)驗(yàn)規(guī)則
當(dāng)一組數(shù)據(jù)不是最理想正態(tài)分布時(shí),前述累積概率規(guī)則仍可應(yīng)用比較理論(理想)正態(tài)分布和經(jīng)驗(yàn)(現(xiàn)實(shí))分布NumberofStandardDeviations標(biāo)準(zhǔn)差數(shù)目TheoreticalNormal理論正態(tài)EmpiricalNormal經(jīng)驗(yàn)正態(tài)+/-1σ68%60-75%+/-2σ95%90-98%+/-3σ99.7%99-100%2/5/2023正態(tài)分布特點(diǎn)-3σ-2σ-1σ1σ2σ3σ68%95%99.73%StandardDeviation標(biāo)準(zhǔn)差σAverage標(biāo)準(zhǔn)差2/5/2023長(zhǎng)期和短期能力(Z-偏差)ZLT=ZST-1.5
Sigma水平短期DPMO長(zhǎng)期DPMO1158655.3691462.52
22750.1308537.53
1350.0
66807.24
31.7
6209.75
0.3
232.76
0.0018
3.42/5/2023正態(tài)分布鑒于許多過(guò)程輸出都是呈正態(tài)分布,所以可以用正態(tài)曲線的特點(diǎn)預(yù)測(cè)過(guò)程對(duì)象總體.即使非正態(tài)數(shù)據(jù)也能轉(zhuǎn)化為正態(tài)數(shù)據(jù),所以正態(tài)曲線的特點(diǎn)仍然可以用來(lái)做預(yù)測(cè)2/5/2023正態(tài)曲線下的區(qū)域分析過(guò)程能力時(shí),我們運(yùn)用正態(tài)曲線下的區(qū)域預(yù)測(cè)超過(guò)規(guī)格界限的產(chǎn)品所占的比例.5%5%規(guī)格上限USL規(guī)格下限LSL2/5/2023標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布,也叫Z分布,有下列參數(shù):Z代表距離均值的標(biāo)準(zhǔn)差的數(shù)量μ=0
σ=1
-4σ
-3σ
-2σ
-1σ
μ
1σ2σ
3σ
4σ
2/5/2023Z代表從均值到能在達(dá)到(容納)多少個(gè)標(biāo)準(zhǔn)差
-4σ
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省德州市陵城區(qū)實(shí)驗(yàn)小學(xué)2025年數(shù)學(xué)五年級(jí)第二學(xué)期期末經(jīng)典試題含答案
- 江蘇省泰州市高港區(qū)2025年寧夏銀川二中下學(xué)期初三年級(jí)統(tǒng)練三物理試題含解析
- 2024秋五年級(jí)語(yǔ)文上冊(cè)第七單元24月跡5教案新人教版
- 二年級(jí)數(shù)學(xué)下冊(cè)軸對(duì)稱圖形教后反思新人教版
- 七年級(jí)數(shù)學(xué)下冊(cè)第8章角8.4對(duì)頂角教案新版青島版
- 破舊電纜出售合同范本
- 木材結(jié)構(gòu)智能成像技術(shù)-全面剖析
- 上海市信息安全測(cè)評(píng)認(rèn)證中心招聘真題2024
- 曲靖市社會(huì)組織孵化中心人員招聘真題2024
- 湖南張家界永定街道辦事處招聘真題2024
- 綜合應(yīng)急預(yù)案、專項(xiàng)應(yīng)急預(yù)案、現(xiàn)場(chǎng)處置方案
- 放射醫(yī)學(xué)檢查技術(shù)及操作規(guī)范
- 《南非綜合簡(jiǎn)要介紹》課件
- 新蘇教版一年級(jí)數(shù)學(xué)下冊(cè)第四單元《認(rèn)識(shí)20~99》全部教案(共3課時(shí))
- 2025年中國(guó)高壓注射器行業(yè)發(fā)展策略、市場(chǎng)環(huán)境及前景研究分析報(bào)告
- 寧德時(shí)代供應(yīng)商申請(qǐng)入庫(kù)教程
- 手術(shù)患者轉(zhuǎn)運(yùn)交接課件
- Unit+6+The+power+of+plants+大單元教學(xué)設(shè)計(jì)2024-2025學(xué)年外研版英語(yǔ)七年級(jí)上冊(cè)+
- 四川大學(xué)華西口腔醫(yī)學(xué)院課件
- 中華民族共同體概論講座第一講中華民族共同體基礎(chǔ)理論課件
- 第六章-GIS分析導(dǎo)論
評(píng)論
0/150
提交評(píng)論