版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一頁,共八十四頁,2022年,8月28日描述性統(tǒng)計學:數(shù)值方法A
DescriptiveStatistics:NumericalMethods
PartAMeasuresofLocation
集中趨勢度量MeasuresofVariability
分散性度量x%第二頁,共八十四頁,2022年,8月28日位置的度量
MeasuresofLocationMean平均數(shù)Median中位數(shù)Mode眾數(shù)Percentiles百分數(shù)Quartiles四分位數(shù)第三頁,共八十四頁,2022年,8月28日問題:莎士比亞的作品是否真的是莎士比亞寫的?美國一般家庭有多少個孩子?男性的薪水是否一定比女性高?新娘和新郎在結婚時的年齡是多少?第四頁,共八十四頁,2022年,8月28日各種平均數(shù)平均數(shù)是一個數(shù)值,是對一個變量的觀察值進行計算后得到的.我們常讀到MBA的平均工資,平均房價,道瓊斯平均股票價格,平均謀殺率等.你都理解這些平均數(shù)嗎?讓我們來看一下下面的句子:當代美國的平均人是女人,平均每個女人有2.1個孩子,且這些女人住在平均價值為$80000的住房中第五頁,共八十四頁,2022年,8月28日一、算術平均數(shù)㈠算術平均數(shù)的概念與用途㈡算術平均數(shù)的計算㈢算術平均數(shù)的數(shù)學性質第六頁,共八十四頁,2022年,8月28日Thisisthemostpopularandusefulmeasureofcentrallocation基本計算方法是各項數(shù)據之和與數(shù)據的個數(shù)之比。是集中趨勢最主要的測度值。SumofthemeasurementsNumberofmeasurementsMean=SamplemeanPopulationmeanSamplesizePopulationsize
Arithmeticmean算術平均數(shù)第七頁,共八十四頁,2022年,8月28日算術平均數(shù):全部變量值之和與變量值個數(shù)相除所得的商。通常也稱為平均數(shù)(average)或均值(mean)。算術平均數(shù)的概念與用途第八頁,共八十四頁,2022年,8月28日STAT算術平均數(shù)83名女生的身高變量一般水平、代表性數(shù)值分布的集中趨勢、中心數(shù)值算術平均數(shù)第九頁,共八十四頁,2022年,8月28日一、算術平均數(shù)㈠算術平均數(shù)的概念與用途㈡算術平均數(shù)的計算㈢算術平均數(shù)的數(shù)學性質第十頁,共八十四頁,2022年,8月28日算術平均數(shù)的計算算術平均數(shù)=總體標志總量總體單位總數(shù)數(shù)據集數(shù)據個數(shù)N簡單算術平均數(shù)第十一頁,共八十四頁,2022年,8月28日第十二頁,共八十四頁,2022年,8月28日“權”和"weight"的字義商務印書館《古代漢語詞典》1998.12版權:1.樹名。2.秤錘,秤。3.稱量。4.權力。5.權宜。6.副詞,姑且。7.權攝,暫代官職。8.周列國名。9.通“顴”,面頰。牛津大學出版社《牛津現(xiàn)代高級英漢雙解詞典》1985Weight/n1.gravitationalforce引力,重力,地心吸力2.Howheavyathingis.重量3.Loadtobesupport負擔4.importanceorinfluence重要,影響力5.pieceofmetalofknownweightusedinscalesforweighingthings秤錘6.systemforunits,scaleornotation,forexpressing計重法
vt1.放砝碼於…上2.使負重擔3.用礦物質處理(織物)使之顯得更結實第十三頁,共八十四頁,2022年,8月28日桿秤合稱“權衡”,秤砣為權,秤桿為衡“權”的概念旨在刻畫對有關假設的整個局面的知識的增長陳克艱《上帝怎樣擲骰子》四川人民出版社,1987,54頁第十四頁,共八十四頁,2022年,8月28日秦權銅詔鐵權秦第十五頁,共八十四頁,2022年,8月28日秦量吳昌碩臨秦權文字第十六頁,共八十四頁,2022年,8月28日
身高組中值人數(shù)比重(cm)(cm)(人)(%)
150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25
總計83100某年級83名女生身高資料組距數(shù)列次數(shù)f頻率f/Σf變量值x加權算術平均數(shù)第十七頁,共八十四頁,2022年,8月28日例題:第十八頁,共八十四頁,2022年,8月28日二、交替標志的平均數(shù)在社會經濟統(tǒng)計中,有時把社會經濟現(xiàn)象的總體單位,分為具有某種標志的單位和不具有這種標志的單位兩組。統(tǒng)計中,用“是”、“否”或“有”、“無”來表示的標志,稱為交替標志,也稱是非標志。第十九頁,共八十四頁,2022年,8月28日交替標誌
Qualitativevariables-proportions
定性變量-比例Qualitativevariablesaresummarizedbyatableofproportionsorpercentages.Whiletherearetheconceptsoflocationandvariabilityforsuchvariables,therearenosinglenumbersummariesforthelocationandvariability.Generallythelocationissummarizedbygivingthepercentagesinthemostcommongroups.第二十頁,共八十四頁,2022年,8月28日交替標誌or是非標誌分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計—為研究是非標誌總體的數(shù)量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現(xiàn)形式的標志,又叫是非標誌交替標誌第二十一頁,共八十四頁,2022年,8月28日是非標誌總體的指標具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標志表現(xiàn)的單位數(shù)所占的成數(shù)指是非標誌總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重成數(shù)第二十二頁,共八十四頁,2022年,8月28日是非標誌總體的均值均值第二十三頁,共八十四頁,2022年,8月28日1.簡單幾何平均數(shù)計算時要進行對數(shù)變換,即:幾何平均數(shù)(又稱“對數(shù)平均數(shù)”)第二十四頁,共八十四頁,2022年,8月28日幾何平均數(shù)(geomean(geomatricmean))是N個變量值連乘積的N次方根。第二十五頁,共八十四頁,2022年,8月28日
就用途而言,幾何平均方法直接用于個體數(shù)量相乘等于總數(shù)量的現(xiàn)象的平均。某產品的總合格率=各連續(xù)作業(yè)工序合格率之積若干年間總的1+利率(復利)=各年度1+利率之積
第一道工序第二道工序全工序投入制品1000個900個1000個合格產品900個810個810個合格率%909081
81%=90%90%向銀行借款1000元,年利率(復利)為10%,則:第一年利息額100元,第二年利息額110元,兩年合計210元。兩年后還款本利和與借款額的比例為1.21。
1.21=1.11.1
第二十六頁,共八十四頁,2022年,8月28日例某機械廠有鑄造車間、機加工車間、裝配車間三個連續(xù)流水作業(yè)車間。本月份這三個車間產品合格率分別為95%、92%、90%,求平均車間產品合格率。解:這說明該廠車間產品平均合格率為92.31%第二十七頁,共八十四頁,2022年,8月28日2.加權幾何平均數(shù)第二十八頁,共八十四頁,2022年,8月28日投資銀行某筆投資的年利率是按復利計算的,25年的年利率分配是:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%,求平均年利率。本利率(%)X年數(shù)f本利率的對數(shù)lgXf·lgX103
12.0128
2.0128105
42.0212
8.0848108
82.033416.2672110102.041420.4140115
22.0607
4.1214合計25-50.9002例第二十九頁,共八十四頁,2022年,8月28日這就是說,25年的平均本利率為108.6%,年平均利率即為8.6%。第三十頁,共八十四頁,2022年,8月28日△幾何平均數(shù)的特點如果數(shù)列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和?。凰m用于反映特定現(xiàn)象的平均水平,即現(xiàn)象的總標志值是各單位標志值的連乘積。第三十一頁,共八十四頁,2022年,8月28日△幾何平均數(shù)的特點如果數(shù)列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和??;它適用于反映特定現(xiàn)象的平均水平,即現(xiàn)象的總標志值是各單位標志值的連乘積。第三十二頁,共八十四頁,2022年,8月28日72法則計算翻一番需要的時間時,可以用72除以增長速度的數(shù)值,得到時期數(shù)比如,每年增長10%,則7.2年翻一番;每年增長3%,則24年翻一番1.1^7.2=1.991.03^24=2.03通常,年利率都是10以下,此法很準72法則同樣還可以用來算貶值,設年通貨膨脹率是8%,那么72/8=9,9年後你現(xiàn)在的一元錢就只能買五毛錢的東西了。第三十三頁,共八十四頁,2022年,8月28日以20天為週期對國際油價進行評估國際油價連續(xù)20天日均漲幅或跌幅超過4%,就應考慮對國內成品油價格進行調整1.04^20=2.190.96^20=0.44該準則意味著:在連續(xù)的20天之內,如果油價上漲超過1倍,或下跌了一半以上,就要考慮調整國內油價第三十四頁,共八十四頁,2022年,8月28日三、次序統(tǒng)計量(位置平均數(shù))㈠眾數(shù)㈡中位數(shù)㈢四分位數(shù)和百分位數(shù)第三十五頁,共八十四頁,2022年,8月28日眾數(shù)(mode):出現(xiàn)次數(shù)最多即出現(xiàn)頻率最高的變量值。身高人數(shù)(CM)(人)
152115421552156415711582159216012161716281634身高人數(shù)(CM)(人)
1643165816651673168716911705171217231741總計
83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174第三十六頁,共八十四頁,2022年,8月28日眾數(shù)的確定方法某年級83名女生身高資料
身高人數(shù)(CM)(人)
152115421552156415711582159216012161716281634
身高人數(shù)(CM)(人)
1643165816651673168716911705171217231741總計
83第三十七頁,共八十四頁,2022年,8月28日
身高人數(shù)比重(CM)(人)(%)
150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25
總計83100某年級83名女生身高資料眾數(shù)的確定方法概約眾數(shù):眾數(shù)所在組的組中值,在本例為162.5cm第三十八頁,共八十四頁,2022年,8月28日眾數(shù)的原理及應用83名女生身高原始數(shù)據83名女生身高組距數(shù)列第三十九頁,共八十四頁,2022年,8月28日
當數(shù)據分布存在明顯的集中趨勢,且有顯著的極端值時,適合使用眾數(shù)。在數(shù)據分布的集中趨勢不明顯或存在兩個以上分布中心時,不適合使用眾數(shù)(前者無眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒有眾數(shù))。眾數(shù)的原理及應用第四十頁,共八十四頁,2022年,8月28日出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200413名學生出生時間分布直方圖眾數(shù)的原理及應用沒有突出地集中在某個年份第四十一頁,共八十四頁,2022年,8月28日192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100眾數(shù)的原理及應用413名學生的身高分布直方圖出現(xiàn)了兩個明顯的分布中心第四十二頁,共八十四頁,2022年,8月28日413名學生身高分布條形圖第四十三頁,共八十四頁,2022年,8月28日413名學生身高分布疊加線圖第四十四頁,共八十四頁,2022年,8月28日STAT
在研究身高時,男生與女生不能合成一個總體,而是應當作為兩個總體分別進行統(tǒng)計。
當數(shù)據分布呈現(xiàn)出雙眾數(shù)或多眾數(shù)時,可以斷定這些數(shù)據來源于不同的總體。第四十五頁,共八十四頁,2022年,8月28日第四十六頁,共八十四頁,2022年,8月28日眾數(shù)的應用可以用來平均名詞型變量:如性別變量只有兩個值,男和女.在美國婦女比男子多.所以可以說平均人口是女人.一項對大學生的研究包括了10個心理學專業(yè)的學生,20個英語專業(yè)的學生和5個數(shù)學專業(yè)的學生.我們就無法計算這些專業(yè)的平均數(shù)的中位數(shù),但我們可以指出眾數(shù)是英語專業(yè),因為它是出現(xiàn)頻數(shù)最多的那個塊專業(yè).眾數(shù)用來描述分類變量,特別是許多個值的分類變量.例如在某一特別的街區(qū),宗教的眾數(shù)是穆斯林,人種的眾數(shù)是亞裔,而社會階級的眾數(shù)是”中上等”第四十七頁,共八十四頁,2022年,8月28日三、次序統(tǒng)計量(位置平均數(shù))㈠眾數(shù)㈡中位數(shù)㈢四分位數(shù)和百分位數(shù)第四十八頁,共八十四頁,2022年,8月28日152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174
中位數(shù)(median):位于變量值序列中點的數(shù)值中位數(shù)第四十九頁,共八十四頁,2022年,8月28日中位數(shù)的確定方法對于未分組數(shù)據:中位數(shù)位置為某年級83名女生身高資料
身高人數(shù)累計(CM)(人)人數(shù)
1521
11542315525156491571101582121592141601226161733162841163445
身高人數(shù)累計(CM)(人)人數(shù)
164348165856166561167364168771169172170577171279172382174183
總計
83第五十頁,共八十四頁,2022年,8月28日中位數(shù)的確定方法
身高人數(shù)累計(CM)(人)人數(shù)
150-15533155-1601114160-1653448165-1702472170以上1183
總計83某年級83名女生身高資料第五十一頁,共八十四頁,2022年,8月28日中位數(shù)的作用及用法中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。566668920中位數(shù)為6第五十二頁,共八十四頁,2022年,8月28日中位數(shù)的作用及用法中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。566668920中位數(shù)為(6+6)/2=6第五十三頁,共八十四頁,2022年,8月28日中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。中位數(shù)的作用及用法第五十四頁,共八十四頁,2022年,8月28日中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。中位數(shù)的作用及用法第五十五頁,共八十四頁,2022年,8月28日中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。中位數(shù)的作用及用法第五十六頁,共八十四頁,2022年,8月28日中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。中位數(shù)的作用及用法第五十七頁,共八十四頁,2022年,8月28日中位數(shù)一定存在;中位數(shù)與算術平均數(shù)相近;中位數(shù)不受極端值影響;變量值與中位數(shù)離差絕對值之和最小。中位數(shù)的作用及用法
變量值3
4
5
5
6
9
10中位數(shù)5平均值6與中位數(shù)離差-2-100145與平均數(shù)離差-3-2-1-1034絕對數(shù)值之和
13
14第五十八頁,共八十四頁,2022年,8月28日中位數(shù)與累計次數(shù)分布在累計次數(shù)分布曲線上,縱軸上50%所對應的點,其橫軸坐標就是中位數(shù)。第五十九頁,共八十四頁,2022年,8月28日結婚年齡中位數(shù)HK第六十頁,共八十四頁,2022年,8月28日第六十一頁,共八十四頁,2022年,8月28日第六十二頁,共八十四頁,2022年,8月28日三、次序統(tǒng)計量(位置平均數(shù))㈠眾數(shù)㈡中位數(shù)㈢四分位數(shù)和百分位數(shù)(四)箱線圖第六十三頁,共八十四頁,2022年,8月28日百分位數(shù):提供了數(shù)據值如何在最小值至最大值之間分布的信息.對不含多個重復數(shù)值的數(shù)據來說,第P個百分數(shù)把數(shù)據分成兩部分:大約P%的觀察值小于第P個百分數(shù);大約(100-P)%的觀察值大于第P個百分數(shù)
四分位數(shù)(quartile
將數(shù)據等分為4部分)和百分位數(shù)(percentile將數(shù)據等分為100部分)。中位數(shù)也是一個分位數(shù)(二分位數(shù),將數(shù)據等分為兩部分)。第六十四頁,共八十四頁,2022年,8月28日第六十五頁,共八十四頁,2022年,8月28日第六十六頁,共八十四頁,2022年,8月28日MeasuresofRelativeStandingandBoxPlots
相對位置的測定和箱線圖PercentileThepthpercentileofasetofmeasurementsisthevalueforwhichatmostp%ofthemeasurementsarelessthanthatvalueatmost100(1-p)%ofallthemeasurementsaregreaterthanthatvalue.ExampleSuppose600isthe78%percentileofaGMATscore.Then60020080078%ofallthescoresliehere22%第六十七頁,共八十四頁,2022年,8月28日152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174第一個四分位數(shù)Q1
第二個四分位數(shù)Q2
第三個四分位數(shù)Q3
分位數(shù)的確定及用途第六十八頁,共八十四頁,2022年,8月28日分位數(shù)的確定及用途25%25%25%25%75%即四分之三的數(shù)據小于等于Q3第六十九頁,共八十四頁,2022年,8月28日三、次序統(tǒng)計量(位置平均數(shù))㈠眾數(shù)㈡中位數(shù)㈢四分位數(shù)和百分位數(shù)(四)箱線圖第七十頁,共八十四頁,2022年,8月28日BoxPlots箱線圖Thisisapictorialdisplay畫圖thatprovidesthemaindescriptivemeasuresofthemeasurementset:L-thelargestmeasurementQ3-TheupperquartileQ2-ThemedianQ1-ThelowerquartileS-ThesmallestmeasurementSQ1Q2Q3LAnadjustmenttothisgeneraldescriptionofaboxplotmaybeneededinthepresenceofoutliers.Seethenextexample.第七十一頁,共八十四頁,2022年,8月28日由於箱型圖可用來幫助判斷資料是否有無離群值存在,因此,須將簡易箱形圖的繪製步驟加以修改。1. 須規(guī)定判斷離群值的內限與外限的範圍資料分佈之內限上界=Q3+1.5
IQR,其中IQR=Q3-Q1資料分佈之內限下界=Q1-1.5
IQR資料分佈之外限上界=Q3+3
IQR資料分佈之外限下界=Q1-3
IQR如下圖:第七十二頁,共八十四頁,2022年,8月28日圖3-16離群值的判斷第七十三頁,共八十四頁,2022年,8月28日Example4.12-GMATscoresCreateaboxplotforthedataregardingtheGMATscoresof200applicants(seefileXm04-12)第七十四頁,共八十四頁,2022年,8月28日440670S410Q1530Q2560Q3590L700IQR=Q3-Q1=590-530=60Fences={Q1-1.5(IQR),Q3+1.5(IQR}={440,670}Theoutliersare700,and410.Therefore,thewhiskerswillextendtothetwoextremevaluesthatarenotoutliers(440and670).Observe.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年倉儲調味品調料存儲服務合同
- 2025年家用電器擔保協(xié)議
- 2025年家電修理技能合作協(xié)議
- 2025年品牌推廣策略合約
- 2025年代理商區(qū)塊鏈技術協(xié)議
- 2025年農村房產過戶協(xié)議
- 2025年環(huán)境資源贈與合同
- 工地電工2025年度勞動合同規(guī)范范本14篇
- 2024裝修合同中的采購合同范本
- 2025版塑料回收利用項目投資合作合同范本3篇
- GB/T 44888-2024政務服務大廳智能化建設指南
- 2023-2024學年江西省萍鄉(xiāng)市八年級(上)期末物理試卷
- 四則混合運算100道題四年級上冊及答案
- 四川省高職單招電氣技術類《電子基礎》歷年考試真題試題庫(含答案)
- 中級半導體分立器件和集成電路裝調工技能鑒定考試題庫(含答案)
- 2024年江西生物科技職業(yè)學院單招職業(yè)技能測試題庫帶解析答案
- 橋本甲狀腺炎-90天治療方案
- (2024年)安全注射培訓課件
- 2024版《建設工程開工、停工、復工安全管理臺賬表格(流程圖、申請表、報審表、考核表、通知單等)》模版
- 部編版《道德與法治》六年級下冊教材分析萬永霞
- 酒店人防管理制度
評論
0/150
提交評論