版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2023/9/14數(shù)據(jù)模型與決策數(shù)據(jù)的產(chǎn)生與圖表描述一、調(diào)查面面觀二、實驗面面觀三、數(shù)據(jù)的圖表描述數(shù)據(jù)、模型與決策2023/9/14數(shù)據(jù)模型與決策一、調(diào)查面面觀1.1調(diào)查如何出錯1.2抽樣誤差與非抽樣誤差1.3抽樣設(shè)計1.4解讀調(diào)查結(jié)論2023/9/14數(shù)據(jù)模型與決策例1.1誰先動手?有人調(diào)查研究酒吧里的打架致死事件,發(fā)現(xiàn)其中90%都是死掉的那個人先動手。真是這樣嗎?如果你跟人打架把對方給揍死了,警察問你誰先動手的時候你怎么回答?1.1調(diào)查如何出錯2023/9/14數(shù)據(jù)模型與決策例1.2美國的種族效應(yīng)1989年,紐約市選出第一位黑人市長,維吉尼亞選出第一位黑人州長。這兩個事件,在投票所訪問投完票的選民后所預(yù)測到的勝負(fù)差距,都比實際開票的差距大。因此,調(diào)查機構(gòu)相當(dāng)確定,有些受訪選民因為不愿承認(rèn)沒投票給黑人候選人而說了謊。2023/9/14數(shù)據(jù)模型與決策例1.3權(quán)威人物的意見有兩個內(nèi)容相同的問題:問題A:陸軍部和海軍部應(yīng)當(dāng)合并為統(tǒng)一的作戰(zhàn)部,您同意么?問題B:艾森豪威爾將軍說,陸軍部和海軍部應(yīng)當(dāng)合并為統(tǒng)一的作戰(zhàn)部,您同意么?結(jié)果對問題A表示同意的比例為29%,而對問題B表示同意的比例為49%,兩者相距甚遠(yuǎn)。無疑,權(quán)威人物艾森豪威爾將軍的意見影響了被調(diào)查者的意見。2023/9/14數(shù)據(jù)模型與決策例1.4總統(tǒng)選舉預(yù)測1936年民主黨人羅斯福任美國總統(tǒng)第一任滿,共和黨人蘭登與他競選總統(tǒng)。
《文學(xué)摘要》雜志根據(jù)有約二百四十萬人參加的民意測驗,預(yù)測蘭登會以57%對43%的優(yōu)勢獲勝。自1916年以來的五屆總統(tǒng)選舉中,《文學(xué)摘要》雜志都正確地預(yù)測出獲勝的一方,其影響力很大。那時蓋洛普剛剛設(shè)立起他的調(diào)查機構(gòu),他根據(jù)一個約五萬人的樣本,預(yù)測羅斯福會以56%對44%的優(yōu)勢獲勝。實際結(jié)果是,羅斯福以62%對38%的優(yōu)勢勝出。當(dāng)時有人說,這次選舉的最大贏家不是羅斯福,而是蓋洛普。自這之后,蓋洛普的調(diào)查機構(gòu)得到迅速的發(fā)展,國內(nèi)外聞名,而《文學(xué)摘要》雜志不久就垮了。
《文學(xué)摘要》雜志的調(diào)查方法有什么問題?2023/9/14數(shù)據(jù)模型與決策實際的抽樣調(diào)查是很復(fù)雜的,即使采用了好的隨機抽樣方法、準(zhǔn)確地計算了誤差界限,調(diào)查結(jié)果也不一定可靠。就拿例3.1來說,本來應(yīng)該是對打架雙方都進(jìn)行調(diào)查,但已經(jīng)死去的被調(diào)查者無法回答,而剩下的被調(diào)查者又可能為保全自己而不如實地回答。那么,這樣的調(diào)查結(jié)果會可靠嗎?下面,我們來看看抽樣調(diào)查有些什么樣的誤差來源,以及抽樣調(diào)查者應(yīng)如何與之奮斗。2023/9/14數(shù)據(jù)模型與決策統(tǒng)計調(diào)查的目的是取得能準(zhǔn)確反映客觀狀況的統(tǒng)計數(shù)據(jù)。在許多時候,調(diào)查結(jié)果并不能準(zhǔn)確地表現(xiàn)事實,總會有誤差出現(xiàn)。在調(diào)查的各個階段,誤差都有可能出現(xiàn)。如果其中一個階段出現(xiàn)了較大誤差,可能會把其他階段都進(jìn)行得很好的一次調(diào)查毀掉,因此必須認(rèn)真細(xì)致地實施調(diào)查的每一個階段、嚴(yán)格控制誤差。為了保證統(tǒng)計數(shù)據(jù)的質(zhì)量,了解誤差的來源與減小誤差的措施很有必要。1.2抽樣誤差與非抽樣誤差2023/9/14數(shù)據(jù)模型與決策繼續(xù)例1.4
從常理來看,應(yīng)該調(diào)查數(shù)據(jù)越多,結(jié)論越可靠。羅斯福的實際得票率為62%,《文學(xué)摘要》雜志的預(yù)測為43%,誤差達(dá)到19%。誤差之大令人驚異。這樣大的誤差是怎么得來的呢?經(jīng)過研究發(fā)現(xiàn),原因在于《文學(xué)摘要》雜志選取樣本有偏性。雜志是根據(jù)電話簿和俱樂部會員的名冊,將問卷郵寄給一千萬人。當(dāng)時美國四個家庭中僅有一家裝電話。他選取的樣本有排斥窮人的選擇偏性。這樣的民意測驗非常不利于民主黨人羅斯福。2023/9/14數(shù)據(jù)模型與決策
此外,《文學(xué)摘要》雜志調(diào)查的一千萬人中只有二百四十萬人回答了問卷,不回答者可能非常有別于回答者,這二百四十萬人代表不了被郵寄問卷的一千萬人。譬如,1936年《文學(xué)摘要》雜志的一次專門的調(diào)查,給在芝加哥的選民每三人寄去一張問卷。約20%的被調(diào)查者作了回答,其中支持蘭登的超過半數(shù)。但是在選舉中,蘭登在芝加哥的得票率只有三分之一。所以當(dāng)出現(xiàn)高不回答率時,謹(jǐn)防不回答偏性。心理研究表明,低收入和高收入的人傾向于不回答問卷,因此中等收入的人在回答者中的比例過高。為此現(xiàn)代調(diào)查機構(gòu)更喜歡采用親自詢問來代替郵寄問卷2023/9/14數(shù)據(jù)模型與決策
即使親自詢問,也有不回答偏性的問題。訪問員來訪時,不在家的人與在家接受訪問的人可能在工作時間、家庭關(guān)系和社會背景等方面有比較大的差異,從而看法也不一樣。例如有一項關(guān)于快餐的市場調(diào)查。抽取500戶家庭進(jìn)行調(diào)查。白天訪問時,有150戶家庭沒人。能不能僅用白天有人的350戶家庭的數(shù)據(jù)?不能。這里有不回答偏性。白天不在家的150戶可能是吃快餐比較多的家庭。2023/9/14數(shù)據(jù)模型與決策誤差按其性質(zhì)可以分為兩類,一類是抽樣誤差,它是由于抽選樣本的隨機性而產(chǎn)生的誤差。只有采用概率抽樣的方式才可能估計抽樣誤差。另一類是非抽樣誤差,它是指除抽樣誤差以外的、由于各種原因而引起的誤差。在概率抽樣、非概率抽樣和全面調(diào)查中,非抽樣誤差都有可能存在。若采用了概率抽樣方法,那么我們可以估計出抽樣誤差的大小,還可以通過選擇樣本量的大小來控制抽樣誤差。在謹(jǐn)慎執(zhí)行的抽樣調(diào)查中,抽樣誤差通常不大。而非抽樣誤差相對比較難以估計和控制。2023/9/14數(shù)據(jù)模型與決策問題的措辭也可能造成誤差問題的措辭造成的誤差是計量誤差的一種。例3.3顯示了由于問題的措辭不同而造成的不同的調(diào)查結(jié)果。研究表明,問卷的不同用詞會造成被調(diào)查者不同的反應(yīng),從而造成調(diào)查誤差。我們來看幾個措辭不當(dāng)?shù)膯栴}。2023/9/14數(shù)據(jù)模型與決策問:您住的地方到這里是多少時間的路程?1、不超過10分鐘2、10~20分鐘3、20~30分鐘4、30分鐘以上用什么方式呢?步行?騎自行車?乘汽車?還是坐飛碟?問:您全家的月收入是多少?1、低于2000元2、2000~5000元3、5000~8000元4、8000~11000元5、11000元以上“全家”的定義是什么?“月收入”包括哪些?而且各月收入不同怎么辦?2023/9/14數(shù)據(jù)模型與決策問:您是否贊成禁止私人擁有槍械以降低犯罪率?
1、很贊成2、比較贊成3、說不清4、比較不贊成5、很不贊成你暗示了“禁止擁有槍械”就必然能“降低犯罪率”。明顯要我贊成吧?問:您在過去一年里購買過哪些牌子的糖果?
(請?zhí)顚懀?/p>
記憶大挑戰(zhàn)?怎么會記得一年那么長的事?2023/9/14數(shù)據(jù)模型與決策
實際中的抽樣調(diào)查是比較復(fù)雜的,若僅采用簡單隨機抽樣方法,很可能根本無法實現(xiàn)。本節(jié)主要介紹兩種常用的抽樣設(shè)計方法,一種是分層抽樣方法,另一種是整群抽樣方法。
1.3抽樣設(shè)計2023/9/14數(shù)據(jù)模型與決策例1.5PackGoodsInc.的分層抽樣方法
PackGoodsInc.是美國一家專門研究包裝食品和飲料(即以瓶子、盒子、罐頭或其他容器包裝的食品和飲料)銷售情況的市場研究公司。該公司以美國所有銷售包裝食品和飲料的商店(包括超市、食品店、便利店、藥店等)作為研究對象。抽樣時,他們首先采用分層抽樣方法,即按照3個維度將總體劃分為18個“格子”,然后在每個“格子”中獨立進(jìn)行抽樣。這3個維度是:一、分層抽樣方法2023/9/14數(shù)據(jù)模型與決策1、地理區(qū)域,包含兩種:
大都市區(qū)域:人口超過一百萬的州或省
州/?。撼╝)外的其他州或省。2、城市大小,包含三種情況:城市“A”:人口超過12萬城市“B”:人口在5000至12萬之間城市“C”:人口少于5000。3、商店類型,分為三種情況:
食品超市,包括食品連鎖店
食品店:除食品超市外的其他食品店非食品店:一些挑選出的藥店等
2023/9/14數(shù)據(jù)模型與決策若按這3個維度對研究總體分類,那么共有18個類,它們可以用一個立方體來表示,如圖4.1所示,其中每個“格子”代表一類。譬如,正前方標(biāo)有“1”的格子表示屬于大都市區(qū)域且人口少于5000人的城市中的所有食品超市。從例3.5,我們不難理解分層抽樣的定義:將總體分成若干個互不重疊的子總體,從每個子總體中獨立地進(jìn)行抽樣。每個子總體,也即例4.5中的“格子”,被成為層(stratum)。2023/9/14數(shù)據(jù)模型與決策分層抽樣的優(yōu)點在于可以提高樣本的代表性,使各個類別(由所劃分的層決定)的樣本都能入樣,避免出現(xiàn)太極端、代表性太差的樣本。在一些大型抽樣調(diào)查中采用分層抽樣可以便于管理。譬如,在一個全國性的抽樣調(diào)查中,若以省、自治區(qū)、直轄市為層,那么可以各省、自治區(qū)、直轄市為單位進(jìn)行獨立抽樣和管理。研究表明,若層內(nèi)差異小、層間差異大,那么可以提高估計量的精度。2023/9/14數(shù)據(jù)模型與決策例1.6人體測量抽樣方案1985~1987年間,國家標(biāo)準(zhǔn)局、中國服裝工業(yè)總公司和中國人民解放軍總后軍需裝備研究所就人的體型尺寸設(shè)計了抽樣方案,以獲取人體各種尺寸的分布情況。考慮到我國人口分布的現(xiàn)狀以及人體測量的特點,該抽樣方案首先將全國各省、市、自治區(qū)劃分為12個層。在每一層被抽中的省、市、自治區(qū)中,以一個自然的群體單位,如一個獨立的實際單位或其中的一個或幾個車間或班組,作為抽樣單元。一旦這個群體單位被抽中,那么該單位中的所有人都成為樣本接受測量。這樣,既簡化了抽樣框又便于管理。另一方面,試調(diào)查時發(fā)現(xiàn),除了對體形尺寸有特殊要求的單位,從事不同職業(yè)人員的體形尺寸無明顯的差異,這說明樣本的代表性也是比較好的。二、整群抽樣方法2023/9/14數(shù)據(jù)模型與決策從總體中按某種方式抽取若干個群體單位,觀測其中所有的單元,這種抽樣方法被稱為整群抽樣。這些群體單位被稱為群(cluster),例4.6中每一自然的群體單位就是一個群。在分群時,希望群內(nèi)的單元差異大,群間的差異小,這樣,被抽到的群代表性好,整群抽樣的效率就高。由此可見,分群的原則與分層的原則正好相反。2023/9/14數(shù)據(jù)模型與決策實際的抽樣調(diào)查是比較復(fù)雜的,很難采用單一的抽樣方法來進(jìn)行抽樣。譬如,例3.5中就采用了先分層抽樣,然后在各層中進(jìn)行整群抽樣,這種抽樣方法被稱為分層整群抽樣。實際的抽樣方法可能還要復(fù)雜得多,不過,了解了簡單隨機抽樣、分層抽樣和整群抽樣,那么實際的抽樣方案大多就很容易理解了!除了這里介紹的抽樣方法外,還有其他的抽樣方法,譬如,多階抽樣、系統(tǒng)抽樣、不等概率抽樣等等。各種抽樣方法是可以結(jié)合起來使用的,譬如,全國性的抽樣調(diào)查常采用多階抽樣與分層抽樣相結(jié)合的方法。實際的抽樣方法2023/9/14數(shù)據(jù)模型與決策1.4解讀調(diào)查結(jié)論
誰做的調(diào)查?一般來說,專業(yè)的抽樣調(diào)查機構(gòu)為了名聲,會好好做調(diào)查的。
總體是什么?也就是說,調(diào)查是在尋求哪些人的意見?樣本是怎樣選取的?注意看他們有沒有提隨機抽樣等方法。樣本多大?最好除了樣本大小外還有精確度的評估,譬如所有用同樣方法可能得到的樣本中的95%會落進(jìn)去的誤差界限。回應(yīng)率多少?也就是說,原來預(yù)定的受訪對象中有百分之多少確實提供了信息?用什么方式聯(lián)絡(luò)受訪者?電話?郵寄?面對面訪談?調(diào)查是什么時候做的?是不是剛好在一個可能影響結(jié)果的事件
問題確實是怎么問的?對于沒能提供上述問題答案的調(diào)查,我們最好先持懷疑態(tài)度,不要被看似冠冕堂皇的幾個數(shù)據(jù)牽著鼻子走??!2023/9/14數(shù)據(jù)模型與決策二、實驗面面觀2.1幾個例子2.2實驗設(shè)計2.3基本原則2023/9/14數(shù)據(jù)模型與決策
例2.1教學(xué)效果
諾瓦東南大學(xué)(NovaSoutheasternUniversity)的一項研究報告指出:學(xué)生在網(wǎng)上學(xué)習(xí)和在教室里學(xué)習(xí)效果一樣好,由此看來,學(xué)生可以全部網(wǎng)上學(xué)習(xí),可以節(jié)約大量經(jīng)費。觀測研究是被動的數(shù)據(jù)搜集方式,它只觀察、記錄或測量,但是沒有主動介入,而實驗?zāi)苤鲃赢a(chǎn)生數(shù)據(jù)。大部分的實驗或觀測研究都是想知道一個或一些變量對另一個變量有何影響。本例中大學(xué)生是受試對象,解釋變量(因子)是學(xué)習(xí)環(huán)境,反應(yīng)變量(指標(biāo))是修完課后學(xué)生的考試成績。上網(wǎng)學(xué)習(xí)的同學(xué)是否和在教室上課的同學(xué)學(xué)的一樣好?需要指定一些學(xué)生到教室上課,并指定另外一些人上網(wǎng)學(xué)習(xí),然后進(jìn)行對比,這就是實驗!2.1幾個例子2023/9/14數(shù)據(jù)模型與決策
例2.2美國政府研究如下一個問題:是否需要為中低收入家庭提供日間托兒服務(wù)?
如果這項服務(wù)能使得這些兒童在日后收到更多更好的教育,則政府可以少付出福利金、增加稅收而很有效益。卡羅來那州的一項啟蒙計劃從1972年開始對一群兒童進(jìn)行跟蹤觀測,結(jié)果顯示,良好的日間照護(hù)對兒童以后的就學(xué)和就業(yè)有很大影響。啟蒙計劃中受試對象是111個人,他們在1972年還是名嬰兒,出生在低收入家庭,身體健康,所有這些嬰兒都得到社會工作者的幫助,其中隨機選出一半的人給予密集學(xué)前教育。這里進(jìn)行了對比,解釋變量是是否接受學(xué)期教育,而反應(yīng)變量則很復(fù)雜,包括是否上大學(xué)以及就業(yè)情況。2023/9/14數(shù)據(jù)模型與決策
潛在變量是對研究中其它變量間的關(guān)系有重大影響但未被列為解釋變量的變量。當(dāng)兩個變量對反應(yīng)變量的影響混在一起而無法區(qū)別時,我們稱這兩個變量是交叉的,交叉變量可以是解釋變量,也可以是潛在變量。在諾瓦東南大學(xué)的研究中,學(xué)生原來的程度是潛在變量,它和解釋變量交叉在一起。學(xué)生期末考試成績一樣好,我們無法判斷原因是什么。2023/9/14數(shù)據(jù)模型與決策例2.3
胃冷凍失敗了
胃冷凍能否使得胃潰瘍病人減輕疼痛?接受胃冷凍治療的病人表示治療后疼痛程度降低了,是否可以說明胃冷凍有效?數(shù)年之后,有人做了另一項臨床實驗,把胃潰瘍病人分成兩組,一組接受胃冷凍治療,一組使用安慰劑。結(jié)果:在接受胃冷凍的82位病人中,34%病情有改善,而在使用安慰劑的78位病人中,38%有改善。從此,醫(yī)生在治療胃潰瘍時不再使用胃冷凍辦法。許多病人對如何治療都有正面反應(yīng),這稱為安慰劑效應(yīng)。2023/9/14數(shù)據(jù)模型與決策例2.4
隨機化雙盲實驗二十世紀(jì)六十年代前,脊髓灰質(zhì)炎(俗稱小兒麻痹癥)是令人懼怕的疾病之一,嚴(yán)重危害著兒童的健康。1954年美國公共衛(wèi)生總署決定組織脊髓灰質(zhì)炎疫苗實驗。實驗對象是1、2、3年級的兒童。如何設(shè)計該實驗?2023/9/14數(shù)據(jù)模型與決策
先后提出了多種方案。第1個實驗方案是,給大量兒童接種疫苗。如果1954年脊髓灰質(zhì)炎發(fā)病率比1953年明顯下降,就說疫苗有效??尚袉??第2個方案是,取得父母同意的兒童接種疫苗,組成處理組。其他兒童組成對照組。該方案如何?研究表明,高收入家庭的父母比低收入家庭的父母更贊成接種疫苗,而高收入家庭的兒童也更易受到脊髓灰質(zhì)炎的傷害。最后確定的一個方案是隨機化對照比較雙盲實驗。該實驗的處理組和對照組都來自父母同意接種疫苗的兒童們。將這些孩子隨機分配到處理組或?qū)φ战M(扔一枚均勻的硬幣,以50%對50%的機會將兒童分配到處理組或?qū)φ战M)。2023/9/14數(shù)據(jù)模型與決策隨機化對照比較雙盲實驗結(jié)果如下表所示:
人數(shù)病例數(shù)每十萬人中的病例數(shù)處理200,7455728對照201,22914271
可用假設(shè)檢驗的方法對疫苗是否有效果進(jìn)行檢驗,留待以后討論。2023/9/14數(shù)據(jù)模型與決策在明確所要考察的(可控)因子及其水平后對實驗進(jìn)行總體安排稱為實驗設(shè)計。要使一項實驗設(shè)計有效必須在安排實驗時注意以下幾點:1)盡量減少實驗誤差。
實驗設(shè)計是Fisher在進(jìn)行農(nóng)業(yè)田間實驗時提出的,他發(fā)現(xiàn)在田間實驗中,環(huán)境條件難以嚴(yán)格控制,實驗誤差不可忽視,故提出對實驗方案必須作合理的安排,以減輕誤差的影響。2)盡量減少實驗次數(shù)。
這意味著減少實驗費用、縮短實驗周期,特別在生產(chǎn)中更要注意這一點,過多的實驗次數(shù)使企業(yè)難以承受,以至于不得不放棄實驗設(shè)計方案。2.2實驗設(shè)計2023/9/14數(shù)據(jù)模型與決策3)便于對實驗結(jié)果進(jìn)行統(tǒng)計分析。
由于在實驗中存在隨機誤差,并體現(xiàn)在指標(biāo)的測量值上,所以對指標(biāo)值的分析只有用統(tǒng)計方法才是客觀的和科學(xué)的分析方法。這樣一來,任何一個實驗問題就有兩個方面:實驗的設(shè)計和數(shù)據(jù)的統(tǒng)計分析。這兩個方面緊密相連,設(shè)計時要想到下一步如何進(jìn)行統(tǒng)計分析,統(tǒng)計分析時要考慮到實驗是按什么設(shè)計方案進(jìn)行的。2023/9/14數(shù)據(jù)模型與決策實驗設(shè)計有三個基本原則:重復(fù)、隨機化和區(qū)組。這三個基本原則在每個實驗中都必須考慮。1)重復(fù):指一個實驗點在相同條件下重復(fù)進(jìn)行若干次實驗。重復(fù)次數(shù)愈多,所得結(jié)論愈可信。但這也帶來實驗時間的延長和實驗費用的增加。實驗設(shè)計要求根據(jù)實際情況在兩者之間取得平衡。譬如在生物、化學(xué)和農(nóng)業(yè)實驗中重復(fù)次數(shù)要略多一些,而在工業(yè)實驗中,若實驗穩(wěn)定,重復(fù)次數(shù)可略少一些。2.3基本原則2023/9/14數(shù)據(jù)模型與決策2)隨機化隨機化是指實驗材料的分配和各實驗點的實驗次序都要隨機確定。它有如下一些好處:隨機化常能使各次實驗結(jié)果相互獨立,而這是實驗設(shè)計中正確使用統(tǒng)計方法分析實驗結(jié)果的基石;可以使不可控因子的影響“抵消”部分,不至于積累成災(zāi);對實驗人員尚未意識到的不可控因子的影響可以得到減弱;可使實驗誤差得到準(zhǔn)確的估計。隨機化可視同參加保險,有可能會增加麻煩和費用,但確能起到消災(zāi)防災(zāi)的作用,只有在隨機化實施十分困難的時才可以不進(jìn)行隨機化。2023/9/14數(shù)據(jù)模型與決策3)區(qū)組
一組實驗總希望在相同或近似相同條件下進(jìn)行,但在很多實際場合很難得到,于是實驗中常采用分“區(qū)組”方法:把實驗單元分為若干個小組,使每組內(nèi)的實驗條件相同或近似相同,而組與組之間在實驗條件上允許有較大差異,這樣的小組在實驗設(shè)計中被稱為區(qū)組。有點類似于抽樣調(diào)查中的分層。譬如,一項農(nóng)田實驗中要到20個實驗田快,但它們的肥程度、日照強弱、水份多少很難達(dá)到完全相同或近似相同。若把20個田塊快分成幾個區(qū)組,使區(qū)組內(nèi)差異小,而區(qū)組間允許差異大一些,這在很多場合就容易辦到。2023/9/14數(shù)據(jù)模型與決策數(shù)據(jù)收集好了,那我們就來看看從數(shù)據(jù)中能挖到什么寶藏了!例3.1交通事故的駕駛因素分析造成交通事故的駕駛因素有判斷失誤、察覺得晚、駕駛錯誤、偏離規(guī)定的行駛路線和酒后或疲勞駕駛等。某地區(qū)交通管理部門對某段時間中的50起交通事故進(jìn)行駕駛因素分析,得到的原始數(shù)據(jù)如下:三、數(shù)據(jù)的圖表描述2023/9/14數(shù)據(jù)模型與決策駕駛錯誤察覺得晚察覺得晚判斷失誤駕駛錯誤察覺得晚判斷失誤察覺得晚判斷失誤察覺得晚判斷失誤酒后或疲勞駕駛察覺得晚判斷失誤察覺得晚駕駛錯誤判斷失誤駕駛錯誤察覺得晚判斷失誤酒后或疲勞駕駛察覺得晚察覺得晚察覺得晚察覺得晚察覺得晚偏離規(guī)定的行駛路線判斷失誤駕駛錯誤察覺得晚判斷失誤判斷失誤判斷失誤察覺得晚駕駛錯誤察覺得晚察覺得晚駕駛錯誤察覺得晚判斷失誤判斷失誤駕駛錯誤駕駛錯誤判斷失誤駕駛錯誤駕駛錯誤酒后或疲勞駕駛察覺得晚察覺得晚察覺得晚2023/9/14數(shù)據(jù)模型與決策從例3.1的數(shù)據(jù),你能看出些什么?也許你看出了“察覺得晚”、“判斷失誤”等因素比較多,“偏離規(guī)定的行駛路線”、“酒后或疲勞駕駛”等因素比較少。很好!其實,只要借助一些簡單的圖表,就能對數(shù)據(jù)加以整理并進(jìn)行初步的定量分析。一些常用的軟件如Excel,幾乎能完美地為你完成這些圖表!2023/9/14數(shù)據(jù)模型與決策3.1頻數(shù)頻率分布表頻數(shù)頻率分布表是表明幾個不相重疊的類中每一類的頻數(shù)和頻率的表格,是很常用的一種數(shù)據(jù)描述方法。頻數(shù)和頻率分別是什么呢?頻數(shù)是指將樣本按照一定的方法分成若干類,每類中含有這個樣本的個體的數(shù)目。頻率是指某個類的頻數(shù)與樣本容量的比值。譬如,在例1中,“察覺得晚”這一因素出現(xiàn)了21次,那么其頻數(shù)為21,頻率為21/50=42%。2023/9/14數(shù)據(jù)模型與決策表1駕駛因素的頻數(shù)頻率分布表駕駛因素頻數(shù)頻率(%)察覺得晚2142判斷失誤1428駕駛錯誤1122偏離規(guī)定的行駛路線12酒后或疲勞駕駛36合計501002023/9/14數(shù)據(jù)模型與決策我們從表1很容易看出:哪些因素是比較主要的因素?各因素之間頻率的差異有多大?等等。有時,累積頻率也需要在頻數(shù)頻率分布表中列出。每一類的累積頻率是指,從第一類開始累積到該類的頻率總和,即將該類及其之前的所有類的頻率相加。譬如,為了分析駕駛因素中的主要因素,我們可以進(jìn)一步改進(jìn)表1,按照頻數(shù)或頻率從大到小的順序,將各因素排序后列出來,并加上累積頻率一項,結(jié)果列于表2中。2023/9/14數(shù)據(jù)模型與決策表2分析駕駛因素中主要因素的頻數(shù)頻率分布表駕駛因素頻數(shù)頻率(%)累積頻率%察覺得晚214242判斷失誤142870駕駛錯誤112292酒后或疲勞駕駛3698偏離規(guī)定的行駛路線12100合計50100
軟件實施用Excel制作定性數(shù)據(jù)頻數(shù)頻率分布表2023/9/14數(shù)據(jù)模型與決策累積頻率更常用于有序數(shù)據(jù)的分析中。我們來看一個例子。例3.2博客調(diào)查(http://)PerseusDevelopment公司在其網(wǎng)頁上發(fā)布了一項關(guān)于博客的調(diào)查報告。該調(diào)查根據(jù)8個博客服務(wù)商提供的博客用戶資料,得到了各年齡段的人創(chuàng)建的博客數(shù),頻數(shù)頻率分布表3顯示了調(diào)查結(jié)果。2023/9/14數(shù)據(jù)模型與決策表3各年齡段的博客創(chuàng)建情況10-1255,5001.351.3513-192,120,00051.4552.8020-291,630,00039.5692.3530-39241,0005.8598.2030-4941,7001.0199.2150-5918,5000.4599.66年齡段創(chuàng)建的博客數(shù)
頻率(%)累積頻率(%)60-6913,9000.34100.00合計4,120,600100.00請注意表2和表3排列順序的不同。2023/9/14數(shù)據(jù)模型與決策用于數(shù)據(jù)描述的圖形比較多,譬如常用的餅狀圖、柱狀圖、直方圖,以及在統(tǒng)計學(xué)中常用的莖葉圖、排列圖等等。當(dāng)我們在考慮各種圖的時候,把變量稍加分類會有幫助。有的變量具備有意義的數(shù)值尺度,如身高幾厘米、考試成績幾分等;而有的變量只是把個體分到不同類別而已,如性別、職業(yè)或教育程度。類別變量只記錄所屬類別,譬如,例1的變量就是類別變量,它包含5個類,個體的數(shù)據(jù)就是指個體屬于其中某個類。要表示類別變量的分布,可以用餅圖,也可用柱狀圖或條形圖,等等。3.2類別變量的圖形顯示2023/9/14數(shù)據(jù)模型與決策以下圖形均由計算機繪制!ExcelMINITAB2023/9/14數(shù)據(jù)模型與決策2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版設(shè)備砂石料購銷與設(shè)備性能優(yōu)化協(xié)議3篇
- 二零二五年度人事部人才與專家工作辦公室員工福利保障合同3篇
- 二零二五年度圖書館圖書修復(fù)與保護(hù)工程合同
- 個體物流配送員勞動協(xié)議格式(2024年版)一
- 二零二五版木材進(jìn)口關(guān)稅減免申請服務(wù)合同4篇
- 二零二五年度土地利用現(xiàn)狀變更測量合同
- 二零二五年度城市公共充電樁運營管理合同4篇
- 二零二五版大數(shù)據(jù)中心項目合作協(xié)議4篇
- 2025年度美容院連鎖加盟區(qū)域代理權(quán)及市場獨占協(xié)議
- 2025年度企業(yè)培訓(xùn)項目財務(wù)結(jié)算合同范本4篇
- 2024生態(tài)環(huán)境相關(guān)法律法規(guī)考試試題
- 有砟軌道施工工藝課件
- 兩辦意見八硬措施煤礦安全生產(chǎn)條例宣貫學(xué)習(xí)課件
- 40篇短文搞定高中英語3500單詞
- 人教版高中數(shù)學(xué)必修二《第九章 統(tǒng)計》同步練習(xí)及答案解析
- 兒科護(hù)理安全警示教育課件
- 三年級下冊口算天天100題
- 國家中英文名稱及代碼縮寫(三位)
- 人員密集場所消防安全培訓(xùn)
- 液晶高壓芯片去保護(hù)方法
- 拜太歲科儀文檔
評論
0/150
提交評論