SAS軟件之單因素方差分析在香水主觀評價中的應(yīng)用_第1頁
SAS軟件之單因素方差分析在香水主觀評價中的應(yīng)用_第2頁
SAS軟件之單因素方差分析在香水主觀評價中的應(yīng)用_第3頁
SAS軟件之單因素方差分析在香水主觀評價中的應(yīng)用_第4頁
SAS軟件之單因素方差分析在香水主觀評價中的應(yīng)用_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、概率論與數(shù)理統(tǒng)計課程報告院系名稱: 信息科學與工程學院 專業(yè)班級: 學生姓名: 理金龍 學 號: 2017年 10月 30日單因素方差分析在香水主觀評價中的應(yīng)用摘要:通過調(diào)研用戶真實的使用感受,對香水進行主觀評價,是一種基于用戶觀點的評價方法。 運用SAS統(tǒng)計學軟件,以不同品牌的香水使用的主觀評價為例,闡述了單因素方差分析方法在香水主觀評價中的應(yīng)用。單因素方差分析方法適用于所有涉及對香水的造型美學、色彩、香味、品質(zhì)感知的評價,該方法既避免了只比較平均值的誤區(qū),又相對于Z檢驗和T檢驗提高了分析效率和可靠性。 關(guān)鍵詞: SAS;單因素方差分析;香水主觀評價Application of Univar

2、iate Analysis of Variance in Subjective Evaluation of PerfumeAbstract: It is an evaluation method based on users view by investigating the users real use experience and subjective evaluation of perfume. The application of single factor analysis of variance (ANOVA) in the subjective evaluation of per

3、fume was described by using SAS statistical software and subjective evaluation of different perfumes of perfume. The one-way variance analysis method is applicable to all the evaluation of the aesthetic, color, fragrance and quality perception of perfume. This method not only avoids the misunderstan

4、ding of the average value, but also improves the efficiency and reliability of the analysis compared with the Z test and T test Sex.Key words: SAS; single factor analysis of variance; perfume subjective evaluation1 研究背景國內(nèi)香水市場競爭日趨激烈, 每個細分市場都有多款香水參與競爭。用戶選擇的余地很大,眼光也越來越挑剔。在此背景下,用戶的喜好成為香水生產(chǎn)企業(yè)設(shè)計新香水和改款香水的重

5、要參考指標。主觀評價方法從用戶實際使用的感受出發(fā),由用戶的打分來評價香水。這種方法的優(yōu)勢在于關(guān)注用戶的實際使用需求和感受。評價的結(jié)果通常用平均值來表示,平均值較高的香水品質(zhì)較好。在實際應(yīng)用中,常常出現(xiàn)兩個誤區(qū):一種是簡單化的比較平均值,而不考慮平均值的置信區(qū)間;一種是對多個品牌的香水進行比較時,缺乏合適的方法,結(jié)論也很模糊。單因素方差分析是一種比較來自多個總體的樣本平均值的統(tǒng)計學方法。該方法在主觀評價中的應(yīng)用可以顯著提高評價結(jié)果分析的速度和準確性。本文采用SAS軟件,以多款中高級香水品質(zhì)為例,闡述了單因素分析方法在香水品質(zhì)主觀評價中的應(yīng)用。2 香水品質(zhì)主觀評價及數(shù)據(jù)主觀評價是一種以用戶體驗和評

6、價為基礎(chǔ)的方法,通過設(shè)定一定的評價環(huán)境和條件,模擬真實的用戶在使用香水時對香水的造型美學、色彩、香味、品質(zhì)等各方面的感受和評價。這種方法在香水設(shè)計前期可以用來作為香水的設(shè)計參考指標,在香水量產(chǎn)階段可以用于與對手的比較,確定香水的定位和市場宣傳亮點。此次主觀評價選擇1120個具有使用香水的豐富經(jīng)歷的人來模擬實際的用戶,主觀評價過程也被嚴格的控制,要求同一批人在同樣的環(huán)境下,按照同樣的評價指標,對不同的品牌的香水進行評價。評價結(jié)果通常采用分數(shù)計量。此次調(diào)查的規(guī)模很大,進行了上千個用戶的調(diào)查,大量的數(shù)據(jù)會抵消奇異值的影響,數(shù)據(jù)也有較好的質(zhì)量。在對評價結(jié)果的分析中,通常的做法是直接將平均值進行比較,沒

7、有考慮置信區(qū)間。平均值是根據(jù)樣本數(shù)據(jù)對總體均值的估計,在不同香水的品質(zhì)相差較大時簡單有效。但是平均值無法判斷對總體進行估計的準確性,而且平均值會因為樣本不同而有所差異,也就是說用平均值無法代表樣本點的分布情況,比如無法反映分布類型和數(shù)據(jù)的離散情況。另外還有一些調(diào)研考慮了平均值的置信區(qū)間,運用Z檢驗或者T檢驗進行不同香水之間的均值比較。但是Z檢驗和T檢驗都只能進行兩兩比較,當同時進行三款或更多香水品牌的評價時,運用Z檢驗和T檢驗將十分繁瑣。本文選用了某第三方調(diào)研機構(gòu)對中高級香水的用戶調(diào)查,包含了ajayeb、ajmal、amreaj、aood、asgar_ali、bukhoor、burberrr

8、y、dehenalaod、junaid、kausar、rose、solidmusk、TeaTreeOil、raspberry、RoseMusk、strawberry、constrected2、carolina_herrera、oudh_maalattar、constrected共計20款香水。每款香水調(diào)查了56位用戶,調(diào)研項目涉及香水的造型美學、色彩、香味、持續(xù)時間等多個項目。用戶的評分采用百分制量表。本文選擇了香水品質(zhì)綜合評價這一個項目來闡述方法的應(yīng)用,這種應(yīng)用也可以推廣到其他幾個項目的分析中。3 單因素方差分析的使用條件和方法方差分析是 20 世紀 20 年代發(fā)展起來的一種統(tǒng)計方法,廣泛應(yīng)

9、用于社會學、工程技術(shù)、醫(yī)藥的試驗分析領(lǐng)域。單因素方差分析是方差分析的一種,通過對數(shù)據(jù)誤差來源的分析來比較多個總體的均值是否相等, 并且判斷分類型自變量對數(shù)值型因變量的顯著性影響。與Z檢驗和T 檢驗方法相比,該方法可以提高分析的效率,同時由于它是將所有的樣本信息結(jié)合在一起,還增加了分析的可靠性。方差分析一般要求滿足3個基本假設(shè):各個總體應(yīng)該服從正態(tài)分布;各個總體的方差應(yīng)該相同;觀測值之間是獨立的。其中,對正態(tài)分布的要求不是很嚴格,但是對方差齊性的要求很嚴格。 根據(jù)上述3個基本假設(shè),方差分析對各個總體的顯著性差異的推斷就可以轉(zhuǎn)化為對各個總體的均值是否相等的推斷了。假設(shè)從 k 個總體中分別抽取包括含

10、有 n1,n2, nk 個觀測值的獨立隨機樣本, 將 k 組樣本的均值記為x1,x2,xk,將總體均值記為x,定義 n=n1+n2+ nk,并且定義下面的均方:需要檢驗的原假設(shè)是:H0:1=2=k其備擇假設(shè)為:H1:,2,k 不全相等如果 MSGMSWFk-1,n-k,a,則拒絕原假設(shè)。Fk-1,n-k 服從分子自由度為k-1,分母自由度為n-k的F分布。4 單因素方差分析在主觀評價的應(yīng)用4.1 數(shù)據(jù)展列本次調(diào)研共涉及20種香水,共計1120名用戶,屬于大規(guī)模調(diào)研。表1中列出了20款香水品質(zhì)評價的均值、標準差、最值等信息如圖4.1所示。圖4.1 描述性統(tǒng)計圖4.2 Evaluation的頻數(shù)分

11、布4.2 單因素試驗設(shè)計的均值比較proc anova data=li.perfume;class perfume;model Evaluation=perfume;means perfume;means perfume/hovtest;run;程序說明:因為數(shù)據(jù)僅僅是按照perfume值分類,所以在class語句中這是僅有的一個變量。變量Evaluation是被分析的因變量,故Evaluation出現(xiàn)在model語句等號的左邊。在方差分析表中,除了總方差和誤差外,方差的來源僅僅是由于各種不同perfume值的變異造成的,因此perfume出現(xiàn)在model語句等號的右邊。Means語句計算主效

12、應(yīng)perfume不同水平所對應(yīng)的因變量均值,選項hovtest計算不同香水品牌組方差齊性的假設(shè)檢驗。輸出的結(jié)果見圖4.3所示:圖4.3(a)分類變量信息結(jié)果分析:anova過程總是輸出兩個基本的方差分析表。一個是總體模型的方差分析表,一個是包含模型中各個變量的方差分析。首先輸出class語句中規(guī)定的每個變量(perfume)、分類變量的取值數(shù)(20)、具體取值:(A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29)以及數(shù)據(jù)集中的觀察個數(shù)(1120)。圖4.3(b)單因素設(shè)計的方差分析結(jié)果

13、接著anova過程對model語句中每個因變量輸出方差分析表。包括:因變量的總平方和(82870.76608)、屬于模型部分的平方和(82616.56012)、屬于誤差部分的平方和(254.20596)、自由度DF(19、1100、1119)、模型的均方MS(4348.24001 = 82616.56012 /19)、誤差的均方MSE(0.23110 = 254.20596 /1100)、模型的F值(18815.7 = 4348.24001 / 0.23110)、分布大于18815.7的概率(0.0001)、(0.996933=82616.56012/ 82870.76608)、變異系數(shù)CV(

14、0.707246=100)、因變量的標準差(0.480725=)、因變量均值(67.97138)。對模型中的每個效應(yīng),anova過程還輸出方差分析表。perfume自由度DF(19)、平方和(82616.56012)、均方MS(4348.24001 = 82616.56012 /19)、F值(18815.7 = 4348.24001 / 0.23110)、分布大于7.40的概率(0.0001)??傮wF檢驗是顯著的(0.00010.05),表明模型是有意義的。品牌perfume的F檢驗也是顯著的(0.00010.05),表明不同品牌的均值不全相等。這里兩個F檢驗是完全相同的,這僅僅是因為在模型中

15、只有一項perfume。注意,我們可以用glm過程替代這個anova過程,能得到相同的方差分析結(jié)果。最大區(qū)別是glm過程將計算每個效應(yīng)的類型1和類型3平方和,而anova只計算類型1的平方和。對于單因素和多因素平衡數(shù)據(jù)來說,anova過程的SS1、glm過程的SS1和SS3都相同。圖4.3(d)Levene的方差齊性檢驗結(jié)果Levene的方差齊性檢驗結(jié)果表明:可以拒絕(0.00010.05)不同品牌組里觀察值的方差是相等的原假設(shè)。圖4.3()每種品牌的觀察數(shù)、均值和標準差結(jié)果最后輸出的是每種品牌的觀察數(shù)、均值和標準差。例如,A10品牌的觀察數(shù)為56,均值為64.4671429,標準差為0.26

16、236487。4.3 均值的多重比較和置信區(qū)間由于品牌perfume的F檢驗是顯著的(0.00010.2226,則為顯著,所以品牌A24的均值不同與A21,應(yīng)該標識不同的字母。因為存在20個均值之間最大差的顯著性,接下來就需要比較19個均值之間差的顯著性,臨界值為0.2219。85.0600057.825710.2219,顯著,82.4239346.018210.2219,顯著,只要存在一個顯著性,就需要繼續(xù)比較20個均值之間差的顯著性。以此類推直至兩兩比較結(jié)束。圖4.5各組均值的t檢驗置信區(qū)間圖4.5中結(jié)果分析:均值t分布的95%置信區(qū)間的一半寬度為0.126046,因此A24品牌均值置信區(qū)

17、間的下限為85.060000.126046,上限為85.060000.126046。其他品牌均值的置信區(qū)間計算,同樣是均值加減0.126046而得到的。圖4.6lsd最小顯著差檢驗圖4.6中結(jié)果分析:注意在顯著水平為0.05上,兩兩比較的最小顯著差為0.1783,如果顯著則被標上“*”。例如,A24均值減A22均值= 85.0600082.42393=2.636070.1783,顯著。綜合分析的結(jié)果表明,A21品牌均值顯著與其他品牌均值不同,且為最小的均值;A24品牌均值也顯著與其他品牌均值不同,且為最大的均值;A13、A25兩個品牌均值之間無顯著差異。4.4 有計劃的均值比較和參數(shù)估計在實際

18、情況中,多重比較要按某種分類標準來進行,我們現(xiàn)在還知道20種品牌的制造商情況,品牌A22、A23和A24三個品牌的香水來自法國(France)制造商,而其他品牌的香水來自非法國(non- France)制造商。我們比較法國香水品牌的均值與非法國香水品牌的均值是否有差異。程序如下:proc glm data=li.perfume;class perfume;model Evaluation=perfume;contrast France VS NON-France perfume -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 17 17 17 -3 -3 -3 -3 -

19、3;estimate France VS NON-France perfume -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 17 17 17 -3 -3 -3 -3 -3;run;程序說明:使用contrast語句來產(chǎn)生有計劃的均值比較分析和使用estimate語句進行參數(shù)估計。注意在anova過程中沒有這兩條語句,必須使用glm過程。使用contrast語句前,應(yīng)該首先表達出所關(guān)心的均值線性組合的原假設(shè),如contrast語句的三個基本參數(shù),一是標簽( France VS NON-France ),二是效應(yīng)名(perfume),三是效應(yīng)的數(shù)字系數(shù)表(-3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 17 17 17 -3 -3 -3 -3 -3)。應(yīng)特別注意的是,數(shù)字系數(shù)的次序是匹配分類變量按字母數(shù)字次序的水平值。事實上,均值線性組合的系數(shù)同樣是model語句中效應(yīng)參數(shù)組合的系數(shù),這是因為,將它們分別代入均值線性組合后,可得到所以,estimate語句的使用格式與contrast語句非常類同。輸出的主要結(jié)果見圖4.7所示:圖4.有計劃的均值比較和參數(shù)估計圖4.7中結(jié)果分析:顯示了法國香水品牌均值與非法國品牌均值比較的平方和為40602.42123,F(xiàn)值為175695,這個分布F值大于175659的概

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論