數(shù)學建模-葡萄酒評價_第1頁
數(shù)學建模-葡萄酒評價_第2頁
數(shù)學建模-葡萄酒評價_第3頁
數(shù)學建模-葡萄酒評價_第4頁
數(shù)學建模-葡萄酒評價_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2012高教社杯全國大學生數(shù)學建模競賽承 諾 書我們仔細閱讀了中國大學生數(shù)學建模競賽的競賽規(guī)則.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴肅處理。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): 我們的參賽報名號為(如果賽區(qū)設(shè)置報名

2、號的話): 所屬學校(請?zhí)顚懲暾娜?參賽隊員 (打印并簽名) :1. 2. 3. 指導教師或指導教師組負責人 (打印并簽名): 日期: 年 月 日賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):2012高教社杯全國大學生數(shù)學建模競賽編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號):基于統(tǒng)計分析的葡萄酒評價摘要本文旨在對評酒員葡萄酒品嘗評分的基礎(chǔ)上,通過對釀酒葡萄以及葡萄酒一些指標間的關(guān)系,做出對葡萄酒合理評價。主要進行了4個方面的研究:問題一

3、,在確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評,但是評酒員之間存在評價尺度、標準的差異,導致對酒質(zhì)量評分存在差異。運用非參數(shù)檢驗模型,對兩組評酒員的評價結(jié)果做Wilcoxon符號平均秩檢驗。求得,兩組評酒員的評價結(jié)果存在顯著差異。通過構(gòu)造標準參考數(shù)據(jù)組,做出標準差,通過判斷兩組評分偏離參考標準數(shù)據(jù)值的程度,以及利用SPSS軟件進行可靠性分析,得出信度。說明第二組評酒員對葡萄酒的評價更具有可信度。問題二,為了對釀酒葡萄進行分級,本文建立考慮權(quán)重的聚類分析,對傳統(tǒng)聚類分析進行改進?;谥笜诉^多,建立單因子方差分析模型,篩選出在聚類分析中發(fā)揮顯著作用的m個指標,通過聚類模型得到對釀酒葡

4、萄的五級劃分。問題三,釀酒葡萄與葡萄酒的理化指標關(guān)系,是研究兩組變量之間的相關(guān)性。通過建立典型相關(guān)分析模型,將兩組變量分別作為一個整體進行分析。通過數(shù)據(jù)分析,得出相關(guān)表達式,得到釀酒葡萄與葡萄酒的理化指標之間存在重要的相關(guān)關(guān)系。問題四,為論證葡萄與葡萄酒的理化指標能否評價葡萄酒的質(zhì)量,本文運用前14個指標建立綜合評價模型,運用主成分分析法分3個成分,經(jīng)過成分重要性計算和相關(guān)性確定正負值對標準化后的樣本數(shù)據(jù)加權(quán)計算評價得分。最后得出11號樣品酒的質(zhì)量最差,23號樣品酒的質(zhì)量最好,與評酒員的評分相近。故認為葡萄與葡萄酒的理化指標能在一定程度上評價葡萄酒的質(zhì)量,部分誤差是因為芳香物質(zhì)等感官指標的影響

5、。關(guān)鍵字:綜合評價模型信度分析 聚類分析典型相關(guān)分析 主成分分析1問題重述確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量。附件1給出了某一年份一些葡萄酒的評價結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據(jù)。請嘗試建立數(shù)學模型討論下列問題:1)分析附件1中兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信?2)根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對這些釀酒葡萄進

6、行分級。3)分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4)分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量?2問題的分析2.1 問題一由于兩組評酒員品嘗評分樣本屬于同一樣本,在對同一研究對象進行不同評判標準時,視為對兩配對樣本的檢驗,且數(shù)據(jù)處理之前總體分布情況未知,可建立非參數(shù)檢驗模型進行顯著性差異評價,本文采用Wilcoxon符號平均秩檢驗。在可信度分析上,可通過建立標準參考數(shù)據(jù)組,兩組評酒員評分分別與其進行標準差比較,判斷離散程度?;蛘卟捎肧PSS對兩組數(shù)據(jù)進行可靠性分析處理。利用最終求得的信度系數(shù)評判兩組評酒員評價結(jié)果的可靠性。2.2

7、 問題二將釀酒葡萄理化指標進行單因子方差分析,選取出在聚類分析中發(fā)揮明顯作用的m個指標。根據(jù)釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量關(guān)系有直接關(guān)系,把對葡萄酒質(zhì)量的評分當做特殊的第m+1個指標。由于各指標的對釀酒葡萄分級所發(fā)揮作用的效果不同,而傳統(tǒng)聚類分析把各指標放在了等同的地位?;谶@點,本文提出了考慮權(quán)重的聚類分析方法。通過網(wǎng)絡(luò)查閱資料,對各指標在分級中所起的重要性進行評分。最后對賦權(quán)的指標進行聚類分析,對所分類樣品數(shù)據(jù)加權(quán)求平均分來分級。2.3 問題三由于葡萄和葡萄酒理化指標之間聯(lián)系為多對多聯(lián)系,研究兩組變量之間的相關(guān)關(guān)系,可以通過典型相關(guān)分析模型,得到典型相關(guān)系數(shù)。對數(shù)據(jù)進行分析,判斷兩組變量

8、之間關(guān)系。2.4 問題四根據(jù)對釀酒葡萄與葡萄酒的理化指標大量數(shù)據(jù)的統(tǒng)計分析,本文選擇了四個統(tǒng)計量來分析理化指標對葡萄酒質(zhì)量的影響。以相關(guān)性和P值來初步分析與葡萄酒的質(zhì)量有顯著相關(guān)的指標。以通徑分析解釋指標變量與葡萄酒質(zhì)量是否為直接作用。以變異系數(shù)的大小反映該指標在總體理化指標中的穩(wěn)定性,變異系數(shù)越小,越穩(wěn)定,就越具有代表性。在四個統(tǒng)計分析中,能總體把握釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響。3模型的假設(shè)和符號說明31 模型假設(shè):1) 評酒師所評的分數(shù)具有客觀可信度。2) 所有樣品的釀酒工藝一致。32 符號說明:信度系數(shù):觀測矩陣:復相關(guān)系數(shù):變異系數(shù):隨機變量:隨機變量:總體協(xié)方差陣:相

9、關(guān)系數(shù):協(xié)方差4模型建立與求解41 問題一411 模型建立1、Wilcoxon符號平均秩檢驗根據(jù)附件1中的數(shù)據(jù),分別求得2組紅葡萄酒以及2組白葡萄酒評酒員品嘗各樣品總分的平均分。首先分析紅葡萄酒兩組評分數(shù)據(jù),由于兩組樣品為同一對象??蓪⑵鋬山M對應數(shù)據(jù)視為兩配對樣本。因其總體分布無法確定,可用非參數(shù)檢驗中的兩配對樣本非參數(shù)Wilcoxon符號平均秩檢驗方法,確定其是否具有顯著差異性。(1)假設(shè)酒樣品來自兩配對樣本總體的分布無顯著差異,將第二組紅樣本的各個觀察值減去第一組紅樣本對應的觀察值,如果得到差值是一個正數(shù),則記為正號;差值為負數(shù),則記為負號。同時保存差值的絕對值數(shù)據(jù)。(2)然后將絕對差值數(shù)

10、據(jù)按升序排序,并求出相應的秩.(3)最后分別計算正號秩總合W+、負號秩總合W以及正號平均秩和負號平均秩。如果正號平均秩和負號平均秩大致相當,則可以認為兩配對樣本數(shù)據(jù)正負變化程度基本相當,分布差距較小。(4)計算Z統(tǒng)計量,并計算P值 (1)n為總個數(shù),。2、可信度分析(1)樣本標準差判別離散程度評判兩組評酒員評價結(jié)果的可信度,求得每組評酒員分別對葡萄酒樣品的評分平均分。再通過構(gòu)造比較標準參考評分數(shù)據(jù)組,通過標準差比較兩組數(shù)據(jù)的離散程度,最終判斷其評酒的可信度。a. 分別求出第一組評酒員對27組紅葡萄酒樣品的平均分與第二組評酒員對27組紅葡萄酒樣品的平均分,以及第一組評酒員對28組白葡萄酒樣品的平

11、均分與第二組評酒員對28組白葡萄酒樣品的平均分b. 分別對原始數(shù)據(jù)中,20各評酒員對每個樣品評價總分數(shù)據(jù)中,去掉兩個最大值與兩個最小值,樣本中數(shù)據(jù)剔除掉部分奇異數(shù)據(jù)組后將變得更加平穩(wěn)可靠,求出該葡萄酒樣品的平均分與,所得Z值數(shù)據(jù)組即為構(gòu)造的標準參考組數(shù)據(jù)。c. 將X數(shù)據(jù)組與Z數(shù)據(jù)組以及Y數(shù)據(jù)組與Z數(shù)據(jù)組分別求出標準差 (2) d. 分別比較與,與大小。即兩組評酒員分別對紅葡萄酒與白葡萄酒的品嘗評分標準差。值越小,說明其對于標準參考分值離散程度較小,該組評酒員的品嘗評分較為可信。(2)運用SPSS實現(xiàn)信度分析信度又叫可靠性,是指測驗的可信程度。它主要表現(xiàn)測驗結(jié)果的一貫性、一致性、再現(xiàn)性和穩(wěn)定性。

12、在測量學中,信度被定義為一組測量分數(shù)的真變異數(shù)功總變異數(shù) (實得變異數(shù))的比率,信度系數(shù)=真變異數(shù)/總變異數(shù),即: (3)內(nèi)在信度也稱為內(nèi)部一致性,用以衡量組成量表題項的內(nèi)在一致性程度如何。運用Cronbachs系數(shù)法檢測模型,求得兩組評酒員品嘗評分的信度。其統(tǒng)計原理為 (4)412 模型求解1、將附件1中的數(shù)據(jù)求出每個樣品品嘗評分均值后,按照樣品順序排列。處理后數(shù)據(jù)如下表:表1 每組的均值得分編號第一組紅第二組紅第一組白第二組白編號第一組紅第二組紅第一組白第二組白樣品162.768.18277.9樣品1558.765.772.478.4樣品280.37474.275.8樣品1674.969.

13、97467.3樣品380.474.678.375.6樣品1779.374.578.880.3樣品468.671.279.476.9樣品1859.965.473.176.7樣品573.372.17181.5樣品1978.672.672.276.4樣品672.266.368.475.5樣品2078.675.877.876.6樣品771.565.377.574.2樣品2177.172.276.479.2樣品872.36671.472.3樣品2277.271.67179.4樣品981.578.272.980.4樣品2385.677.175.977.4樣品1074.268.874.379.8樣品2478

14、71.573.376.1樣品1170.161.672.371.4樣品2569.268.277.179.5樣品1253.968.363.372.4樣品2673.87281.374.3樣品1374.668.865.973.9樣品277371.564.877樣品147372.67277.1樣品2881.379.6建立假設(shè):檢驗標準:運用SPSS軟件,運行結(jié)果為:Wilcoxon 帶符號秩檢驗:表2 秩N秩均值秩和第二組紅 第一組紅負秩22a13.39294.50正秩5b16.7083.50結(jié)0c總數(shù)27第二組白 第一組白負秩9d11.0699.50正秩19e16.13306.50結(jié)0f總數(shù)28表3

15、檢驗統(tǒng)計量c第二組紅 第一組紅第二組白 第一組白Z-2.535a-2.357b漸近顯著性(雙側(cè))0.0110.018結(jié)果分析:由運行結(jié)果可以看出,對于紅葡萄酒,正秩與負秩均值分別為13.39與16.70,大致相當。因此,Wilcoxon符號平均秩檢驗是可行的。由于,拒絕原假設(shè)與無顯著差異,即兩組評酒員的對紅葡萄酒的評價結(jié)果有顯著性差異。同理,正秩與負秩均值分別為11.06與16.13,大致相當。因此,Wilcoxon符號平均秩檢驗是可行的。由于,拒絕原假設(shè)與無顯著差異,即兩組評酒員的對白葡萄酒的評價結(jié)果有顯著性差異。由于兩組品酒員對紅葡萄酒與白葡萄酒的品嘗評分均存在顯著差異,因此,可認為兩組評

16、酒員的評價結(jié)果由顯著差異。2、(1)由EXCEL中的SUM函數(shù),求得各評酒員對各葡萄酒樣品的評分分值;用AVERAGE函數(shù)求得每組評酒員對每個葡萄酒樣品的平均分。再運用(SUM(A2:J2)-LARGE(A2:J2,1)-SMALL(A2:J2,1)-LARGE(A2:J2,2)-SMALL(A2:J2,2)/(COUNT(A2:J2)-4)函數(shù),求得標準參考值,所得數(shù)據(jù)如下表:表4 每組均值得分與標準參考值樣品第一組紅第二組紅紅標準參考值第一組白第二組白白參考值162.768.165.68758277.980.0625280.37476.687574.275.876.375380.474.6

17、77.578.375.678.0625468.671.270.187579.476.978.4375573.372.172.56257181.577.5672.266.368.7568.475.573771.565.368.577.574.276.25872.36669.37571.472.372.875981.578.279.562572.980.477.68751074.268.871.2574.379.878.6251170.161.665.812572.371.472.31251253.968.36263.372.469.1251374.668.871.7565.973.971.375

18、147372.673.31257277.175.751558.765.762.187572.478.476.81251674.969.972.43757467.370.8751779.374.575.87578.880.380.31251859.965.462.37573.176.776.18751978.672.67672.276.474.56252078.675.877.577.876.6782177.172.274.062576.479.279.68752277.271.673.8757179.476.18752385.677.181.37575.977.476.75247871.574

19、.062573.376.175.52569.268.268.062577.179.579.56252673.87273.187581.374.378.5625277371.571.937564.87772.252881.379.680.93753.150922.7501123.5625022.263666結(jié)果分析:由最終數(shù)據(jù)可得,即第一組評酒員比第二組評酒員對紅葡萄酒的品嘗評分與標準比較值偏差較大,可認為第二組評酒員的品嘗評分較貼近標準比較值,即第二組評酒員對紅葡萄酒的評價結(jié)果更可信。又 ,同理可得第二組評酒員對白葡萄酒的品嘗評分更具可信力。綜上,第二組評酒員對葡萄酒的評價結(jié)果更可信。(2)將

20、每個評酒員對每個葡萄酒樣本的總體評分按要求輸入SPSS數(shù)據(jù)處理界面,通過可靠性分析處理,結(jié)果如下:表5 第一組評酒員可靠性Cronbachs Alpha項數(shù) .89428表6 第二組評酒員可靠性Cronbachs Alpha項數(shù).92328結(jié)果分析:由運算結(jié)果可得,說明第二組評酒員對葡萄酒評分信度較大,即第二組評酒員對葡萄酒的評價更具有可信度。42 問題二421 模型建立1、單因素方差分析選取理化指標:方差分析就是采用數(shù)理統(tǒng)計的方法對所得結(jié)果進行分析以鑒別各種因素對研究對象的某些特性值影響大小的一種有效方法。對釀酒葡萄的理化指標進行單因素方差分析,分析F統(tǒng)計量及其相伴概率,選取出在快速聚類中發(fā)

21、揮明顯作用的m個指標。單因子方差分析基本原理見附錄A:2、酒質(zhì)量的分數(shù)選取將問題一中更可信的那組評分結(jié)果去除最低最高分取均值作為樣品酒質(zhì)量的標準評分值,并將此作為對釀酒葡萄分級的第m+1個重要指標。3、考慮權(quán)重的K-means聚類分析聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類??紤]到聚類分析沒有考慮指標權(quán)重的問題,即將所有的指標的權(quán)重視為等同。所以本文以對標準化后的指標賦權(quán)重來改進傳統(tǒng)的聚類分析法。首先對原始數(shù)據(jù)進行標準化處理,消除量綱的影響。Z Scores:標準化變換公式為: (5)對指標重要性進行分級賦權(quán):根據(jù)查閱書籍與網(wǎng)上資料將m+1個指標分

22、成三個等級,分別給予1-3的分數(shù)。如表7:表7 指標重要性等級得分等級一級重要二級重要三級重要得分w(分)321賦權(quán)后的數(shù)據(jù): (7)處理后的數(shù)據(jù)再次進行單因素方差分析,選取最合適的n個指標。4、K-means算法:將已經(jīng)測定n個采樣點的m種指標數(shù)據(jù)列成一個二維矩陣,亦稱作觀測矩陣: (8)把分成c個組,求出每組的聚類重心,使得組內(nèi)的方差和達到最小, (9)其中迭代過程:(1)給出初始聚類中心,(2)用下列公式更新 (10)其中l(wèi)為迭代次數(shù)。(3)更新 (11)如果或者則停止;否則,轉(zhuǎn)至(2)。422 模型求解運用spss對釀酒葡萄的理化指標做單因子方差分析,結(jié)果見表8.表8 ANOVA表聚類

23、誤差FSig.均方df均方df氨基酸總量.89741.01922.880.492蛋白質(zhì)2.5664.715223.588.021VC含量1.1104.980221.132.367花色苷2.6034.709223.673.019酒石酸1.7254.868221.987.132蘋果酸3.7724.496227.603.001檸檬酸2.2174.779222.847.048多酚氧化酶3.0904.620224.983.005褐變度5.1544.2452221.060.000DPPH自由基4.1374.430229.632.000總酚4.6644.3342213.974.000單寧3.3234.578

24、225.754.003葡萄總黃酮4.8874.2932216.662.000白藜蘆醇4.7974.3102215.496.000黃酮醇1.6154.888221.819.161總糖2.6704.696223.834.016還原糖2.0524.809222.538.069可溶性固形物1.8444.846222.179.105PH值1.8324.849222.159.107可滴定酸2.0684.806222.567.067固酸比1.0834.985221.100.381干物質(zhì)含量3.4874.548226.366.001果穗質(zhì)量.90841.01722.894.484百粒質(zhì)量1.8214.8512

25、22.140.110果梗比1.3434.938221.432.257出汁率2.0484.809222.530.070果皮質(zhì)量.80041.03622.772.555果皮顏色L*1.9624.825222.379.083果皮顏色a*6.0244.0872269.576.000果皮顏色b*4.7824.3122215.307.000對第二組葡萄酒的質(zhì)量得分如表9:表9 葡萄酒樣品得分酒樣品編號123456789評分68.62573.62575.12571.62572.2566.2566.566.37578.5酒樣品編號101112131415161718評分6862.37568.7568.572.

26、7566.2569.62574.7564.875酒樣品編號192021222324252627評分72.8757672.571.87577.7572.12567.2571.7571.125將11個葡萄的理化指標與酒的質(zhì)量進行賦權(quán):釀酒葡萄的好壞與所釀的葡萄酒的質(zhì)量有直接的關(guān)系。好的釀酒葡萄在忽略釀酒工藝等因素影響下可以說與葡萄酒的質(zhì)量是呈正相關(guān)關(guān)系的。反過來說葡萄酒的好壞也在很大程度上說明釀酒葡萄的好壞,基于這點,取葡萄酒的質(zhì)量為一級重要性。葡萄中酸的含量,對葡萄酒的影響也很大。在葡萄酒中,酸除了平衡口感外,還具有抗氧化,保持葡萄酒鮮美的作用。單寧和色素對紅葡萄酒的特色和風味作用也是顯著的。單

27、寧是很好的抗氧化物質(zhì)。葡萄果中的五大要素物質(zhì)的含量及構(gòu)成比例起著非常重要的作用??梢哉f葡萄果中的糖、酸、單寧、芳香物質(zhì)和色素是判斷釀酒葡萄品質(zhì)的指標性物質(zhì)。據(jù)此可對包含這些物質(zhì)的指標給予二級重要性。表10 指標重要性評分結(jié)果指標蘋果酸多酚氧化酶褐變度DPPH自由基總酚單寧重要性得分211112指標白藜蘆醇干物質(zhì)含量果皮顏色a+果皮顏色b+葡萄總黃酮酒的質(zhì)量重要性得分112213對賦權(quán)后的數(shù)據(jù)再次做單因素方差分析,結(jié)果如下:表11 ANOVA表聚類誤差均方df均方dfFSig.V618.97141.2782214.845.000V82.0884.802222.602.064V93.8574.48

28、1228.027.000V104.0374.448229.018.000V115.0094.2712218.483.000V1214.77742.041227.242.001V134.5304.3582212.645.000V144.4314.3762211.778.000V22.41941.10622.379.821V2924.3764.2952282.553.000V3017.49041.5472211.304.000V3150.46941.4602234.564.000再次選擇sig0.01的指標,得到最終的蘋果酸、褐變度、DPPH自由基、總酚、單寧、葡萄總黃酮、白藜蘆醇、果皮顏色a+、

29、b+、酒的質(zhì)量共10個賦權(quán)指標。根據(jù)選取的10個指標做分類的樹狀圖如下:圖1 聚類樹狀圖由樹狀圖可以看出將樣本分為5類是比較合適的。用spss的k-均值聚類結(jié)果顯示如附錄B附表1。因為10個變量的sig0.01聚類效果是比較理想的。分類后的葡萄依據(jù)所釀葡萄酒質(zhì)量的平均得分,分級如表12.表12 紅葡萄分級結(jié)果第一級第二級第三級第四級第五級樣品號得分樣品號得分樣品號得分樣品號得分樣品號得分273.625471.625168.625666.251162.375375.125572.25866.375766.5978.51472.7510682377.751774.751268.751972.875

30、1368.520761566.252172.51669.6252271.8751864.8752472.1252567.252671.752771.125平均分76.25平均分72.693182平均分67.5平均分67.333333平均分62.375根據(jù)同樣的方法對白葡萄酒分級:表13 白葡萄所選指標及得分所選取指標重要性得分DPPH自由基總酚葡萄總黃酮黃酮醇總糖11112可溶性固形物果穗質(zhì)量百粒質(zhì)量果皮顏色L*果皮顏色b*葡萄酒質(zhì)量111223表14 白葡萄分級結(jié)果第一級第二級第三級第四級第五級樣品號得分樣品號得分樣品號得分樣品號得分樣品號得分273.625471.625168.625666

31、.251162.375375.125572.25866.375766.5978.51472.7510682377.751774.751268.751972.8751368.520761566.252172.51669.6252271.8751864.8752472.1252567.252671.752771.125平均分76.25平均分72.693182平均分67.5平均分67.333333平均分62.37543 問題三431 模型建立典型相關(guān)分析復相關(guān)系數(shù)描述兩組隨機變量與之間的相關(guān)程度。其思想是先將每一組隨機變量作線性組合,成為兩個隨機變量: (12)再研究u,v的相關(guān)系數(shù)。由于u,v與投

32、影向量a,b有關(guān),所以與a,b有關(guān), (13)這個為復相關(guān)系數(shù)。當總體的均值向量及總體協(xié)方差陣未知時需要根據(jù)從總體抽取的一個樣本,對其進行估計,進而求出樣本典型相關(guān)系數(shù)和典型相關(guān)變量。設(shè)為來自總體的一個樣本,其中,對應的樣本數(shù)據(jù)可以表示成 (14)則總體協(xié)方差陣的極大似然估計為 (15)其中 (16) (17)式中, (18)432 模型求解現(xiàn)將劃分后的釀酒葡萄指標蘋果酸 x1,多酚氧化酶活力 x2,褐變度 x3,DPPH自由基1/IC50 x4,總酚 x5,單寧 x6,葡萄總黃酮 x7,白藜蘆醇 x8,干物質(zhì)含量 x9,果皮顏色 x10,b* x11?;ㄉ?y1,單寧 y2,總酚 y3,酒

33、總黃酮 y4,白藜蘆醇 y5,DPPH半抑制體積 y6,色澤L* y7,a* y8, b* y9。在SPSS中調(diào)用Cancorr函數(shù)。在“Syntax Editor”窗口中輸入下列語句:INCLUDE C:Program FilesSPSSCanonical correlation.sps.CANCORR SET1= y1 to y9 / SET2= x1 to x11 /.部分運行結(jié)果為:Correlations Between Set-1 and Set-2X1 X2 X3 X4 X5 X6 X7 X8 X9 X11Y1 .6926 .4779 .7659 .5666 .6043 .659

34、6 .4411 -.0350 .2297 -.1022Y2 .2984 .1344 .4436 .7532 .8118 .7096 .6829 .0490 .4153 -.0946Y3 .3532 .1484 .4573 .8145 .8742 .7364 .8152 .0761 .2969 -.0645Y4 .2667 .1188 .4422 .7638 .8791 .6858 .8219 .0469 .2456 -.1554Y5 -.1864 -.1216 -.0930 .4205 .4667 .3102 .5675 .0135 .0765 -.2669Y6 .2452 .0688 .37

35、93 .7785 .8734 .6904 .8132 .0728 .3305 -.1035Y7 -.3462 -.4088 -.5633 -.7070 -.7517 -.6717 -.6085 .1621 -.2039 .3401Y8 -.5588 .0022 -.3325 -.1227 -.1600 -.0947 -.0673 -.4494 -.2488 -.6468Y9 -.3102 .0953 -.2434 -.0552 .0620 -.2097 .0474 -.1101 .3922 .0106 可以看出y2與各變量間的相關(guān)系數(shù)非常接近于y4與各變量間的相關(guān)系數(shù),說明Y中涵蓋信息的重疊性

36、。Canonical Correlations1 .9772 .9573 .9104 .8275 .7876 .6287 .5178 .3719 .171Test that remaining correlations are zero: Wilks Chi-SQ DF Sig.1 .000 161.510 99.000 .0002 .001 113.771 80.000 .0083 .008 75.418 63.000 .1364 .045 48.136 48.000 .4675 .141 30.314 35.000 .6946 .372 15.348 24.000 .9107 .614 7

37、.568 15.000 .9408 .837 2.753 8.000 .9499 .971 .461 3.000 .927數(shù)據(jù)表明典型相關(guān)系數(shù)基本是顯著的,在多個因變量中,選取第二組典型變量進行解釋。Standardized Canonical Coefficients for Set-1 1 2 3 4 5 6 7 8 9Y1 .890 -1.669 1.034 -1.512 -1.137 1.518 1.552 .542 -.673Y2 -.076 .809 .631 -.765 1.833 1.934 -.690 -.141 1.228Y3 .318 .039 -1.149 2.068

38、-1.078 -.281 3.026 -2.566 .492Y4 -.212 .285 .060 -1.246 -1.331 1.221 -1.832 -.861 .659Y5 -.149 .150 .040 -.582 -.152 .379 -.301 .828 1.270Y6 -.120 .023 .014 .466 .378 -1.914 .747 2.539 -3.639Y7 -.205 -.902 .558 -.784 -1.147 2.366 2.467 -.133 -1.134Y8 .260 -.406 -.703 -.606 -.071 .724 1.087 -.503 -.8

39、13Y9 -.125 -.271 .931 -.898 -.441 .111 .648 -.318 -.052 Standardized Canonical Coefficients for Set-2 1 2 3 4 5 6 7 8 9 X1 .523 -.468 -.336 .171 -.691 .878 .279 .524 .594 X2 .029 -.400 .024 -.470 -.701 -.480 .140 -.424 .651 X3 .109 .200 .688 .197 .404 -.113 -.498 -.292 -.978 X4 .809 .430 .244 1.041

40、1.684 .422 .777 -1.061 .736 X5 -.393 .486 .591 -.731 -.589 -1.005 -2.391 .280 -.189 X6 .312 -.107 -.594 .434 .237 .728 .207 .002 -.109 X7 -.407 .052 -.619 -.294 -1.753 .252 1.425 .101 -.220 X8 -.047 .002 -.035 -.521 -.161 -.666 -.022 1.509 .557 X9 -.030 .426 .625 -.438 .460 .754 .562 .122 .074X10 -.

41、591 .183 .131 .377 -.933 2.220 -.692 -1.241 .479X11 .150 .002 .500 .704 .750 -2.198 .546 -.149 -.867 由運行結(jié)果可以得出第二對典型變量的表達式以及表達式:Canonical Loadings for Set-1 1 2 3 4 5 6 7 8 9Y1 .947 .158 .195 .052 -.144 .067 -.016 .108 -.001Y2 .620 .721 .215 -.028 .069 .171 .096 .022 -.066Y3 .633 .704 .090 .043 -.242

42、 .009 .188 .017 .010Y4 .508 .719 .045 -.090 -.404 .116 -.109 -.020 -.163Y5 .049 .519 -.316 -.329 -.248 -.090 .325 .458 .366Y6 .521 .775 .091 -.075 -.205 -.003 .119 .169 -.173Y7 -.837 -.404 -.003 .249 .004 .264 -.003 .049 -.048Y8 -.118 -.143 -.662 -.618 .270 -.162 .143 -.155 -.044Y9 -.321 .257 .335 -

43、.582 .056 -.463 .285 -.281 .051典型載荷是衡量原始變量與典型變量的相關(guān)程度指標,由圖可知:因變量組與第二對典型變量的相關(guān)程度相對都較高,自變量組中與第二對典型變量有較強相關(guān)性。U2與其他因變量間相關(guān)系數(shù)較高。因為第二典型相關(guān)系數(shù)高達0.957,并且通過顯著性檢驗。說明了兩類指標之間存在著重要的相關(guān)關(guān)系。44 問題四441 模型建立1、相關(guān)性分析 Pearson相關(guān)系數(shù): 設(shè)兩隨機變量為X和Y,則兩總體的相關(guān)系數(shù)為 (19)式中,是兩變量的協(xié)方差;、是變量X和Y的方差??傮w相關(guān)系數(shù)需要用樣本相關(guān)系數(shù)來估計。設(shè),分別為來自X和Y的兩個樣本,則樣本相關(guān)系數(shù)為 (20)樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計量。2、變異系數(shù)變異系數(shù)公式如下: (21)式中:是第項指標的變異系數(shù)、也稱為標準差系數(shù);是第項指標的標準差;是第項指標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論