數(shù)學建模A題葡萄酒質量的評價_第1頁
數(shù)學建模A題葡萄酒質量的評價_第2頁
數(shù)學建模A題葡萄酒質量的評價_第3頁
數(shù)學建模A題葡萄酒質量的評價_第4頁
數(shù)學建模A題葡萄酒質量的評價_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、word2012高教社杯全國大學生數(shù)學建模競賽承 諾 書我們仔細閱讀了中國大學生數(shù)學建模競賽的競賽規(guī)那么.我們完全明白,在競賽開始后參賽隊員不能以任何方式包括 、電子郵件、網上咨詢等與隊外的任何人包括指導教師研究、討論與賽題有關的問題。我們知道,抄襲別人的成果是違反競賽規(guī)那么的, 如果引用別人的成果或其他公開的資料包括網上查到的資料,必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽規(guī)那么,以保證競賽的公正、公平性。如有違反競賽規(guī)那么的行為,我們將受到嚴肅處理。我們授權全國大學生數(shù)學建模競賽組委會,可將我們的論文以任何形式進行公開展示包括進行網上公示,

2、在書籍、期刊和其他媒體進行正式或非正式發(fā)表等。我們參賽選擇的題號是從A/B/C/D中選擇一項填寫: A 隱去論文作者相關信息 日期: 2012 年 9 月 10 日賽區(qū)評閱編號由賽區(qū)組委會評閱前進行編號:2012高教社杯全國大學生數(shù)學建模競賽編 號 專 用 頁賽區(qū)評閱編號由賽區(qū)組委會評閱前進行編號:賽區(qū)評閱記錄可供賽區(qū)評閱時使用:評閱人評分備注全國統(tǒng)一編號由賽區(qū)組委會送交全國前編號:全國評閱編號由全國組委會評閱前進行編號:.word葡萄酒質量的評價摘 要葡萄酒質量的好壞主要依賴于評酒員的感觀評價,由于人為主觀因素的影響,對于酒質量的評價總會存在隨機差異,為此找到一種簡單有效的客觀方法來評酒,就

3、顯得尤為重要了。本文通過研究釀酒葡萄的好壞與所釀葡萄酒的質量的關系,以及葡萄酒和釀酒葡萄檢測的理化指標的關系,以及葡萄酒理化指標與葡萄酒質量的關系,旨在通過客觀數(shù)據建立數(shù)學模型,用客觀有效的方法來評價葡萄酒質量。首先,采用雙因子可重復方差分析方法,對紅、白葡萄酒評分結果分別進行檢驗,利用Matlab軟件得到樣品酒各個分析結果,結合數(shù)據分析,發(fā)現(xiàn)對于紅葡酒有的評價結果存在顯著性差異,對于白葡萄酒只有53%的評價結果存在顯著性差異。通過比擬可知,兩組評酒員對紅葡萄酒的評分結果更具有顯著性差異,而對于白葡萄酒的評分,評價差異性較為不明顯。為了評價兩組結果的可信度,借助Alpha模型用克倫巴赫系數(shù)衡量

4、,并結合檢驗,得出紅葡萄酒第一組評酒員的評價結果可信度更高,而對白葡萄酒的品嘗評分,第二組評酒員的評價結果可信度更高。綜合來看,主觀因素對葡萄酒質量的評價具有不確定性。結合已分析出的兩組品酒師可靠性結果,對葡萄酒的理化指標進行加權平均,最終得出十位品酒師對樣品酒的綜合評價得分。將每一樣品酒的綜合得分與其所對應釀酒葡萄的理化指標一級指標共同構成一個數(shù)據矩陣,采用聚類分析法,利用SPSS軟件對葡萄酒樣進行分類,根據分類的結果以及各葡萄樣品酒綜合得分最終將釀酒葡萄分為A優(yōu)質、B良好、C中等、D差四個等級,客觀地反映了釀酒葡萄的理化指標與葡萄酒質量之間的聯(lián)系。為了分析釀酒葡萄與葡萄酒理化指標之間的聯(lián)系

5、,采用相關分析法,能有效地反映出兩者間的聯(lián)系,取與葡萄各成分相關性顯著的葡萄酒理化指標,與葡萄成分做多元線性回歸得出葡萄酒理化指標與釀酒葡萄的擬合方程,從而反映釀酒葡萄與葡萄酒理化指標之間的聯(lián)系。由于已經通過回歸分析建立了釀酒葡萄和葡萄酒理化指標之間的關系,因此從釀酒葡萄成分對葡萄酒的理化指標的影響,再研究出葡萄酒理化指標與葡萄酒質量的聯(lián)系,便可作為一個橋梁,反映出葡萄與葡萄酒理化指標對葡萄酒的質量的作用。研究葡萄酒理化指標與葡萄酒質量的聯(lián)系,需要運用變量間的相關性及系數(shù)法分析葡萄酒的理化指標與葡萄酒質量評價指標的相關性,通過比擬選出與葡萄酒評價的一級指標相關性程度大的葡萄酒成分,進行回歸分析

6、法,建立釀酒葡萄的理化指標與葡萄酒質量之間的擬合方程,結合各個質量一級指標的權重,從而完成了從葡萄酒成分對葡萄酒質量的客觀評價。綜合計算結果,與釀酒葡萄分級的結果吻合,所以分析結果較客觀。關鍵詞:葡萄酒 雙重多因素分析 數(shù)據分析 Alpha模型 聚類分析及歐式距離相關性分析 多元回歸 系數(shù)法1. 問題重述葡萄酒的感官質量是評價葡萄酒質量優(yōu)劣的重要標志。確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄

7、酒和葡萄的質量,可輔助感官檢查。附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據。試建立數(shù)學模型求解以下問題:1. 分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?2. 根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量?2. 問題分析釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量,此題要求通過釀

8、酒葡萄的理性指標和釀酒師給予的評分,綜合考慮釀酒葡萄的理性指標與葡萄酒的質量的關系。問題一:要求對兩組評酒員評價結果有無差異性進行分析,并分析得出哪一組的品酒員的結果更具有可信。通過繪制每個樣品酒的均值評分差異圖,對每個樣品酒的兩組評酒員在各個指標的均值進行比擬,發(fā)現(xiàn)對于紅葡萄的評價,兩組評酒員還是存在著顯著性的差異的,而對于白葡萄酒的評價,兩組評酒員的差異性并不是很明顯,列舉局部紅、白葡萄酒評分差異圖如下:圖表 1紅葡萄酒樣品12差異圖左邊,系列1為第二組品酒員打分均值,系列2為第一組品酒員打分均值。圖表 2紅葡萄酒樣品15差異圖右邊,橫坐標為10個指標變量,包括澄清度、色調、香氣純粹度、香

9、氣濃度、香氣質量、口感純粹度、口感濃度、口感質量以及整體評價。針對兩組評酒員在大量差異圖中表現(xiàn)出來對紅、白葡萄酒的評價存在差異,對紅、白葡萄酒進行分開地顯著性檢驗。第一步,利用每個樣品酒都具有兩組評酒員的評價結果,對兩組結果進行雙因子可重復方差分析,得出題中給出的27種葡萄樣品酒各個分析結果。比擬27個顯著性檢驗的結果,假設具有顯著性差異的樣品酒占總樣品酒的比例高于,有足夠的把握認定兩組評酒員的評價結果具有顯著性差異。第二步,對兩組評酒員給予紅、白葡萄酒的打分進行可信性分析,將紅、白葡萄酒分別進行可信度分析,比擬兩組評酒員對不同種類葡萄酒的評價是否具有各自的優(yōu)勢。在進行雙因子多重分析和可信性分

10、析之前,需要對原先數(shù)據進行如下處理:1.對于附件1給出的數(shù)據,先將兩組品酒員的評價結果按著樣品酒進行統(tǒng)一劃分,每一樣品酒對應著兩種評價結果。將每一樣品酒的評價結果組成評價矩陣,矩陣以葡萄酒的評價指標為列項,共10列,以每個評酒員作為橫向量,共20行。2.針對紅葡萄酒樣品20評酒員4號對色調的評分缺失,利用同組評酒員對紅葡萄酒樣品20色調評分的平均值作為4號評酒員的評分值。做可信度分析時,將兩組的27種酒樣品評價結果組成兩組評價總矩陣,以葡萄酒的評價指標為列項,共10列,以每個評酒員作為橫向量,共270行,分別用對兩組矩陣進行信度分析,目的是對量表的可靠性與有效性進行檢驗,判斷出哪一組可信度更高

11、。問題二:問題二要求對釀酒葡萄進行分級,釀酒葡萄的成分直接影響葡萄酒的質量,選取優(yōu)質營養(yǎng)成分高的釀酒葡萄釀酒,保證了葡萄酒的營養(yǎng)價值和保健價值。但是葡萄酒質量優(yōu)劣,不單單從營養(yǎng)成分和養(yǎng)身價值上考慮,一瓶優(yōu)質的葡萄酒,還得具備著可欣賞性,純粹的口感、芬芳的酒香等優(yōu)點,而這些優(yōu)點,都得由評酒員來給出評價。所以,對釀酒葡萄進行分級,不單單從葡萄的成分上考慮,還得結合最終釀成的葡萄酒質量綜合考慮。因此將釀酒葡萄的各成分與評價員給予所釀成的葡萄酒的質量打分綜合起來,進行聚類分析,將釀酒葡萄依據綜合指數(shù)進行分類,結合聚類分析的結果以及綜合指標的分數(shù)將葡萄劃分等級。依據:在進行據聚類分析之前,需要對原始數(shù)據

12、進行預先處理1. 分別計算附件一中評酒員各項評分指標的權重并加和,最后求取10位評酒員的權重平均值作為葡萄酒樣品的綜合評價指標。2. 用釀酒葡萄各項理化指標屢次測得的取平均值以及酒樣的綜合指標形成一個31列28行的原始資料陣,并用SPSS 的標準化將數(shù)據標準化。問題三:釀酒葡萄和葡萄酒的理化指標都很多,為了找出它們之間的聯(lián)系,首先將葡萄的成分與葡萄酒的理性指標列成一個大矩陣,分析葡萄成分與葡萄酒理想指標的相關性,找出它們之間相關性大的指標,與葡萄成分做多元線性回歸得出葡萄酒理化指標與釀酒葡萄的擬合方程,從而反映釀酒葡萄與葡萄酒理化指標之間的聯(lián)系。1. 釀酒葡萄的成分和葡萄酒的理化指標列成一個大

13、矩陣。2. 通過SPSS軟件做相關性分析,選取與葡萄酒理化指標相關性程度大的葡萄酒成分個指標,建立擬合方程。問題四:釀酒葡萄的理化指標并不能直接與葡萄酒的質量建立聯(lián)系,由于在問題3中已經通過相關性分析建立了釀酒葡萄和葡萄酒理化指標之間的關系,因此我們分析葡萄酒的理化指標與葡萄酒質量的相關性,計算相關性系數(shù),通過比擬選出系數(shù)高的即與葡萄酒質量指標相關性程度大的葡萄酒成分,進而用回歸分析法建立釀酒葡萄的理化指標與葡萄酒質量之間的關系。1附表一中列出了十位品酒員對葡萄酒外觀、香氣和口感分析三者的數(shù)據,用Matlabb,分別對四項指標求2728種紅白葡萄酒樣品權重平均值作為葡萄酒質量的評價指標。2.

14、通過SPSS軟件作因子分析分析兩者之間的相關性,選取與葡萄酒質量指標相關性程度大的葡萄酒成分個指標,建立擬合方程。3. 符號說明顯著性水平置信度誤差平方和行組間誤差列組間誤差組內誤差克倫巴赫系數(shù)明考斯基距離歐式距離4. 模型假設(1) 假設數(shù)據來源真實有效(2) 假設各變量的相差微小,各坐標對歐式距離的奉獻是同等的且變差大小相同,歐氏距離效果理想。3 假設釀酒工藝條件相同,無其他人為因素影響4為低信度,那么尚可,假設那么屬于高信度。假設組一與組二評分分別處于不同信度區(qū)間,可信度差異明顯。5. 建模過程5.1. 問題一的建模與求解模型建立:利用雙因素可重復方差分析結合0-1分析檢驗兩組評酒員的評

15、價結果有無顯著性差異1.雙因子可重復方差分析的統(tǒng)計模型。假設在兩因子方差分析中,因子共有個水平,記作,每個水平下,進行次試驗,因子共有個水平。一個典型的雙因子方差分析的數(shù)據結構如下表所示。表格 1 雙因子可重復方差分析的數(shù)據結構因子因子為因子的某個水平下第試驗所得結果,表示因子的第個水平,。第列數(shù)據為因子的第個水平下所考察的變量取值,每一列為一個總體,=1,2,。所以一個兩因子方差分析的數(shù)據結構表里,共有個總體,在此題中,。下表給出因子所對應的各個指標:指標外觀澄清度外觀色調香氣純粹度香氣濃度香氣質量口感純粹度口感濃度口感持久性口感質量整體得分給出雙因子可重復方差分析的原假設和備擇假設:當原假

16、設為真時,說明兩組評酒員的評價結果不存在顯著性差異,反之稱兩組評酒員的評價結果存在著顯著性影響因素。當原假設為真時,說明選取的各個指標對評價結果沒有顯著性影響,在此題中,顯然原假設是不成立的,后續(xù)的檢驗將證明這點。2.兩因子方差分析的方差分解。(1)誤差平方和。每一個觀察值與總平均值之間的離差平方和稱為誤差平方和,記作=其中,稱為總均值。 (2)行組間誤差。雙因子誤差平方和分解的第一局部,稱為行組間誤差,記作=(3)列組間誤差。雙因子誤差平方和分解的第二局部,稱為列組間誤差,記作=(4)組內誤差。雙因子誤差平方和分解的第三局部,稱為組內誤差,記作=行組間誤差衡量的是行因子不同水平之間的差異,列

17、組間誤差衡量的是列因子不同水平之間的差異。它們的誤差值中既包含隨即誤差也包含了因子影響的系統(tǒng)誤差。所以判斷行列因子是否有顯著性影響,主要考察行列組間誤差和組內誤差之間的差異大小。如果行列組間誤差和組內誤差很接近,就認為行列因子無顯著性影響。反之,認為行列因子有顯著性影響。兩因子方差分析的檢驗統(tǒng)計量。其中。根據單因素方差分析推導,有行組間誤差服從自由度為的分布列組間誤差服從自由度為的分布剩余的列組服從自由度為的分布那么兩因素方差分析的檢驗統(tǒng)計量為如下兩個:(1) 行檢驗統(tǒng)計量。(2) 列檢驗統(tǒng)計量。雙因子可重復方差分析的結果判定當顯著性水平為時,如果 ,拒絕,說明兩組評酒員的評價結果存在顯著性差

18、異;等價的值檢驗是,當值<時,拒絕原假設;綜合來講,當,或值< 時,拒絕原假設。0-1數(shù)據分析在給定條件下,對于有個樣品酒來說紅葡萄酒,白葡萄酒,定義函數(shù): 1其中為每個樣品酒的值。給定置信度: 2對個樣品酒的雙因子可重復方差檢驗后,得出值,那么認為在置信水平下,兩組評酒員的評價結果存在著顯著性差異。Alpha模型進行可靠性分析克倫巴赫系數(shù):測度內部一致性的一個指標, 與皮爾遜系數(shù)都是一樣的范圍在01 之間,如果為負值那么說明表中某些工程的內容是其他一些工程的反面;越接近于1,那么量表中工程的內部一致性越是高,可信度越大。根據量表中的工程數(shù)和各項之間的相關系數(shù)計算得出當量表中工程增

19、加時,值也會增大;同時,工程之間的相關系數(shù)較高時,也會比擬大。這里的是指各項與其他各項之和計算相關系數(shù)的平均值。模型求解:雙因子可重復方差分析模型檢驗利用Matlab的函數(shù)對已經預處理的數(shù)據進行雙因子可重復方差分析,可以得到每個樣品酒的檢驗結果,列舉兩個檢驗結果如下所示:提取每個樣品酒的所對應值,然后結合公式1、公式2進行0-1分析,得到紅、白葡萄酒的各個樣品酒的如下:圖表 3模型檢驗結果紅葡萄酒值以及值,得到 01110111111100 1010001111111白葡萄酒值以及值,得到 11000100111010 11101011001001模型結果分析分析圖標3的結果,可以知道,對于紅

20、葡萄酒來說,對27個葡萄酒樣品評分檢驗中,有%的評價結果中,兩組評酒員的評價結果存在著顯著性差異置信水平為95%。對于白葡萄酒的28個葡萄樣品評分的檢驗,只有53%的評價結果中,兩組評酒員的評價結果存在顯著性檢驗置信水平為95%。這樣的結果,符合之前問題分析中,各個組隊樣品酒的評分均值差異圖。即:兩組評酒員對紅葡萄的評分結果更具有顯著性差異,而對于白葡萄酒的評分,兩組評酒員的評價差異性較不明顯。Alpha模型的可靠性分析1. 利用進行可靠性統(tǒng)計量對紅葡萄酒的兩組品酒員評分的分析第一組紅葡萄酒案例處理匯總第二組紅葡萄酒案例處理匯總%案例有效268案例有效270已排除2.7已排除0.0總計270總

21、計270第一組紅葡萄酒可靠性統(tǒng)計量第二組紅葡萄酒可靠性統(tǒng)計量基于標準化項的 項數(shù)基于標準化項的 項數(shù).874.90610.750.78610假設將某一工程從量表中剔除,那么量表的平均得分、方差每個工程得分與剩余各工程得分間的相關系數(shù)、以該工程為自變量所有其他工程為應變量建立回歸方程的值以及值將會改變。有表知第一組數(shù)據中剔除了兩項,增加到,第一組評酒員紅葡萄酒的,組2尚有35%的內容未曾涉及,故信度不高。表格 2第一組紅葡萄酒平方和均方人員之間人員內部 項之間殘差總計總均值 = 2679240324122679.000類內相關性95% 置信區(qū)間使用真值 0 的 F 檢驗下限上限值單個測量.409

22、b.362.4602672403.000平均測量.874c.850.8952672403.000表格 3第二組紅葡萄酒平方和均方人員之間2699242124302699.000人員內部 項之間殘差總計總均值 = 類內相關性95% 置信區(qū)間使用真值 0 的 F 檢驗下限上限值單個測量.230.191.2762692421.000平均測量.750.703.7922692421.000分析比擬兩者的F檢驗說明, =<=,組2的顯著性更強, 而、均小于,表示兩組該量表的重復度量效果良好。綜合分析結果說明,組一的評酒員可信度更高。2可靠性統(tǒng)計量對白葡萄酒的兩組品酒員評分進行分析 同樣利用SPSS可

23、靠性分析,建立Alpha模型對白葡萄酒的品酒員評分數(shù)據進行檢驗,發(fā)現(xiàn)不同種類的酒,因其釀造,成分的不同,品酒員對葡萄口感,質量的分析評價上有差異,得出第一組品酒員白葡萄酒的、,組2的顯著性更強,、均小于 表示兩組該量表的重復度量效果良好。綜合分析結果說明,白葡萄酒組二的品酒員可信度更高。5.2. 問題二的建模與求解模型建立:聚類分析及歐式距離對樣品和指標變量進行分類主要采用聚類分析法,而求取樣品以及類之間的距離有多種方法,其中主要使用歐式距離和最短距離法。(1) 數(shù)據標準化由于所選數(shù)據的量綱和數(shù)值大小都不一致,數(shù)值的變化范圍也不同,因此必須首先對所選數(shù)據進行標準化處理,如果有個樣本,個樣本有個

24、指標,那么每個變量可表示為,均值標準方差那么標準化后 2聚類距離:對樣品進行聚類時,“靠近往往由某種距離來刻畫。假設每個樣品有個指標,故每個樣品可以看成維空間中的一個點, 個樣品就組成維空間中的個點,樣品與指標構成一個矩陣,此時就可以用距離來度量樣品之間的接近程度。令表示第個樣品的第個指標, 表示第個樣品與第個樣品之間的距離,最常見最直觀的計算距離的方法是:明考斯基距離()當時, 即為絕對距離當時, 即為歐氏距離當時 稱為切比雪夫距離。當各變量的測量值相差懸殊時,為了計算的準確性,需先將數(shù)據標準化,然后用標準化后的數(shù)據進行計算。系統(tǒng)聚類;,將個樣品各自看成一類,然后規(guī)定樣品之間的距離和類與類之

25、間的距離。開始,因每個樣品自成一類,類與類之間的距離與樣品之間的距離是相等的,選擇距離最小的一對并成一個新類,計算新類與其他類的距離,再將距離最近的兩類合并,這樣每次少一類,直至所有的樣品都成一類為止,最終完成養(yǎng)分的分類。計算類與類之間的距離主要有:1最短距離法:設、分別為一類,那么最短距離的計算公式為:此時將類與類合并為類,那么任意的類和的距離公式為依次下去,最終完成對樣品的分類。(2)最長距離法將類與類合并為類,那么任意的類和的距離公式為3類平均法將類與類合并為類,那么任意的類和的距離公式為4重心法將類與類合并為類,那么任意的類和的距離公式為模型求解:根據歐式距離對釀酒葡萄分類1對紅葡萄酒

26、進行分類 將附件中的組一評酒員評價標準,算出各項所占權重并加和,最終求得十位品酒員對每個葡萄酒樣品的平均值,作為27種酒樣品的綜合評價指標,并用葡萄酒的綜合指標以及釀酒葡萄的理化指標形成一個31列28行的原始資料陣,將其數(shù)據標準化,通過spss進行聚類分析,得到酒樣品的八個類別,并列出每個酒樣品所對應的綜合指標,得出下表以及聚類分析樹狀圖圖表3:不同來源紅葡萄酒聚類分析第一類酒樣品12186715綜合評價指標第二類酒樣合評價指標172452026第三類酒樣品25綜合評價指標第四類酒樣品814綜合評價指標第五類酒樣品1第六類酒樣品3212923綜合評價指標第七類酒樣品1

27、0綜合評價指標第八類酒樣品11綜合評價指標表格 4 葡萄酒的分類與綜合評價指標觀察表中數(shù)據,不難發(fā)現(xiàn)紅葡萄酒樣品1、10、11、25單獨化為一類,而不與綜合指標相近的酒品類為一組,根據這四種葡萄酒的理化指標以及釀酒葡萄的成分對綜合指標相近的組類進行分析比擬,得出酒品1的花色苷含量高達 mg/100g鮮重,單寧 mol/kg、總酚、總黃酮kg、順式白藜蘆醇kg均高于第一類酒樣品理化指標的數(shù)據。紅葡萄酒樣品10、11、花色苷含量較低,白藜蘆醇含量較高,樣品25氨基酸含量較低,果穗質量含量較高,均與指標相近的類別的理化指標數(shù)據有較大差異。據資料分析得,新酒主要以花色苷為主色調,陳酒種單寧起主導作用。

28、有單寧存在,花色苷將減少。氨基酸的含量與人體血液中的氨基酸有著密切聯(lián)系,與脯氨酸成負相關,但與纈氨酸成正相關。這些含量的上下會影響葡萄酒口感、色澤、純粹度,從而評酒員對酒的分數(shù)存在差異。因此,聚類分析結果在對各項理化指標進行數(shù)據處理時,達不到組間距離。結合綜合指標的上下以及聚類分析的結果,以及每一種釀酒葡萄所對應的紅葡萄酒樣品,將釀酒葡萄分為A、B、C、D。分別代表優(yōu)質、良好、中等、差四個等級:如下表A葡萄樣品3212923綜合評價指標B葡萄樣合評價指標172452026C葡萄樣品258141110綜合評價指標D葡萄樣品121867151綜合評價指標表格 5 釀酒葡萄

29、紅的等級劃分 1對釀酒葡萄白進行分類 由問題一知,第二組評酒員對白葡萄酒評價可信度更高,用聚類分析的歐式距離可分出不同組類,根據綜合指標的上下劃分出A、B、C、D分別代表優(yōu)質、良好、中等、差四個等級:其中葡萄樣品氨基酸總量100g、酒石酸11.790g/L、不含檸檬酸、葡萄花色苷含量較低、葡萄褐變度、黃酮醇含量均遠遠高于同組水平、因此這3種釀酒葡萄的理化指標與其綜合指標相近的組類有一定的差異而達不到組間距離,單獨分為一組。表格 6 釀酒葡萄白的等級劃分A葡萄樣品1722綜合指標B葡萄樣品618715113綜合指標C葡萄樣品52092841421綜合指標葡萄樣品23262121024D綜合指標葡

30、萄樣品8111916綜合指標5.3. 問題三的建模與求解模型建立相關性分析相關分析是描述兩個變量間關系的密切程度,主要由相關系數(shù)值表示,當相關系數(shù)的絕對值越接近于1,那么表示兩個變量間的相關性越顯著。雙變量系數(shù)測量的主要指標有卡方類測量、Spearman相關系數(shù)、pearson相關系數(shù)等,由于釀酒葡萄和葡萄酒的數(shù)據為定距數(shù)據,那么在進行兩者間的相關性檢驗時用pearson相關系數(shù)來判斷,其公式為:Pearson簡單相關系數(shù)檢驗統(tǒng)計量為:其中統(tǒng)計量服從個自由度的分布。回歸分析多元回歸分析是研究多個變量之間關系的回歸分析方法,確定變量之間數(shù)量的可能形式,并用數(shù)學模型表示如下:其中為截距項,為偏回歸

31、系數(shù),為殘差項。多元回歸方程及其顯著性檢驗建立模型,要對模型進行擬合度檢驗,回歸方程的顯著性檢驗就是檢驗樣本回歸方程的變量的線性關系是否顯著,即能否根據樣本來推斷總體回歸方程中的多個回歸系數(shù)中至少有一個不等于0,主要是說明樣本回歸方程的顯著性。檢驗的方法用方差分析,這時因變量的總體變異系本分解為回歸平方和與誤差平方和,即表示為:其中此外可以用檢驗對整個回歸進行顯著性檢驗,即與所考慮的k個變量自變量是否有顯著性線性關系,即公式為:檢驗的時候分別與的臨界值進行比擬,假設,認為回歸高度顯著 或稱在水平上顯著;。認為回歸在水平上顯著;那么稱回歸在水平上顯著。假設,那么回歸不顯著,此時與這個自變量的線性

32、關系就不確切。表格 7 多元線性回歸方差分析表變差來源平方和自由度均方回歸剩余總和模型求解葡萄酒的花色苷與釀酒葡萄個別指標的相關性Correlations花色苷蘋果酸褐變度DPPH自由基總酚單寧葡萄總黃酮黃酮醇果梗比J1花色苷Pearson Correlation1.633*.696*.655*.728*.688*.566*.352.477*.923*Sig. (2-tailed).000.000.000.000.000.002.071.012.000N27272727272727272727蘋果酸Pearson Correlation.633*1.644*.052.193.235.052.0

33、56.230.693*Sig. (2-tailed).000.000.795.334.237.797.782.249.000N27272727272727272727褐變度Pearson Correlation.696*.644*1.295.361.473*.236.421*.498*.767*Sig. (2-tailed).000.000.135.064.013.237.029.008.000N27272727272727272727DPPH自由基Pearson Correlation.655*.052.2951.857*.645*.836*.428*.501*.567*Sig. (2-ta

34、iled).000.795.135.000.000.000.026.008.002N27272727272727272727總酚Pearson Correlation.728*.193.361.857*1.755*.895*.346.391*.613*Sig. (2-tailed).000.334.064.000.000.000.077.044.001N27272727272727272727單寧Pearson Correlation.688*.235.473*.645*.755*1.688*.385*.350.661*Sig. (2-tailed).000.237.013.000.000.0

35、00.047.074.000N27272727272727272727葡萄總黃酮Pearson Correlation.566*.052.236.836*.895*.688*1.263.269.441*Sig. (2-tailed).002.797.237.000.000.000.186.175.021N27272727272727272727黃酮醇Pearson Correlation.352.056.421*.428*.346.385*.2631.633*.408*Sig. (2-tailed).071.782.029.026.077.047.186.000.035N27272727272

36、727272727果梗比Pearson Correlation.477*.230.498*.501*.391*.350.269.633*1.502*Sig. (2-tailed).012.249.008.008.044.074.175.000.008N27272727272727272727花色苷Pearson Correlation.923*.693*.767*.567*.613*.661*.441*.408*.502*1Sig. (2-tailed).000.000.000.002.001.000.009.035.008N27272727272727272727*. Correlation

37、 is significant at the level (2-tailed).*. Correlation is significant at the level (2-tailed).由表可知,以上各個變量與葡萄酒中的花色苷的p都小于,那么可認為在的顯著性水平下,以上各個變量與葡萄酒中的花色苷都顯著相關,可做回歸分析觀察葡萄酒中的花色苷與釀酒葡萄中的果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚,輸出結果如下:Model SummarybModelRR SquareAdjusted R SquareStd. Error of

38、 the EstimateDurbin-Watson1.956a.913.859a. Predictors: (Constant), 果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚b. Dependent Variable: J1又表可知調整的判定系數(shù)為,可認為方程的擬合性比擬高,即被解釋變量被模型解釋的局部較多,為能解釋的局部較少。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression10.000aResidual16Total26a. Predictors: (Const

39、ant), 果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚b. Dependent Variable: J1一依據該表可進行回歸方程的顯著性檢驗,由表我們可以知道F檢驗統(tǒng)計量和P值分別為、0,在的顯著性水平下,由于概率P值小于顯著性水平,那么拒絕原假設,認為被解釋變量個解釋變量間存在顯著的線性關系,可建立線性回歸模型。由此在對方程中個系數(shù)進行檢驗,結果如下:多元線性回歸模型的求解根據相關性的分析,葡萄酒中的花色苷與釀酒葡萄中的果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷

40、, 總酚中相關性較大的幾項,用SPSS 分析多元線性回歸,得出線性關系的擬合方程。輸入移去的變量b模型輸入的變量移去的變量方法1總酚, 多酚氧化酶活力, 蘋果酸, 果梗比, 黃酮醇, DPPH自由基, 褐變度, 花色苷, 單寧, 葡萄總黃酮.輸入2.多酚氧化酶活力向后準那么: F-to-remove >= .100 的概率。3.褐變度向后準那么: F-to-remove >= .100 的概率。4.花色苷向后準那么: F-to-remove >= .100 的概率。5.黃酮醇向后準那么: F-to-remove >= .100 的概率。表格 8 葡萄酒花色苷與葡萄理化指

41、標的多元線性回歸輸入/移出變量由于當P<時,因變量與變量之間的相關性顯著,結合向后推移法,剔除了多酚氧化酶活力、褐變度、花色苷、黃酮醇、篩選出最吻合的變量。系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版5(常量)00果梗比-1+130蘋果酸+140葡萄總黃酮3+150單寧0DPPH自由基0總酚0表格9葡萄酒花色苷與葡萄理化指標的多元線性回歸變量篩選結果及系數(shù)模型匯總模型RR 方調整 R 方標準 估計的誤差1.874.890.579.35802.874.829.513.34943.860.778.491.32034.845.755.467.31185.825.715.449.3

42、080表格 10葡萄酒花色苷與葡萄理化指標的多元線性回歸R方及標準估計的誤差根據R方值的大小,可判斷出多元線性回歸方程的契合度,觀察模型后退5次得到R方值與標準估計的誤差, =,可知方程的吻合性較高。最后得到葡萄酒花色苷與葡萄理化指標的線性回歸方程為 其中、分別代表葡萄果梗比、蘋果酸、葡萄總黃酮、單寧、DPPH自由基、總酚含量、葡萄酒花色苷 以上方程可代表,每1單位的果梗比、蘋果酸、葡萄總黃酮、單寧、DPPH自由基、總酚含量的變化所引起葡萄酒花色苷的變化。從而反映了釀酒葡萄與葡萄酒理化指標的聯(lián)系。5.4. 問題四的建模與求解模型建立首先,尋求如何應用葡萄酒的理化指標對葡萄酒質量進行綜合評價,然

43、后結合問題三中,釀酒葡萄與葡萄酒之間的聯(lián)系,我們便可以從釀酒葡萄的理化指標進行對葡萄酒質量的客觀評價。(1) 變量間的相關性及系數(shù)法。一般|r|>,存在顯著性相關;|r|<關系極弱,認為不相關。|r|中度相關、|r|認為低度相關。 系數(shù)法:對定距變量的數(shù)據進行計算。公式為其中為相關系數(shù);、分別是變量x、y的均值;、分別是變量、的第個觀測值使用,對葡萄酒的理化指標之間相似或不相似測量,進行距離相關分析以考察相互接近程度。首先設,其中,分別為外觀、香氣、口感和整體評價的評價指標綜合得分函數(shù),令、分別表示為葡萄酒的理化指標,通過SPSS 作分析兩者之間的相關性,選取相關性較大的個指標21

44、0作為的相關性指標建立回歸方程如下:(2) 多元線性回歸模型的建立假設因變量與解釋變量,具有線性關系,它們之間的線性回歸模型可表示為: 其中為隨機擾動項觀測值。對于第個觀測值:即:也即:假定:(3) 擬合方程的顯著性檢驗方差分析表:離差名稱平方和自由度均方差回歸RSSKRSS/kk個解釋變量殘差ESSn-k-1ESS/n-k-1總離差TSSn-1檢驗:與解釋變量之間的線性關系是否顯著。2.3. 查表得: 4. 假設 ,拒絕,回歸方程顯著 ,接受,回歸方程不顯著(4) 建立葡萄酒理化指標與葡萄酒質量之間的關系通過評價指標知道,外觀、香氣、口感和整體評價在整個葡萄酒的評價中所占權重是不同的,各個權

45、重定義為:、,我們定義葡萄酒的總評分值的函數(shù)為:通過對的比擬,我們便可以客觀地從一種葡萄酒的含量來判斷葡萄酒的質量了。由問題三,我們已經知道,釀酒葡萄與葡萄酒的理化指標之間存在著聯(lián)系。于是,我們通過釀酒葡萄與葡萄酒的聯(lián)系,然后通過對葡萄酒成分進行評分,就得到了釀酒葡萄與葡萄質量之間的聯(lián)系了。模型求解 變量間的相關性及系數(shù)法的求解首先,“近似矩陣表格給出的是各變量之間的相似矩陣,圖中以線框標注了相關系數(shù)較大的幾對變量。分析外觀與紅葡萄酒成分的相關性得到圖表 5外觀分析與紅葡萄酒理化指標的相關系矩陣從上表可以看出外觀分析與花色苷、單寧、總酚、總黃酮、白藜蘆醇、DPPH半抑制體積、L*(D65)、a

46、*(D65)、H平均、C平均含量相關系較大,與其余的成分相關性很弱。圖表 6香氣分析與葡萄酒理化指標的相關系矩陣從香氣分析與紅葡萄酒理化指標的相關系分析,得出與單寧、總酚、總黃酮、白藜蘆醇 、DPPH半抑制體積 、L*(D65)相關性較為顯著。圖表 7口感分析與葡萄酒理化指標的相關系矩陣同樣可以發(fā)現(xiàn),口感分析與單寧、總酚、總黃酮、白藜蘆醇、DPPH半抑制體積、b*(D65)、H平均有相關性。圖表 8平衡及整體評價與紅葡萄酒理化指標的相關系矩陣平衡及整體評價與單寧、總酚、總黃酮、白梨蘆醇、DPPH半抑制體積、b*D65、H平均、C平均相關。多元線性回歸模型的求解根據相關性的分析,得出外觀分析與紅

47、葡萄酒理化指標相關性較大的幾項,用SPSS 分析多元線性回歸,得出方程的線性關系。輸入移去的變量b模型輸入的變量移去的變量方法1C平均, L*(D65), H平均, 白藜蘆醇(mg/kg), 總黃酮mmol/kg, 單寧(mmol/kg), 花色苷, 總酚(mmol/kg), DPPH半抑制體積, a*(D65).輸入2.DPPH半抑制體積向后準那么: F-to-remove >= .100 的概率。3.單寧(mmol/kg)向后準那么: F-to-remove >= .100 的概率。4.總酚(mmol/kg)向后準那么: F-to-remove >= .100 的概率。5.a*(D65)向后準那么: F-to-remove >= .100 的概率。6.C平均向后準那么: F-to-remove >= .100 的概率。7.總黃酮mmol/kg向后準那么: F-to-remove >= .100 的概率。b. 因變量: 外觀分析.表格 11外觀分析與葡萄酒理化指標的多元線性回歸輸入/移出變量由于當P<時,因變量與變量之間的相關性顯著,結合向后推移法,剔除了單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論