12年全國數學建模競賽試卷_第1頁
12年全國數學建模競賽試卷_第2頁
12年全國數學建模競賽試卷_第3頁
12年全國數學建模競賽試卷_第4頁
12年全國數學建模競賽試卷_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2012高教社杯全國大學生數學建模競賽承 諾 書我們仔細閱讀了中國大學生數學建模競賽的競賽規(guī)則.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴肅處理。我們授權全國大學生數學建模競賽組委會,可將我們的論文以任何形式進行公開展示(包括進行網上公示,

2、在書籍、期刊和其他媒體進行正式或非正式發(fā)表等)。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): A 我們的參賽報名號為(如果賽區(qū)設置報名號的話): 08057 所屬學校(請?zhí)顚懲暾娜?哈爾濱工程大學 參賽隊員 (打印并簽名) :1. 劉娟 2. 郭威 3. 張錚 指導教師或指導教師組負責人 (打印并簽名): 日期: 2012 年 9 月 10 日賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):2012高教社杯全國大學生數學建模競賽編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號

3、):全國評閱編號(由全國組委會評閱前進行編號): 釀酒葡萄與葡萄酒質量關系分析摘要本文圍繞釀酒葡萄的理化指標與葡萄酒質量的關系問題,對兩組評酒員的評價結果的差異性及可信度、釀酒葡萄的等級劃分、釀酒葡萄的理化指標與葡萄酒的理化指標的聯(lián)系以及釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響等問題分別進行了建模,對葡萄的理化指標與葡萄酒的理化指標及葡萄酒的質量關系問題進行了分析。對于問題一,運用配對t檢驗的方法對兩組評價結果進行顯著性差異的判斷,算得兩組的紅葡萄酒和白葡萄酒的評價結果的P值均小于0.05=,即有顯著性差異。對于兩組評價結果的可信度,本文以評酒員的可靠性為檢驗標準,評酒員受心理、生理及外界

4、干擾等因素的影響越小,評價結果越公正越穩(wěn)定。運用評分者信度檢驗中的Cronbach 檢驗模型對每一組的10個評論員進行可靠性檢查,得到第一組的10個評酒員信度高,一致性好,因此第一組的評價結果可信。對于問題二,本文將附表2和3的數據進行整理,得到29個釀酒葡萄的理化指標,運用因子分析模型對29個變量進行降維處理,分別得到紅釀酒葡萄有9個因子,白釀酒葡萄有10個因子,它們相互獨立而且包含原有指標的信息。然后通過多元線性回歸模型,將這些因子與葡萄酒的質量進行相關分析,得到有一些因子對結果的影響微小,可以略掉,最終得到紅釀酒葡萄有6個因子、白釀酒葡萄有7個因子可以反映葡萄酒的質量。根據這些因子的權重

5、作聚類分析,最后將紅白釀酒葡萄各分為四個等級。對于問題三,經過對比發(fā)現(xiàn),隨著釀酒葡萄釀成葡萄酒,釀酒葡萄的大部分指標都通過某些物理化學反應變成了其他指標,使得最后釀酒葡萄的理化指標的數目大大減少,并且葡萄酒中的每一個理化指標都不是單純的與釀酒葡萄理化指標中的一個或幾個有關系。運用多元線性回歸模型,將葡萄酒的每一個理化指標都與釀酒葡萄和葡萄酒共有的所有理化指標建立線性關系,最后通過擬合的系數判斷釀酒葡萄的理化指標與葡萄酒的理化指標的定性表達式。對于問題四,在問題二和問題三的基礎上,我們已經確定了釀酒葡萄的理化指標與葡萄酒的質量有一定的相關關系,釀酒葡萄的理化指標也與葡萄酒的理化指標有相關關系,所

6、以酒和葡萄間相同的指標對就質量的影響也是線性相關的。我們把釀酒葡萄中的理化指標和葡萄酒中的理化指標當作自變量,評分結果作為因變量進行擬合,得出系數,用得到的關系式,代入以上所說的自變量,得到一組擬合后感官得分y,再對y和y進行顯著性差異檢驗,得到結果,論證能否用理化指標評價葡萄酒質量。結果沒有顯著性差異,說明可以用釀酒葡萄和葡萄酒的理化指標來判斷葡萄酒的質量。關鍵詞:評分者信度 因子分析 多元線性回歸 聚類分析問題重述確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質

7、量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數據。請嘗試建立數學模型討論下列問題:1. 分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?2. 根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量?問題的分析葡萄酒的質量70%決定于原料的質量,30%決定于工藝和設備。釀酒葡萄的理化指

8、標對于葡萄酒的質量有著舉足輕重的影響。本文針對釀酒葡萄與葡萄酒的質量關系,主要解決四個問題:感官評價葡萄酒質量的可靠性問題、釀酒葡萄的分級問題、釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系以及釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,以此來分析論證能否用釀酒葡萄和葡萄酒的理化指標來評價葡萄酒的質量。2.1問題一:確定兩組評酒員的評價結果有無顯著差異,哪組更可信。問題一中要求對兩組評酒員的評價結果進行統(tǒng)計分析,找出更可信的結果。我們以評酒員對每個酒樣品各個分項指標的評分的總和的平均值作為每個組的評價結果。由于樣本數量為27(紅葡萄酒)、28(白葡萄酒)均小于30,我們可以用t檢測來進行顯著性檢驗。t

9、檢測還包括單樣本t檢驗,獨立樣本t檢驗以及配對樣本t檢驗,分別適用于不用的樣本類型。由于我們的兩組數據是對同一樣本的兩次測量,滿足配對樣本t檢驗的前提條件,于是我們用SPSS中的配對樣本t檢驗來實現(xiàn)對總評分的顯著性檢驗。對于哪一組結果更可信,我們認為考察的是評酒員的可信程度。因為是感官分析,每個評酒員的生理、心理、品評環(huán)境的復雜性都對最終的評價結果有影響。一個好的經驗豐富的評酒員,不受主觀及人為因素的干擾,能夠公正的評價酒樣品的質量。我們將評酒員類比為量器,采用評分者信度法,考查評酒員的可靠性,可靠性高的一組評酒員對應的評價結果更可信。2.2問題二:根據釀酒葡萄的理化指標和葡萄酒的質量對釀酒葡

10、萄進行分級附表2和附表3中釀酒葡萄的理化指標多且雜,而且有一些葡萄酒的理化指標都是有聯(lián)系的,有隱性關系。根據降維的思想,我們得到釀酒葡萄的理化指標的內在聯(lián)系,把多指標轉化為幾個相互獨立而且包含原有指標大部分信息的綜合指標。根據釀酒葡萄的理化指標和葡萄酒的質量的相關分析計算,最終確定釀酒葡萄中能包含全部信息的指標,然后通過聚類分析對釀酒葡萄進行分級。2.3問題三:分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系 針對釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系,我們首先分析釀酒葡萄和葡萄酒的各項理化指標。經過對比我們發(fā)現(xiàn),隨著釀酒葡萄釀成葡萄酒,釀酒葡萄的大部分指標都通過某些物理化學反應變成了其他指標,使得最后

11、釀酒葡萄的理化指標的數目大大減少,并且葡萄酒中的每一個理化指標都不是單純的與釀酒葡萄理化指標中的一個或幾個有關系。所以我們假設,葡萄酒的每一個理化指標都與釀酒葡萄和葡萄酒共有的所有理化指標有線性關系,并且共有指標的變化是由于其他指標的物理化學反應所得。該線性關系符合了多元線性回歸分析的前提條件,所以我們采用SPSS中的多元線性回歸擬合來驗證我們的假設。2.4問題四:分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量由于有了問題二和問題三的基礎,我們在分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響時,可以把釀酒葡萄中的理化指標分為兩類:一類是

12、釀酒過程中發(fā)生物理化學反應變化成葡萄酒中成分的理化指標;一類為沒有完全轉化為葡萄酒指標,但是會對葡萄酒評分時的某些細則造成影響的理化指標(如百粒質量、果穗質量、果皮質量等等)。所以我們需要把釀酒葡萄的指標分別討論。因為第三問中我們已經計算出釀酒葡萄中理化指標和葡萄酒中理化指標的線性關系,所以我們完全可以用葡萄酒中的理化指標綜合第一類的指標,所以我們只要把葡萄酒中的所有理化指標和釀酒葡萄中的第二類指標放在一起作為自變量,把對應葡萄酒的質量評分作為因變量進行多元線性回歸擬合即可。模型假設3.1條件假設1.所有的酒樣品除了釀酒葡萄樣品不同外,釀造葡萄酒的工藝和設備等因素均相同。2.附表1中第一組白葡

13、萄酒樣品3中某一項指標出現(xiàn)了77分、附表3中葡萄樣品12、13、21中的某些芳香類物質比其他樣品高出幾百倍,這些都與實際不符。我們將77改為7,芳香類物質改小。假設這些改變不影響結果的分析。(實際計算中反應影響不大)3.假設評酒員評價葡萄酒質量時,不受酒樣品的序號、評價順序的干擾。其他在模型中的假設在具體的模型建立與求解中給出。模型的建立與求解4.1問題一:確定兩組評酒員的評價結果有無顯著差異,哪組更可信。4.1.1模型I:配對t檢驗顯著性差異模型模型的建立(1)兩配對樣本t檢驗是根據樣本數據對樣本來自的兩配對總體的均值是否有顯著性差異進行推斷。一般用于同一研究對象分別給予兩種中不同處理的效果

14、比較。配對樣本是指對同一樣本進行兩次測試所獲得的兩組數據,或對兩個完全相同的樣本在不同條件下進行測試所得的兩組數據。兩組中的1-27號紅葡萄酒以及1-28號白葡萄酒分別為相同的酒樣品,由兩組不同的10個評酒員對紅、白葡萄酒進行品嘗后對其分類指標打分,得到葡萄酒的評價結果。由此得到的樣本符合配對樣本的定義。因此用配對樣本t檢驗進行顯著性差異判斷。配對t檢驗要求兩樣本來自的兩個總體應該服從正態(tài)分布。檢驗數據的正態(tài)分布性有多種方法:頻率分布直方圖法、卡法檢驗法、P-P圖(Q-Q圖)等。本文利用SPSS統(tǒng)計軟件,對樣本數據繪制出P-P圖,檢驗其正態(tài)分布性。圖1 兩組紅白葡萄酒評分數據正態(tài)分布檢驗由圖1

15、可以看出,樣本數據的P-P圖均近似顯示為一條直線,所以可看作服從正態(tài)分布,可以用配對樣本t檢驗考查是否有顯著性差異。(2)配對樣本t檢驗的基本實現(xiàn)思路假設總體服從正態(tài)分布,總體服從正態(tài)分布,分別從這兩個總體中抽取樣本()和(),且兩樣本相互配對。要求檢驗和是否有顯著差異。第一步,引進一個新的隨機變量,對應的樣本值為(),其中,這樣,檢驗的問題就轉化為單樣本t檢驗問題。即轉化為檢驗Y的均值是否與0有顯著差異。第二步,建立零假設 =0第三步,構造t統(tǒng)計量 第四步,SPSS自動計算t值和對應的P值第五步,做出推斷:若P值顯著水平,則不能拒絕零假設,即認為兩總體均值不存在顯著差異。其中=0.05。模型

16、的求解(1)紅葡萄酒評分的顯著性差異檢驗我們做出如下假設:評酒員對于兩組紅葡萄酒的評分沒有顯著性差異評酒員對于兩組紅葡萄酒的評分有顯著性差異圖2 成對樣本統(tǒng)計量圖2表明,第一組和第二組的評分的平均值沒有較大差異,第二組的平均分略低于第一組的平均分。圖3 成對樣本相關系數圖3中,第三列“相關系數”是兩組紅葡萄酒總平均分的簡單相關系數,第四列“sig值”是相關系數檢驗的概率P-值,它表明在顯著性水平為0.05時,第一組和第二組總平均分的相關程度較強。圖4 成對樣本檢驗圖4中,均值是兩組紅葡萄酒總平均分的平均差異,相差了2.54分;另外還給出了差值樣本的標準差,均值的標準誤差以及95%置信區(qū)間的上下

17、限;t值是進行T檢驗統(tǒng)計量的觀測值;從結果我們可以看出:在顯著性水平為0.05時,由于,且可能性低于0.05的事件被稱為小概率事件,不予考慮。所以拒絕假設,接受假設,即我們可以認為對于兩組紅葡萄酒的評分有顯著性差異。(2)白葡萄酒評分的顯著性差異檢驗我們同樣做出如下假設:評酒員對于兩組白葡萄酒的評分沒有顯著性差異評酒員對于兩組白葡萄酒的評分有顯著性差異用與紅葡萄酒的檢驗方法一樣的處理方法,可以得到:第一組和第二組白葡萄酒的評分的平均值沒有較大差異,第二組的平均分略高于第一組的平均分。表明在顯著性水平為0.05時,第一組和第二組總平均分沒有太大的相關性。圖7中,均值是兩組紅酒總平均分的平均差異,

18、相差了-2.52分;從結果我們可以看出:在顯著性水平為0.05時,由于,且可能性低于0.05的事件被稱為小概率事件,不予考慮。所以拒絕假設,接受假設,即我們可以認為對于兩組白葡萄酒的評分有顯著性差異。(3)結論:通過兩組配對樣本t檢驗的結果,我們可以得到,兩組評酒員的評價結果有顯著性差異。4.1.2 模型II:可靠性分析模型由以上分析可知,兩組評酒員的評價結果有顯著性差異,為了便于后續(xù)問題的分析我們需要確定哪一組評酒員的結果更加可信,也即確定兩組評比結果的可信度。模型的建立在實際研究中,經常需要借助量表來了解對象的某一特性。有時候沒有現(xiàn)成的量表可以采用,需要研究者自己編制量表進行測量。而對于自

19、己編制的量表,就需要對量表的可靠性進行分析。信度是評價結果的前后一致性,也就是評價得分使人們可以信賴的程度有多大。我們將10個評酒員類比為相同的量表,正如一個好的量表,它的結果是可靠的、穩(wěn)定的。而10個評酒員各有自己的評價尺度和標準,而且是感官分析,這些差異可以類比為量表測量的隨機誤差,顯然所有的評酒員受生理、心理、品評環(huán)境的影響越小,結果越穩(wěn)定越可靠。在這樣的類比下,信度分析可以用到我們的樣本分析中。我們用評分者信度法來檢驗量表的等同性,考慮誤差的來源是否是評分者之間的差異。評酒員人工評判時,測量誤差來源于兩方面:評酒員自身和評酒員之間,考察的指標分別是評酒員內信度和評酒員間信度。評分越一致

20、,評酒員的信度越高。當有兩個以上評分者對同一測驗任務評分時,評分者間信度的計算方法有:肯德爾和諧系數、Cronbach 和多聯(lián)系相關分析。而如果采用等級評定的方式評價,用肯德爾和諧系數是可取的,當評分者用百分制或其他非等級評定的方式閱卷時,用這些系數不能反應評分者之間的評分絕對差別,在這種情況下,采用Cronbach 信度系數法。Cronbach 信度系數其公式為: 其中,在紅白葡萄酒中分別為27個紅葡萄酒樣品10個評酒員評分結果的平均值,28個白葡萄酒樣品10個評酒員的評分結果的平均值, 為第i個酒樣品得分的樣內方差, 為全部酒樣品總得分的方差。我們用SPSS統(tǒng)計軟件作信度可靠性分析。(2)

21、模型的求解由SPSS統(tǒng)計軟件進行Cronbach 信度系數分析。以第一組紅葡萄酒的評價結果表為例,進行說明,其他三個表格的處理相同。首先計算評酒員在酒樣品評價中評價結果的均數與標準差。輸出的結果文件中第二個表格為評酒員間的兩兩相關系數矩陣。圖5 第一組評酒員評價紅酒的兩兩相關矩陣從中可見,10號評酒員與其他評酒員的相關系數最低。第四部分顯示將某一個評酒員剔除的情況下得到的平均得分、方差、每個評酒員評分與剩余各項目得分間的關系、以該項目為自變量所有其他項目為應變量建立回歸方程的值以及內部一致性值各是多少。圖6 其他統(tǒng)計值從中可見,去除品酒員10后 ,內部的評酒員評價結果的一致性最好,為0.916

22、。在每個項目得分與剩余項目得分間的相關系數中,評酒員2與其他評酒員的相關性最大,評酒員10最低。輸出結果的最后一部分為評酒員的一致性檢驗。圖7 第一組10個評酒員評價紅葡萄酒的值該信度結果表明=0.912。信度較好。各評酒員的一致性較好。同樣的處理方法,可以得到其他三個表的值。圖8 第二組10個評酒員評價紅葡萄酒的值由圖7與圖8可以看出,第一組的值較大,評酒員間的差異小,一致性好,因此第一組紅葡萄酒的評價結果可信。圖9 第一組評酒員評價白葡萄酒的值圖10 第二組評酒員評價白葡萄酒的值由圖9和圖10可以得出,第一組的評酒員評價白葡萄酒的值大,信度高,內部一致性好,因此第一組的評價結果可信。(3)

23、結論:第一組的評價結果更可信。4.2問題二:根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級4.2.1模型I:降維模型模型的建立在根據釀酒葡萄的理化指標和葡萄酒的質量給釀酒葡萄分級之前,我們需要對附表2中紅葡萄和白葡萄各理化指標進行數據處理,把所有多次測量的數據取平均值,并且只對藍色的一級指標進行考慮。另外,由于芳香類物質會影響葡萄酒的香氣方面的評分質量,我們又把附表3中芳香類物質的和作為另一個變量與附表2的其他變量進行合并。于是我們一共得到了29個變量。首先我們用SPSS軟件對29個變量進行相關分析,證明它們有相關性。由于29個變量不是相互獨立的,它們之間仍然存在著許多內在聯(lián)系,有

24、些是顯而易見的關系,如氨基酸和蛋白質;而有些則是隱藏在內部的內在聯(lián)系,這是我們無法簡單的判斷的。本文將29個釀酒葡萄的理化指標作為因子分析的變量因子,建立指標體系:其中,是29個釀酒葡萄的理化指標,是公共因子,是特殊因子,它與公共因子之間彼此獨立。是指標在公共因子上的載荷,因子載荷的統(tǒng)計含義是指標在公共因子上的相關系數,表示與線性相關程度。由因子分析得到的因子能夠反映原有指標的大部分信息。但是對于最終的分級給予的標準不夠明確。本文用多元線性回歸的方法將因子與葡萄酒的質量建立關系,得出最終的分級指標。模型的求解首先對數據進行標準化處理。在SPSS中導入標準化處理后的29個理化指標的數據。通過指標

25、的相關矩陣可以看出變量間有一定的相關關系。通過公因子方差可以看出這些變量可以做因子分析。圖11 第一組紅葡萄酒旋轉成分矩陣由圖17列出了第一組紅葡萄酒的旋轉矩陣。 圖12 公共因子碎石圖圖12所示是公共因子碎石圖,它的橫坐標為公共因子數,縱坐標為公共因子特征值??梢娗懊?個公共因子,特征值變化非常明顯,以后的特征值變化趨于平穩(wěn)。因此說明提取9個公共因子可以對原變量的信息描述有顯著作用。從前面的旋轉矩陣圖中也可以看出這個結果。同樣的處理方法,白釀酒葡萄的也是29個變量進行因子分析,得到公共因子碎石圖。圖13 白釀酒葡萄的理化指標的公共因子碎石圖由圖13可以看出,前面10個公共因子,特征值變化非常

26、明顯,以后的特征值變化趨于平穩(wěn)。因此說明提取10個公共因子可以對原變量的信息描述有顯著作用。為了輔助和佐證因子分析,我們將葡萄酒的質量即各種樣品葡萄酒作為一個變量加入到總的數據中,并通過控制序號來進行偏相關分析,從分析結果中我們得到了各個變量以及各變量與葡萄酒質量之間的相關性,并將相關性很強的變量進行了合并,結果與因子分析相似。以因子分析后的9個因子為自變量,分別為自變量。葡萄酒質量記為,用SPSS進行多元線性分析得到如下數據。圖14 因子與紅葡萄酒質量的多元線性系數經過回歸擬合后,由于相關性太小,對最終結果的影響也很小,當作微小量舍去,得到最后的擬合關系式:將各系數進行歸一化得到各變量所占權

27、重0.303,-0.1814,-0.1756,0.1071,0.1694,0.0636。用同樣的處理方法對白釀酒葡萄的理化指標與白葡萄酒的質量進行多元線性回歸分析。得到結果為:圖15因子與白葡萄酒質量的多元線性系數其中對最終的結果影響很小,舍去不計。最終表達式為:4.2.2模型II:R型聚類模型模型建立聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。層次聚類分析中的R型聚類是對研究對象的觀察變量進行分類,它使具有共同特征的變量聚在一起。聚類的主要過程可以分為四個步驟:數據預處理(標準化)構造關系矩陣(親疏關系的描述)聚類確定最佳分類(類別數)模型求解用SPSS統(tǒng)計軟

28、件結合權重進行聚類分析,對釀酒葡萄分了四個等級。圖16 聚類分析圖16表明全部樣本都進入了聚類分析。圖17 每個聚類中的案例數圖18 27個紅釀酒葡萄分等級結果注:紅釀酒葡萄共分四個等級,第一等級最差,逐級質量提高,第四等級質量最好。用同樣的處理方法對白釀酒葡萄進行聚類分析,得到:圖19 白釀酒葡萄分級注:紅釀酒葡萄共分四個等級,第一等級最差,逐級質量提高,第四等級質量最好。由圖18、圖19可以得出:紅釀酒葡萄分為四個等級,第一等級質量最差,第四等級質量最好:11號紅葡萄為第一等級葡萄,4、7、8、15、18號葡萄為第二等級,1、6、10、12、14、16、21、22、24、25、27號葡萄為

29、第三等級,2、3、5、9、13、17、19、20、23、26號葡萄為第四等級。白釀酒葡萄分為四個等級,與紅葡萄類似,第一等級質量最差,第四等級質量最好:1、2、3、6、7、8、9、10、14、16、19、21、22、24號白葡萄為第一等級葡萄,12、13、27號葡萄為第二等級,11、15、23號葡萄為第三等級,4、5、17、18、20、25、26、28號葡萄為第四等級。同時由以上分析可以看出,釀酒葡萄的理化指標與葡萄酒的質量有相關關系,一些理化指標比較好,釀出來的葡萄酒的品質也比較高。4.3問題三:分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系 由釀酒葡萄經過發(fā)酵后釀成葡萄酒,釀酒葡萄的理化指標經過

30、變化后變?yōu)槠咸丫浦械睦砘笜?,我們假設,葡萄酒的每一個理化指標都與釀酒葡萄和葡萄酒共有的所有理化指標有線性關系,并且共有指標的變化時由于其他指標的物理化學反應得到。線性關系可以用多元線性回歸法來處理。4.3.1多元線性回歸模型模型的建立多元線性回歸分析是在線性相關條件下,研究兩個或兩個以上自變量對一個因變量的數量變化關系。多元線性總體回歸方程為:系數的表示在其他自變量不變的情況下,自變量變動一個單位時引起的因變量的平均變動單位。其他回歸系數的含義類似。由于我們是對樣本的參數進行擬合估計,所以我們使用無常數項的多元線性樣本回歸方程:式中為的估計值。本模型中的自變量為釀酒葡萄中與葡萄酒共有的理化指

31、標,因變量為葡萄酒的理化指標。為因變量的序數。多元線性回歸方程中回歸系數的估計同樣可以采用最小二乘法。有殘差平方和。根據微積分中求極小值的原理,可知殘差平方和存在極小值。欲使SSE達到最小,對的偏導數必須等于零。將對求偏導數,并令其等于零,加以整理后可得到第個方程式: 通過求解這一方程組便可得到的估計值。另外,在實際求解回歸系數的估計值的過程中,由于自變量個數較多,計算十分復雜,也需要測定方程的擬合程度、檢驗回歸方程和回歸系數的顯著性。模型的求解經過SPSS中的多元線性擬合計算,我們得出了紅葡萄酒中的花色苷與紅釀酒葡萄各理化指標之間擬合的結果表。如圖20到圖25。圖20描述性統(tǒng)計量(紅葡萄酒中

32、花色苷)圖20中,第一行為因變量的參數,第二行以下為紅釀酒葡萄中10個自變量的參數。包括平均值、方差和個案數為27。圖21 相關性(紅葡萄酒中花色苷)圖21中列出了各個變量之間的相關性及顯著性檢驗結果,從中可以看出紅釀酒葡萄中的花色苷與紅葡萄酒中的花色苷之間的相關性最大。圖22 輸入/移去的變量(紅葡萄酒中花色苷)圖22中輸出的是被引入或從回歸方程中被剔除的各變量。該圖說明變量已全部引入。圖23 模型匯總(紅葡萄酒中花色苷)圖23輸出的是常用統(tǒng)計量。從這部分可以看出相關系數,判定系數,調整的判定系數,和越接近1說明回歸效果越好。圖24 方差分析表(紅葡萄酒中花色苷)從圖24中可以看出:統(tǒng)計量,

33、F越大說明自變量造成的因變量的變動遠遠大于隨機因素對因變量造成的影響,也就是說明回歸的效果越好;相伴概率值。說明多個自變量與紅葡萄酒中花色苷存在線性回歸關系,即我們先前的假設成立。圖25 擬合系數(紅葡萄酒中花色苷)符號說明:假設紅釀酒葡萄中的自變量依次為:花色苷,dpph,總酚,單寧,總黃酮,白藜蘆醇,L,a,b,芳香物質假設紅葡萄酒的各理化指標即因變量依次為:從圖中可以看出該多遠線性回歸方程為:。(花色苷,單寧,總酚,酒總黃酮,白藜蘆醇,DPPH,L,a,b,芳香物質)則該多元線性回歸方程為:上式即為紅葡萄酒中花色苷與紅釀酒葡萄理化指標之間的聯(lián)系。同理,根據同樣的分析方法,我們可以得到紅色

34、葡萄酒中其他的理化指標與紅釀酒葡萄之間的關系,以及白葡萄酒中的理化指標與白釀酒葡萄之間的關系。下面我們將給出結果,具體表格將由附錄中給出。假設白釀酒葡萄中的自變量依次為:(具體表格見附錄)(dpph,總酚,單寧,酒總黃酮,白藜蘆醇,L,a,b,芳香物質)另外,假設紅葡萄酒的各理化指標即因變量依次為:從圖中可以看出該多遠線性回歸方程為:。(單寧,總酚,酒總黃酮,白藜蘆醇,DPPH,L,a,b,芳香物質)則白葡萄酒中的理化指標與白釀酒葡萄之間的關系式為:根據這些等式,我們可以分析出葡萄酒的各參數與釀酒葡萄各參數之間的關系,拿上式來說,它反應白葡萄酒中的芳香類物質質量與紅釀酒葡萄各參數的線性關系,從

35、中我們可以看出,在同一單位的情況下,對白葡萄酒芳香類物質質量影響最大的是DPPH值、白藜蘆醇含量、A*值、B*值以及總酚值,他們中有些起促進作用,有些起抑制作用;也有一些系數較小的影響量,此處為了精確計算沒有略去,在大致估算時可以忽略這些參數簡化計算。4.4問題四:分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量首先,將自變量數據和因變量數據共同做成一個矩陣,進行因子分析并進行旋轉處理。因子分析是將多項指標重新組合成一組新的互相無關的幾個綜合指標,根據實際需要從中選取盡可能少的指標,已達到盡可能多的反映原指標信息的分析方法。通過SPSS因子分析旋轉處理后的結果如下圖。圖26 旋轉后因子與原指標的相關系數矩陣從上圖可以看出,經過整合,原自變量的個數由17個變成了5個,且每個因子與哪些自變量接近也已經在上圖中反應出,接下來我們將應用因子進行下一步的計算。接下來,我們使用多元線性回歸分析將感官得分作為因變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論