爆炸下限定量構(gòu)效關(guān)系_第1頁
爆炸下限定量構(gòu)效關(guān)系_第2頁
爆炸下限定量構(gòu)效關(guān)系_第3頁
爆炸下限定量構(gòu)效關(guān)系_第4頁
爆炸下限定量構(gòu)效關(guān)系_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、化學物質(zhì)爆炸下限定量構(gòu)效關(guān)系研究研究意義QSPR基本原理和基本研究步驟研究概況本論文研究工作模型預測結(jié)果比較分析及結(jié)論主要內(nèi)容主要內(nèi)容 爆炸下限是物質(zhì)爆炸危險性的重要評價參數(shù),但實際工業(yè)的爆炸下限數(shù)據(jù)庫空白很多,傳統(tǒng)的實驗方式無法保證所獲結(jié)果的可靠性、準確性、一致性,而且往往測量昂貴且費時。 運用定量構(gòu)效關(guān)系(QSPR)預測的方法既能夠方便迅速獲得爆炸下限數(shù)據(jù),而且能保證結(jié)果的可靠性,還能通過已有的預測模型獲得新物質(zhì)的爆炸下限值,同時能得到分子結(jié)構(gòu)中影響爆炸下限的主要因素。研究意義英文全稱為:Quantitative Structure-property Relationship,QSPR中文

2、簡稱定量構(gòu)效關(guān)系兩條基本假設(shè): 分子性質(zhì)的變化依賴于其結(jié)構(gòu)的變化; 分子的結(jié)構(gòu)可以用反映分子結(jié)構(gòu)特征的各種參 數(shù)來描述,即化合物的性質(zhì)可以用化學結(jié)構(gòu)的函數(shù)來表示。 QSPR基本原理QSPR基本原理 可見,可見,QSPRQSPR方法是一個不完全歸納法的分析過程:由方法是一個不完全歸納法的分析過程:由已知的結(jié)構(gòu)性質(zhì)樣本出發(fā)先建立模型,再利用所建立的模已知的結(jié)構(gòu)性質(zhì)樣本出發(fā)先建立模型,再利用所建立的模型對新樣本進行預測。型對新樣本進行預測。圖1 QSPR基本原理 所需要僅僅是分子的結(jié)構(gòu)信息分子的結(jié)構(gòu)信息及目標性質(zhì)的實驗數(shù)目標性質(zhì)的實驗數(shù)據(jù)據(jù),通過對計算出來的分子的各種結(jié)構(gòu)參數(shù)和實驗性質(zhì)進行統(tǒng)計分析統(tǒng)

3、計分析,建立分子的結(jié)構(gòu)參數(shù)和所研究的性質(zhì)之間的定定量關(guān)系量關(guān)系 ,達到預測的目的。 QSPR基本原理 QSPR基本步驟數(shù)據(jù)的獲得和整理(DIPPR)預測模型的建立(HM,B-MLR,SVM) 模型的檢驗(R2,AARD(%),RMSE,Q2ext) 分子結(jié)構(gòu)的輸入和優(yōu)化(Hyperchem8.0)分子描述符的計算 (Codessa)分子描述符的選擇(HM,B-MLR)圖2 QSPR研究的基本步驟 QSPR基本步驟分子描述符的計算分子描述符的計算分子描述符:即分子結(jié)構(gòu)參數(shù),是一個分子的數(shù)學表征,可 以以數(shù)學的方式表示了每一個分子的特征,包含了分子的各種結(jié)構(gòu)信息。描述符計算其實就是把分子結(jié)構(gòu)轉(zhuǎn)換為

4、數(shù)值信息的過程 主要有六種:組成描述符,幾何描述符,拓撲描述符,靜電描述符,量子化學描述符,熱力學描述符 QSPR基本步驟分子描述符的選擇分子描述符的選擇增加計算復雜性,偶然相關(guān),不穩(wěn)健,自相關(guān)造成內(nèi)部冗余關(guān)鍵問題關(guān)鍵問題:從大量的描述符中選擇出與目標性質(zhì)最緊密相關(guān)的參數(shù),最好是用盡可能少的變量來表征盡可能多的結(jié)構(gòu)信息。常用篩選方法:啟發(fā)式方法(HM),逐步回歸法,遺傳算法,變量最優(yōu)子集回歸法,神經(jīng)網(wǎng)絡(luò)法,模擬退火法等。QSPR基本步驟預測模型的建立預測模型的建立訓練集和測試集的劃分 訓練集用于建立預測模型,測試集用于測試所建立的模型的預測能力。建模方法 (線性關(guān)系,非線性關(guān)系) 判別分析,主

5、成分分析,因子分析,線性回歸,主成分回歸分析,偏最小二乘法,人工神經(jīng)網(wǎng)絡(luò),遺傳算法,支持向量機以及投影尋蹤回歸等。 本次研究建模采用線性回歸方法里的啟發(fā)式回歸本次研究建模采用線性回歸方法里的啟發(fā)式回歸(HM)(HM)和和最佳多元線性回歸以及非線性方法里的支持向量機最佳多元線性回歸以及非線性方法里的支持向量機(SVM)(SVM)。 QSPR基本步驟模型的檢驗?zāi)P偷臋z驗內(nèi)檢驗:通過訓練集檢驗?zāi)P偷慕D芰D芰Γ〝M合能力和穩(wěn)健能力);外檢驗:通過測試集檢驗?zāi)P偷念A測能力預測能力,即用已建立的訓練模型來預測未參與模型訓練的物質(zhì)的性質(zhì)?!傲粢环ā苯换ヲ炞C(LOO-CV)RMSE,AARD泛化能力及預

6、測精度泛化能力及預測精度;F檢驗值、t檢驗值模型的顯著性問模型的顯著性問題題(公式見論文第9頁)。 20022200iiiiyyyyRyyyy2021211trainingiilootrainingiiiyyQyy 20212()11testiiexttestii triyyQyy 研究概況研究概況 爆炸下限預測模型研究概況 與燃燒熱、化學計量濃度等關(guān)聯(lián), 人工神經(jīng)網(wǎng)絡(luò)方法(臨界溫度、臨界壓力等) 基團貢獻法 預測方法研究概況 基團貢獻法,經(jīng)驗公式法,QSPRQSPR 不足 優(yōu)勢優(yōu)勢目前預測理化性質(zhì)的趨勢目前預測理化性質(zhì)的趨勢 本論文研究工作 擬對113種烴類物質(zhì)進行定量構(gòu)效關(guān)系研究,建立烴類

7、物質(zhì)的爆炸下限預測模型,并探究影響物質(zhì)爆炸下限性質(zhì)的主要結(jié)構(gòu)因素。主要研究內(nèi)容有: 分別用QSPR的三種建模方法建立預測模型 計算各參數(shù),評價模型效果(R2、RMSE、 AARD、Q2ext ) 比較分析三個預測模型 探究分子結(jié)構(gòu)中影響爆炸下限的主要因素 模型預測 HM模 B-MLR模型 SVM模型 線性建模及分子描述符計算在CODESSA軟件中完成,而SVM的建模及相關(guān)計算在MATLAB軟件中完成。最后在MATLAB軟件中計算各個模型的R2、AARD、Q2loo、Q2ext,RMSE,并將三個預測模型進行比較討論分析。 HM模型啟發(fā)式回歸(啟發(fā)式回歸(HMHM)方法篩選描述符原則)方法篩選描

8、述符原則: 1)不是每個化合物都有的參數(shù); 2)對所有化合物來說,數(shù)值變化比較小的描述符; 3)在一個參數(shù)相關(guān)方程中,F(xiàn)檢驗值小于1.0的參數(shù); 4)t檢驗值小于某一定義值的描述符。 HM模型 具有4個描述符的集合為最佳描述符集,其所對應(yīng)的模型即為最佳模型 圖3 HM方法篩選最佳描述符集HM模型表2 HM方法的分子描述符篩選結(jié)果信息 表3 HM模型中的分子描述符統(tǒng)計學參數(shù) HM模型所得訓練模型:LFL=1.4230+0.0218X1-0.3074X2-0.02085X3-0.01227X4 內(nèi)部檢驗內(nèi)部檢驗: R2=0.9773 Q2loo=0.9773 AARD=4.3483% RMSE=0

9、.05 F=902.61 n=89穩(wěn)健性、擬合能力及穩(wěn)健性、擬合能力及精度均較好精度均較好圖4 HM方法的訓練模型的預測值和實驗值的比較 圖5 HM模型對測試集所得預測值與實驗值的比較 HM模型 HMHM預測模型效果令人滿意預測模型效果令人滿意外部檢驗外部檢驗:R2=0.9534,AARD=4.4828%,RMSE=0.0685,Q2ext=0.9564 預測能力、泛化能力、預測精度均較好預測能力、泛化能力、預測精度均較好B-MLR模型B-MLRB-MLR篩選描述符原則:篩選描述符原則: 1)對剩余的描述符做相關(guān)分析,搜取所有計算出的正交描述符i,j 2)用這些描述符與性質(zhì)關(guān)聯(lián)得到二元線性方程

10、,篩選出Nc(=400)個方程(有較大判定系數(shù))進行進一步的回歸分析; 3)向方程中加入非共線描述符k成為三參數(shù)模型,如果三參數(shù)模型的F值小于最佳的兩參數(shù)模型的F值,兩參數(shù)模型為最后結(jié)果,反之,保存最佳三參數(shù)模型(最大判定系數(shù))并用于下一步計算; 4)向方程中再次加入非共線性描述符,類似于第三步,把得到的(n+1)參數(shù)模型F值與最佳的兩參數(shù)模型的F值比較。 B-MLR模型圖6 B-MLR方法篩選最佳描述符集 具有4個描述符的集合為最佳描述符集,其所對應(yīng)的模型即為最佳模型 表5 B-MLR模型中的分子描述符統(tǒng)計學參數(shù) B-MLR模型表4 B-MLR方法的分子描述符篩選結(jié)果信息 B-MLR模型所得

11、訓練模型:LFL=1.4565-0.3145Y1+6.5291Y2-0.02048Y3-0.002037Y4 內(nèi)部檢驗內(nèi)部檢驗: R2=0.9777 Q2loo=0.9777 AARD=4.3437% RMSE=0.0496 F=919.04 n=89穩(wěn)健性、擬合能力及穩(wěn)健性、擬合能力及精度均較好精度均較好圖7 B-MLR方法的訓練模型的預測值和實驗值的比較B-MLR模型外部檢驗外部檢驗:R2=0.9522,AARD=4.5851%,RMSE=0.0696,Q2ext=0.9549 預測能力、泛化能力、預測精度均較好預測能力、泛化能力、預測精度均較好B-MLRB-MLR預測模型效果預測模型效果

12、 令人滿意令人滿意圖8 B-MLR模型對測試集所得預測值與實驗值的比較SVM模型 重要參數(shù): 核函數(shù)的類型、懲罰常數(shù)C、-不敏感損失函數(shù)中、核函數(shù)寬度參數(shù)及它們的組合。本次研究中支持向量機分析主要采用改進的svm加強工具箱結(jié)合MATLAB2009來運行,以B-MLR方法所選擇的4個分子描述符作為輸入?yún)?shù)。選擇RBFRBF徑向基函數(shù)徑向基函數(shù)作為核函數(shù),烴類物質(zhì)的爆炸下限數(shù)據(jù)先經(jīng)過0,1范圍的歸一化處理,采用格點搜索的方法格點搜索的方法選擇最佳的參數(shù)組合。 SVM模型最優(yōu)參數(shù)為:懲罰系數(shù)C=22.6274,核函數(shù)的寬度=0.0032725, -不敏感損失函數(shù)=0.125 訓練模型:R2=0.9782,Q2loo=0.9782,AARD=3.8031%,RMSE=0.0490,n=89 測試集外部驗證:R2=0.9559,AARD=4.6680%,RMSE=0.0696,Q2ext=0.9549。圖9 SVM訓練模型的預測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論