版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二節(jié) 化學(xué)信息處理,化學(xué)信息學(xué),產(chǎn)生的背景 組合化學(xué)和高通量篩選,出現(xiàn)了巨大的信息,需要快速收集、存儲、分析和處理,隨著信息技術(shù)向化學(xué)領(lǐng)域的滲透,形成了新的交叉學(xué)科化學(xué)信息學(xué)。 研究內(nèi)容 化合物信息在計算機中的表示 化合物數(shù)據(jù)庫的建立、使用和管理 化合物相似性、多樣性及分子類藥性分析 化合物定量構(gòu)效關(guān)系,化學(xué)信息學(xué) Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics,利用計算機信息處理技術(shù)對化學(xué)分子結(jié)構(gòu)和相關(guān)信息進行管理的一種綜合性技術(shù)和學(xué)科 應(yīng)用化學(xué)信息學(xué)可促進化學(xué)信息的獲取、轉(zhuǎn)化與共享,一、化學(xué)信
2、息的表示方法,化學(xué) 分子,一維結(jié)構(gòu):化合物名稱(俗名);線性符號表示法。,二維結(jié)構(gòu):原子用元素符號,鍵用短線,即化合物結(jié)構(gòu)式。為平面結(jié)構(gòu)。,三維結(jié)構(gòu):原子的空間位置、相互間距離、鍵角和二面角等。,分子表面:建立在三維結(jié)構(gòu)基礎(chǔ)上,能與分子的三維結(jié)構(gòu)一一對應(yīng)。,苯丙氨酸分子結(jié)構(gòu)表征層次,(一)一維結(jié)構(gòu)表示,SMILES(簡化分子線性輸入系統(tǒng))編碼的基本原則,原子通常以大寫元素符號表示(省略氫原子),芳香結(jié)構(gòu)原子則以小寫表示。 相鄰原子依次排放在一起,單鍵通常省略,雙鍵和三鍵分別以“=”和“#”表示,芳香鍵以“:”表示,也可省略。 分支部分放在括號內(nèi),環(huán)則打開,并賦予斷開鍵兩端的原子以相同的數(shù)值。
3、雙鍵“/”表示順式,“”表示反式。 原子順時針排列用表示,逆時針排列用表示。,甲烷 CH4 C 乙醇 C2H5OH CCO 氰化氫 HCN C#N 環(huán)已烷 C6H12 C1CCCCC1 吡啶 C5H5N n1ccccc1 異丁酸 (CH3)2CHCO2H CC(C)C(=O)O 反式二溴甲烷 Br/C=C/Br 或BrC=CBr 順式二溴甲烷 BrC=C/Br 或Br/C=CBr L-丙氨酸 NCH(C)C(=O)O D-丙氨酸 NCH(C)C(=O)O,舉例說明,苯丙氨酸,NC(Cc1ccccc1)C(O)=O,C/C=CC=CH(O)C#N,SMILES編碼的立體化學(xué)信息表示,SLN編碼(
4、Sybyl線性標(biāo)記法)的規(guī)則,原子以其元素符號表示,氫原子也要顯示; 單鍵省略,雙鍵、三鍵和芳香鍵分別以“=” “#”和“:”表示; 分支也采用括號表示;環(huán)也打開,依靠環(huán)上一個預(yù)先定義好的具有唯一編號的原子及符號來識別,如環(huán)己烷表示為C15H2CH2CH2CH2CH2CH215; 原子和鍵的屬性(如電荷、立體化學(xué)性質(zhì)等)可通過方括號 或尖括號在該原子后標(biāo)記出; 對大分子的原子,可使用縮寫,如氨基酸可以用其三個字母縮寫形式表示。,(二)二維結(jié)構(gòu)表示,1、圖論基礎(chǔ)和圖的矩陣表示 一個簡單的圖由頂點(V)和邊(E)組成,因此圖被定義為一個三元組, 為映射函數(shù)。在下面一個簡單的無向圖中, V=1,2,
5、3,4, E=e1,e2,e3,e4, e5, e6。,圖也可用矩陣表示:設(shè)G=為無向圖,令mij等于頂點vi與邊ej的關(guān)聯(lián)次數(shù),則稱(mij)n*m為G的關(guān)聯(lián)矩陣,記為M(G)。,用圖表示苯丙氨酸的結(jié)構(gòu),2、化合物結(jié)構(gòu)的矩陣表示 (1)鄰接矩陣(以乙醛為例),(2)距離矩陣:表示了相應(yīng)原子之間的距離:幾何距離(用表示), 拓?fù)渚嚯x(兩原子之間連接的鍵的個數(shù)) (3)鍵矩陣:矩陣元素為相連接的兩個原子之間的鍵級。 雙鍵:2,三鍵:3。 (4)關(guān)聯(lián)矩陣:是一個nm的矩陣。 頂點(原子)作為列(n),邊(化學(xué)鍵)作為行(m), 如果邊在頂點內(nèi),則相應(yīng)的元素置為1。,3、連接表,20世紀(jì)80年代開始
6、,成為化合物在計算機中表示的最主要方法。 首先對每個原子進行編號并列表 然后在另一表格中列出鍵的信息, 鍵級用整數(shù)表示,1表示單鍵,2表示雙鍵。,(三)三維結(jié)構(gòu)表示,1、直接坐標(biāo)法 用迪卡爾坐標(biāo)直接存儲每個原子的三維坐標(biāo)(x,y,z),2、內(nèi)坐標(biāo)法,每個原子位置以與其他原子間的3個相對位置關(guān)系表示相對距離、鍵角、二面角,(四)分子存儲格式及其相互轉(zhuǎn)換,基本存儲 分子的元素組成、原子坐標(biāo)、原子連接關(guān)系 其他存儲 分子子結(jié)構(gòu)信息,適用于生物大分子 原子電荷信息,調(diào)用時不必再計算 確定特定原子化學(xué)環(huán)境的原子類型信息,二、化合物數(shù)據(jù)庫的生產(chǎn)和管理,目前有很多商業(yè)化合物數(shù)據(jù)庫可以利用 MDL藥物數(shù)據(jù)報告
7、(MDDR)含有115000個類藥性 化合物。 美國國家癌癥研究所(NCI)數(shù)據(jù)庫含有250000個 化合物。,MDL ISIS化學(xué)數(shù)據(jù)庫管理系統(tǒng),ISIS系統(tǒng)提供了基于Oracle 數(shù)據(jù)庫系統(tǒng)的各類化學(xué)信息系統(tǒng)的管理和開發(fā)工具,可以同時管理化學(xué)結(jié)構(gòu)、化學(xué)反應(yīng)、生物活性及譜圖等多種化學(xué)信息。 ISIS已應(yīng)用于全球超過80%的化學(xué)與制藥企業(yè),已成為事實上的化學(xué)信息管理系統(tǒng)的工業(yè)標(biāo)準(zhǔn)。,ISIS (Integrated Scientific Information Management System)MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件,由三個主要模塊組成: (1) 化學(xué)信息管理系統(tǒng):ISIS/HOS
8、T主服務(wù)器應(yīng)用程序,進行通訊連接,集中數(shù)據(jù)庫數(shù)據(jù)并作處理 (2) 化學(xué)信息生成和管理軟件:ISIS/BASE用于生成局部數(shù)據(jù)庫及處理信息 (3) 化學(xué)畫圖軟件:ISIS/DRAW用于輸入結(jié)構(gòu)式和搜尋詢問條件,2D結(jié)構(gòu)輸入,計算機繪制化學(xué)結(jié)構(gòu)式 首先輸入原子和鍵的骨架結(jié)構(gòu),原子數(shù)、電荷會自動變?yōu)樯舷聵?biāo) 軟件的模板中收集大量分子片段 可智能分析結(jié)構(gòu)式,處理結(jié)構(gòu)式的編碼和變換 還可有附加功能,如自動命名、化學(xué)計算、光譜分析等,三維結(jié)構(gòu)的轉(zhuǎn)化,3D結(jié)晶結(jié)構(gòu)參數(shù)轉(zhuǎn)入3D數(shù)據(jù)庫,軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型,三、分子相似性和多樣性分析,分子相似性和多樣性分析方法的原則:結(jié)構(gòu)相似的分子有著相似的性質(zhì)
9、或活性。 作用:在識別新的具有與已知化合物相同性質(zhì)或活性的化合物時具有十分重要的作用。 數(shù)據(jù)庫的化學(xué)多樣性(chemical diversity): 數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)適用于先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學(xué)相似性(chemical similarity) 適用于先導(dǎo)化合物優(yōu)化 評價方法:通過計算分子的描述符,并比較化合物描述符的近似程度。,分子描述符,概念:在相似性和多樣性分析中,需要建立化合物結(jié)構(gòu)和它們生 物活性或者理化性質(zhì)的映射,分子描述符就是其中的一種映射。 作用:通常一個或多個描述符可以用來描述分子的結(jié)構(gòu)、性質(zhì)等, 如lgP在一定程度上反映了分子穿透細(xì)胞膜的能力;拓?fù)渲笖?shù)
10、描述 了結(jié)構(gòu)的復(fù)雜性。 描述符的內(nèi)容是由兩方面決定的,一是化合物的分子表示,二是計 算描述符的算法。,分子描述的分類,分子相似性分析方法,基于定性特征的和基于定量特征的。 對于兩個化合物A和B, a是A所具有而B不具有的特征數(shù)目 b是B所具有而A不具有的特征數(shù)目 c是兩者共同的特征數(shù)目 d為兩者都不具有的特征數(shù)目 c和d表示了化合物A和B之間的相似性 a和b表示了化合物A和B之間的多樣性 所有的特征數(shù)目為n=a+b+c+d 這樣,可以建立一種直觀的相似性評價方法:考察所有匹配的特征數(shù)目c+d在所有特征數(shù)目(c+d)+(a+b)中所占的比例,即(c+d)/(a+b+c+d)。這也被稱作為簡單匹配
11、系數(shù)。 可以看出,A和B均不具有的特征并沒有表達任何信息,所以,d可以從上面的方法中刪除,得到了Tanimoto相似度計算公式。,化學(xué)多樣性的定量表達Tanimoto系數(shù),用化學(xué)空間中電荷和電勢等描述符比較不同分子的性質(zhì) TC = c /(a+b+c) a為A中基礎(chǔ)片斷的描述符的數(shù) b為B中基礎(chǔ)片斷的描述符的數(shù)目 c為A和B中共有的基礎(chǔ)片斷的描述符的數(shù)目 相同分子TC = 1;分子沒有共同描述符時TC = 0,相似性搜尋,根據(jù)分子相似性原理,可以在數(shù)據(jù)庫中搜尋與目標(biāo)分子具有一定相似性的分子,即相似性搜尋。 步驟: 1、目標(biāo)選擇 2、描述符選擇和編碼 3、相似性評價方法選擇 4、搜尋語句的輸入 5、相似性打分,四、互聯(lián)網(wǎng)上的化學(xué)信息資源,(一)化學(xué)搜索引擎 1、大型通用搜索引擎:Google、百度等。 2、專門用于搜索化學(xué)信息的引擎:ChemFinder, MetaXchem. (二)互聯(lián)網(wǎng)上的化學(xué)數(shù)據(jù)庫 1、文獻數(shù)據(jù)庫(CA、Medline) 2、化合物數(shù)據(jù)庫(Gmelin, CSD) 3、綜合數(shù)據(jù)庫(Beilstein、PDB),常用化合物數(shù)據(jù)庫,FCD (Fine Chemicals Directory) MDL 維護。收載約90 000化合物和20 000化合物數(shù)據(jù),包括化學(xué)系統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度舊環(huán)保設(shè)備買賣與運營維護合同3篇
- 二零二五年度建筑廢棄物綜合利用合同3篇
- 計算思維課程設(shè)計
- 海南醫(yī)學(xué)院《生物醫(yī)學(xué)工程倫理及政策法規(guī)》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五年度抵債資產(chǎn)轉(zhuǎn)讓與受讓合同3篇
- 海南師范大學(xué)《武術(shù)教學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 照明電氣設(shè)計課程設(shè)計
- 2025年度生態(tài)農(nóng)業(yè)園區(qū)綠化種植與生態(tài)保護合同3篇
- 二零二五年度安置房租賃中介服務(wù)合同
- 算法課程設(shè)計2048
- 有關(guān)企業(yè)會計人員個人工作總結(jié)
- 2023年咸陽市市級事業(yè)單位選聘筆試真題
- 廣西燃?xì)獍踩珯z查標(biāo)準(zhǔn) DBJ T45-1472-2023(2023年7月1日實施)
- 2024年防災(zāi)科技學(xué)院漢語言文學(xué)專業(yè)《現(xiàn)代漢語》期末試卷A(有答案)
- 多旋翼無人機駕駛員執(zhí)照(CAAC)備考試題庫大全-下部分
- 水務(wù)集團定崗定員方案范文
- 期末核心素養(yǎng)測評卷2023-2024學(xué)年語文五年級上冊+統(tǒng)編版
- 上海八年級數(shù)學(xué)上期末幾何提優(yōu)題目集錦
- DB32T3494-2019灌漿復(fù)合瀝青路面施工技術(shù)規(guī)范
- 2024年石油石化技能考試-石油鉆井工筆試參考題庫含答案
- DLT 5175-2021 火力發(fā)電廠熱工開關(guān)量和模擬量控制系統(tǒng)設(shè)計規(guī)程-PDF解密
評論
0/150
提交評論