北京大學(xué)化學(xué)信息學(xué)_第1頁(yè)
北京大學(xué)化學(xué)信息學(xué)_第2頁(yè)
北京大學(xué)化學(xué)信息學(xué)_第3頁(yè)
北京大學(xué)化學(xué)信息學(xué)_第4頁(yè)
北京大學(xué)化學(xué)信息學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、課程內(nèi)容安排第十一講:Chemoinformatics分子結(jié)構(gòu)信息的計(jì)算機(jī)存儲(chǔ)和表達(dá)分子二維數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)檢索技術(shù)第十二講:Cheminformatics分子多樣性和化合物篩選三維結(jié)構(gòu)的實(shí)驗(yàn)數(shù)據(jù)資源基于三維結(jié)構(gòu)的計(jì)算方法化合物組合庫(kù)高通量虛擬篩選1化學(xué)信息學(xué)第十一講Chemoinformatics2內(nèi) 容相關(guān)名詞辨析及化學(xué)信息學(xué)由來(lái)分子結(jié)構(gòu)信息的計(jì)算機(jī)存儲(chǔ)和表達(dá)分子二維數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)檢索技術(shù)3名詞解釋 Computational Chemistry 計(jì)算化學(xué): 使用數(shù)學(xué)方法計(jì)算分子性質(zhì)和模擬分子行為的方法。并且包括合成設(shè)計(jì)、數(shù)據(jù)庫(kù)搜索、組合庫(kù)操作等 (Hopfinger, 1981; Ugi

2、et al., 1990). IUPAC Computational 4相關(guān)名詞辨析5名詞解釋 Molecular Modeling 分子建模方法: 使用計(jì)算化學(xué)和圖形顯示技術(shù)研究分子結(jié)構(gòu)和性質(zhì),從而獲得在給定環(huán)境下的分子三維結(jié)構(gòu)的近似表達(dá) IUPAC Medicinal Chemistry, IUPAC Computational6名詞解釋 Chemometrics 化學(xué)統(tǒng)計(jì)學(xué): 使用數(shù)理統(tǒng)計(jì)學(xué)的方法對(duì)化學(xué)信息(如有機(jī),分析和藥物化學(xué))進(jìn)行分析,或進(jìn)行化學(xué)實(shí)驗(yàn)的設(shè)計(jì)和模擬IUPAC Computational7名詞解釋 Bio-informatics 生物信息學(xué): 使用數(shù)理統(tǒng)計(jì)學(xué)的方法對(duì)化學(xué)

3、信息(如有機(jī),分析和藥物化學(xué))進(jìn)行分析,或進(jìn)行化學(xué)實(shí)驗(yàn)的設(shè)計(jì)和模擬IUPAC Computational8名詞解釋 Chemoinformatics ?: Chemoinformatics 是知識(shí)管理(knowledge management)的有機(jī)組成部分Nicholas J. Hrib, Norton P. PeetChemoinformatics: are we exploiting these new science?“Drug Discovery Today 5 (11): 483-485, Nov. 20009名詞解釋 Cheminformatics 化學(xué)信息學(xué): 結(jié)合化學(xué)合成、生

4、物篩選及數(shù)據(jù)挖掘技術(shù)指導(dǎo)藥物發(fā)現(xiàn)和開(kāi)發(fā), 用于合理的設(shè)計(jì)具有類(lèi)藥性質(zhì)的化合物,構(gòu)建用于虛擬高通量篩選的智能化合物庫(kù),研究以往的數(shù)據(jù)知道先導(dǎo)化合物的優(yōu)化Cheminformatics: Intelligent Drug Discovery May 28- 30, 2003 Philadelphia PA 1011Human Alcohol Dehydrogenase (Adh1A) 分類(lèi):Oxidoreductase簡(jiǎn)介:Molecule: Class I Alcohol Dehydrogenase 1, Subunit; Chain: A, B; Engineered: Yes實(shí)驗(yàn)方法:X-r

5、ay Diffraction12Human Alcohol Dehydrogenase (Adh1A) 13分子結(jié)構(gòu)信息的計(jì)算機(jī)存儲(chǔ)和表達(dá)如何使用計(jì)算機(jī)存儲(chǔ)化學(xué)結(jié)構(gòu)?如何處理存儲(chǔ)的結(jié)構(gòu)信息?計(jì)算機(jī)在Chemoinfomatics中的應(yīng)用?14分子結(jié)構(gòu)信息表達(dá)的內(nèi)容原子原子間的連接鍵型立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms15分子結(jié)構(gòu)信息表達(dá)的內(nèi)容原子原子間的連接鍵型立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms16分子結(jié)構(gòu)信息表達(dá)的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atom

6、s17分子結(jié)構(gòu)信息表達(dá)的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms18分子結(jié)構(gòu)信息表達(dá)的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms1920分子結(jié)構(gòu)一維表示法(Line Notation)簡(jiǎn)介:使用字符串表示分子結(jié)構(gòu)現(xiàn)有的幾種表示法Wiswesser Line Notation (WLN) (Dialog)Simplified Molecular Input Line System (SMILES/SMARTS) (Daylight)Representation of

7、Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein)Sybyl Line Notation (SLN)- (Tripos)ROSDAL1O-2=3O,2-4-5N,4-6-7=-12-7,10-13OSLNOHC(=O)CH(NH2)CH2C1=CHCH=C(OH)CH=CH1WLN QVYZ1R DQSMILESOC(=O)C(N)CC1=CC=C(O)C=C121分子結(jié)構(gòu)一維表示法(Line Notation)Simplified Molecular Input Line Entry System (SMILES) 基于價(jià)鍵模

8、型的標(biāo)記法Author: Dave Weininger (Daylight)22CMethaneC1CCCCC1cyclohexaneOwaterc1ccccc1benzeneCCethaneCOmethanolOC methanol NCH(C)C(=O)OCCOethanolCC(=O)CacetoneO=C=Ocarbon dioxideL-alanineSMILE標(biāo)記示例23atom : symbol sign 雙字母原子符號(hào): Br (Upper/lower case)原子的預(yù)定義價(jià)鍵:B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1),

9、 Cl(1), Br(1), I(1)大寫(xiě)的字母表示非芳香體系示例:ClHydrochloric acidSH2S Fe+Iron(II)cationAtoms 語(yǔ)法24Bond 語(yǔ)法bond : | - | = | # | . ; single | double | triple | disconnectionEthene C=CFormaldehyde C=OHydrogen Cyanide C#NButadiene C=CC=C25分支 將支鏈放在括號(hào)中SMILES: CCCC(C(=O)O)CCCbranch : ( ) | ( ) | ( ) | ( )26環(huán)定義 合環(huán)鍵用數(shù)字標(biāo)出2

10、7 非連接關(guān)系 (disconnections): 同位素表示:SMILES: Na+.O-c1ccccc1specified inside brackets. SMILES: 13CH4其它定義28F/C=C/FF/C=CF雙鍵構(gòu)型的表示 / 29從旋光中心沿字符串順序觀察,逆時(shí)針為,順時(shí)針為NC(C)(F)C(=O)O手性表示 or 30氫原子表示顯式表示氫原子的四種情況:帶電荷的氫, 如:質(zhì)子 H+ 與其它氫相連的氫, 如:氫氣 HH 氫橋同位素,如:重水, 2HO2H 31芳香性N1ccccc1 N1=CC=CC=C1C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C1

11、32O-n+1ccccc1pyridine-N-oxideOCH1CCCCCH1Ocis-resorcinolCC(C)NCC(O)COc1cccc2ccccc12Propranolol a beta-blocker一些例子33SMILES的正規(guī)化標(biāo)記c1ccccc1Oc2ccccc2(N)Nc2ccccc2Oc1ccccc1O(c1ccccc1)(c2ccccc2N)Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 34分子結(jié)構(gòu)一維表示法(Line Notation)優(yōu)點(diǎn):易于手工書(shū)寫(xiě)結(jié)構(gòu)緊湊局限:信息量小對(duì)復(fù)雜分子的標(biāo)記比較繁

12、瑣。某些情況下,標(biāo)記具有二義性。35分子結(jié)構(gòu)一維表示法的應(yīng)用構(gòu)造查詢語(yǔ)言子結(jié)構(gòu)匹配相似性搜索(結(jié)構(gòu)指紋)化合物組合庫(kù)的壓縮存儲(chǔ)反應(yīng)數(shù)據(jù)庫(kù)36SMILES 應(yīng)用示例ClogP 辛醇/水分配系數(shù)實(shí)驗(yàn)方法logP計(jì)算 pH 7.0時(shí)的分配系數(shù)數(shù)據(jù)庫(kù)規(guī)模 = 2,000,000化合物工作站搜索速度= 500,000/s37ClogP的計(jì)算使用片斷加和法 (片斷值校正項(xiàng))片斷值基于實(shí)驗(yàn)值,與片斷的類(lèi)型有關(guān),如:極性基團(tuán)、鹵素、離子、不飽和鍵校正項(xiàng)描述不同片斷間的相互作用,如:氫鍵等383940分子結(jié)構(gòu)信息的計(jì)算機(jī)存儲(chǔ)和表達(dá)分子結(jié)構(gòu)二維表示法連接表 (Connection Table)鄰接矩陣 (Adja

13、cency Table)41連接表 (Connection Table)簡(jiǎn)介:計(jì)算機(jī)系統(tǒng)中主流結(jié)構(gòu)表示方法類(lèi)型 “內(nèi)部” CTs (內(nèi)存) 程序處理“外部” CTs (磁盤(pán)文件)文件存儲(chǔ) 數(shù)據(jù)交換42“Redundant” Connection TableO1 2 1C0 1 1 3 2 4 1O0 2 2C 1 2 1 5 1 6 1N2 4 1C2 4 1 7 1C0 6 1 8 212 1C1 7 2 9 1C1 8 110 2C0 9 211 113 1C110 112 2C111 2 7 1O110 143MDL Connection Table數(shù)據(jù)交換的事實(shí)標(biāo)準(zhǔn)衍生文件格式Molf

14、ile (single molecule)SDfile (set of molecules and data)RGfile (Markush structure)Rxnfile (single reaction)RDfile (set of reactions with data)示例44benzene WLViewer 3D 0 12 12 0 0 0 0 0 0 0 0 0 1.1202 0.0003 0.0002 C 0 0 0 0 0 0 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0 3.

15、8522 0.0006 -0.0007 C 0 0 0 0 0 0 3.1691 -1.1823 0.0001 C 0 0 0 0 0 0 1.8034 -1.1829 -0.0003 C 0 0 0 0 0 0 0.1202 0.0002 0.0011 H 0 0 0 0 0 0 1.3028 2.0494 -0.0011 H 0 0 0 0 0 0 3.6690 2.0500 -0.0001 H 0 0 0 0 0 0 4.8522 0.0005 -0.0015 H 0 0 0 0 0 0 3.6692 -2.0482 0.0010 H 0 0 0 0 0 0 1.3036 -2.0490

16、 -0.0010 H 0 0 0 0 0 0 1 2 4 0 0 0 1 6 4 0 0 0 2 3 4 0 0 0 3 4 4 0 0 0 4 5 4 0 0 0 5 6 4 0 0 0 1 7 1 0 0 0 2 8 1 0 0 0 3 9 1 0 0 0 4 10 1 0 0 0 5 11 1 0 0 0 6 12 1 0 0 0M END45其它CTs格式Standard Molecular Data (SMD) formatnever gained wide acceptanceProtein Data Bank (PDB) formatCrystallographic Inform

17、ation File (CIF)Molecular Information File (MIF) developed from SMD and compatible with CIFChemical Exchange Format (CXF) Chemical Abstracts ServiceChemical Markup Language (CML)for data exchange using the InternetIChI (IUPAC Chemical Identifier) 46分子結(jié)構(gòu)信息的計(jì)算機(jī)存儲(chǔ)和表達(dá)分子結(jié)構(gòu)三維表示法三維坐標(biāo)文件 (Mol, XYZ, SD )內(nèi)部坐標(biāo)表

18、示法 (Z-Matrix)47benzene WLViewer 3D 0 12 12 0 0 0 0 0 0 0 0 0 1.1202 0.0003 0.0002 C 0 0 0 0 0 0 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0 3.8522 0.0006 -0.0007 C 0 0 0 0 0 0 3.1691 -1.1823 0.0001 C 0 0 0 0 0 0 1.8034 -1.1829 -0.0003 C 0 0 0 0 0 0 0.1202 0.0002 0.0011 H

19、0 0 0 0 0 0 1.3028 2.0494 -0.0011 H 0 0 0 0 0 0 3.6690 2.0500 -0.0001 H 0 0 0 0 0 0 4.8522 0.0005 -0.0015 H 0 0 0 0 0 0 3.6692 -2.0482 0.0010 H 0 0 0 0 0 0 1.3036 -2.0490 -0.0010 H 0 0 0 0 0 0 1 2 4 0 0 0 1 6 4 0 0 0 2 3 4 0 0 0 3 4 4 0 0 0 4 5 4 0 0 0 5 6 4 0 0 0 1 7 1 0 0 0 2 8 1 0 0 0 3 9 1 0 0 0

20、 4 10 1 0 0 0 5 11 1 0 0 0 6 12 1 0 0 0M END48Methanol Z-matrix C O 1 l1 H 1 l2 2 a1 H 1 l3 2 a2 3 da1 H 1 l3 2 a2 3 -da1 H 2 l4 1 a3 3 180.0 l1 1.42 l2 1.09 l3 1.09 l4 1.09 l5 1.09 l6 1.0 a1 109.0 a2 110.0 a3 108.0 a4 110.0 a5 110.0 da1 60.0 da2 120.0 da3 60.0z-matrix49分子芳香性問(wèn)題使用單雙鍵交替表示法導(dǎo)致同一分子有不同的拓?fù)?/p>

21、表示法,以及其它問(wèn)題解決方式:使用芳香鍵類(lèi)型使用規(guī)一化的原子鍵類(lèi)型50共振結(jié)構(gòu)是否看作同一分子?答案是你期望如何處理使用規(guī)一化的鍵型使用單雙鍵交替法51共振結(jié)構(gòu)共振式定義的方法HQX=R Q=XRHQ, X or R只能是特定原子keto-enol 共振結(jié)構(gòu)CA不能正確識(shí)別單一的不飽和碳鏈Daylight不能正確識(shí)別52結(jié)構(gòu)習(xí)慣規(guī)則有時(shí)稱 “business rules”某些化學(xué)基團(tuán)的不同表示法習(xí)慣規(guī)則確定哪一種更合適需要軟件進(jìn)行轉(zhuǎn)換53Stereochemistrydifferent compounds with identical connectivitysame topology, di

22、fferent topographyS-tyrosineR-tyrosine54立體化學(xué)不同的表示法上下鍵Cahn, Ingold, Prelog (CIP) designators (R, S, E, Z)基于文本的描述符 (光學(xué)旋光)55立體化學(xué): 上下鍵給圖的節(jié)點(diǎn)著色很多連接表格式包含特殊的上下鍵表示需要確定連接的原子便于生成圖形顯示可以轉(zhuǎn)換成其它手性定義56上/下鍵問(wèn)題不同的上/下鍵表示可能是同一手性分子 不同的圖,相同的分子某些上下鍵組合并不足以確定手性57Stereochemistry: CIP designatorsR.S. Cahn, C. Ingold, and V. Pre

23、log, Angewandte Chemie Intl. Ed. in English 1966, 5, 385-551one-letter designator for stereocentersbased on rules assigning priorities to groups around ittetrahedral carbons (R, S)double bonds (E, Z)additional colors for graph nodes or edgesuseful for distinguishing stereoisomers when absolute confi

24、guration is knownless useful for matching parts of structures (substructure search) as priority rules can cause designator to change when remote part of structure is changed58其它復(fù)雜情況有機(jī)金屬和配合物復(fù)雜立體化學(xué)特殊鍵型共價(jià)或離子鍵型不確定 “business rules” 無(wú)機(jī)物沒(méi)有象有機(jī)物類(lèi)似的明確拓?fù)潢P(guān)系部分組成為分?jǐn)?shù)晶體結(jié)構(gòu)59其它復(fù)雜情況氫橋二茂鐵可能的解決方法鍵連接任意一個(gè)碳原子鍵連所有5個(gè)碳原子鍵連一個(gè)環(huán)中心的偽原子(dummy atom)60生物大分子使用縮寫(xiě)描述基本單元61生物大分子每個(gè)縮寫(xiě)具有預(yù)定義的連接點(diǎn)混合表示法定義新的縮寫(xiě)62聚合物聚合物的性質(zhì)與聚合條件有關(guān)重復(fù)單元

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論