蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)_第1頁(yè)
蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)_第2頁(yè)
蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)_第3頁(yè)
蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)_第4頁(yè)
蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)第1頁(yè),共59頁(yè),2023年,2月20日,星期四目錄4.3.1PDB數(shù)據(jù)庫(kù)4.3.2MMDB數(shù)據(jù)庫(kù)4.3.3SCOP數(shù)據(jù)庫(kù)4.3.4DSSP數(shù)據(jù)庫(kù)第2頁(yè),共59頁(yè),2023年,2月20日,星期四引言第3頁(yè),共59頁(yè),2023年,2月20日,星期四4.3.1PDB數(shù)據(jù)庫(kù)1.簡(jiǎn)介

美國(guó)Brookhaven實(shí)驗(yàn)室1971年建立的大分子結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB蛋白質(zhì)晶體結(jié)構(gòu)資料數(shù)據(jù)庫(kù)

(ProteinDataBank)。

PDB數(shù)據(jù)庫(kù)的維護(hù)由結(jié)構(gòu)生物信息學(xué)研究合作組織(ResearchCollaborationforStructuralBioinformatics,RCSB)負(fù)責(zé)。第4頁(yè),共59頁(yè),2023年,2月20日,星期四2.數(shù)據(jù)來(lái)源

通過(guò)實(shí)驗(yàn)(X射線晶體衍射,核磁共振,電子顯微鏡方法等)測(cè)定的生物大分子的三維結(jié)構(gòu)。主要是蛋白質(zhì)的三維結(jié)構(gòu),還包括核酸、糖類、蛋白質(zhì)與核酸復(fù)合物的三維結(jié)構(gòu)。第5頁(yè),共59頁(yè),2023年,2月20日,星期四3.數(shù)據(jù)統(tǒng)計(jì)截止2008年4月,PDB數(shù)據(jù)庫(kù)已含有50277個(gè)結(jié)構(gòu)數(shù)據(jù),其中約93%是蛋白質(zhì)的結(jié)構(gòu)。第6頁(yè),共59頁(yè),2023年,2月20日,星期四第7頁(yè),共59頁(yè),2023年,2月20日,星期四Other包括

proteinsnucleicacidscomplexesX-rayNMRMicroscopy

第8頁(yè),共59頁(yè),2023年,2月20日,星期四4.數(shù)據(jù)查詢

PDB中的記錄有唯一的PDB-ID,包括4個(gè)字符串,可由大寫(xiě)字母A~Z和數(shù)字0~9組合而成。

PDB和它的鏡像站點(diǎn)提供每個(gè)PDB記錄的查詢,可按一些專門(mén)的查詢項(xiàng)目(如提交數(shù)據(jù)、作者姓名、結(jié)構(gòu)表達(dá))進(jìn)行檢索。

第9頁(yè),共59頁(yè),2023年,2月20日,星期四例1:查詢“PDBID=1ADZ”的結(jié)構(gòu)數(shù)據(jù)(1)登陸PDB網(wǎng)站/pdb/

(2)在上方的搜索欄選中“PDBIDorkeyword”,在文本框中輸入“1ADZ”,單擊SiteSearch按鈕,出現(xiàn)結(jié)果。第10頁(yè),共59頁(yè),2023年,2月20日,星期四第11頁(yè),共59頁(yè),2023年,2月20日,星期四數(shù)據(jù)查看:(3)分別單擊標(biāo)簽Biology&Chemistry生物學(xué)和化學(xué),Materials&Methods材料和方法,SequenceDetails細(xì)分序列,Geometry幾何形態(tài),觀察數(shù)據(jù)信息。也可以單擊Help查看幫助文件。(4)回到StructureSummary組織摘要,標(biāo)簽,在右側(cè)的ImagesandVisualization區(qū)域可以觀察蛋白的三維結(jié)構(gòu),可以單擊KiNG,Jmol,WebMol等查看三維結(jié)構(gòu)。(5)單擊左側(cè)目錄中的DownloadFiles下載不同格式和內(nèi)容的文件;或下載FASTA序列文件;也可單擊1adz右側(cè)的DownloadPDBfile圖標(biāo)下載PDB文件(1adz.pdb)。第12頁(yè),共59頁(yè),2023年,2月20日,星期四生物學(xué)與化學(xué)標(biāo)簽第13頁(yè),共59頁(yè),2023年,2月20日,星期四

方法標(biāo)簽第14頁(yè),共59頁(yè),2023年,2月20日,星期四序列標(biāo)簽第15頁(yè),共59頁(yè),2023年,2月20日,星期四幾何形狀標(biāo)簽第16頁(yè),共59頁(yè),2023年,2月20日,星期四摘要標(biāo)簽第17頁(yè),共59頁(yè),2023年,2月20日,星期四例2:查詢“人calmodulin(鈣調(diào)素蛋白:一種鈣結(jié)合蛋白)”(1)登陸PDB網(wǎng)站(2)單擊Advancedsearch→將StructureTitle限制為human和calmodulin→單擊EvaluateQuery(3)得到多個(gè)結(jié)構(gòu)數(shù)據(jù),其中“PDBID=1GGZ”的搜索結(jié)果最符合要求,是人上皮細(xì)胞中的鈣調(diào)素樣蛋白,單擊此ID,進(jìn)入1GGZ的具體界面。

第18頁(yè),共59頁(yè),2023年,2月20日,星期四電子教程

第19頁(yè),共59頁(yè),2023年,2月20日,星期四5.數(shù)據(jù)結(jié)構(gòu)

PDB中對(duì)于每一個(gè)結(jié)構(gòu)記錄,包含名稱、參考文獻(xiàn)、序列、一級(jí)結(jié)構(gòu)、二級(jí)結(jié)構(gòu)和原子坐標(biāo)等信息。每條記錄有兩種序列信息,一種是顯式序列信息(explicitsequence),一種是隱式序列信息(implicitsequence)。第20頁(yè),共59頁(yè),2023年,2月20日,星期四

在PDB文件中,以關(guān)鍵字SEQRES作為顯式序列標(biāo)記,以該關(guān)鍵字打頭的每一行都是關(guān)于序列的信息;PDB的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個(gè)原子的名稱和原子的三維坐標(biāo)。第21頁(yè),共59頁(yè),2023年,2月20日,星期四PDB數(shù)據(jù)庫(kù)的詳細(xì)字段說(shuō)明如下:HEADER分子類,公布日期,ID號(hào)OBSLTE注明該ID號(hào)已改為新號(hào)TITLE說(shuō)明試驗(yàn)方法類型CAVEAT可能的錯(cuò)誤提示COMPND化合物分子組成SOURCE化合物來(lái)源KEYWDS關(guān)鍵詞EXPDTA測(cè)定結(jié)構(gòu)所用的試驗(yàn)方法第22頁(yè),共59頁(yè),2023年,2月20日,星期四AUTHOR結(jié)構(gòu)測(cè)定者REVDAT修訂日期及相關(guān)內(nèi)容SPRSDE已撤銷或更改的相關(guān)記錄JRNL發(fā)表坐標(biāo)集的文獻(xiàn)REMARK1有關(guān)文獻(xiàn)REMARK2最大分辨率REMARK3用到的程序和統(tǒng)計(jì)方法REMARK4其他注解DBREF其他序列庫(kù)的有關(guān)記錄SEQADVPDB與其它記錄的出入第23頁(yè),共59頁(yè),2023年,2月20日,星期四SEQRES殘基序列MODRES對(duì)標(biāo)準(zhǔn)殘基的修飾HET非標(biāo)準(zhǔn)殘基HETNAM非標(biāo)準(zhǔn)殘基的化學(xué)名稱HETSYN非標(biāo)準(zhǔn)殘基的同義字FORMUL非標(biāo)準(zhǔn)殘基化學(xué)式HELIX螺旋SHEET折疊TURN轉(zhuǎn)角SSBOND有二硫鍵存在第24頁(yè),共59頁(yè),2023年,2月20日,星期四LINK殘基間化學(xué)鍵HYDBND氫鍵SLTBRG鹽橋CISPEP順勢(shì)殘基SITE特性位點(diǎn)CRYST1晶胞參數(shù)ORIGXn直角-PDB坐標(biāo)SCALEn直角部分結(jié)晶學(xué)坐標(biāo)MTRIXn非晶相對(duì)稱TVECT轉(zhuǎn)換因子第25頁(yè),共59頁(yè),2023年,2月20日,星期四MODEL多亞基時(shí)顯示亞基號(hào)ATOM標(biāo)準(zhǔn)基團(tuán)的原子坐標(biāo)SIGATM標(biāo)準(zhǔn)差A(yù)NISOU溫度因子SIGUIJ各種溫度因素導(dǎo)致的標(biāo)準(zhǔn)差TER鏈末端HETATM非標(biāo)準(zhǔn)基團(tuán)原子坐標(biāo)ENDMDL亞基結(jié)束CONECT原子間的連通性有關(guān)記錄MASTER版權(quán)擁有者END文件結(jié)束第26頁(yè),共59頁(yè),2023年,2月20日,星期四6.結(jié)構(gòu)模型顯示軟件RasMolRasMol是一個(gè)進(jìn)行分子三維立體結(jié)構(gòu)顯示的軟件,可以非常方便地觀察蛋白質(zhì)、核酸以及一些小分子的三維結(jié)構(gòu),并在自己的個(gè)人電腦上,以各種模式、各種角度,甚至按照自己的意愿旋轉(zhuǎn),觀察此分子的微觀三維立體結(jié)構(gòu),進(jìn)而了解化合物分子結(jié)構(gòu)和各種微觀性質(zhì)與宏觀性質(zhì)之間的定量關(guān)系。第27頁(yè),共59頁(yè),2023年,2月20日,星期四例如:在RasMol軟件下觀察1GGZ.pdb結(jié)構(gòu)(1)下載并安裝RasMol(/software/rasmol/)(2)單擊開(kāi)始→程序→Raswin→Raswin,運(yùn)行RasMol。(3)當(dāng)運(yùn)行RasMol時(shí),程序首先打開(kāi)具有黑色背景的主窗口(顯示窗口),同時(shí)也會(huì)打開(kāi)另一個(gè)窗口,其背景色是白色的,被稱作“命令行窗口”。初始運(yùn)行時(shí),命令行窗口通常為最小化狀態(tài),用ALT+TAB鍵切換,即可打開(kāi)該窗口,在主顯示窗口的菜單中的任何選擇和操作,均可在此窗口中輸入命令行實(shí)現(xiàn)。第28頁(yè),共59頁(yè),2023年,2月20日,星期四(4)單擊RasMol主菜單上的“File/Open”載入“人上皮細(xì)胞calmodulin樣蛋白”的結(jié)構(gòu)數(shù)據(jù)(即1GGZ.pdb)。(5)蛋白質(zhì)分子的外觀立體結(jié)構(gòu)觀察:

利用RasMol主菜單上的“Display”命令中的不同顯示模式來(lái)變換分子的三維立體結(jié)構(gòu)的外觀。(6)蛋白質(zhì)分子的外觀立體結(jié)構(gòu)的顏色顯示模式:

利用主菜單上的“Colours”命令來(lái)選擇不同的顏色顯示模式,以進(jìn)一步更直觀、清晰地展示所要觀察的分子的立體結(jié)構(gòu)。第29頁(yè),共59頁(yè),2023年,2月20日,星期四

(7)蛋白質(zhì)分子三維結(jié)構(gòu)的選擇性顯示:

RasMol主菜單中的“Display”和“Colours”命令主要用于分子的正常顯示,在主菜單上還有一個(gè)“Options”選項(xiàng)命令,可以進(jìn)行一些非正常的顯示。(8)蛋白質(zhì)分子三維結(jié)構(gòu)的旋轉(zhuǎn)顯示:①鼠標(biāo)點(diǎn)擊窗口右方與下方的滾卷?xiàng)l,將以X軸或Y軸旋轉(zhuǎn)。②將鼠標(biāo)移至主屏幕區(qū),按住鼠標(biāo)左鍵,移動(dòng)鼠標(biāo),就可以任意旋轉(zhuǎn)此分子。按住Shift鍵,同時(shí)按住鼠標(biāo)的右鍵,移動(dòng)鼠標(biāo),即可實(shí)現(xiàn)以Z軸旋轉(zhuǎn)。③通過(guò)命令行方式。(9)蛋白質(zhì)三維立體結(jié)構(gòu)圖像的輸出第30頁(yè),共59頁(yè),2023年,2月20日,星期四習(xí)題:1.PDB和RSCB的中英文全稱分別是什么?2.PDB中的數(shù)據(jù)主要來(lái)源于哪兩種實(shí)驗(yàn)測(cè)定的生物大分子三維結(jié)構(gòu)?3.PDB中的每條記錄有哪兩種序列信息?4.PDB記錄中的EXPDTA,HELIX,SSBOND各代表什么含義?第31頁(yè),共59頁(yè),2023年,2月20日,星期四4.3.2MMDB數(shù)據(jù)庫(kù)1.簡(jiǎn)介

分子模型數(shù)據(jù)庫(kù)MMDB(MolecularModelingDatabase)是一個(gè)關(guān)于三維生物分子結(jié)構(gòu)的數(shù)據(jù)庫(kù),是美國(guó)生物技術(shù)信息中心(NCBI)所開(kāi)發(fā)的生物信息數(shù)據(jù)庫(kù)集成系統(tǒng)Entrez的一個(gè)部分。

MMDB是來(lái)源于PDB三維結(jié)構(gòu)的一部分,MMDB重新組織和驗(yàn)證了這些信息,從而保證在化學(xué)和大分子三維結(jié)構(gòu)之間的交叉參考。第32頁(yè),共59頁(yè),2023年,2月20日,星期四2.查詢(1)登陸網(wǎng)站/Structure/MMDB/mmdb.shtml(2)在文本框中輸入“1ggz”(或者右下角的PDB/MMDBCode文本框中),單擊Go按鈕,顯示查詢結(jié)果。第33頁(yè),共59頁(yè),2023年,2月20日,星期四家族構(gòu)成3D大分子結(jié)構(gòu)保守區(qū)域數(shù)據(jù)庫(kù)第34頁(yè),共59頁(yè),2023年,2月20日,星期四第35頁(yè),共59頁(yè),2023年,2月20日,星期四3.三維結(jié)構(gòu)顯示程序Cn3DCn3D是MMDB一個(gè)配套的三維結(jié)構(gòu)顯示程序,它具有可靠的顯示三維數(shù)據(jù)庫(kù)結(jié)構(gòu)的能力。圖像以動(dòng)畫(huà)形式顯示,用戶可以旋轉(zhuǎn)或縮放結(jié)構(gòu),也可以用條帶圖、空間結(jié)構(gòu)圖、熱能分布圖等方式來(lái)顯示,掌握分子結(jié)構(gòu)的不同功能第36頁(yè),共59頁(yè),2023年,2月20日,星期四第37頁(yè),共59頁(yè),2023年,2月20日,星期四第38頁(yè),共59頁(yè),2023年,2月20日,星期四第39頁(yè),共59頁(yè),2023年,2月20日,星期四(1)在剛才的查詢結(jié)果頁(yè),單擊左側(cè)結(jié)構(gòu)圖下方的Viewoptions,展開(kāi)選項(xiàng)。(2)Tasks選擇SaveFile,Program選擇Cn3D,Drawing選擇Backbone。(3)在結(jié)構(gòu)圖上單擊,下載文件3。(4)下載并安裝Cn3D軟件。(5)開(kāi)始→程序→NCBI→Cn3D→Cn3D4.1注:MMDB采用ASN.1的記錄格式,而非PDB格式。第40頁(yè),共59頁(yè),2023年,2月20日,星期四第41頁(yè),共59頁(yè),2023年,2月20日,星期四第42頁(yè),共59頁(yè),2023年,2月20日,星期四第43頁(yè),共59頁(yè),2023年,2月20日,星期四4.3.3SCOP數(shù)據(jù)庫(kù)1.簡(jiǎn)介蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP(StructuralClassificationofProteins)的目標(biāo)是提供關(guān)于已知結(jié)構(gòu)蛋白質(zhì)之間的結(jié)構(gòu)和進(jìn)化關(guān)系的信息,所涉及的蛋白質(zhì)包括結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中的所有條目。第44頁(yè),共59頁(yè),2023年,2月20日,星期四

SCOP數(shù)據(jù)庫(kù)除了提供蛋白質(zhì)結(jié)構(gòu)和進(jìn)化關(guān)系信息外,對(duì)于每一個(gè)蛋白質(zhì)還包括下述信息:到PDB的鏈接,序列,參考文獻(xiàn),結(jié)構(gòu)的圖像等。

SCOP的結(jié)構(gòu)分類主要是通過(guò)人工來(lái)完成的,通過(guò)圖形顯示器觀察和比較蛋白質(zhì)結(jié)構(gòu),并借助于一些軟件工具進(jìn)行分析。第45頁(yè),共59頁(yè),2023年,2月20日,星期四2.分類的層次結(jié)構(gòu)(1)家族:

具有明顯進(jìn)化關(guān)系的蛋白質(zhì)聚集到一個(gè)家族中,意味著兩個(gè)蛋白質(zhì)之間的等同氨基酸殘基數(shù)超過(guò)30%。然而,在某些情況下,雖然兩個(gè)蛋白質(zhì)序列不相似,但它們具有相似的結(jié)構(gòu)和相似的功能,表明屬于同一個(gè)家族。第46頁(yè),共59頁(yè),2023年,2月20日,星期四(2)超家族:

超家族中的成員具有遠(yuǎn)源進(jìn)化關(guān)系,具有共同的進(jìn)化源。(3)折疊:

無(wú)論有無(wú)共同的進(jìn)化起源,只要具有相同排列和拓?fù)浣Y(jié)構(gòu)的主要二級(jí)結(jié)構(gòu),即將蛋白質(zhì)分類為具有相同的折疊。第47頁(yè),共59頁(yè),2023年,2月20日,星期四3.SCOP查詢

(1)網(wǎng)址:http://scop.mrc-lmb.cam.ac.uk/scop/

(2)單擊topofthehierarchy

SCOP首先從總體上將蛋白質(zhì)進(jìn)行分類,例如全型,全型,以平行折疊為主的/型,以反平行折疊為主的+型等。第48頁(yè),共59頁(yè),2023年,2月20日,星期四第49頁(yè),共59頁(yè),2023年,2月20日,星期四第50頁(yè),共59頁(yè),2023年,2月20日,星期四第51頁(yè),共59頁(yè),2023年,2月20日,星期四第52頁(yè),共59頁(yè),2023年,2月20日,星期四例如:

SCOP1.73版本有46456個(gè)全型蛋白質(zhì),該結(jié)構(gòu)類型下有258個(gè)折疊類。在這258個(gè)折疊類中的第一個(gè)超家族是類球蛋白;類球蛋白又包含4個(gè)家族,其中第一個(gè)家族包含6個(gè)結(jié)構(gòu)域;每個(gè)結(jié)構(gòu)域下面有很多蛋白質(zhì)成員。

也可以直接利用查找工具,查找特定的蛋白質(zhì)1GGZ。

第53頁(yè),共59頁(yè),2023年,2月20日,星期四4.3.4DSSP數(shù)據(jù)庫(kù)1.簡(jiǎn)介

蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)DSSP(DatabaseofSecondaryStructureofProtein)是一個(gè)二級(jí)結(jié)構(gòu)推導(dǎo)數(shù)據(jù)庫(kù)。對(duì)生物大分子數(shù)據(jù)庫(kù)PDB中的任何一個(gè)蛋白質(zhì),根據(jù)其三維結(jié)構(gòu)推導(dǎo)出對(duì)應(yīng)的二級(jí)結(jié)構(gòu)。

第54頁(yè),共59頁(yè),2023年,2月20日,星期四2.分類結(jié)構(gòu)描述分類α-helixH310helixGπ-helixIβ-strandEβ-bridgeBorbCoilC,LorspaceTurnTBendS第55頁(yè),共59頁(yè),2023年,2月20日,星期四3.DS

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論