人類基因組計(jì)劃和生物信息學(xué)_第1頁(yè)
人類基因組計(jì)劃和生物信息學(xué)_第2頁(yè)
人類基因組計(jì)劃和生物信息學(xué)_第3頁(yè)
人類基因組計(jì)劃和生物信息學(xué)_第4頁(yè)
人類基因組計(jì)劃和生物信息學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 人類基因組計(jì)劃和生物信息學(xué)徐新來(lái)安道昌王芷3李青付紅波(中國(guó)生物工程中心北京100081 (3中國(guó)科技信息研究所北京100038提要:介紹人類基因組計(jì)劃和生物信息學(xué), 闡述了兩者的關(guān)系, 提出了在人類基因組計(jì)劃中發(fā)展生物信息學(xué)的策略。一、(Genom e P ro 2ject , H GP 1990年提出實(shí)施的一項(xiàng)大科學(xué)計(jì)劃, 在世界各國(guó)引起了很大反響。計(jì)劃的提出旨在對(duì)人類基因組3×109個(gè)脫氧核苷酸對(duì)進(jìn)行作圖和測(cè)序, 進(jìn)而解讀和破譯生老病死以及語(yǔ)言、記憶和疾病發(fā)生的遺傳信息。而生物信息學(xué)是集生物學(xué)、數(shù)學(xué)、信息學(xué)、計(jì)算機(jī)科學(xué)一體化的一門(mén)新的學(xué)科。早在H GP 提出時(shí)就預(yù)示到生物信息

2、學(xué)的重要性, 當(dāng)時(shí)就成立了有42位著名專家組成的生物信息學(xué)任務(wù)組。隨著人類基因組計(jì)劃的進(jìn)展, 基因組的數(shù)據(jù)和信息大量, 迅速地增加, 信息的收集、儲(chǔ)存、分發(fā)、分析的管理越來(lái)越顯得緊迫和重要。利用數(shù)學(xué)模式和計(jì)算機(jī)處理數(shù)據(jù)的功能來(lái)處理和分析大量增加的人類基因組信息的結(jié)果, 使人類基因組計(jì)劃和生物信息學(xué)緊緊地結(jié)合起來(lái)了, 而且隨著兩者的緊密結(jié)合和互相滲透, 人類基因組計(jì)劃的前進(jìn)步伐會(huì)大大加快, 從而提前完成計(jì)劃, 為人類造福。二、從人類基因組計(jì)劃看生物信息學(xué)美國(guó)在1990年率先提出H GP , 計(jì)劃用15年時(shí)間, 投入30億美元, 完成人類全部24條染色體的3×109脫氧核苷酸對(duì)(bp 的

3、序列測(cè)定, 主要任務(wù)包括作圖(遺傳圖譜、物理圖譜的建立 、測(cè)序和基因識(shí)別。其中還包括模式生物(如大腸桿菌、酵母、線蟲(chóng)、小鼠等 基因, 。、物理圖譜的建立是測(cè)序的必要條件; 遺傳圖譜是根據(jù)遺傳連鎖標(biāo)志之間的重組頻率來(lái)確定它們的距離, 遺傳圖譜的建立為基因識(shí)別和完成基因定位創(chuàng)造了條件。物理圖譜是以核苷酸的長(zhǎng)度為單位繪制而成, 詳細(xì)描述染色體上界標(biāo)間的距離, 主要是編碼蛋白質(zhì)的外顯子和排序DNA 克隆庫(kù)組成, 這些DNA 分子克隆庫(kù)相互交錯(cuò)、重疊。人類基因組全部DNA 序列的測(cè)定是H GP 的核心部分; 隨著遺傳和物理圖譜的完成和即將完成, 測(cè)序就成為今后重中之重的工作。而大規(guī)模測(cè)序技術(shù)的改進(jìn)及分析

4、大片段DNA 序列的生物信息技術(shù)的進(jìn)步, 對(duì)完成人類基因組全部核苷酸順序測(cè)定起著決定性作用。測(cè)序的完成依賴物理圖譜上的排序的DNA 片段分子克隆, 這些分子圖譜通常是在較短的時(shí)間由一個(gè)研究組從單一分離群體中獲得的, 為了充分利用所有資料信息, 要對(duì)其全部標(biāo)記的同時(shí)進(jìn)行分析, 這種分析涉及十分龐雜和巨大的計(jì)算, 手工無(wú)法完成。基因識(shí)別是H GP 的重要內(nèi)容之一; 目的是要識(shí)別全部人類的基因, 即基因組在生命活動(dòng)中發(fā)生轉(zhuǎn)錄表達(dá)的DNA 片段, 并對(duì)其結(jié)構(gòu)進(jìn)行研究。目前常采用的有二種方法:一是從基因組順序中識(shí)別那些轉(zhuǎn)錄表達(dá)的DNA 片段; 二是從c D 2NA 文庫(kù)中挑取并克隆。兩種方法都必須依靠生

5、物信息學(xué)的幫助即信息系統(tǒng)的建立; 前者需要對(duì)基因組進(jìn)行分析, 后者要對(duì)基因文庫(kù)進(jìn)行分析, 甚至還要進(jìn)行分類分型, 建立二級(jí)庫(kù), 才能有效地挑取到所需要的DNA 分子克隆。模式生物基因組在H GP 中占有重要的位置; 模06高技術(shù)通訊1998181 式生物基因組結(jié)構(gòu)相對(duì)比較簡(jiǎn)單、單位DNA 片段上基因的密度高, 易于基因的識(shí)別。從進(jìn)化角度講, 動(dòng)物的許多基因有很大的同源性, 對(duì)模式生物基因的分析有助于人類基因的結(jié)構(gòu)與功能的闡明。在這種背景下生物信息學(xué)的重要性便在基因組計(jì)劃提出后真正顯示出來(lái)了。H GP 的提出和實(shí)施, 實(shí)驗(yàn)的數(shù)據(jù)和信息急劇大量的增加, 信息的管理和分析成為一項(xiàng)重要的研究?jī)?nèi)容。生物

6、信息學(xué)以基因組信息學(xué)為核心, 收集、儲(chǔ)存、, 和分析m RNA 的信息, , 發(fā)現(xiàn)新的基因, 并對(duì)基因結(jié)構(gòu)和功能進(jìn)行研究。信息的收集、儲(chǔ)存、分發(fā)、分析是基因組計(jì)劃最初提出時(shí)確定的任務(wù), 計(jì)劃實(shí)施后, 每天都有上萬(wàn)的數(shù)據(jù), 數(shù)據(jù)的取舍非常重要, 數(shù)據(jù)的標(biāo)準(zhǔn)化和檢驗(yàn)成為信息處理的第一步工作。同時(shí), 數(shù)據(jù)必須能提供給廣大的科研工作者使用, 計(jì)算機(jī)管理要提供一個(gè)工作界面, 才能有效地利用信息。另外, 這些數(shù)據(jù)還應(yīng)可視化, 方便用戶使用。生物信息學(xué)的研究更重要的作用是將原始的信息庫(kù)進(jìn)行分析、分類, 按照需要建立具有特殊功能的二級(jí)數(shù)據(jù)庫(kù)。二級(jí)數(shù)據(jù)庫(kù)是進(jìn)一步研究開(kāi)發(fā)基因組的重要手段, 通常是封閉的, 不對(duì)外

7、開(kāi)放, 僅供內(nèi)部使用。隨著基因組研究的發(fā)展, 向功能基因組研究轉(zhuǎn)化, 解讀生物的遺傳密碼成為生物信息學(xué)的又一項(xiàng)重要的任務(wù)。生物信息學(xué)另一項(xiàng)重要任務(wù)是分析工具的研究開(kāi)發(fā), 如序列相似性比較的軟件。分析軟件是有效利用基因組信息的有利工具, 同時(shí)分析軟件也是構(gòu)建二級(jí)、三級(jí)數(shù)據(jù)庫(kù)的條件和手段。分析軟件還可將不同性質(zhì)的數(shù)據(jù)庫(kù)結(jié)合一起, 如將基因組序列數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)結(jié)合計(jì)算, 可以推斷結(jié)構(gòu)和功能的關(guān)系, 從而成為一種發(fā)現(xiàn)新基因的較為快捷的方法, 有利解讀全部生物遺傳密碼。生物信息學(xué)發(fā)展很快, 各種數(shù)據(jù)庫(kù)不斷涌現(xiàn), 數(shù)據(jù)庫(kù)各有不同的特色。美國(guó)、日本、歐盟、加拿大等國(guó)都有基因組數(shù)據(jù)庫(kù), 有的是國(guó)際性的, 有

8、的是本國(guó)的, 有的公開(kāi), 有的不公開(kāi)。其中比較有代表性的數(shù)據(jù)庫(kù)有:美國(guó)的GenB ank , 歐盟的E M BL , 日本的DDBJ 和美國(guó)的N CB I 等。數(shù)據(jù)庫(kù)的內(nèi)容十分豐富, 有表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)(dbEST , 有序列標(biāo)記位點(diǎn)數(shù)據(jù)庫(kù)(dbST S , 有蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)序列功能位點(diǎn)數(shù)據(jù)庫(kù)、結(jié), ank , 該庫(kù)已有, 近5萬(wàn)條蛋白。三、生物信息學(xué)發(fā)展現(xiàn)狀隨著信息學(xué)大環(huán)境的改善, 如信息高速公路、國(guó)際互聯(lián)網(wǎng)的發(fā)展, 生物信息學(xué)發(fā)展迅速。美國(guó)、日本及歐洲各國(guó)的生物信息學(xué)已相繼在In ternet 上建立了各自的網(wǎng)絡(luò)節(jié)點(diǎn), 進(jìn)行管理大型數(shù)據(jù)庫(kù), 為研究人員提供研究數(shù)據(jù)的分析、處理、

9、采集、交換的服務(wù)。國(guó)際互聯(lián)網(wǎng)所到之處, 都有各種研究機(jī)構(gòu)的聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)的建立, 開(kāi)展生物信息學(xué)研究。各種數(shù)據(jù)庫(kù)各具特色:GenB ank 、E M BL 、DDBJ 是三大核苷酸蛋白質(zhì)數(shù)據(jù)庫(kù); GDB 數(shù)據(jù)庫(kù)主要收集遺傳學(xué)制圖的資料; CEPH 的數(shù)據(jù)庫(kù)收集YA C con tig ; Genethon 、CHL C 儲(chǔ)存遺傳學(xué)標(biāo)記系列; W h iethead 研究所的數(shù)據(jù)庫(kù)可了解全部18000個(gè)ST S 及聯(lián)系作圖的信息; 另外還有突變序列的數(shù)據(jù)庫(kù)在建立之中。在各類數(shù)據(jù)庫(kù)建立的同時(shí), 數(shù)據(jù)庫(kù)設(shè)計(jì)中出現(xiàn)了集成化趨勢(shì), 集成化包括:各類數(shù)據(jù)的集成、數(shù)據(jù)庫(kù)與數(shù)據(jù)分析軟件的整合。各種數(shù)據(jù)庫(kù)分析、測(cè)

10、序應(yīng)用軟件包也被開(kāi)發(fā)出來(lái)。除了數(shù)據(jù)庫(kù)、數(shù)據(jù)分析軟件的發(fā)展, 生物信息學(xué)中比較基因組學(xué)的發(fā)展也較為突出。其中河豚、鼠、豬、牛和馬的基因組與人基因組的比較研究, 秀麗隱桿線蟲(chóng)與人基因組的比較研究、酵母與人基因組的比較研究, 支原體與嗜血流感桿菌基因組的比較研究, 都取得了成果, 從比較中分離到一些人類遺傳病的候選基16高技術(shù)通訊1998181 因, 鑒定了一些新克隆的基因, 為人類基因組的分析提供了有益的數(shù)據(jù)。隨著計(jì)算機(jī)技術(shù)的發(fā)展和滲透, 生物信息學(xué)在人類基因組中大規(guī)模測(cè)序的自動(dòng)化控制、測(cè)序結(jié)果分析處理、序列數(shù)據(jù)的計(jì)算機(jī)管理、各類遺傳圖譜、物理圖譜的繪制、研究數(shù)據(jù)的網(wǎng)絡(luò)獲取、分析和交換, 以數(shù)據(jù)分

11、析的結(jié)果輔助基因組研究等都發(fā)揮著不可替代的功能, 顯示出越來(lái)越重要的作用。四、科學(xué)重要的課題, 為全世界所關(guān)注。由于其重大的科學(xué)意義和潛在的經(jīng)濟(jì)價(jià)值, 積極開(kāi)展有關(guān)的研究勢(shì)在必行。人類基因組計(jì)劃啟動(dòng)時(shí), 生物信息學(xué)技術(shù)就已成為發(fā)展的重點(diǎn)之一, 目前有關(guān)基因序列、圖譜的數(shù)據(jù)信息的大量積累, 使生物信息學(xué)研究在人類基因組研究中的重要性越來(lái)越突出, 在今后的人類基因研究中, 生物信息學(xué)是一個(gè)信息庫(kù), 一種高層次研究的工具。如果生物信息學(xué)研究發(fā)展滯后, 將意味著失去信息, 失去高層次、高水平研究的基礎(chǔ)。中國(guó)1993年開(kāi)始參與H GP 研究, 但由于資金技術(shù)等各種原因, 其研究水平與國(guó)際同行尚有較大差距

12、。我國(guó)雖然早在1993年中國(guó)人類基因組計(jì)劃中列入了生物信息學(xué)的內(nèi)容, 但真正起步可能是在19951996年, 基礎(chǔ)比較弱, 尚處于引進(jìn)國(guó)外已有數(shù)據(jù)庫(kù), 為國(guó)內(nèi)研究人員提供服務(wù)的階段。中國(guó)的人類基因組研究和生物信息學(xué)都處于一個(gè)不容樂(lè)觀的現(xiàn)狀。如何在現(xiàn)有的資金、技術(shù)條件下, 找到1個(gè)或2個(gè)突破口, 改變落后現(xiàn)狀, 在國(guó)際同類研究領(lǐng)域爭(zhēng)得一席之地, 我們認(rèn)為應(yīng)該在策略上作些調(diào)整。11在人類基因組研究上, 找功能基因。利用我國(guó)豐富的遺傳資源和廣泛的疾病譜系, 從“c DNA ”入手, 盡快地克隆一批新基因?!癱 DNA ”又稱互補(bǔ)DNA , 只占整個(gè)基因組DNA 很小的一部分, 是編碼蛋白質(zhì)的, 即功

13、能基因, , 才可以完成, 我, , 利用我們的優(yōu)勢(shì), 。21在引進(jìn)國(guó)外數(shù)據(jù)庫(kù)的同時(shí), 建立中國(guó)人基因資源數(shù)據(jù)庫(kù)。生物信息學(xué)對(duì)推進(jìn)基因組的工作十分重要, 充分利用國(guó)際基因信息庫(kù)的信息, 建立國(guó)際合作關(guān)系, 在基因組研究工作的基礎(chǔ)上, 組建自己的生物信息網(wǎng)絡(luò), 建設(shè)基因資源、基因結(jié)構(gòu)的數(shù)據(jù)庫(kù)。同時(shí), 進(jìn)行分析軟件的開(kāi)發(fā)研究, 構(gòu)建特殊需要的二級(jí)、三級(jí)數(shù)據(jù)庫(kù), 從已知的c DNA 文庫(kù)中, 進(jìn)行測(cè)序和功能推測(cè)研究, 發(fā)現(xiàn)新基因, 才有可能在國(guó)際人類基因組計(jì)劃中占有一席之地。31人才培養(yǎng)。當(dāng)務(wù)之急是對(duì)現(xiàn)有從事基因研究的科技人員進(jìn)行生物信息學(xué)的培訓(xùn)。只有有了中國(guó)自己的一支專門(mén)從事生物信息學(xué)研究的科研隊(duì)

14、伍, 才能在中國(guó)人類基因組研究中做出國(guó)際領(lǐng)先水平的工作。參考文獻(xiàn)1劉春宇, 夏家輝1國(guó)外醫(yī)學(xué)遺傳學(xué)分冊(cè), 1996, 19(5 :2622李衛(wèi)東, 王明榮1國(guó)外醫(yī)學(xué)遺傳學(xué)分冊(cè), 1996, 19(5 :2643丁達(dá)夫, 梁衛(wèi)平, 陳潔1生物信息學(xué), 1998, 50, 2(3 :20(上接第60頁(yè)10N akano T , FujiM , N agano K et al . N ipp on S teel T echnical R ep ort , 1987, 34(7 :2111M c D avid R M , T hom as B G . M etallu rg ical and M aterials T ransactions B , 1996, 27B :67212Ho B . M aster s thesis , U niversity of Illi 2no is at U rbana 2Champaign , U rbana , I L , 199113M c D avid R M . M as

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論