版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 人類基因組計(jì)劃和生物信息學(xué)徐新來(lái)安道昌王芷3李青付紅波(中國(guó)生物工程中心北京100081 (3中國(guó)科技信息研究所北京100038提要:介紹人類基因組計(jì)劃和生物信息學(xué), 闡述了兩者的關(guān)系, 提出了在人類基因組計(jì)劃中發(fā)展生物信息學(xué)的策略。一、(Genom e P ro 2ject , H GP 1990年提出實(shí)施的一項(xiàng)大科學(xué)計(jì)劃, 在世界各國(guó)引起了很大反響。計(jì)劃的提出旨在對(duì)人類基因組3×109個(gè)脫氧核苷酸對(duì)進(jìn)行作圖和測(cè)序, 進(jìn)而解讀和破譯生老病死以及語(yǔ)言、記憶和疾病發(fā)生的遺傳信息。而生物信息學(xué)是集生物學(xué)、數(shù)學(xué)、信息學(xué)、計(jì)算機(jī)科學(xué)一體化的一門(mén)新的學(xué)科。早在H GP 提出時(shí)就預(yù)示到生物信息
2、學(xué)的重要性, 當(dāng)時(shí)就成立了有42位著名專家組成的生物信息學(xué)任務(wù)組。隨著人類基因組計(jì)劃的進(jìn)展, 基因組的數(shù)據(jù)和信息大量, 迅速地增加, 信息的收集、儲(chǔ)存、分發(fā)、分析的管理越來(lái)越顯得緊迫和重要。利用數(shù)學(xué)模式和計(jì)算機(jī)處理數(shù)據(jù)的功能來(lái)處理和分析大量增加的人類基因組信息的結(jié)果, 使人類基因組計(jì)劃和生物信息學(xué)緊緊地結(jié)合起來(lái)了, 而且隨著兩者的緊密結(jié)合和互相滲透, 人類基因組計(jì)劃的前進(jìn)步伐會(huì)大大加快, 從而提前完成計(jì)劃, 為人類造福。二、從人類基因組計(jì)劃看生物信息學(xué)美國(guó)在1990年率先提出H GP , 計(jì)劃用15年時(shí)間, 投入30億美元, 完成人類全部24條染色體的3×109脫氧核苷酸對(duì)(bp 的
3、序列測(cè)定, 主要任務(wù)包括作圖(遺傳圖譜、物理圖譜的建立 、測(cè)序和基因識(shí)別。其中還包括模式生物(如大腸桿菌、酵母、線蟲(chóng)、小鼠等 基因, 。、物理圖譜的建立是測(cè)序的必要條件; 遺傳圖譜是根據(jù)遺傳連鎖標(biāo)志之間的重組頻率來(lái)確定它們的距離, 遺傳圖譜的建立為基因識(shí)別和完成基因定位創(chuàng)造了條件。物理圖譜是以核苷酸的長(zhǎng)度為單位繪制而成, 詳細(xì)描述染色體上界標(biāo)間的距離, 主要是編碼蛋白質(zhì)的外顯子和排序DNA 克隆庫(kù)組成, 這些DNA 分子克隆庫(kù)相互交錯(cuò)、重疊。人類基因組全部DNA 序列的測(cè)定是H GP 的核心部分; 隨著遺傳和物理圖譜的完成和即將完成, 測(cè)序就成為今后重中之重的工作。而大規(guī)模測(cè)序技術(shù)的改進(jìn)及分析
4、大片段DNA 序列的生物信息技術(shù)的進(jìn)步, 對(duì)完成人類基因組全部核苷酸順序測(cè)定起著決定性作用。測(cè)序的完成依賴物理圖譜上的排序的DNA 片段分子克隆, 這些分子圖譜通常是在較短的時(shí)間由一個(gè)研究組從單一分離群體中獲得的, 為了充分利用所有資料信息, 要對(duì)其全部標(biāo)記的同時(shí)進(jìn)行分析, 這種分析涉及十分龐雜和巨大的計(jì)算, 手工無(wú)法完成。基因識(shí)別是H GP 的重要內(nèi)容之一; 目的是要識(shí)別全部人類的基因, 即基因組在生命活動(dòng)中發(fā)生轉(zhuǎn)錄表達(dá)的DNA 片段, 并對(duì)其結(jié)構(gòu)進(jìn)行研究。目前常采用的有二種方法:一是從基因組順序中識(shí)別那些轉(zhuǎn)錄表達(dá)的DNA 片段; 二是從c D 2NA 文庫(kù)中挑取并克隆。兩種方法都必須依靠生
5、物信息學(xué)的幫助即信息系統(tǒng)的建立; 前者需要對(duì)基因組進(jìn)行分析, 后者要對(duì)基因文庫(kù)進(jìn)行分析, 甚至還要進(jìn)行分類分型, 建立二級(jí)庫(kù), 才能有效地挑取到所需要的DNA 分子克隆。模式生物基因組在H GP 中占有重要的位置; 模06高技術(shù)通訊1998181 式生物基因組結(jié)構(gòu)相對(duì)比較簡(jiǎn)單、單位DNA 片段上基因的密度高, 易于基因的識(shí)別。從進(jìn)化角度講, 動(dòng)物的許多基因有很大的同源性, 對(duì)模式生物基因的分析有助于人類基因的結(jié)構(gòu)與功能的闡明。在這種背景下生物信息學(xué)的重要性便在基因組計(jì)劃提出后真正顯示出來(lái)了。H GP 的提出和實(shí)施, 實(shí)驗(yàn)的數(shù)據(jù)和信息急劇大量的增加, 信息的管理和分析成為一項(xiàng)重要的研究?jī)?nèi)容。生物
6、信息學(xué)以基因組信息學(xué)為核心, 收集、儲(chǔ)存、, 和分析m RNA 的信息, , 發(fā)現(xiàn)新的基因, 并對(duì)基因結(jié)構(gòu)和功能進(jìn)行研究。信息的收集、儲(chǔ)存、分發(fā)、分析是基因組計(jì)劃最初提出時(shí)確定的任務(wù), 計(jì)劃實(shí)施后, 每天都有上萬(wàn)的數(shù)據(jù), 數(shù)據(jù)的取舍非常重要, 數(shù)據(jù)的標(biāo)準(zhǔn)化和檢驗(yàn)成為信息處理的第一步工作。同時(shí), 數(shù)據(jù)必須能提供給廣大的科研工作者使用, 計(jì)算機(jī)管理要提供一個(gè)工作界面, 才能有效地利用信息。另外, 這些數(shù)據(jù)還應(yīng)可視化, 方便用戶使用。生物信息學(xué)的研究更重要的作用是將原始的信息庫(kù)進(jìn)行分析、分類, 按照需要建立具有特殊功能的二級(jí)數(shù)據(jù)庫(kù)。二級(jí)數(shù)據(jù)庫(kù)是進(jìn)一步研究開(kāi)發(fā)基因組的重要手段, 通常是封閉的, 不對(duì)外
7、開(kāi)放, 僅供內(nèi)部使用。隨著基因組研究的發(fā)展, 向功能基因組研究轉(zhuǎn)化, 解讀生物的遺傳密碼成為生物信息學(xué)的又一項(xiàng)重要的任務(wù)。生物信息學(xué)另一項(xiàng)重要任務(wù)是分析工具的研究開(kāi)發(fā), 如序列相似性比較的軟件。分析軟件是有效利用基因組信息的有利工具, 同時(shí)分析軟件也是構(gòu)建二級(jí)、三級(jí)數(shù)據(jù)庫(kù)的條件和手段。分析軟件還可將不同性質(zhì)的數(shù)據(jù)庫(kù)結(jié)合一起, 如將基因組序列數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)結(jié)合計(jì)算, 可以推斷結(jié)構(gòu)和功能的關(guān)系, 從而成為一種發(fā)現(xiàn)新基因的較為快捷的方法, 有利解讀全部生物遺傳密碼。生物信息學(xué)發(fā)展很快, 各種數(shù)據(jù)庫(kù)不斷涌現(xiàn), 數(shù)據(jù)庫(kù)各有不同的特色。美國(guó)、日本、歐盟、加拿大等國(guó)都有基因組數(shù)據(jù)庫(kù), 有的是國(guó)際性的, 有
8、的是本國(guó)的, 有的公開(kāi), 有的不公開(kāi)。其中比較有代表性的數(shù)據(jù)庫(kù)有:美國(guó)的GenB ank , 歐盟的E M BL , 日本的DDBJ 和美國(guó)的N CB I 等。數(shù)據(jù)庫(kù)的內(nèi)容十分豐富, 有表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)(dbEST , 有序列標(biāo)記位點(diǎn)數(shù)據(jù)庫(kù)(dbST S , 有蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)序列功能位點(diǎn)數(shù)據(jù)庫(kù)、結(jié), ank , 該庫(kù)已有, 近5萬(wàn)條蛋白。三、生物信息學(xué)發(fā)展現(xiàn)狀隨著信息學(xué)大環(huán)境的改善, 如信息高速公路、國(guó)際互聯(lián)網(wǎng)的發(fā)展, 生物信息學(xué)發(fā)展迅速。美國(guó)、日本及歐洲各國(guó)的生物信息學(xué)已相繼在In ternet 上建立了各自的網(wǎng)絡(luò)節(jié)點(diǎn), 進(jìn)行管理大型數(shù)據(jù)庫(kù), 為研究人員提供研究數(shù)據(jù)的分析、處理、
9、采集、交換的服務(wù)。國(guó)際互聯(lián)網(wǎng)所到之處, 都有各種研究機(jī)構(gòu)的聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)的建立, 開(kāi)展生物信息學(xué)研究。各種數(shù)據(jù)庫(kù)各具特色:GenB ank 、E M BL 、DDBJ 是三大核苷酸蛋白質(zhì)數(shù)據(jù)庫(kù); GDB 數(shù)據(jù)庫(kù)主要收集遺傳學(xué)制圖的資料; CEPH 的數(shù)據(jù)庫(kù)收集YA C con tig ; Genethon 、CHL C 儲(chǔ)存遺傳學(xué)標(biāo)記系列; W h iethead 研究所的數(shù)據(jù)庫(kù)可了解全部18000個(gè)ST S 及聯(lián)系作圖的信息; 另外還有突變序列的數(shù)據(jù)庫(kù)在建立之中。在各類數(shù)據(jù)庫(kù)建立的同時(shí), 數(shù)據(jù)庫(kù)設(shè)計(jì)中出現(xiàn)了集成化趨勢(shì), 集成化包括:各類數(shù)據(jù)的集成、數(shù)據(jù)庫(kù)與數(shù)據(jù)分析軟件的整合。各種數(shù)據(jù)庫(kù)分析、測(cè)
10、序應(yīng)用軟件包也被開(kāi)發(fā)出來(lái)。除了數(shù)據(jù)庫(kù)、數(shù)據(jù)分析軟件的發(fā)展, 生物信息學(xué)中比較基因組學(xué)的發(fā)展也較為突出。其中河豚、鼠、豬、牛和馬的基因組與人基因組的比較研究, 秀麗隱桿線蟲(chóng)與人基因組的比較研究、酵母與人基因組的比較研究, 支原體與嗜血流感桿菌基因組的比較研究, 都取得了成果, 從比較中分離到一些人類遺傳病的候選基16高技術(shù)通訊1998181 因, 鑒定了一些新克隆的基因, 為人類基因組的分析提供了有益的數(shù)據(jù)。隨著計(jì)算機(jī)技術(shù)的發(fā)展和滲透, 生物信息學(xué)在人類基因組中大規(guī)模測(cè)序的自動(dòng)化控制、測(cè)序結(jié)果分析處理、序列數(shù)據(jù)的計(jì)算機(jī)管理、各類遺傳圖譜、物理圖譜的繪制、研究數(shù)據(jù)的網(wǎng)絡(luò)獲取、分析和交換, 以數(shù)據(jù)分
11、析的結(jié)果輔助基因組研究等都發(fā)揮著不可替代的功能, 顯示出越來(lái)越重要的作用。四、科學(xué)重要的課題, 為全世界所關(guān)注。由于其重大的科學(xué)意義和潛在的經(jīng)濟(jì)價(jià)值, 積極開(kāi)展有關(guān)的研究勢(shì)在必行。人類基因組計(jì)劃啟動(dòng)時(shí), 生物信息學(xué)技術(shù)就已成為發(fā)展的重點(diǎn)之一, 目前有關(guān)基因序列、圖譜的數(shù)據(jù)信息的大量積累, 使生物信息學(xué)研究在人類基因組研究中的重要性越來(lái)越突出, 在今后的人類基因研究中, 生物信息學(xué)是一個(gè)信息庫(kù), 一種高層次研究的工具。如果生物信息學(xué)研究發(fā)展滯后, 將意味著失去信息, 失去高層次、高水平研究的基礎(chǔ)。中國(guó)1993年開(kāi)始參與H GP 研究, 但由于資金技術(shù)等各種原因, 其研究水平與國(guó)際同行尚有較大差距
12、。我國(guó)雖然早在1993年中國(guó)人類基因組計(jì)劃中列入了生物信息學(xué)的內(nèi)容, 但真正起步可能是在19951996年, 基礎(chǔ)比較弱, 尚處于引進(jìn)國(guó)外已有數(shù)據(jù)庫(kù), 為國(guó)內(nèi)研究人員提供服務(wù)的階段。中國(guó)的人類基因組研究和生物信息學(xué)都處于一個(gè)不容樂(lè)觀的現(xiàn)狀。如何在現(xiàn)有的資金、技術(shù)條件下, 找到1個(gè)或2個(gè)突破口, 改變落后現(xiàn)狀, 在國(guó)際同類研究領(lǐng)域爭(zhēng)得一席之地, 我們認(rèn)為應(yīng)該在策略上作些調(diào)整。11在人類基因組研究上, 找功能基因。利用我國(guó)豐富的遺傳資源和廣泛的疾病譜系, 從“c DNA ”入手, 盡快地克隆一批新基因?!癱 DNA ”又稱互補(bǔ)DNA , 只占整個(gè)基因組DNA 很小的一部分, 是編碼蛋白質(zhì)的, 即功
13、能基因, , 才可以完成, 我, , 利用我們的優(yōu)勢(shì), 。21在引進(jìn)國(guó)外數(shù)據(jù)庫(kù)的同時(shí), 建立中國(guó)人基因資源數(shù)據(jù)庫(kù)。生物信息學(xué)對(duì)推進(jìn)基因組的工作十分重要, 充分利用國(guó)際基因信息庫(kù)的信息, 建立國(guó)際合作關(guān)系, 在基因組研究工作的基礎(chǔ)上, 組建自己的生物信息網(wǎng)絡(luò), 建設(shè)基因資源、基因結(jié)構(gòu)的數(shù)據(jù)庫(kù)。同時(shí), 進(jìn)行分析軟件的開(kāi)發(fā)研究, 構(gòu)建特殊需要的二級(jí)、三級(jí)數(shù)據(jù)庫(kù), 從已知的c DNA 文庫(kù)中, 進(jìn)行測(cè)序和功能推測(cè)研究, 發(fā)現(xiàn)新基因, 才有可能在國(guó)際人類基因組計(jì)劃中占有一席之地。31人才培養(yǎng)。當(dāng)務(wù)之急是對(duì)現(xiàn)有從事基因研究的科技人員進(jìn)行生物信息學(xué)的培訓(xùn)。只有有了中國(guó)自己的一支專門(mén)從事生物信息學(xué)研究的科研隊(duì)
14、伍, 才能在中國(guó)人類基因組研究中做出國(guó)際領(lǐng)先水平的工作。參考文獻(xiàn)1劉春宇, 夏家輝1國(guó)外醫(yī)學(xué)遺傳學(xué)分冊(cè), 1996, 19(5 :2622李衛(wèi)東, 王明榮1國(guó)外醫(yī)學(xué)遺傳學(xué)分冊(cè), 1996, 19(5 :2643丁達(dá)夫, 梁衛(wèi)平, 陳潔1生物信息學(xué), 1998, 50, 2(3 :20(上接第60頁(yè)10N akano T , FujiM , N agano K et al . N ipp on S teel T echnical R ep ort , 1987, 34(7 :2111M c D avid R M , T hom as B G . M etallu rg ical and M aterials T ransactions B , 1996, 27B :67212Ho B . M aster s thesis , U niversity of Illi 2no is at U rbana 2Champaign , U rbana , I L , 199113M c D avid R M . M as
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度文化傳媒內(nèi)容制作合同
- 2024年大型活動(dòng)保障車輛租賃合同
- 2024年上海房屋裝修工程分包合同
- 2024年廉潔承諾函:雙方誠(chéng)信自律協(xié)議
- 教育工作者主要先進(jìn)事跡(5篇)
- 中學(xué)生讀書(shū)演講稿
- 2024年度質(zhì)量控制合同:MLB棒球帽正品知識(shí)分享
- 2024年工程監(jiān)測(cè)與檢測(cè)合同
- 2024室內(nèi)外演唱會(huì)舞臺(tái)安全檢測(cè)合同
- 2024年國(guó)際商貿(mào)合同的科學(xué)與藝術(shù)
- 大學(xué)生國(guó)家安全教育學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 學(xué)術(shù)論文文獻(xiàn)閱讀與機(jī)助漢英翻譯智慧樹(shù)知到答案2024年重慶大學(xué)
- 2024分布式光伏并網(wǎng)發(fā)電系統(tǒng)設(shè)計(jì)導(dǎo)則
- 老年心房顫動(dòng)診治中國(guó)專家共識(shí)(2024)解讀
- 供貨方案及保證措施供貨方案六篇
- 深入學(xué)習(xí)2024《軍隊(duì)生態(tài)環(huán)境保護(hù)條例》
- (初級(jí))航空油料特設(shè)維修員(五級(jí))理論考試題庫(kù)-上(單選題)
- 2024新人教版物理八年級(jí)上冊(cè)《第三章 物態(tài)變化》大單元整體教學(xué)設(shè)計(jì)
- 同仁堂集團(tuán)招聘筆試題庫(kù)2024
- 中國(guó)蠶絲綢文化智慧樹(shù)知到答案2024年浙江大學(xué)
- 換電站(充電樁)安全風(fēng)險(xiǎn)告知
評(píng)論
0/150
提交評(píng)論