




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
后基因組時(shí)代的生物信息胡艷玲謝瑩HGP——人類(lèi)基因組計(jì)劃這張解剖圖將包括4張小圖,包括了人類(lèi)基因組計(jì)劃的全部主要內(nèi)容,它們分別是遺傳圖(連鎖圖)、物理圖、序列圖和轉(zhuǎn)錄圖。后基因組時(shí)代的生物信息學(xué)2003年HGP測(cè)序工作全部完成后,生命科學(xué)進(jìn)入后基因組時(shí)代。
※
后基因組時(shí)代的工作重點(diǎn)是:在整體水平上對(duì)基因組的功能進(jìn)行研究。由此誕生了功結(jié)構(gòu)基因組學(xué)能基因?qū)W,結(jié)構(gòu)是功能的基礎(chǔ),又產(chǎn)生了。
※
在功能基因組學(xué)的基礎(chǔ)上又產(chǎn)生了蛋白組學(xué)和RNA組學(xué)。第一節(jié)基因組表達(dá)及調(diào)控的研究基因組表達(dá)及調(diào)控在全細(xì)胞的水平,識(shí)別所有基因組表達(dá)產(chǎn)物:※mRNA:cDNA陣列※
蛋白質(zhì):二維電泳—質(zhì)譜研究生物大分子相互作用: 闡明基因組表達(dá)在發(fā)育過(guò)程中的時(shí)、空的整體調(diào)控網(wǎng)絡(luò)。蛋白質(zhì)組學(xué): 高通量解析蛋白質(zhì)的高級(jí)結(jié)構(gòu),是連接基因組功能研究和新藥開(kāi)發(fā)的橋梁。基因組學(xué)、生物信息學(xué)與新藥研制未來(lái)的藥物研究過(guò)程將是基于生物信息知識(shí)挖掘的過(guò)程數(shù)據(jù)處理和關(guān)聯(lián)分析發(fā)現(xiàn)藥物作用對(duì)象確定靶目標(biāo)分子針對(duì)靶目標(biāo)進(jìn)行合理的藥物設(shè)計(jì)CDNA微陣列基因表達(dá)數(shù)據(jù)的網(wǎng)絡(luò)資源
※GEO(/geo)
※
ArrayExpress(http://www.ebi.ac.uk/arrayexpress/)
※SMD(/)除了以上3個(gè)綜合性的基因表達(dá)數(shù)據(jù)倉(cāng)庫(kù)外,還有一些專(zhuān)門(mén)的基因表達(dá)數(shù)據(jù)庫(kù),例如
※YMD(YaleMicroarrayDatabase,/microarray/)
※ArrayDB(/arraydb/)
※BodyMap(http://bodymap.ims.u-tokyo.ac.jp/)
※ExpressDB(/ExpressDB/)
※HuGEIndex(HumanGeneExpressionIndex,/welcome/index.html)基因表達(dá)數(shù)據(jù)的聚類(lèi)分析聚類(lèi)分析可將具有相似表達(dá)模式的基因聚在一起,分析同類(lèi)基因的功能,并對(duì)未知基因的功能和生物學(xué)特性進(jìn)行推測(cè)。
分層聚類(lèi)分裂或凝聚算法運(yùn)行到某一階段,類(lèi)別劃分結(jié)果達(dá)到聚類(lèi)標(biāo)準(zhǔn)時(shí)即可停止分裂或凝聚;K-均值聚類(lèi)優(yōu)點(diǎn):思想簡(jiǎn)單易行,時(shí)間復(fù)雜性接近線(xiàn)性,對(duì)大規(guī)模數(shù)據(jù)的挖掘具有高效性和可伸縮性。缺點(diǎn):該算法要求預(yù)指定類(lèi)數(shù),而實(shí)際應(yīng)用中很難預(yù)測(cè)類(lèi)數(shù),因此需要通過(guò)試誤,即使用多套不同的參數(shù)設(shè)定,比較其結(jié)果,并且從生物學(xué)角度對(duì)結(jié)果進(jìn)行驗(yàn)證。K-均值聚類(lèi)SOM聚類(lèi)SOM(自組織映射)的由來(lái):
1991,Kohonen提出,模擬人腦中的神經(jīng)元層;人腦中不同的神經(jīng)元區(qū)域負(fù)責(zé)不同的功能;一旦有外部刺激,與刺激相關(guān)的神經(jīng)元會(huì)被激勵(lì),并且其附近神經(jīng)元也會(huì)受到激勵(lì);SOM聚類(lèi)(一)輸入數(shù)據(jù)獲勝神經(jīng)元臨近神經(jīng)元12SOM聚類(lèi)(二)輸入數(shù)據(jù)獲勝神經(jīng)元臨近神經(jīng)元不同的神經(jīng)元區(qū)域代表不同的輸入數(shù)據(jù)模式34基因網(wǎng)絡(luò)研究的前提假定和基本原理什么是基因調(diào)控網(wǎng)絡(luò)?細(xì)胞、DNA、蛋白質(zhì)、基因、基因網(wǎng)絡(luò)為什么要研究基因調(diào)控網(wǎng)絡(luò)?從分子水平認(rèn)識(shí)細(xì)胞組織的功能。我完全不懂生物學(xué);我為什么要講這個(gè)?了解基因調(diào)控網(wǎng)絡(luò),對(duì)我們有什么啟發(fā)?基因和蛋白質(zhì)基因網(wǎng)絡(luò)研究的前提假定和基本原理基因調(diào)控網(wǎng)絡(luò)是指一組調(diào)控因子如何調(diào)控一套基因表達(dá)的過(guò)程.機(jī)體的功能發(fā)展來(lái)緣于遺傳網(wǎng)絡(luò)間的互作?;蚓W(wǎng)絡(luò)研究的前提假定和基本原理基因調(diào)控網(wǎng)絡(luò)研究的目的※識(shí)別和推斷基因網(wǎng)絡(luò)的結(jié)構(gòu)、特性和調(diào)控關(guān)系※認(rèn)識(shí)復(fù)雜的分子調(diào)控過(guò)程※理解支配基因表達(dá)和功能的基本規(guī)則※揭示基因表達(dá)過(guò)程中的信息傳輸規(guī)律※整體的框架下研究基因的功能近年來(lái)發(fā)表的基于微陣列數(shù)據(jù)進(jìn)行基因調(diào)控網(wǎng)絡(luò)構(gòu)建和分析的軟件包基因調(diào)控網(wǎng)絡(luò)整合分析※基因表達(dá)數(shù)據(jù)※DNA序列※轉(zhuǎn)錄因子與順式調(diào)控元件相互作用※蛋白—蛋白相互作用※蛋白在細(xì)胞中的定位等再結(jié)合生物學(xué)實(shí)驗(yàn)驗(yàn)證,可以完善基因調(diào)控網(wǎng)絡(luò)。經(jīng)過(guò)若干次的建?!M—實(shí)驗(yàn)循環(huán)可以逼近真實(shí)的生物學(xué)基因調(diào)控網(wǎng)絡(luò)。文本挖掘的提出※雷諾氏?。菏且环N治療方法和病因?qū)W都未知的血液系統(tǒng)疾病,表現(xiàn)為血液循環(huán)紊亂,血液黏度升高?!渌墨I(xiàn)中發(fā)現(xiàn)食用魚(yú)油可以降低血液黏度?!鵖wanson把這兩種知識(shí)聯(lián)系起來(lái)提出食用魚(yú)油應(yīng)該對(duì)雷諾氏病病人有幫助的假設(shè)。
3年后有人通過(guò)臨床實(shí)驗(yàn)證實(shí)了這一點(diǎn)從文獻(xiàn)中可以發(fā)現(xiàn)或者挖掘到以前未知的知識(shí)文本挖掘的方法基于文獻(xiàn)的生物信息分析最重要一點(diǎn)就是如何找出隱含的、具有語(yǔ)義關(guān)聯(lián)的生物概念進(jìn)行下一步的推理,這也是最為復(fù)雜的步驟。主要有以下方法:
※基于統(tǒng)計(jì)的方法
※基于自然語(yǔ)言處理的方法
※基于關(guān)聯(lián)規(guī)則挖掘的方法
※于模式識(shí)別的方法基于統(tǒng)計(jì)方法的文本挖掘基于統(tǒng)計(jì)的方法是通過(guò)詞的共現(xiàn)對(duì)已知基因或者其他生物信息關(guān)系進(jìn)行聚類(lèi)分析,得到新的基因或生物功能相互作用關(guān)系,或通過(guò)查找彼此間經(jīng)常同時(shí)出現(xiàn)但不是隨機(jī)出現(xiàn)的實(shí)體,進(jìn)而鑒別出關(guān)系。CHAUSSABEL等提出了一種用文獻(xiàn)輪廓挖掘微陣列表達(dá)數(shù)據(jù)技術(shù)PUBGENE(HTTP://WWW.PUBGENE.ORG/)基于自然語(yǔ)言處理的方法基于自然語(yǔ)言處理的系統(tǒng):通過(guò)分析語(yǔ)法結(jié)構(gòu)進(jìn)行關(guān)系抽取,對(duì)句子從詞法、句法和語(yǔ)義上進(jìn)行解析,把自然語(yǔ)言分解為可以從中提取出關(guān)系的結(jié)構(gòu)。例子:
MedstractEngCG基于關(guān)聯(lián)規(guī)則挖掘的方法關(guān)聯(lián)規(guī)則相對(duì)于其他在基因芯片數(shù)據(jù)分析中使用的數(shù)據(jù)挖掘技術(shù)(例如聚類(lèi)分析、主成份分析、因子分析等)而言,能夠推測(cè)基因之間表達(dá)關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則一般形式是LHS—RHS。例子:
{geneA↑}→{geneB↑,geneC↓}基于模式識(shí)別的方法基于模式識(shí)別的方法是對(duì)與已知有關(guān)系的實(shí)體相鄰近的文本進(jìn)行模式的抽象,再利用生成的模式對(duì)測(cè)試語(yǔ)料集文本進(jìn)行模式匹配,最終得到基因或蛋白質(zhì)關(guān)系結(jié)果。
例子:
RLIMS—P第三節(jié)分子進(jìn)化和系統(tǒng)發(fā)育分析分子進(jìn)化和系統(tǒng)發(fā)育分析我們學(xué)醫(yī),又不研究物種,學(xué)進(jìn)化有什么用?廣西地區(qū)動(dòng)物HEV基因型及亞型分布過(guò)度繁殖有限的生活條件+導(dǎo)致生存斗爭(zhēng)+變異導(dǎo)致適者生存+有利性狀遺傳導(dǎo)致生物新類(lèi)型出現(xiàn)達(dá)爾文把這種在生存斗爭(zhēng)中,適者生存、不適者被淘汰的過(guò)程,叫做自然選擇。過(guò)度繁殖生存斗爭(zhēng)遺傳變異適者生存
達(dá)爾文的“自然選擇”學(xué)說(shuō)基因突變1、核苷酸替代、插入/缺失、重組2、基因轉(zhuǎn)換固定在生物個(gè)體以及物種內(nèi)遺傳漂變自然選擇傳遞給后代產(chǎn)生新的形態(tài)、性狀分子系統(tǒng)學(xué)是研究進(jìn)化機(jī)制的一個(gè)重要工具。生物進(jìn)化的分子機(jī)制abcdabcd拓?fù)浣Y(jié)構(gòu):有根樹(shù):反映時(shí)間順序無(wú)根樹(shù):反映距離
理論上,一個(gè)DNA序列在物種形成或基因復(fù)制時(shí),分裂成兩個(gè)子序列,因此系統(tǒng)發(fā)育樹(shù)一般是二歧的。一般考慮二歧的樹(shù)結(jié)構(gòu):二歧樹(shù)分支:內(nèi)部分支外部分支節(jié)點(diǎn):內(nèi)部節(jié)點(diǎn)外部節(jié)點(diǎn)系統(tǒng)發(fā)育樹(shù)的種類(lèi)——有根樹(shù)、無(wú)根樹(shù)構(gòu)建系統(tǒng)發(fā)育樹(shù)的數(shù)據(jù)1、特征數(shù)據(jù)(characterdata):提供了基因、個(gè)體、群體或物種的信息2、距離數(shù)據(jù)(distancedata)或相似性數(shù)據(jù)(similaritydata):涉及的則是成對(duì)基因、個(gè)體、群體或物種的信息。
距離矩陣距離數(shù)據(jù)可以由特征數(shù)據(jù)計(jì)算得到。反之?系統(tǒng)發(fā)育樹(shù)的構(gòu)建構(gòu)建系統(tǒng)發(fā)育樹(shù)的數(shù)據(jù)1、特征數(shù)據(jù)(characterdata):提供了基因、個(gè)體、群體或物種的信息2、距離數(shù)據(jù)(distancedata)或相似性數(shù)據(jù)(similaritydata):涉及的則是成對(duì)基因、個(gè)體、群體或物種的信息。
距離矩陣距離數(shù)據(jù)可以由特征數(shù)據(jù)計(jì)算得到。反之?系統(tǒng)發(fā)育樹(shù)的構(gòu)建paralogsorthologs分子進(jìn)化與系統(tǒng)發(fā)育分析軟件第四節(jié)單核苷酸多態(tài)性與連鎖不平衡人類(lèi)基因組多態(tài)性遺傳信息檢驗(yàn)–風(fēng)險(xiǎn)估計(jì)研究–臨床醫(yī)學(xué)轉(zhuǎn)換分子遺傳流行病學(xué)Isthereafamilialaggregation?Isitgenetic?Whichgeneticmodel?Whichgenes?ContributioningeneralpopulationClinicalobservationCase-controlstudyTwinstudyAdoptionstudyMigrationstudySegregationstudyLinkagestudyAssociationstudyGene-geneGene-environment基因分型分析DNA序列的變異性人類(lèi)DNA序列99.9%都是一樣的
→3000000核酸存在差異通常定義為多態(tài)性SNP其較低等位位點(diǎn)頻率>1%遺傳變異研究的目的挖掘遺傳性疾病的病因以及預(yù)防預(yù)測(cè)進(jìn)行個(gè)性化醫(yī)療通過(guò)位點(diǎn)確定疾病基因一般術(shù)語(yǔ)連鎖不平衡(LD)在某一群體中,不同座位上某兩個(gè)等位基因出現(xiàn)在同一條單元型上的頻率與預(yù)期的隨機(jī)頻率之間存在明顯差異的現(xiàn)象。微衛(wèi)星標(biāo)記2-4個(gè)核苷酸重復(fù)GAACGTACTCACACACACACACATTTGACTTCGATGATAGATAGATAGATAGATACGT重復(fù)數(shù)(→30)具有高度多態(tài)性均勻分布在整個(gè)基因組通過(guò)PCR就可以鑒別出來(lái)ACGTGTCGGTCTTAAA
MaternalchromosomeACGTGTCCGTCTTAAA
PaternalchromosomeACGTGTCGGTCTTAAA
Maternalchromosome
ACGTGTCGGTCTTAAA
PaternalchromosomeACGTGTCCGTCTTAAA
MaternalchromosomeACGTGTCCTACTTAAA
PaternalchromosomeIndividual1Individual2Individual3SNP單核苷多態(tài)(SNP)單體型57單體型即位于一條染色體上或某一區(qū)域的一組相關(guān)聯(lián)的SNP位點(diǎn)。單體型構(gòu)建分子實(shí)驗(yàn)構(gòu)建單體型費(fèi)用昂貴、耗資大 Genotypes → Haplotypes,twoalternatives SNP1AT AT AT SNP2GC GC CG →統(tǒng)計(jì)統(tǒng)計(jì)學(xué)推斷單體型更可行。單體型構(gòu)建基于家庭的單體型構(gòu)建分析軟件:Simwalk,Merlin,Genehunter,Allegro...基于非親緣的單體型構(gòu)建沒(méi)有基于家庭可靠EM-算法(期望最大算法)://www-gene.cimr.cam.ac.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度宅基地子女贈(zèng)與及后續(xù)土地開(kāi)發(fā)利用合同
- 2025年甘肅有色冶金職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及參考答案
- 2025年度房地產(chǎn)租賃合同管理及市場(chǎng)調(diào)控合同
- 2025年度三方委托付款與物流運(yùn)輸合同
- 2025年度XX小區(qū)供熱設(shè)施安全評(píng)估與供用熱力合同
- 2025年度養(yǎng)老機(jī)構(gòu)委托經(jīng)營(yíng)管理協(xié)議
- 2025年度新能源汽車(chē)合伙項(xiàng)目退股協(xié)議書(shū)
- 2025年度學(xué)校學(xué)生資助項(xiàng)目合同協(xié)議
- 2025年度國(guó)際學(xué)校辦學(xué)許可引進(jìn)與轉(zhuǎn)讓合同
- 2025年湖北省鄂州市單招職業(yè)適應(yīng)性測(cè)試題庫(kù)帶答案
- 2024年廣東省《輔警招聘考試必刷500題》考試題庫(kù)含必背答案
- 餐飲企業(yè)牛奶產(chǎn)品推廣方案
- 2025年中國(guó)南光集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 工程造價(jià)鑒定申請(qǐng)書(shū)
- 五年級(jí)下冊(cè)數(shù)學(xué)北師大版課件練習(xí)一
- 《房屋建筑發(fā)展史》課件
- 第6章平面圖形的初步認(rèn)識(shí)數(shù)學(xué)探究雞蛋餅的分割教案2024-2025學(xué)年蘇科版(2024)七年級(jí)數(shù)學(xué)上冊(cè)
- 如何開(kāi)展中醫(yī)護(hù)理技術(shù)
- 麻醉、精神藥品培訓(xùn)課件
- 新媒體導(dǎo)論彭蘭課件
- 安全生產(chǎn)管理制度匯編(一般化工企業(yè))
評(píng)論
0/150
提交評(píng)論