生物信息學札記第版_第1頁
生物信息學札記第版_第2頁
生物信息學札記第版_第3頁
生物信息學札記第版_第4頁
生物信息學札記第版_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學札記(第4版)樊龍江浙江大學作物科學研究所浙江大學生物信息學研究所浙江大學 IBM生物計算實驗室2017年9月本材料已由浙江大學出版社出版:生物信息學,樊龍江主編,2017部分內容可通過下列網址獲得:札記前言第一版這份材料是我學習和講授生物信息學課程時的備課筆記,材料大多是根據當時收集的一些外文資料翻譯編輯而成。學生在學習過程中經常要求我給他們提供一些中文的講義或材料,這促使我把我的這份筆記整理并放到網上,供大家參考。要提醒使用者的是,這份材料僅是根據我對生物信息學的一些浮淺的認識整理而成,其中的錯誤和偏頗只能請讀者自鑒了。2001年6月第二版 自1999年開始接觸生物信息學以來,一

2、晃已近六年,而本札記也近四歲了。2001和2002年中國科學院理論物理所的郝柏林院士在浙江大學首次開設生物信息學研究生課程,我作為他的助教系統(tǒng)地學習了生物信息學;同時,借著我國水稻基因組測序計劃的機遇,在他的帶領下從2001年開始從事水稻基因組分析,從此自己便完全投入到這一嶄新、引人入勝的領域中來。不斷有來信向我索要本札記的電子版文件,同時在不少網站上看到推薦該札記的內容。生物信息學、基因組學等發(fā)展很快,現(xiàn)在再回頭審看該札記,有些部分已慘不忍讀,這促使我下決心更新它。但因時間和學識問題,還是有不少部分自己不甚滿意,就只有待日后再努力了。歡迎告訴我札記中的BUG,我的信箱fanlj 或bioin

3、plant。2005年3月30日第三版近年來高通量測序技術產生的序列數(shù)據大量出現(xiàn)(如小RNA和大規(guī)模群體SNP數(shù)據),本次更新根據這一進展增加了兩章內容,分別是第七章有關小RNA的分析和第八章遺傳多態(tài)性及正向選擇檢測。兩章內容由我的博士生王煜為主編寫,李澤峰和劉云參與了文獻整理。另外還更新了第四章有關水稻基因組分析一節(jié)。2010年1月第四版2014年浙江大學開展本科生教材建設工作,我當時作為系主任要帶頭,就承諾編寫我主講的生物信息學教材。編寫教材的確不是一件容易的事,經過幾番掙扎和多方努力,總算完成了編寫,算是了卻了一樁心思。該教材內容比較完整,也跟蹤了生物信息學領域的最新進展。我就權且把該教

4、材內容作為札記的第四版,也算給該札記一個完美的結尾。2017年9月生物信息學前言 自開始接觸生物信息學以來,一晃已近二十年了。我是在攻讀博士期間開始注意并學習生物信息學的。我的博士生導師胡秉民為應用數(shù)學專業(yè)教授,主要從事生態(tài)系統(tǒng)模型模擬研究。雖然已具備一定數(shù)量統(tǒng)計和數(shù)量遺傳學基礎,但當時對于生物信息學,我還是非常陌生的,通過自學才開始一點點了解這門新興學科。2001-2003年間,中國科學院理論物理所郝柏林院士在浙江大學首次開設“生物信息學”研究生課程,我作為他的助教,系統(tǒng)地學習了生物信息學;同時,在他的帶領下從事水稻基因組分析。自那時起,浙江大學生物信息學學科和相應研究機構也逐步建立起來。2

5、004年郝院士離開杭州加入復旦大學,生物信息學研究生課程就由我和朱軍教授承擔下來。現(xiàn)在該課程作為浙江大學全校性研究生公共課程,已成為一門重點建設課程,每年選課人數(shù)都在150人左右。上個世紀末,我國生物信息學還處于起步階段,學習資料很少。學生時常索要學習材料,于是我整理了備課筆記,取名生物信息學札記,于2001年6月掛到實驗室主頁上供學生參考。隨著生物信息學發(fā)展,分別于2005年3月和2010年1月更新札記兩次。由于網絡傳播的作用,許多生物信息學初學者都讀過該札記,在國內形成一定的影響。本書是在該札記框架基礎上,補充大量新材料編寫而成。生物信息學學科內容涵蓋廣且發(fā)展很快?;趪鴥韧馍镄畔W相關

6、教材,以及自身對生物信息學的粗淺理解,我把生物信息學大致分為四部分(篇)內容:第一部分即基礎篇,為生物信息學的基礎知識。這部分內容總體變化不大(與10-15年前比較),它是生物信息學的核心知識,生物信息學教學最重要部分,為應為必講內容;第二部分高通量測序數(shù)據分析篇,最近十年才出現(xiàn)的生物信息學新內容。2005年高通量測序技術突破后,針對該技術產生的序列數(shù)據,出現(xiàn)大量生物信息學新算法和新工具;第三部分生物信息學外延與交叉,重點介紹與生物信息學密切相關的其他生物學學科。生物信息學引入了這些學科的部分核心技術(或反過來被引入),如數(shù)量遺傳學、群體遺傳學和新興學科合成生物學;第四部分為生物信息學資源與實

7、踐篇。生物信息學數(shù)據庫和軟件工具對生物學學科至關重要,所以這部分也是生物信息學重要組成部分。同時,該篇中以實踐為目的的生物信息學教學資源是課堂教學的一個很好補充。我重點編寫了本書第一部分基礎篇。我的學生參與撰寫了有關章節(jié),同時也邀請了相應領域研究者參與部分章節(jié)撰寫(徐海明:數(shù)量遺傳學;阮松林:蛋白質組學),最后由我統(tǒng)稿。我們盡可能完整地列出參考書目,標注材料來源,但一定還會有所遺漏。本書受浙江大學本科專業(yè)核心課程教材建設專項經費資助出版。每次拿起書稿總是能發(fā)現(xiàn)一些錯誤或不準確的地方,但由于出版計劃一再拖延,只好交稿付印了。如果你發(fā)現(xiàn)書中問題,望賜教指正(fanlj),以便我們再版時更正。樊龍江

8、2016年9月生物信息學簡要目錄及PDF下載(二校稿,以出版為準)緒論PDF第一篇:生物信息學基礎第1-1章生物信息類型及其產生途徑PDF第1-2章分子數(shù)據庫和常見記錄格式第1-3章兩條序列聯(lián)配及其算法PDF第1-4章多條序列聯(lián)配及功能域分析PDF第1-5章基因預測與功能注釋PDF第1-6章系統(tǒng)發(fā)生樹構建第1-7章蛋白質結構預測與藥物設計第1-8章生物信息學計算機基礎第二篇:高通量測序數(shù)據分析第2-1章基因組拼接與分析PDF第2-2章基因組變異與分析第2-3章轉錄組分析第2-4章非編碼RNA分析PDF第2-5章甲基化與組蛋白修飾第2-6章宏基因組分析第2-7章蛋白質組分析第三篇:生物信息學外延

9、與交叉第3-1章系統(tǒng)生物學第3-2章群體遺傳學第3-3章數(shù)量遺傳學第3-4章合成生物學第四篇:生物信息學資源與實踐第4-1章生物信息學常用代碼和關鍵詞第4-2章生物信息學常用英語術語及釋義第4-3章生物信息學主要數(shù)據庫與工具PDF第4-4章生物信息學實驗PDF參考文獻詳細目錄序郝柏林院士前言緒論第一節(jié)生物信息與生物信息學第二節(jié)生物信息學簡史與展望第三節(jié)本書的組織和使用第一篇:生物信息學基礎第1-1章生物信息類型及其產生途徑第一節(jié)生物信息的類型第二節(jié)DNA測序技術1、 第一代測序技術2、 第二代測序技術3、 第三代測序技術第三節(jié)高通量測序技術的應用1、 DNA/RNA相關測序2、 蛋白質-DNA

10、/RNA互作3、 甲基化/宏基因組第四節(jié)蛋白質序列及其結構測定1、 蛋白質序列與蛋白質互作測定2、 蛋白質結構測定第1-2章分子數(shù)據庫和常見記錄格式第一節(jié)分子序列數(shù)據庫概述一、分子數(shù)據庫概念二、數(shù)據庫記錄格式三、數(shù)據庫冗余、序列遞交和檢索第二節(jié)核苷酸及其相關數(shù)據庫一、DNA/RNA序列數(shù)據庫二、基因組數(shù)據庫三、非編碼RNA數(shù)據庫第三節(jié)蛋白質及其相關數(shù)據庫第四節(jié)代謝途徑等專業(yè)數(shù)據庫1、 代謝途徑數(shù)據庫2、 代謝組學等數(shù)據庫第1-3章兩條序列聯(lián)配及其算法第一節(jié)序列聯(lián)配基本概念第二節(jié)計分矩陣1、 計分矩陣的一般原理2、 氨基酸替換矩陣四、位置特異性計分矩陣(PSSM)第三節(jié)兩條序列聯(lián)配算法一、Nee

11、dleman-Wunsch算法二、Smith-Waterman算法第四節(jié)BLAST算法及數(shù)據庫搜索1、 BLAST算法2、 利用BLAST進行數(shù)據庫序列搜索三、序列相似性的統(tǒng)計推斷第1-4章多條序列聯(lián)配及功能域分析第一節(jié)多序列聯(lián)配概念及其算法1、 多序列聯(lián)配概念2、 多序列全局聯(lián)配算法三、多序列局部聯(lián)配算法第二節(jié)蛋白質序列功能域分析與模型1、 功能域概念二、功能域模型第三節(jié)熵及矩陣信息量1、 不確定性與信息量二、信息熵的應用第1-5章基因預測與功能注釋第一節(jié)基因組序列構成與基因預測一、基因組序列的基本構成 二、基因預測及其基本方法三、基因注釋流程第二節(jié)從頭預測隱馬爾可夫模型(HMM)方法1、

12、馬爾可夫和隱馬爾可夫模型二、隱馬爾可夫模型問題及其算法三、HMM基因預測模型及其應用第三節(jié)貝葉斯統(tǒng)計及其基因預測應用1、 貝葉斯統(tǒng)計與生物信息學2、 利用貝葉斯統(tǒng)計進行基因預測第四節(jié)基因功能注釋一、利用序列和結構域數(shù)據庫進行注釋二、利用功能分類和代謝途徑信息進行注釋第五節(jié)基因序列構成分析一、堿基構成與分布二、DNA行走與Z曲線三、同向重復序列分析四、蛋白質序列跨膜等特征分析第1-6章系統(tǒng)發(fā)生樹構建第一節(jié)系統(tǒng)發(fā)生樹與遺傳模型一、系統(tǒng)發(fā)生樹概述二、遺傳模型第二節(jié)距離法1、 非加權平均連接聚類法(UPGMA法)二、Fitch-Margoliash算法三、鄰接法第三節(jié)簡約法第四節(jié)似然法一、DNA序列的

13、似然模型二、兩條序列系統(tǒng)發(fā)生樹三、三條及多條序列系統(tǒng)發(fā)生樹第五節(jié)基因組組分矢量方法1、 組分矢量方法(CVTree算法)2、 基因組關聯(lián)“距離”與系統(tǒng)發(fā)生樹構建第1-7章蛋白質結構預測與藥物設計第一節(jié)蛋白質結構概述1、 蛋白質結構及其預測2、 蛋白質結構數(shù)據庫3、 蛋白質結構主要預測工具第二節(jié)蛋白質二級結構預測1、 二級結構預測方法2、 結構預測實例第三節(jié)蛋白質三級結構預測一、同源建模法二、折疊識別法第四節(jié)計算機輔助藥物設計1、 間接藥物設計二、直接藥物設計第1-8章生物信息學計算機基礎第一節(jié)使用Unix/Linux操作平臺一、Unix/Linux操作系統(tǒng)及其結構二、Linux Shell常用

14、命令第二節(jié)掌握一門計算機編程語言1、 計算機編程語言2、 Python語言簡介3、 R語言4、 MySQL語言第三節(jié)并行與自動化一、并行式計算二、并行化模型及其實例第四節(jié)其他一、算法二、可視化與畫圖第二篇:高通量測序數(shù)據分析第2-1章基因組拼接與分析第一節(jié)基因組序列拼接概念1、 基因組短序列拼接問題2、 基因組從頭拼接主要方法3、 利用遺傳圖譜等進行基因組組裝第二節(jié)圖論及基于德布魯因圖拼接算法1、 圖論2、 基于德布魯因圖的拼接算法第三節(jié)第三代測序數(shù)據拼接方法第四節(jié)基于字符串(K-mer)的基因組調查與分析1、 基因組大小估計2、 基因組復雜度估計3、 基因組“肖像”及缺失字符串分析第2-2章

15、基因組變異與分析第一節(jié)基因組變異類型與檢測方法1、 基因組變異類型2、 基因組變異檢測方法第二節(jié)基因組重測序及其應用1、 基因組重測序應用領域2、 基因組重測序數(shù)據分析第2-3章轉錄組分析第一節(jié)轉錄組測序與拼接1、 轉錄組及其技術平臺2、 轉錄組序列拼接第二節(jié)基因表達分析1、 差異表達基因的鑒定2、 差異表達基因富集分析第三節(jié)可變剪切和基因融合分析1、 基因可變剪切2、 融合基因第2-4章非編碼RNA分析第一節(jié)非編碼RNA簡介1、 非編碼RNA類型與功能2、 非編碼RNA進化3、 樣品采集及其測序方法4、 非編碼RNA主要數(shù)據庫第二節(jié)小RNA計算識別與靶基因預測1、 miRNA主要特征及計算識

16、別2、 siRNA主要特征及計算識別3、 miRNA和siRNA靶基因預測第三節(jié)長非編碼RNA鑒定與功能分析1、 線性lncRNA鑒定2、 環(huán)化RNA鑒定3、 lncRNA功能預測第2-5章甲基化與組蛋白修飾第一節(jié)表觀遺傳機制第二節(jié)甲基化測序與分析1、 甲基化測序原理2、 生物信息學分析方法第三節(jié)組蛋白修飾測定與分析1、 組蛋白的樣品制備2、 組蛋白修飾分析方法第2-6章宏基因組分析第一節(jié)宏基因組及其分析方法1、 宏基因組概述2、 宏基因組學技術應用第二節(jié)16S rDNA序列分析1、 技術方法與分析流程2、 物種多樣性分析3、 物種豐富度估計4、 群落結構分析第三節(jié)全基因組序列數(shù)據分析1、 分

17、析流程與內容2、 基因預測及功能注釋第2-7章蛋白質組分析第一節(jié)蛋白質組學概述1、 蛋白質組及其分析2、 高通量分離和鑒定技術第二節(jié)雙向電泳圖像與質譜組合分析1、 膠圖獲取與分析2、 利用指紋圖譜鑒定蛋白質第三節(jié)質譜數(shù)據采集與分析1、 質譜數(shù)據采集策略2、 肽段數(shù)據庫搜索與質量控制第四節(jié)定量蛋白質組分析1、 同位素標記定量分析2、 非同位素標記定量分析第三篇:生物信息學外延與交叉第3-1章系統(tǒng)生物學第一節(jié)系統(tǒng)生物學概述第二節(jié)網絡與生物網絡1、 無標度和階層網絡2、 生物網絡模塊及其算法工具第三節(jié)基因調控網絡1、 布爾網絡模型2、 貝葉斯網絡模型第3-2章群體遺傳學第一節(jié)群體遺傳多態(tài)性與結構1、

18、 遺傳多態(tài)性及其估計2、 群體結構第二節(jié)正向選擇的統(tǒng)計檢驗1、 自然選擇與中性檢驗2、 基于種內多態(tài)性的檢驗方法3、 基于種內多態(tài)和種間分歧度的檢測方法第三節(jié)群體進化的溯祖測驗一、溯祖理論二、溯祖測驗應用第四節(jié)統(tǒng)計測驗分析問題與策略第3-3章數(shù)量遺傳學第一節(jié)數(shù)量性狀遺傳基本概念第二節(jié)連鎖分析1、 連鎖分析原理2、 試驗群體的連鎖分析3、 常用連鎖分析軟件第三節(jié)關聯(lián)分析1、 關聯(lián)分析基本原理2、 常用關聯(lián)分析軟件第3-4章合成生物學第一節(jié)什么是合成生物學?1、 合成生物學定義和研究內容2、 合成生物學引發(fā)的爭議第二節(jié)從“基因線路”開始:模塊化工程化1、 基因線路的基本概念2、 幾個經典基因線路設計第三節(jié)從最小基因組開始:基因組人工合成1、 基因組的人工合成和重構2、 噬菌體基因組人工合成與重構3、 細菌基因組人工合成與重構第四篇:生物信息學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論