




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
ICSCCS65.020.99GXTCTechnicalspecificationofjickfruitcoldresistancegeneminingbasedontranscriptomesequencingtechnIT/GXTC0015—2024本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由廣西壯族自治區(qū)亞熱帶作物研究所提出并宣貫。本文件由廣西熱帶作物學(xué)會歸口。本文件起草單位:廣西壯族自治區(qū)亞熱帶作物研究所。本文件主要起草人:杜英俊、朱鵬錦、唐秀觀、鐘云婕、何江、歐景莉、葉維雁。1T/GXTC0015—2024菠蘿蜜抗寒基因挖掘技術(shù)規(guī)范基于轉(zhuǎn)錄組測序技術(shù)本文件界定了菠蘿蜜抗寒基因挖掘基于轉(zhuǎn)錄組測序技術(shù)的術(shù)語和定義,給出了技術(shù)原理,并規(guī)定了儀器設(shè)備及試劑、品種選擇與使用、轉(zhuǎn)錄組測序流程、生物信息學(xué)分析的要求。本文件適用于篩選菠蘿蜜抗寒基因。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T35890高通量測序數(shù)據(jù)序列格式規(guī)范3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1轉(zhuǎn)錄組測序transcriptomesequencing通過二代測序平臺快速全面地獲得某一物種特定細(xì)胞或組織在某一狀態(tài)下的幾乎所有的轉(zhuǎn)錄本及基因序列,可以用于研究基因表達(dá)量、基因功能、結(jié)構(gòu)、可變剪接和新轉(zhuǎn)錄本預(yù)測等。3.2fastq格式fastqformat基于文本的、保存生物序列(通常是核酸序列)和其測序質(zhì)量信息的、每四行表示一條序列的標(biāo)準(zhǔn)格式。3.3質(zhì)量控制qualitycontrol對測序儀下機的原始數(shù)據(jù)進(jìn)行質(zhì)量評估,具體內(nèi)容包括含N比例、GC含量、序列重復(fù)情況、序列長度分布情況、堿基平衡情況等。3.4測序片段sequencingfragment高通量測序平臺產(chǎn)生的含有堿基序列和質(zhì)量值的序列片段。3.5差異表達(dá)基因differentiallyexpressedgenes(DEGs)通過閾值法、統(tǒng)計法或者其他檢驗方法,篩選出組間的表達(dá)水平存在顯著差異的基因。3.6差異倍數(shù)foldchange根據(jù)同一個基因或轉(zhuǎn)錄本在不同條件下表達(dá)豐度差異的倍數(shù)。4原理根據(jù)基因在不同樣品中的表達(dá)量識別差異表達(dá)基因,并對其進(jìn)行功能注釋和富集分析,篩選差異表達(dá)基因。5儀器設(shè)備及試劑2T/GXTC0015—2024儀器:Illumina高通量測序平臺、瓊脂糖凝膠電泳儀、分光光度計、熒光計、生物分析儀。試劑:RNA提取試劑盒。6品種選擇與使用6.1品系選取選取生長勢一致耐寒品系(GXRZBLM00051,編號為A)和不耐寒品系(GXRZBLM00006,編號為B),低溫脅迫(3℃~4℃)后A正常生長發(fā)育,沒有出現(xiàn)寒害癥狀;而B出現(xiàn)寒害癥狀,其葉背面出現(xiàn)水浸狀斑塊,葉組織變成褐色或深褐色,后呈現(xiàn)青枯狀。6.2樣品制備分別選取兩個品系的菠蘿蜜各5棵樹,從東南西北四個方向隨機采集葉片,將葉片用去離子水(ddH?O)洗凈后放液氮中速凍,帶回實驗室-80℃凍存。7轉(zhuǎn)錄組測序流程7.1總RNA提取總RNA的提取采用多糖多酚植物總RNA提取試劑盒,操作按照RNA提取試劑盒說明書進(jìn)行。7.2RNA檢測度。檢測RNA完整性。7.3文庫構(gòu)建按下列步驟執(zhí)行:b)將RNA打斷成短片段;f)雙鏈cDNA末端修復(fù)、加A尾并連接測序接頭;7.4文庫質(zhì)檢7.4.1初步定量使用熒光計進(jìn)行初步定量,使用生物分析儀對文庫的插入片段長度(insertsize)進(jìn)行檢測,插入片段長度符合預(yù)期后才可進(jìn)行下一步實驗。7.4.2準(zhǔn)確定量運用Q-PCR(熒光定量PCR)方法對文庫的有效濃度進(jìn)行準(zhǔn)確定量(文庫有效濃度>2nM完成庫檢。7.5上機測序庫檢合格后,用Illumina平臺進(jìn)行測序,測序后得到原始數(shù)據(jù)。原始數(shù)據(jù)為fastq格式。3T/GXTC0015—20248生物信息學(xué)分析步驟8.1測序數(shù)據(jù)及質(zhì)量控制8.1.1測序數(shù)據(jù)過濾過濾流程如下:8.1.2測序錯誤率分布測序錯誤率計算公式如式(1):式中:e——測序錯誤率。8.1.3GC含量分布檢查測序讀段在每個位置的GC及AT含量應(yīng)分別相等,且在整個測序過程基本穩(wěn)定不變。8.2轉(zhuǎn)錄本拼接8.2.1拼接無參考基因組的轉(zhuǎn)錄組測序,采用Trinity軟件對cleanreads(經(jīng)過處理后去除低質(zhì)量、含有接頭的reads)進(jìn)行拼接以獲取后續(xù)分析的參考序列。8.2.2Corset聚類使用Corset比對轉(zhuǎn)錄本的reads數(shù)和表達(dá)模式,對轉(zhuǎn)錄本進(jìn)行層次聚類,層次聚類后的序列信息以FASTA格式儲存。8.2.3轉(zhuǎn)錄本拼接結(jié)果統(tǒng)計將Trinity拼接得到的轉(zhuǎn)錄本序列作為后續(xù)分析的參考序列,以Corset層次聚類后得到最長Cluster序8.3基因功能注釋8.3.1NR數(shù)據(jù)庫注釋結(jié)果統(tǒng)計與NR庫的比對,查看本物種轉(zhuǎn)錄本序列與相近物種的相似情況和同源序列的功能信息。8.3.2GO分類對基因進(jìn)行GO注釋之后,將注釋成功的基因按照GO三個大類生物過程、細(xì)胞組分、分子功能的下一層級進(jìn)行分類。8.3.3KOG分類4T/GXTC0015—2024運用KOG數(shù)據(jù)庫,將功能注釋直接繼承給同一KOG簇的其他成員。8.4CDS預(yù)測對組裝得到的轉(zhuǎn)錄本進(jìn)行CDS(編碼序列)預(yù)測,按下列步驟進(jìn)行:a)進(jìn)行開放閱讀框(ORF)預(yù)測,默認(rèn)保留氨基酸長度大于100的轉(zhuǎn)錄本。b)將預(yù)測得到的蛋白序列分別和Uniprot蛋白數(shù)據(jù)庫、PFAM蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫進(jìn)行比對注釋,提高CDS預(yù)測的靈敏度。c)結(jié)合蛋白數(shù)據(jù)庫的比對結(jié)果,保留和已知蛋白庫有同源性的、可信度得分最高的ORF。8.5基因表達(dá)定量步驟如下:a)將Trinity組裝并去冗余之后的轉(zhuǎn)錄本作為參考序列,將每個樣品的cleanreads(經(jīng)過處理后去除低質(zhì)量、含有接頭的reads)往參考序列上比對。讓片段數(shù)目能真實地反映轉(zhuǎn)錄本表達(dá)水平。c)采用FPKM作為衡量轉(zhuǎn)錄本或基因表達(dá)水平的指標(biāo),F(xiàn)PKM計算公式如式(2):式中:8.5.1樣品基因表達(dá)量整體分布用箱線圖中表示單個樣品基因表達(dá)水平分布的離散程度。用密度圖展示樣品中基因豐度隨著表達(dá)量變化的趨勢。用小提琴圖展示多組數(shù)據(jù)的分布狀態(tài)以及概率密度。8.5.2樣品相關(guān)性分析將皮爾遜相關(guān)系數(shù)r作為生物學(xué)重復(fù)相關(guān)性的評估指標(biāo)。生物學(xué)重復(fù)樣品間R2≥0.8。8.5.3主成分分析運用主成分分析(PCA)從原始變量中導(dǎo)出少數(shù)幾個主成分,將原來多個指標(biāo)作線性組合,作為新的綜合指標(biāo)。8.6差異基因篩選8.6.1差異表達(dá)基因分析和篩選條件設(shè)置按下列步驟執(zhí)行:a)有生物學(xué)重復(fù)的樣品,使用DESeq2進(jìn)行樣品組間的差異表達(dá)分析;無生物學(xué)重復(fù)的樣品使用FPKM等經(jīng)過標(biāo)準(zhǔn)化的數(shù)據(jù)。b)對假設(shè)檢驗概率(Pvalue)進(jìn)行多重假設(shè)檢驗校正,得到錯誤發(fā)現(xiàn)率(FDR)。8.6.2基因上的reads原始計數(shù)對比對結(jié)果進(jìn)行統(tǒng)計,得到每個樣品比對到每個基因上的reads數(shù)目。5T/GXTC0015—20248.6.3差異基因數(shù)量統(tǒng)計統(tǒng)計每組的差異基因總數(shù)、上調(diào)基因數(shù)、下調(diào)基因數(shù)。8.6.4差異基因信息匯總對每個差異分組計算得到差異基因信息進(jìn)行統(tǒng)計匯總。8.6.5差異基因M-versus-Aplot分析利用MA圖分析基因的表達(dá)水平和差異倍數(shù)的整體分布。8.6.6差異基因volcanoplot分析利用火山圖分析兩組樣品中差異基因的整體分布情況。8.6.7基因表達(dá)聚類分析將各比較組合差異基因做層次聚類分析,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。8.7差異表達(dá)基因功能注釋和富集分析8.7.1差異表達(dá)基因功能注釋將基因注釋到KEGG、GO、KOG數(shù)據(jù)庫后,統(tǒng)計數(shù)據(jù)庫中每個通路包含的差異基因數(shù)量。8.7.2差異表達(dá)基因KEGG富集分析8.7.2.1Pathway(通路)顯著性富集分析以KEGG數(shù)據(jù)庫中Pathway為單位,找出與整個基因組背景相比,在差異表達(dá)基因中顯著性富集的Pathway。8.7.2.2對KEGG的Pathway進(jìn)行解析,使用相應(yīng)網(wǎng)頁來展示KEGG富集通路。8.7.2.3KEGG富集程度通過Richfactor(指該通路中富集到的差異基因個數(shù)與注釋到該通路所有基因個數(shù)的比值)、Qvalue(Q值)和富8.7.3差異表達(dá)基因GO富集分析8.7.3.1將差異表達(dá)基因按照GO三個大類生物過程、細(xì)胞組分、分子功能的下一層級進(jìn)行分類。8.7.3.2找出與整個基因組背景相比,在差異表達(dá)基因中顯著性富集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2.2聲音的特性 說課稿2025年初中人教版物理八年級上冊
- 2025年黨政領(lǐng)導(dǎo)干部黨章黨規(guī)黨紀(jì)知識考試題庫及答案(共150題)
- 智能財稅綜合實訓(xùn) 上篇 課件全套 社會共享初級代理實務(wù)-社會共享企業(yè)管家
- 2025年可生物降解有機垃圾厭氧發(fā)酵裝置合作協(xié)議書
- 2025年廣東省深圳市中考一模語文試題(原卷版+解析版)
- 銀行業(yè)務(wù)流程優(yōu)化與風(fēng)險控制方案
- 網(wǎng)絡(luò)安全攻防實戰(zhàn)與防御策略
- 新能源行業(yè)光伏電站智能調(diào)度與管理方案
- 制造業(yè)智能化生產(chǎn)線升級方案
- 項目執(zhí)行階段工作總結(jié)與經(jīng)驗教訓(xùn)分享報告
- 2024-2025學(xué)年第二學(xué)期天域全國名校協(xié)作體高三3月聯(lián)考 語文試卷(含答案)
- 江蘇省職教聯(lián)盟2024-2025學(xué)年高二上學(xué)期校際聯(lián)考期中調(diào)研測試語文卷(原卷版)
- 2025湘美版(2024)小學(xué)美術(shù)一年級下冊教學(xué)設(shè)計(附目錄)
- 異位妊娠婦產(chǎn)科護(hù)理學(xué)講解
- 2025年度智慧養(yǎng)老服務(wù)平臺開發(fā)與運營服務(wù)合同
- 2025中國鐵塔甘肅分公司社會招聘60人易考易錯模擬試題(共500題)試卷后附參考答案
- 兒童口腔接診流程
- 2025社區(qū)醫(yī)保工作計劃
- 社會責(zé)任內(nèi)審評估報告表
- 個人借款分期還款合同
- 船舶起重吊裝作業(yè)安全方案
評論
0/150
提交評論