計算機算法在生物信息學中的應用研究_第1頁
計算機算法在生物信息學中的應用研究_第2頁
計算機算法在生物信息學中的應用研究_第3頁
計算機算法在生物信息學中的應用研究_第4頁
計算機算法在生物信息學中的應用研究_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第第頁計算機算法在生物信息學中的應用研究摘要:隨著社會經(jīng)濟的不斷進步與發(fā)展,計算機技術(shù)的不斷創(chuàng)新改革,計算機算法受到了越來越多生物信息學者的關(guān)注和重視。計算機算法作為生物信息學中的重中之重,是一個必不可缺的關(guān)鍵組成部分,生物信息學中的問題具有數(shù)量繁多、計算量大的鮮明特征,必須采用最先進合理的計算機算法,才能不斷提高處理生物信息學問題的效率。文章將進一步的對計算機算法在生物信息學中的應用展開分析和探討。

關(guān)鍵詞:計算機算法;生物信息學;應用研究

引言

生物信息學作為一門新興的交叉學科,它涵蓋了計算機科學、生物學以及統(tǒng)計學等不同的學科。它的主要研究內(nèi)容是通過應用計算機對各種生物數(shù)據(jù)信息進行檢索、分析以及儲存。在生物信息學中,它的各種組合問題都具有數(shù)量繁多、計算量大的鮮明特征,為了能有效地解決各類組合難問題,就必須不斷提高計算的處理速度,創(chuàng)新計算機算法,保證各算法和程序的高效性。

1在生物信息學中普遍被應用的計算機算法

在生物信息學中那些常見NP-難的組合優(yōu)化問題可以分為以下幾個:群體單體型檢測問題、個體單體型檢測問題、多元聚合酶鏈反應引物集設計問題、標簽SNPs選擇問題、序列比對問題以及基因芯片的探針設計問題[1]。這些問題都具有大量的信息數(shù)據(jù),對于計算機的處理速度要求偏高。所以,必須不斷優(yōu)化計算機算法,對計算機算法在生物信息學中的應用展開分析和研究。通常來說,生物信息學中組合優(yōu)化問題采用的計算機算法主要包括以下幾種:近似算法、精確算法、啟發(fā)式算法以及參數(shù)化算法等。采用近似算法通??梢缘玫捷^為滿意的時間復雜度。精確算法則是生物信息學中遇到難度大組合問題的首要選擇,然而它具備偏高的時間復雜度[2]。啟發(fā)式算法相對于傳統(tǒng)的計算機算法,前者獲得解的收斂速度會快很多。參數(shù)化算法通過從組合問題的參數(shù)特性研究分析入手,建立出多維的數(shù)學模型,從而有效地解決問題。

2啟發(fā)式算法在生物信息學中的應用

啟發(fā)式算法通常被普遍應用于較大規(guī)模生物信息學的組合問題中,啟發(fā)式算法具體包括了以下幾種不同的算法:粒子群優(yōu)化算法、神經(jīng)網(wǎng)絡算法、遺傳算法、混沌免疫進化算法、模擬退火算法。

粒子群優(yōu)化算法又可以稱為微粒群算法或者微粒群優(yōu)化算法,它是通過模擬鳥群尋食行為而不斷發(fā)展起來的一種基于群體合作的隨機搜索的優(yōu)化算法。通常情況下,可以將它歸類為群集智能的一種,被納入了多主體優(yōu)化系統(tǒng)。粒子群優(yōu)化算法的主要發(fā)明者為Kennedy教授和Eberhart教授。在解決組合優(yōu)化問題過程中,粒子群優(yōu)化算法通過將問題的每一個解相對應的找出空間中某只鳥的位置,將空間中所有的鳥統(tǒng)稱為粒子,每一個粒子的飛行都通過隊員的飛行經(jīng)驗以及自身的飛行經(jīng)驗進行適當?shù)恼{(diào)整。當某個粒子在實際的飛行過程中遇到最佳的飛行位置,這個就是粒子的最優(yōu)解,也就是個體的極值。而如果是整個集體的最優(yōu)解,也就是群體的極值,它為每個粒子所遇到過的最佳位置總和。在實際的算法操作過程中,粒子是否處于較優(yōu)的位置需要通過優(yōu)化函數(shù)決定的適應度來確定。與此同時,粒子的飛行速度直接關(guān)系到每個粒子的飛行距離以及方向。粒子群優(yōu)化算法最大的優(yōu)勢就在于它不需要依靠大量的經(jīng)驗參數(shù),簡捷實用、適用于并行處理、具備較快的收斂速度等[3],而它的弊端則是收斂精度不夠高、容易局限于局部的極值。

神經(jīng)網(wǎng)絡算法在生物信息學中的主要作用是用來對生物神經(jīng)系統(tǒng)信息處理過程的模擬。神經(jīng)網(wǎng)絡算法主要可以分為兩個層面,一個為輸出層面,另一個為輸入層面。在這兩個層面中間還存在些許隱藏的學習層面,這些學習層面中又包含了很多的結(jié)點[4]。不同結(jié)點之間的連接方式多種多樣,與此同時,每個結(jié)點如何把輸入信號轉(zhuǎn)換為輸出信號的選擇性也有很多[5]。要想對神經(jīng)網(wǎng)絡進行有效的訓練,就必須提供大量的數(shù)據(jù)信息。神經(jīng)網(wǎng)絡在得到訓練后,就能夠起到從相同類型沒有處理過的數(shù)據(jù)中獲取信息的作用。神經(jīng)網(wǎng)絡算法最大的不足在于,無法從大量的生物信息數(shù)據(jù)參數(shù)中提取出最簡單的知識。

3參數(shù)化算法

參數(shù)化算法作為一種先進的計算機算法,通過將計算實踐和計算理論有效地結(jié)合在一起,從而不斷提高解決生物信息學組合問題的效率。通過學習參數(shù)計算理論可以知道,在生物信息學中的某些NP-難問題能夠?qū)嵭袇?shù)化,簡單來說就是合理設計出算法復雜度為“0”的計算方法。在這個過程中,c作為一個常數(shù),n則作為問題的規(guī)模,k是一個參數(shù),這個參數(shù)的變化過程只能保持在一個小的范圍中。一旦常數(shù)c的數(shù)值較小,參數(shù)化算法就能充分的抓住k作為一個小參數(shù)的特性,較為快速的破解掉生物信息學中的NP-難問題。

4結(jié)束語

綜上所述,要想大力發(fā)展生物信息學,就必須將生物學和計算機學緊密的結(jié)合在一起。既要加強生物學方面知識的學習,還要不斷對計算機算法進行改革創(chuàng)新,提高計算機算法的運行速度以及精確度,共同促進生物信息學穩(wěn)定持續(xù)的發(fā)展。

參考文獻

[1](沙特)AlsuwaiyelMH.算法設計技巧與分析[M].吳偉昶,方世昌,等,譯.北京:電子工業(yè)出版社,2008:371-407.

[2](美)BaxevanisAndreasD,F(xiàn)rancisOuelletteBF.生物信息學:基因和蛋白質(zhì)分析的實用指南[M].李衍達,孫之榮,等,譯.北京:清華大學出版社,2008:13-120.

[3]楊久俊,鄧輝文,滕姿.基于混沌免疫進化算法的聚類算法分析[J].計算機科學,2008,8:154-156.

[4]謝民主.單體型組裝問題參數(shù)化建模及算法研究[D].長沙:中南大學,2008.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論