在生物信息學研究中,常用的方法和技術如下。
一、數學統計方法
數學統計在生物信息學中是一種最常用的方法。例如,在分析DNA語言中的語義、分析密碼子使用頻率、利用馬爾科夫模型進行基因識別時都要用絞??臣品椒ā?BR>二、動態規劃方法
動態規劃(Dynamic Programming)是一種通用的優化方法,其基本思想是:在狀態空間中,根據目標函數,通過遞推,求出一條從狀態起點到狀態終點的最優路徑(代價最小的路徑)。動態規劃在生物信息學研究中用得最多的方面是DNA序列或者蛋白質序列的兩兩對比排列。
三、模式識別技術
模式識別是在輸入樣本中尋找特征并識別對象的一種技術。模式識別主要有兩種方法,一種是根據統計特征進行識別,另一種是根據對象的結構特征進行識別,而后者常用的方法為句法識別。在基因識別中,對于DNA序列上的功能位點和特征信號的識別都需要用到模式識別。
四、數據庫技術
在生物信息學中,數據庫技術是最基本的技術。生物分子信息的存儲、管理、查詢等功能是建立在數據庫管理系統之上。目前的分子信息數據庫大都采用關系數據庫管理系統。
五、人工神經網絡技術
人工神經網絡是對大腦神經網絡的模擬,這種模擬既是在功能上的,也是在結構上,這與傳統的串行計算機有著本質的區別。神經網絡計算不僅計算速度快,重要的是它更具有智能。從應用來看,神經網絡計算在優化和模式識別方面具有非常強的能力。在生物信息學研究中,無論是基因識別還是蛋白質結構預測,神經網絡都取得了比其它方法更為準確的結果。
六、分子模型化技術
分子模型化是利用計算機分析分子結構的一種技術。包括顯示分子的三維結構,顯示分子的理化或電子學特性,將分子小片段組裝成更大的分子片段或完整的分子結構。利用分子模型化軟件,用戶可以通過交互操作平移、旋轉和縮放分子的三維結構,從不同的角度觀察分子構象和形狀。對于DNA分子,我們可以直觀地觀察雙螺旋結構,看到兩條鏈的走向,還可以研究堿基之間的氫鍵配對。對于蛋白質分子,既可以觀察其結構骨架,可以觀察其外觀形狀,也可以研究其活性部位或結合部位的結構。
七、分子力學和量子力學計算
在分子構象優化研究方面必須要用量子力學或分子力學。結構優化工作按理應該用量子力學來完成,但是由于生物大分子體系太復雜,包含幾千個原子,超過了目前量子力學方法可以處理的體系范圍,所以研究生物大分子的構象,主要還是用基于半經驗勢函數的分子力學方法,而量子力學則在確定勢函數的參數和研究局部性質時起作用。
八、分子動力學模擬
分子動力學模擬是一種重要的統計物理方法,在物理和化學上早有應用。用此方法可以研究蛋白質的構象,對蛋白質進行動力學研究。這是利用計算機進行模擬實驗的基礎。
九、專家系統
專家系統將有關專家的知識和經驗以一定的知識表示形式(如產生式規則、語義網絡等)存放在計算中,并在用戶需要時,以智能的方式幫助解決問題,提供參考性決策。專家系統是人工智能領域里的一個重要分支,在生物信息學研究中也有著應用,如用于基因識別。
十、Internet技術
目前,分子生物學研究人員進行信息交流特別是生物分子數據的交流,都是通過Internet網實現的。在大多數情況下,你可以從Internet網上查到你所想要的生物分子數據,如原始的序列和結構數據,經過加工處理以后的數據。同時,你也可以將所要處理的數據直接送到相應的網絡服務器上,服務器接受你的處理請求,并將處理結果返回給你。
一、數學統計方法
數學統計在生物信息學中是一種最常用的方法。例如,在分析DNA語言中的語義、分析密碼子使用頻率、利用馬爾科夫模型進行基因識別時都要用絞??臣品椒ā?BR>二、動態規劃方法
動態規劃(Dynamic Programming)是一種通用的優化方法,其基本思想是:在狀態空間中,根據目標函數,通過遞推,求出一條從狀態起點到狀態終點的最優路徑(代價最小的路徑)。動態規劃在生物信息學研究中用得最多的方面是DNA序列或者蛋白質序列的兩兩對比排列。
三、模式識別技術
模式識別是在輸入樣本中尋找特征并識別對象的一種技術。模式識別主要有兩種方法,一種是根據統計特征進行識別,另一種是根據對象的結構特征進行識別,而后者常用的方法為句法識別。在基因識別中,對于DNA序列上的功能位點和特征信號的識別都需要用到模式識別。
四、數據庫技術
在生物信息學中,數據庫技術是最基本的技術。生物分子信息的存儲、管理、查詢等功能是建立在數據庫管理系統之上。目前的分子信息數據庫大都采用關系數據庫管理系統。
五、人工神經網絡技術
人工神經網絡是對大腦神經網絡的模擬,這種模擬既是在功能上的,也是在結構上,這與傳統的串行計算機有著本質的區別。神經網絡計算不僅計算速度快,重要的是它更具有智能。從應用來看,神經網絡計算在優化和模式識別方面具有非常強的能力。在生物信息學研究中,無論是基因識別還是蛋白質結構預測,神經網絡都取得了比其它方法更為準確的結果。
六、分子模型化技術
分子模型化是利用計算機分析分子結構的一種技術。包括顯示分子的三維結構,顯示分子的理化或電子學特性,將分子小片段組裝成更大的分子片段或完整的分子結構。利用分子模型化軟件,用戶可以通過交互操作平移、旋轉和縮放分子的三維結構,從不同的角度觀察分子構象和形狀。對于DNA分子,我們可以直觀地觀察雙螺旋結構,看到兩條鏈的走向,還可以研究堿基之間的氫鍵配對。對于蛋白質分子,既可以觀察其結構骨架,可以觀察其外觀形狀,也可以研究其活性部位或結合部位的結構。
七、分子力學和量子力學計算
在分子構象優化研究方面必須要用量子力學或分子力學。結構優化工作按理應該用量子力學來完成,但是由于生物大分子體系太復雜,包含幾千個原子,超過了目前量子力學方法可以處理的體系范圍,所以研究生物大分子的構象,主要還是用基于半經驗勢函數的分子力學方法,而量子力學則在確定勢函數的參數和研究局部性質時起作用。
八、分子動力學模擬
分子動力學模擬是一種重要的統計物理方法,在物理和化學上早有應用。用此方法可以研究蛋白質的構象,對蛋白質進行動力學研究。這是利用計算機進行模擬實驗的基礎。
九、專家系統
專家系統將有關專家的知識和經驗以一定的知識表示形式(如產生式規則、語義網絡等)存放在計算中,并在用戶需要時,以智能的方式幫助解決問題,提供參考性決策。專家系統是人工智能領域里的一個重要分支,在生物信息學研究中也有著應用,如用于基因識別。
十、Internet技術
目前,分子生物學研究人員進行信息交流特別是生物分子數據的交流,都是通過Internet網實現的。在大多數情況下,你可以從Internet網上查到你所想要的生物分子數據,如原始的序列和結構數據,經過加工處理以后的數據。同時,你也可以將所要處理的數據直接送到相應的網絡服務器上,服務器接受你的處理請求,并將處理結果返回給你。