比較和比對生物序列有什麼用?
比對基於這樣一個事實:所有生物體都與進化相關。這意味著在進化上彼此更接近的物種的核苷酸(DNA、RNA)和蛋白質序列必須表現出更高的相似性。
比對是將序列排列起來以獲得最大程度一致性的步驟,這也定義了序列之間相似性的程度。如果兩個序列來自共同祖先,則這兩個序列是同源的。
透過序列比對獲得的相似性程度有助於確定兩個序列之間同源性的可能性。這種比對有助於確定進化樹(也稱為系統發育樹)中不同物種的相對位置。
生物序列比對的問題可以定義如下:給定兩個或多個輸入生物序列,識別具有高度保守子序列的相同序列。如果要比對的多個序列只有兩個,則稱為成對序列比對;否則,則為多序列比對。
要區分和比對的序列可以是核苷酸(DNA/RNA)或氨基酸(蛋白質)。對於核苷酸,如果兩個符號完全相同,則它們可以比對。但對於氨基酸,如果兩個符號完全相同,或者如果一個可以透過自然界中出現的替換從另一個轉變而來,則它們可以比對。
比對分為兩種型別:區域性比對和全域性比對。前者僅比對序列的某些區域,而後者需要比對序列的整個長度。
對於核苷酸或氨基酸,插入、缺失和替換在自然界中以多種機率出現。替換矩陣定義了核苷酸或氨基酸替換的機率以及插入和缺失的機率。
通常使用間隙字元“−”來表示不需要比對兩個符號的位置。為了計算比對的質量,通常會定義一個評分系統,該系統通常將相同的符號計為正分,將間隙計為負分。
分數的代數和作為比對分數。比對的目標是在一些可能的比對之間獲得最大分數。然而,找到最佳比對的成本非常高。因此,已經開發了幾種啟發式技術來找到次優比對。
基因組是一個生物體的全部基因組。當需要蛋白質時,相應的基因會被複制到RNA中。RNA是核苷酸鏈。DNA指導合成多種RNA分子,每種分子在細胞功能中都具有特定的作用。
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP