- Biopython 教程
- Biopython - 首頁
- Biopython 簡介
- Biopython - 安裝
- 建立簡單的應用程式
- Biopython - 序列
- 高階序列操作
- 序列 I/O 操作
- Biopython - 序列比對
- Biopython - BLAST 概述
- Biopython - Entrez 資料庫
- Biopython - PDB 模組
- Biopython - 基序物件
- Biopython - BioSQL 模組
- Biopython - 群體遺傳學
- Biopython - 基因組分析
- Biopython - 表型微陣列
- Biopython - 繪圖
- Biopython - 聚類分析
- Biopython - 機器學習
- Biopython - 測試技術
- Biopython 資源
- Biopython - 快速指南
- Biopython - 有用資源
- Biopython - 討論
Biopython 簡介
Biopython 是 Python 最大的、最流行的生物資訊學軟體包。它包含許多針對常見生物資訊學任務的不同子模組。它由 Chapman 和 Chang 開發,主要用 Python 編寫。它還包含 C 程式碼來最佳化軟體的複雜計算部分。它可以在 Windows、Linux、Mac OS X 等作業系統上執行。
基本上,Biopython 是一個 Python 模組集合,提供用於處理 DNA、RNA 和蛋白質序列操作的功能,例如 DNA 字串的反向互補、在蛋白質序列中查詢基序等。它提供了許多解析器來讀取所有主要的基因資料庫,如 GenBank、SwissPort、FASTA 等,以及執行其他流行的生物資訊學軟體/工具(如 NCBI BLASTN、Entrez 等)的包裝器/介面,在 Python 環境中。它有類似的專案,如 BioPerl、BioJava 和 BioRuby。
特性
Biopython 可移植、清晰且易於學習語法。一些主要特性列在下面:
解釋型、互動式和麵向物件。
支援 FASTA、PDB、GenBank、Blast、SCOP、PubMed/Medline、ExPASy 相關格式。
處理序列格式的選項。
管理蛋白質結構的工具。
BioSQL - 用於儲存序列以及特徵和註釋的標準 SQL 表集。
訪問線上服務和資料庫,包括 NCBI 服務(Blast、Entrez、PubMed)和 ExPASy 服務(SwissProt、Prosite)。
訪問本地服務,包括 Blast、Clustalw、EMBOSS。
目標
Biopython 的目標是透過 Python 語言提供對生物資訊學的簡單、標準和廣泛的訪問。Biopython 的具體目標列在下面:
提供對生物資訊學資源的標準化訪問。
高質量、可重用的模組和指令碼。
可用於 Cluster 程式碼、PDB、NaiveBayes 和馬爾可夫模型的快速陣列操作。
基因組資料分析。
優勢
Biopython 需要很少的程式碼,並具有以下優點:
提供在聚類中使用的微陣列資料型別。
讀取和寫入 Tree-View 型別檔案。
支援用於 PDB 解析、表示和分析的結構資料。
支援 Medline 應用程式中使用的期刊資料。
支援 BioSQL 資料庫,這是所有生物資訊學專案中廣泛使用的標準資料庫。
透過提供模組來將生物資訊學檔案解析為特定格式的記錄物件或序列加特徵的通用類,支援解析器開發。
基於食譜風格的清晰文件。
案例研究
讓我們檢查一些用例(群體遺傳學、RNA 結構等),並嘗試瞭解 Biopython 在該領域如何發揮重要作用:
群體遺傳學
群體遺傳學是研究群體內的遺傳變異,包括檢查和模擬基因和等位基因在空間和時間上群體頻率的變化。
Biopython 提供 Bio.PopGen 模組用於群體遺傳學。此模組包含收集有關經典群體遺傳學資訊的所有必要功能。
RNA 結構
對我們的生命至關重要的三大生物大分子是 DNA、RNA 和蛋白質。蛋白質是細胞的“主力軍”,作為酶發揮著重要作用。DNA(脫氧核糖核酸)被認為是細胞的“藍圖”。它攜帶細胞生長、吸收營養物質和繁殖所需的所有遺傳資訊。RNA(核糖核酸)在細胞中充當“DNA 影印本”。
Biopython 提供 Bio.Sequence 物件,表示核苷酸,即 DNA 和 RNA 的構建塊。