- Biopython 教程
- Biopython - 首頁
- Biopython - 簡介
- Biopython - 安裝
- 建立簡單應用程式
- Biopython - 序列
- 高階序列操作
- 序列 I/O 操作
- Biopython - 序列比對
- Biopython - BLAST 概述
- Biopython - Entrez 資料庫
- Biopython - PDB 模組
- Biopython - 基序物件
- Biopython - BioSQL 模組
- Biopython - 群體遺傳學
- Biopython - 基因組分析
- Biopython - 表型微陣列
- Biopython - 繪圖
- Biopython - 聚類分析
- Biopython - 機器學習
- Biopython - 測試技術
- Biopython 資源
- Biopython - 快速指南
- Biopython - 有用資源
- Biopython - 討論
Biopython - 基因組分析
基因組是完整的 DNA 集,包括所有基因。基因組分析是指研究單個基因及其在遺傳中的作用。
基因組圖
基因組圖將遺傳資訊表示為圖表。Biopython 使用 Bio.Graphics.GenomeDiagram 模組來表示 GenomeDiagram。GenomeDiagram 模組需要安裝 ReportLab。
建立圖表的步驟
建立圖表的流程通常遵循以下簡單模式:
為要顯示的每一組獨立特徵建立一個 FeatureSet,並將 Bio.SeqFeature 物件新增到其中。
為要顯示的每個圖形建立一個 GraphSet,並將圖形資料新增到其中。
為圖表上的每個軌道建立一個 Track,並將 GraphSet 和 FeatureSet 新增到所需的軌道中。
建立一個 Diagram,並將 Tracks 新增到其中。
告訴 Diagram 繪製圖像。
將影像寫入檔案。
讓我們以一個輸入 GenBank 檔案為例:
https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbk 並從 SeqRecord 物件讀取記錄,然後最終繪製基因組圖。解釋如下:
我們將首先匯入所有模組,如下所示:
>>> from reportlab.lib import colors >>> from reportlab.lib.units import cm >>> from Bio.Graphics import GenomeDiagram
現在,匯入 SeqIO 模組以讀取資料:
>>> from Bio import SeqIO
record = SeqIO.read("example.gb", "genbank")
在這裡,記錄從 genbank 檔案讀取序列。
現在,建立一個空圖表以新增軌道和特徵集:
>>> diagram = GenomeDiagram.Diagram( "Yersinia pestis biovar Microtus plasmid pPCP1") >>> track = diagram.new_track(1, name="Annotated Features") >>> feature = track.new_set()
現在,我們可以使用從綠色到灰色的備用顏色(如下定義)應用顏色主題更改:
>>> for feature in record.features: >>> if feature.type != "gene": >>> continue >>> if len(feature) % 2 == 0: >>> color = colors.blue >>> else: >>> color = colors.red >>> >>> feature.add_feature(feature, color=color, label=True)
現在您可以在螢幕上看到以下響應:
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> <Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>
讓我們為上述輸入記錄繪製一個圖表:
>>> diagram.draw(
format = "linear", orientation = "landscape", pagesize = 'A4',
... fragments = 4, start = 0, end = len(record))
>>> diagram.write("orchid.pdf", "PDF")
>>> diagram.write("orchid.eps", "EPS")
>>> diagram.write("orchid.svg", "SVG")
>>> diagram.write("orchid.png", "PNG")
執行上述命令後,您可以在 Biopython 目錄中看到儲存的以下影像。
** Result ** genome.png
您還可以透過進行以下更改以圓形格式繪製圖像:
>>> diagram.draw(
format = "circular", circular = True, pagesize = (20*cm,20*cm),
... start = 0, end = len(record), circle_core = 0.7)
>>> diagram.write("circular.pdf", "PDF")
染色體概述
DNA 分子包裝成稱為染色體的線狀結構。每個染色體都由 DNA 組成,DNA 緊密纏繞在稱為組蛋白的蛋白質周圍多次,這些蛋白質支撐其結構。
當細胞不分裂時,染色體在細胞核中不可見——甚至在顯微鏡下也看不到。然而,構成染色體的 DNA 在細胞分裂過程中會變得更加緊密地包裝,然後可以在顯微鏡下看到。
在人類中,每個細胞通常包含 23 對染色體,總共 46 條。這 23 對中的 22 對稱為常染色體,在男性和女性中看起來相同。第 23 對,性染色體,在男性和女性之間有所不同。女性有兩條 X 染色體,而男性有一條 X 染色體和一條 Y 染色體。