Biopython - 基因組分析



基因組是完整的 DNA 集,包括所有基因。基因組分析是指研究單個基因及其在遺傳中的作用。

基因組圖

基因組圖將遺傳資訊表示為圖表。Biopython 使用 Bio.Graphics.GenomeDiagram 模組來表示 GenomeDiagram。GenomeDiagram 模組需要安裝 ReportLab。

建立圖表的步驟

建立圖表的流程通常遵循以下簡單模式:

  • 為要顯示的每一組獨立特徵建立一個 FeatureSet,並將 Bio.SeqFeature 物件新增到其中。

  • 為要顯示的每個圖形建立一個 GraphSet,並將圖形資料新增到其中。

  • 為圖表上的每個軌道建立一個 Track,並將 GraphSet 和 FeatureSet 新增到所需的軌道中。

  • 建立一個 Diagram,並將 Tracks 新增到其中。

  • 告訴 Diagram 繪製圖像。

  • 將影像寫入檔案。

讓我們以一個輸入 GenBank 檔案為例:

https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbk 並從 SeqRecord 物件讀取記錄,然後最終繪製基因組圖。解釋如下:

我們將首先匯入所有模組,如下所示:

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

現在,匯入 SeqIO 模組以讀取資料:

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

在這裡,記錄從 genbank 檔案讀取序列。

現在,建立一個空圖表以新增軌道和特徵集:

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

現在,我們可以使用從綠色到灰色的備用顏色(如下定義)應用顏色主題更改:

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

現在您可以在螢幕上看到以下響應:

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

讓我們為上述輸入記錄繪製一個圖表:

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

執行上述命令後,您可以在 Biopython 目錄中看到儲存的以下影像。

** Result **
genome.png

Creating Diagram

您還可以透過進行以下更改以圓形格式繪製圖像:

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

染色體概述

DNA 分子包裝成稱為染色體的線狀結構。每個染色體都由 DNA 組成,DNA 緊密纏繞在稱為組蛋白的蛋白質周圍多次,這些蛋白質支撐其結構。

當細胞不分裂時,染色體在細胞核中不可見——甚至在顯微鏡下也看不到。然而,構成染色體的 DNA 在細胞分裂過程中會變得更加緊密地包裝,然後可以在顯微鏡下看到。

在人類中,每個細胞通常包含 23 對染色體,總共 46 條。這 23 對中的 22 對稱為常染色體,在男性和女性中看起來相同。第 23 對,性染色體,在男性和女性之間有所不同。女性有兩條 X 染色體,而男性有一條 X 染色體和一條 Y 染色體。

廣告

© . All rights reserved.