數字影像處理 - 卷積的概念

本教程介紹了訊號與系統的一個非常重要的概念。我們將完整地討論卷積。它是什麼？為什麼會有它？我們可以用它實現什麼？

我們將從影像處理的基礎開始討論卷積。

什麼是影像處理？

正如我們在影像處理教程的介紹和訊號與系統中討論的那樣，影像處理或多或少是訊號與系統的研究，因為影像只不過是一個二維訊號。

我們還討論過，在影像處理中，我們正在開發一個系統，其輸入是影像，輸出也是影像。這可以用圖片表示為：

上圖中標為“數字影像處理系統”的框可以被認為是一個黑盒子。

它可以更好地表示為：

我們到目前為止取得了什麼成果？

到目前為止，我們已經討論了兩種重要的影像處理方法。或者換句話說，我們可以說，到目前為止，我們的黑盒以兩種不同的方式工作。

兩種不同的影像處理方法是：

圖形（直方圖）

此方法稱為直方圖處理。我們在之前的教程中詳細討論了它，用於提高對比度、影像增強、亮度等。

變換函式

此方法稱為變換，其中我們討論了不同型別的變換和一些灰度級變換。

處理影像的另一種方法

這裡我們將討論處理影像的另一種方法。此方法稱為卷積。通常，用於影像處理的黑盒（系統）是LTI系統或線性時不變系統。線性意味著這樣的系統，其中輸出始終是線性的，既不是對數也不是指數或任何其他。時不變意味著一個系統在時間上保持不變。

所以現在我們將使用第三種方法。它可以表示為：

它可以用兩種數學方式表示：

g(x,y) = h(x,y) * f(x,y)

它可以解釋為“掩膜與影像卷積”。

或者

g(x,y) = f(x,y) * h(x,y)

它可以解釋為“影像與掩膜卷積”。

有兩種表示方式，因為卷積運算子(*)是可交換的。h(x,y)是掩膜或濾波器。

什麼是掩膜？

掩膜也是一個訊號。它可以用一個二維矩陣表示。掩膜通常是1x1、3x3、5x5、7x7階。掩膜應始終為奇數階，因為否則您無法找到掩膜的中間位置。為什麼我們需要找到掩膜的中間位置？答案在下面，在如何執行卷積的主題中。

如何執行卷積？

為了對影像執行卷積，應採取以下步驟。

僅翻轉一次掩膜（水平和垂直）
將掩膜滑動到影像上。
將對應的元素相乘，然後相加。
重複此過程，直到計算出影像的所有值。

卷積示例

讓我們執行一些卷積。第一步是翻轉掩膜。

掩膜

讓我們將我們的掩膜設為：

1	2	3
4	5	6
7	8	9

水平翻轉掩膜

3	2	1
6	5	4
9	8	7

垂直翻轉掩膜

9	8	7
6	5	4
3	2	1

影像

讓我們考慮一個這樣的影像：

2	4	6
8	10	12
14	16	18

卷積

將掩膜在影像上進行卷積。它是這樣完成的。將掩膜的中心放在影像的每個元素上。將對應的元素相乘，然後相加，並將結果貼上到放置掩膜中心的影像元素上。

紅色框是掩膜，橙色值是掩膜的值。黑色框和值屬於影像。現在對於影像的第一個畫素，其值將計算為：

第一個畫素 = (5*2) + (4*4) + (2*8) + (1*10)

= 10 + 16 + 16 + 10

= 52

在原始影像的第一個索引處放置52，並對影像的每個畫素重複此過程。

為什麼要進行卷積？

卷積可以實現以前兩種影像處理方法無法實現的功能。這些包括模糊、銳化、邊緣檢測、降噪等。

列印頁面