- 數字影像處理
- DIP - 首頁
- DIP - 影像處理簡介
- DIP - 訊號與系統簡介
- DIP - 攝影史
- DIP - 應用與用途
- DIP - 維度的概念
- DIP - 相機成像原理
- DIP - 相機機制
- DIP - 畫素的概念
- DIP - 透視變換
- DIP - 每畫素位元數的概念
- DIP - 影像型別
- DIP - 顏色程式碼轉換
- DIP - 灰度到RGB轉換
- DIP - 取樣的概念
- DIP - 畫素解析度
- DIP - 放大的概念
- DIP - 放大方法
- DIP - 空間解析度
- DIP - 每英寸畫素點和線條
- DIP - 灰度級解析度
- DIP - 量化的概念
- DIP - ISO 偏好曲線
- DIP - 抖動的概念
- DIP - 直方圖簡介
- DIP - 亮度和對比度
- DIP - 影像變換
- DIP - 直方圖滑動
- DIP - 直方圖拉伸
- DIP - 機率論導論
- DIP - 直方圖均衡化
- DIP - 灰度級變換
- DIP - 卷積的概念
- DIP - 掩膜的概念
- DIP - 模糊的概念
- DIP - 邊緣檢測的概念
- DIP - Prewitt運算元
- DIP - Sobel運算元
- DIP - Robinson 羅盤掩膜
- DIP - Krisch 羅盤掩膜
- DIP - 拉普拉斯運算元
- DIP - 頻域分析
- DIP - 傅立葉級數和變換
- DIP - 卷積定理
- DIP - 高通濾波器與低通濾波器
- DIP - 顏色空間導論
- DIP - JPEG壓縮
- DIP - 光學字元識別
- DIP - 計算機視覺與圖形學
- DIP 有用資源
- DIP - 快速指南
- DIP - 有用資源
- DIP - 討論
數字影像處理 - 卷積的概念
本教程介紹了訊號與系統的一個非常重要的概念。我們將完整地討論卷積。它是什麼?為什麼會有它?我們可以用它實現什麼?
我們將從影像處理的基礎開始討論卷積。
什麼是影像處理?
正如我們在影像處理教程的介紹和訊號與系統中討論的那樣,影像處理或多或少是訊號與系統的研究,因為影像只不過是一個二維訊號。
我們還討論過,在影像處理中,我們正在開發一個系統,其輸入是影像,輸出也是影像。這可以用圖片表示為:
上圖中標為“數字影像處理系統”的框可以被認為是一個黑盒子。
它可以更好地表示為:
我們到目前為止取得了什麼成果?
到目前為止,我們已經討論了兩種重要的影像處理方法。或者換句話說,我們可以說,到目前為止,我們的黑盒以兩種不同的方式工作。
兩種不同的影像處理方法是:
圖形(直方圖)
此方法稱為直方圖處理。我們在之前的教程中詳細討論了它,用於提高對比度、影像增強、亮度等。
變換函式
此方法稱為變換,其中我們討論了不同型別的變換和一些灰度級變換。
處理影像的另一種方法
這裡我們將討論處理影像的另一種方法。此方法稱為卷積。通常,用於影像處理的黑盒(系統)是LTI系統或線性時不變系統。線性意味著這樣的系統,其中輸出始終是線性的,既不是對數也不是指數或任何其他。時不變意味著一個系統在時間上保持不變。
所以現在我們將使用第三種方法。它可以表示為:
它可以用兩種數學方式表示:
g(x,y) = h(x,y) * f(x,y)
它可以解釋為“掩膜與影像卷積”。
或者
g(x,y) = f(x,y) * h(x,y)
它可以解釋為“影像與掩膜卷積”。
有兩種表示方式,因為卷積運算子(*)是可交換的。h(x,y)是掩膜或濾波器。
什麼是掩膜?
掩膜也是一個訊號。它可以用一個二維矩陣表示。掩膜通常是1x1、3x3、5x5、7x7階。掩膜應始終為奇數階,因為否則您無法找到掩膜的中間位置。為什麼我們需要找到掩膜的中間位置?答案在下面,在如何執行卷積的主題中。
如何執行卷積?
為了對影像執行卷積,應採取以下步驟。
- 僅翻轉一次掩膜(水平和垂直)
- 將掩膜滑動到影像上。
- 將對應的元素相乘,然後相加。
- 重複此過程,直到計算出影像的所有值。
卷積示例
讓我們執行一些卷積。第一步是翻轉掩膜。
掩膜
讓我們將我們的掩膜設為:
| 1 | 2 | 3 |
| 4 | 5 | 6 |
| 7 | 8 | 9 |
水平翻轉掩膜
| 3 | 2 | 1 |
| 6 | 5 | 4 |
| 9 | 8 | 7 |
垂直翻轉掩膜
| 9 | 8 | 7 |
| 6 | 5 | 4 |
| 3 | 2 | 1 |
影像
讓我們考慮一個這樣的影像:
| 2 | 4 | 6 |
| 8 | 10 | 12 |
| 14 | 16 | 18 |
卷積
將掩膜在影像上進行卷積。它是這樣完成的。將掩膜的中心放在影像的每個元素上。將對應的元素相乘,然後相加,並將結果貼上到放置掩膜中心的影像元素上。
紅色框是掩膜,橙色值是掩膜的值。黑色框和值屬於影像。現在對於影像的第一個畫素,其值將計算為:
第一個畫素 = (5*2) + (4*4) + (2*8) + (1*10)
= 10 + 16 + 16 + 10
= 52
在原始影像的第一個索引處放置52,並對影像的每個畫素重複此過程。
為什麼要進行卷積?
卷積可以實現以前兩種影像處理方法無法實現的功能。這些包括模糊、銳化、邊緣檢測、降噪等。