卷积简介
卷积是计算机视觉 (CV) 中的一个流行术语。在讨论如何实现 CV 任务时,经常会提到卷积神经网络。因此,任何 CV 追求者都必须完全理解“卷积”一词。
卷积是几个图像处理运算符使用的基本数学运算。卷积是一种将两个整数数组相乘的方法,通常大小不同但维数相同,以产生具有相同维度的第三个数组。
卷积的应用包括信号处理、统计学、概率、工程、物理学、计算机视觉、图像处理、声学等等。
图像处理包括图像滤波、噪声去除、图像识别、图像分割等,卷积在图像滤波中发挥着很大的作用。
使用卷积进行图像过滤图像过滤是将特定图像的像素值更改为模糊、锐化、浮雕或使边缘更清晰。它改变了原始图像的外观。如今,许多图像过滤器正在主导社交媒体应用程序。
大多数使用 Instagram 的人可能知道其中使用的图像过滤器。图像过滤是特定于应用程序的,因为有时我们需要模糊图像,有时我们希望图像具有较高清晰度。
图像过滤器非常易于使用。学习它背后的数学和图像处理是非常有趣的。图像过滤器使用各种卷积核来执行不同的图像过滤。
卷积滤波器(有时称为内核)与图像一起使用以实现模糊、锐化、浮雕、边缘检测和其他效果。这是通过内核和图像的卷积来执行的。核通常是 3×3 矩阵,卷积过程正式描述如下:
g(x,y)=w*f(x,y)
其中 g(x,y) 表示滤波后的输出图像,f(x,y) 表示原始图像,w 表示滤波器内核。下图显示了卷积的工作原理。
卷积过程讲解【1】
因此,上图清楚地表明,如果我们更改内核,输出将发生变化。有许多卷积核用于锐化、模糊或平滑图像。下表显示了各种内核及其效果。
表格1:各种内核及其作用
各种图像过滤的卷积实现 1. 框模糊框模糊是一种简单的模糊,其中每个像素都设置为其周围像素的平均值。它可以写成两个函数 f[n] 和 g[n] 的离散卷积,其中 f[n] 表示图像的离散像素值,g[n] 是我们的内核,它是一个矩阵,表示为
实施步骤: 第 1 步:打开谷歌colab notebook谷歌colab被用于实施。Colaboratory,或简称“Colab”,使你能够在浏览器中编写和运行 Python
无需配置
免费使用 GPU
简单分享
无论你是学生、数据科学家还是 AI 研究人员,Colab 都可以为你提供帮助。要开始使用 Google Colab,请搜索“google colab”并单击第一个链接。然后选择“创建新笔记本”。你现在已准备好开始编写代码。
第 2 步:导入库import cv2 import numpy as np import matplotlib.pyplot as plt第 3 步:读取图像并绘制它
image = cv2.imread('/content/1.PNG') image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) fig, ax = plt.subplots(1, figsize=(12,8)) plt.imshow(image)第 4 步:制作内核并应用卷积
让我们制作一个用于模糊图像的内核。我们将使用 Numpy 构建一个 3×3 的矩阵,并将其除以 9,如图 1 所示。filter2D() 函数给出输入数组和内核的卷积。
abc=np.ones((3,3)) kernel = np.ones((3, 3), np.float32) / 9 img = cv2.filter2D(image, -1, kernel) fig, ax = plt.subplots(1,2,figsize=(10,6)) ax[0].imshow(image) ax[1].imshow(img)
Box Blur的输出:
2. 锐化图像锐化用于锐化图像。图像锐化的三个主要原因:
为了克服相机引入的模糊
引起对特定领域的注意
以增加可读性
任何当前相机的原始数据总是略微不清晰。在图像捕获过程的每个阶段都会引入模糊。
首先,无论制作多么精细,当光线穿过镜头元件时,都会丢失一些清晰度。其次,当传感器处理落在其上的光子时,最尖锐的过渡被平均化并略微模糊。最后,当插入三个不同的颜色通道以创建最终图像时,会引入适度的模糊。
其次,对比度吸引人的眼睛。当我们看一张照片时,我们的注意力会被最精美的元素所吸引。因此,如果你想引导观众的注意力,选择性锐化是实现这一目标的最佳技术之一。
最后,增强图像可以提高基本元素的可见性。例如,文本变得更容易阅读,单个叶子变得更加明显,人群中的面孔变得更加清晰。锐化是用下面的内核完成的。
执行以下是在图像中进行锐化的代码,
import cv2 import numpy as np import matplotlib.pyplot as plt image = cv2.imread('/content/1.PNG') image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) kernel = np.array([[0, -1, 0], [-1, 5, -1], [0, -1, 0]]) img = cv2.filter2D(image, -1, kernel) fig, ax = plt.subplots(1,2,figsize=(10,6)) ax[0].imshow(image) ax[1].imshow(img)
锐化的输出:
3. 浮雕浮雕意味着形成一个从表面伸出的3D模具。当对图片应用浮雕滤镜时,生成的图像类似于浮雕 - 原始图像的纸或金属浮雕,其中特征以高浮雕(更突出)或低浮雕(不那么突出)突出. 以下是用于图像浮雕的卷积核……
执行为了实现图像浮雕,我们必须遵循与框模糊中解释的相同的过程。唯一的变化是它的内核。
import cv2 import numpy as np import matplotlib.pyplot as plt image = cv2.imread('/content/1.PNG') image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) kernel = np.array([[-2, -1, 0], [-1, 1, 1], [0, 1, 2]]) img = cv2.filter2D(image, -1, kernel) fig, ax = plt.subplots(1,2,figsize=(10,6)) ax[0].imshow(image) ax[1].imshow(img)
浮雕输出:
因此,如表 1 所示,你可以更改内核,因此你可以拥有各种图像过滤器。
结束语卷积只不过是一个简单的数学函数,用于各种图像过滤技术。卷积使用一个2输入矩阵:即图像矩阵和核。在此帮助下,通过执行卷积,它生成输出。当你更改内核时,你还可以注意到输出中的更改。
参考http://cse3521.artifice.cc/images/3d_convolution_animation.gif
https://setosa.io/ev/image-kernels/
https://www.sciencedirect.com/topics/computer-science/convolution-filter
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。
↓扫描二维码添加小编↓
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)