imgaug库指南（六）：从入门到精通的【图像增强】之旅

2024-01-07 17:33:56

引言

在深度学习和计算机视觉的世界里，数据是模型训练的基石，其质量与数量直接影响着模型的性能。然而，获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此，数据增强技术应运而生，成为了解决这一问题的关键所在。而imgaug，作为一个功能强大的图像增强库，为我们提供了简便且高效的方法来扩充数据集。本系列博客将带您深入了解如何运用imgaug进行图像增强，助您在深度学习的道路上更进一步。我们将从基础概念讲起，逐步引导您掌握各种变换方法，以及如何根据实际需求定制变换序列。让我们一起深入了解这个强大的工具，探索更多可能性，共同推动深度学习的发展。

前期回顾

链接	主要内容
imgaug库指南（一）：从入门到精通的【图像增强】之旅	介绍了imgaug库的主要功能、安装方式、提供一个简单的数据增强示例(针对一副图像)
imgaug库指南（二）：从入门到精通的【图像增强】之旅	介绍了如何利用imgaug库对批量图像进行数据增强并可视化
imgaug库指南（三）：从入门到精通的【图像增强】之旅	详细介绍了imgaug库的数据增强方法 —— 高斯模糊
imgaug库指南（四）：从入门到精通的【图像增强】之旅	详细介绍了imgaug库的数据增强方法 —— 均值模糊
imgaug库指南（五）：从入门到精通的【图像增强】之旅	详细介绍了imgaug库的数据增强方法 —— 中值模糊/滤波，并介绍了如何利用【中值滤波】过滤椒盐噪声

在本博客中，我们将向您详细介绍imgaug库的数据增强方法 —— 双边模糊/滤波。

双边模糊/滤波(BilateralBlur)

功能介绍

iaa.BilateralBlur是imgaug库中的一个方法，用于对图像进行双边模糊。双边模糊是一种特殊的模糊技术，它在模糊图像的同时考虑了像素的空间信息和灰度值信息。这意味着双边模糊可以更好地保护图像的边缘和细节，同时去除噪声。

语法

import imgaug.augmenters as iaa
aug = iaa.BilateralBlur(
    d=(3, 10), sigma_color=(10, 250), sigma_space=(10, 250))

d: 滤波过程中每个像素邻域的直径;
- 若d为整数，则每个像素邻域的直径为d；
- 若d为包含两个整数的元组 (a, b)，直径将从 [a…b] 区间中随机采样；
sigma_space: 控制模糊程度的空间标准差。较大的值会导致更强的模糊效果。
- 若sigma_space为整数，则空间标准差为sigma_space；
- 若sigma_space为包含两个整数的元组 (a, b)，空间标准差将从 [a…b] 区间中随机采样；
sigma_color: 控制模糊程度的颜色标准差。较大的值会导致更强的模糊效果。
- 若sigma_color为整数，则空间标准差为sigma_color；
- 若sigma_color为包含两个整数的元组 (a, b)，空间标准差将从 [a…b] 区间中随机采样；

示例代码

使用不同标准差参数

import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 创建双边模糊增强器
aug1 = iaa.BilateralBlur(d=7, sigma_color=50, sigma_space=50)
aug2 = iaa.BilateralBlur(d=7, sigma_color=150, sigma_space=150)
aug3 = iaa.BilateralBlur(d=7, sigma_color=200, sigma_space=200)


# 对图像进行双边模糊处理
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和模糊后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Blurred Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Blurred Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Blurred Image3")
plt.show()

运行结果如下：

图1 原图及中值模糊/滤波结果可视化

注意事项：

性能考虑：双边模糊是一种相对较耗时的操作。因此，在处理大图像或视频时，需要考虑到计算资源的需求。
结果的可重复性：由于双边模糊是非线性操作，每次应用可能会产生稍微不同的结果。如果你需要结果的可重复性，可以使用aug.to_deterministic()方法将增强器转换为确定性状态。

总结

iaa.BilateralBlur是imgaug库中的一个非常有用的数据增强方法。它是一种非线性的滤波方法，结合了图像的空间邻近度和像素值相似度，旨在达到保边去噪的目的。双边滤波器的好处是可以做边缘保存，它能够有效地将影像上的噪声去除，同时保存影像上的边缘信息。具体来说，双边滤波器在平滑图像的同时，能更好地保留图像中的边缘信息，对于高频细节的保护效果也优于传统的滤波器。然而，双边滤波器对于彩色图像里的高频噪声的处理效果并不理想，可能会保留过多的高频信息。

小结

imgaug是一个强大的图像增强库，它可以帮助你创建出丰富多样的训练数据，从而改进你的深度学习模型的性能。通过定制变换序列和参数，你可以轻松地适应各种应用场景，从计算机视觉到医学影像分析。随着深度学习的发展，imgaug在未来将继续发挥重要作用。因此，将imgaug纳入你的数据增强工具箱是一个明智的选择。

参考链接

结尾

亲爱的读者，首先感谢您抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见，因为这对我们来说意义非凡。
俗话说，当局者迷，旁观者清。您的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果您觉得我们的博文给您带来了启发，那么，希望您能为我们点个免费的赞/关注，您的支持和鼓励是我们持续创作的动力。
请放心，我们会持续努力创作，并不断优化博文质量，只为给您带来更佳的阅读体验。
再次感谢您的阅读，愿我们共同成长，共享智慧的果实！

文章来源:https://blog.csdn.net/qq_41813454/article/details/135433721
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！