0 引言
人脸作为图像与视频中最重要的视觉图像之一,在计算机视觉、模式识别、多媒体技术研究中占有很重要的地位。可视化分析和目标识别研究中最具有挑战性的任务之一就是理解人们如何处理和识别彼此的相貌,并进行相应的计算机建模来最终完成人脸的自动识别。近年来,随着计算机科学在人机交互领域的快速发展,作为人脸信息处理中的一项关键技术,人脸检测与识别现在已经成为模式识别与计算机视觉领域内一项受到普遍重视。无线视频监控系统将被监控点实时采集的图片、视频文件通过无线网络及时地传输给远程监控中心,实时动态地报告被监测点的情况,及时发现问题并进行处理。
本文提出了一种有效的无线远程人脸追踪系统的解决方案。采用AdaBoost算法进行人脸的检测,选择了Haar特征方法,把训练得出的Haar特征转换成弱分类器,通过一定的方法将弱分类器进行组合构成强分类器,对分类器进行训练后应用到图像中进行人脸区域的检测,从而得到较准确的人脸信息;采用GPRS技术进行人脸图像数据的无线传输,通过GPRS/CDMA无线窄带网络连接Internet互联网络,在无线视频监控终端对视频信号进行实时采集,无线传送到远程服务器;采用Gabor小波进行特征提取,获得人脸图像的Gabor特征;采用SVM进行分类,对人脸图像进行分类识别,得出识别结果,对符合条件的人脸给出警报。本系统可以应用于商场、机场、车站、地铁站等场所。
1 视频图像处理
1.1 去噪处理
图像在生成和传输过程中常受到各种噪声的干扰和影响,使图像质量下降。所以在进行图像分析和处理之前都需要对图像进行去噪处理。噪声的模型按照对图像的影响可以分为加性噪声模型和乘性噪声模型两大类。假设,f(x,y)为原始图像,g(x,y)为有噪声的图像,n(x,y)为噪声。
加性噪声模型为:
g(x,y)=f(x,y)+n(x,y) (1)
乘性噪声模型为:
g(x,y)=f(x,y)[1+n(x,y)] (2)
空域中去噪方法包括:中值滤波、均值滤波等。中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性处理技术。其核心运算是将模板中的数据进行排序,这样一个亮点(暗点)的噪声,就会在排序过程中被排在数据序列的最右侧或最左侧,因此,最终选择的数据序列中间位置上的值一般不是噪声点的值。由此便可以达到抑制噪声的目的;均值滤波实际上就是用该像素对应的模板中各像素值的均值替代该像素的像素值,均值滤波的方法是,对待处理的当前图像,选择一个模板,该模板为其近邻的若干像素组成,用模板中像素的均值来替代原像素值。
1.2 亮度调整
由于采集图像时的光照强度和相机自身性能的不同,使得采集到的图像的亮度有许多不同。而本文的人脸检测是基于特征的,特征值与图像的灰度值有很大关系。所以即使图像对应的特征结构相同,但是由于亮度不同,通常会被分类器认为是不同的图像。所以无论是在训练分类器阶段还是在检测阶段都需要对图像进行亮度的调整,需要将不同亮度的图像调整到同一范围。常用的亮度调整技术包括:线性动态范围调整、非线性动态范围调整、直方图均衡化等。线性动态范围调整的方法是其中比较简单的一种,计算量也比较小。调整的计算公式如下:
1.3 图像的形状变换
图像形状变换是指用数学建模的方法对图像形状发生的变化进行描述的过程。最基本的图像变换包括图像的缩小、放大、旋转等。本文中的训练阶段和检测阶段都需要对图像进行形状的变换,比如在建立训练样本库的时候将不同尺寸的图像归一化到19×19的尺寸。图像缩小从物理意义上来说,是将描述图像的物理尺寸缩小相应的倍数。数字图像的缩小是通过减少像素个数来实现的,所以就需要根据所期望缩小的尺寸数据,从原图像中选择合适的像素点,使图像缩小之后可以尽量保持原有的特征不丢失。
图像放大,从物理含义上来讲是指图像缩小的逆运算。但是图像放大是从小数据量到大数据量的过程,因此需要对许多数据进行估计。由于图像相连像素之间的相关性很强,所以可以利用这个相关性来实现图像的放大。比较好的图像放大的方法是双线性插值法,该方法不是将原图像的像素复制到子快中,而是只填写在子快的某一个像素的位置上。采用双线性插值的方法可以平缓像素块之间的过度,有效的抑制了马赛克现象的产生。本文采用了双线性插值的方法。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)