(文章来源:迅声云)
从2019年至今,我们接触到了各式各样的声音检测需求,市场上关于声音检测的需求不断,甚至很多工厂都把声音检测纳入的标准检测规范之中,这也正映射出声音检测应用的逐渐普及。因此我们单开一帖介绍时下很火的声音检测技术。首先我们需要把声音检测技术与语音识别,声纹识别加以区分。
从声音特性角度来看,声音可以划分为语音,音乐与环境声三大类,而目前主流的语音识别及声纹识别技术都是针对语音信号处理的,技术发展的相对成熟,而我们所提到的声音检测技术则主要是针对环境声的,包括城市交通,工厂噪声,自然环境声等等,整体技术还处于早期发展阶段,虽不够成熟,但是具有广阔的应用空间。
从学术角度来看声音检测技术的归属——是从属于计算机听觉学科的分支。
什么是计算机听觉?近10年来,随着半导体技术,互联网,音频压缩技术,录音设备的共同发展,使得数字格式的各种声音急剧增加。在人类听觉机制的启发之下,诞生了一个新的学科——计算机听觉,也可以称之为机器听觉。计算机听觉是一个面向数字音频与音乐,研究用计算机软件来分析和理解海量数字音频内容的算法与系统的科学。
通俗来讲——计算机听觉的目的是让计算机或者机器能具备人类的听觉感知能力!
为了模拟人类能够通过声音特性产生主观感受的能力,计算机听觉要实现的核心功能主要是如下三点:1、 声音检测/音频事件检测(audio event detecTIon)2、 声目标识别(acousTIc target detecTIon)3、 声源定位(Sound source locaTIon)。其中声源定位我们前面的文章也有过初步的讲解,还不太清楚的小伙伴们可以点击查看。声源定位与声场成像有什么区别?
声目标识别更为复杂,后期会加以介绍,今天我们主要介绍声音检测/音频事件检测技术。
声音检测/音频事件检测(AED)也叫做声音事件检测,环境声音检测,主要目的是检测连续的音频流之中有无出现目标声音事件,比如检测设备故障异常发出的声音,事故现场发出的声音,野生动物的声音等等。类比人类,机器可以用过聆听周边环境的声音判断发生了什么。
如果说语音识别是将我们人类语音翻译为机器能听懂的语言,那么环境声音检测技术就是将环境声音翻译为机器可以理解的声音。只不过在实际实现的过程中,各种背景噪声干扰同时存在,针对环境声的检测相比语音识别会更加复杂与困难,所以也导致语音识别技术发展相对较早也较为成熟。但是随着近些年城市智慧化建设的需要,与工厂自动化升级的推动,声音检测技术也在快速完善。
声音检测技术和声源定位一样,最早都是应用在军事领域,用于进行声呐探潜,在海洋里利用声音探测潜水艇及舰船的螺旋桨噪声作为检测手段,判断敌情。当然至今这一技术仍是海洋里最为普遍可靠的技术方案。
近些年,该技术逐渐在民用领域快速发展,在各个领域都有广泛应用。例如:巡检机器人的“听觉进化”之路。智慧安防的终极大招——给你讲3个故事吧!、工业设备异常声音监测……这些也只是声音检测技术民用的冰山一角,还有大量的应用前景与空间。
近几年国外也越来越重视这项技术的发展与应用,包括世界名校,谷歌等行业巨头也争相加入这一领域的研究。
(责任编辑:fqj)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)