机器学习的音频提取_随笔

机器学习的音频提取

机器学习，学什么？比如运动检测、视觉中的视频、听觉中的音频及语言处理、嗅觉中的气味（香烟白酒水及各种气体）、触觉、传感器能感知到的环境参数，如加速度、航向角、速度角度、温湿度、大气压甚至事物轮廓、红外数据等等。视频、图像、文字、语音、味道、质感等信息都是一种学习内容，学习并解析视频、图像、文字、语音、味道、质感等。

比如车载摄像头，可以听懂语音，还能识别人的表情神态、动作，观察是否存在疲劳驾驶、分心、打电话等状况，并进行及时的语音提醒；医疗机器人可以像人类医生一样通过“望、闻、问、切”进行诊断，听得懂声音，还可根据肢体动作、微表情、语调等来综合判断精准反馈。

视频提取一般想到的就是通过摄像头，声音的获取一般通过PDM、PCM、Microphone等设备，而各种sensor更是感知到很多很多，包括人能感知或不能感知的，不得不说这是机器有些能做人做不了了的事情的原因。

本节重点介绍如何使用PDM进行音频数据采集，首先就是要有一个带有PDM器件的设备，作为采集的输入接口，后台程序作为数据处理接口。功能主要是采集16kHz的音频7秒钟，并且将音频数据打印输出到串口，代码如下：

#include "cyhal.h"
#include "cybsp.h"
#include "cy_retarget_io.h"
#include "cy8ckit_028_epd_pins.h"
#include "mtb_e2271cs021.h"
#include "GUI.h"
#include "LCDConf.h"

/*******************************************************************************

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5702693.html

机器学习的音频提取

发表评论

评论列表（0条）