机器学习的音频提取

机器学习的音频提取,第1张

机器学习的音频提取

机器学习,学什么?比如运动检测、视觉中的视频、听觉中的音频及语言处理、嗅觉中的气味(香烟白酒水及各种气体)、触觉、传感器能感知到的环境参数,如加速度、航向角、速度角度、温湿度、大气压甚至事物轮廓、红外数据等等。视频、图像、文字、语音、味道、质感等信息都是一种学习内容,学习并解析视频、图像、文字、语音、味道、质感等。

比如车载摄像头,可以听懂语音,还能识别人的表情神态、动作,观察是否存在疲劳驾驶、分心、打电话等状况,并进行及时的语音提醒;医疗机器人可以像人类医生一样通过“望、闻、问、切”进行诊断,听得懂声音,还可根据肢体动作、微表情、语调等来综合判断精准反馈。

视频提取一般想到的就是通过摄像头,声音的获取一般通过PDM、PCM、Microphone等设备,而各种sensor更是感知到很多很多,包括人能感知或不能感知的,不得不说这是机器有些能做人做不了了的事情的原因。

本节重点介绍如何使用PDM进行音频数据采集,首先就是要有一个带有PDM器件的设备,作为采集的输入接口,后台程序作为数据处理接口。功能主要是采集16kHz的音频7秒钟,并且将音频数据打印输出到串口,代码如下:

#include "cyhal.h"
#include "cybsp.h"
#include "cy_retarget_io.h"
#include "cy8ckit_028_epd_pins.h"
#include "mtb_e2271cs021.h"
#include "GUI.h"
#include "LCDConf.h"

/*******************************************************************************

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5702693.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存