微信小程序声音识别什么时候出来的_软件运维

现在小程序的语音识别实现起来有点绕，处理起来太繁琐，网上也有大牛的php开源转码的，但是像linux要依赖gcc和ffmpeg，本身音频知识就欠缺，还要编译之类的，而且语音文件有巨大的深坑，服务器现在的做法是录音后上传服务器解码、转码成pcm或wav，我用的php，只能用百度的语音识别的php SDK。

1、微信小程序录音，提交到服务器（此时音频格式为silk）；

2、利用silk-v3-decoder（https://github.com/kn007/silk-v3-decoder），把silk 转换成pcm格式（silk/decoder /data/test.silk /data/1.pcm）；

3、用 ffmpeg 把 44100 采样率单声道 16bts pcm 文件转 16000采样率 16bits 位深的单声道pcm文件

ffmpeg -y -f s16le -ac 1 -ar 44100 -i test44.pcm -acodec pcm_s16le -f s16le -ac 1 -ar 1600016k.pcm （获得pcm文件）

ffmpeg -y -f s16le -ar 24000 -ac 1 -i /data/1.pcm -f wav -ar 16000 -b:a 16 -ac 1 /data/1.wav （获得wav文件）

4、调用百度api 转换 pcm ，就能获取百度转换后的文字

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/yw/11557361.html

微信小程序声音识别什么时候出来的

发表评论

评论列表（0条）