微信小程序声音识别什么时候出来的

微信小程序声音识别什么时候出来的,第1张

现在小程序的语音识别实现起来有点绕,处理起来太繁琐,网上也有大牛的php开源转码的,但是像linux要依赖gcc和ffmpeg,本身音频知识就欠缺,还要编译之类的,而且语音文件有巨大的深坑,服务器现在的做法是录音后上传服务器解码、转码成pcm或wav,我用的php,只能用百度的语音识别的php SDK。

1、微信小程序录音,提交到服务器(此时音频格式为silk);

2、利用silk-v3-decoder(https://github.com/kn007/silk-v3-decoder), 把silk 转换成pcm格式 (silk/decoder /data/test.silk /data/1.pcm);

3、 用 ffmpeg 把 44100 采样率 单声道 16bts pcm 文件转 16000采样率 16bits 位深的单声道pcm文件

ffmpeg -y -f s16le -ac 1 -ar 44100 -i test44.pcm -acodec pcm_s16le -f s16le -ac 1 -ar 1600016k.pcm (获得pcm文件)

ffmpeg -y -f s16le -ar 24000 -ac 1 -i /data/1.pcm -f wav -ar 16000 -b:a 16 -ac 1 /data/1.wav (获得wav文件)

4、调用百度api 转换 pcm , 就能获取百度转换后的 文字


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/11557361.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存