外语配音软件“布谷鸟配音“和ffmepg转换软件的使用以及SYD

外语配音软件“布谷鸟配音“和ffmepg转换软件的使用以及SYD,第1张

外语配音软件"布谷鸟配音"和ffmepg转换软件的使用以及CAL文件提取到C语言 布谷鸟配音缺点

因为现在要使用意大利语的语音,所以原来的文字转语音工具不能够使用了,然后采用了"布谷鸟配音"这个软件,可以输出很多个语言:

但是布谷鸟配音软件有个问题,它输出的WAV文件不是标准的RIFF文件,所以之前的CAL转换方式(看文章https://blog.csdn.net/chengdong1314/article/details/124027262)就不行了,再深入研究发现布谷鸟配音输出的是S16 16K的音频格式,也就是16BIT 16KHZ,所以没有办法引入ffmepg来转换wav文件为8Bit的格式以方便给后面的单片机引用.

ffmepg软件安装

ffmepg软件请看如下文章的说明:https://zhuanlan.zhihu.com/p/324472015
安装成功可以输入如下指令来查看版本号:

F:\download>ffmpeg -version
ffmpeg version 5.1.1-essentials_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
built with gcc 12.1.0 (Rev2, Built by MSYS2 project)
configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libmfx --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
libavutil      57. 28.100 / 57. 28.100
libavcodec     59. 37.100 / 59. 37.100
libavformat    59. 27.100 / 59. 27.100
libavdevice    59.  7.100 / 59.  7.100
libavfilter     8. 44.100 /  8. 44.100
libswscale      6.  7.100 /  6.  7.100
libswresample   4.  7.100 /  4.  7.100
libpostproc    56.  6.100 / 56.  6.100
转换WAV文件为8KHZ 16BIT

安装好后使用如下命令转换布谷鸟输出的wav(重命名布谷鸟生成的wav为"1.wav"并且放在F:\download目录下),其实我最终需要的是8KHZ 8BIT的:

F:\download>ffmpeg -i 1.wav -ar 8000 1_16BIT8KHZ.wav
ffmpeg version 5.1.1-essentials_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 12.1.0 (Rev2, Built by MSYS2 project)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libmfx --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
  libavutil      57. 28.100 / 57. 28.100
  libavcodec     59. 37.100 / 59. 37.100
  libavformat    59. 27.100 / 59. 27.100
  libavdevice    59.  7.100 / 59.  7.100
  libavfilter     8. 44.100 /  8. 44.100
  libswscale      6.  7.100 /  6.  7.100
  libswresample   4.  7.100 /  4.  7.100
  libpostproc    56.  6.100 / 56.  6.100
[aac @ 0000023ac14ab700] Estimating duration from bitrate, this may be inaccurate
Input #0, aac, from '1.wav':
  Duration: 00:00:02.28, bitrate: 65 kb/s
  Stream #0:0: Audio: aac (LC), 22050 Hz, mono, fltp, 65 kb/s
Stream mapping:
  Stream #0:0 -> #0:0 (aac (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
Output #0, wav, to '1_16BIT8KHZ.wav':
  Metadata:
    ISFT            : Lavf59.27.100
  Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, mono, s16, 128 kb/s
    Metadata:
      encoder         : Lavc59.37.100 pcm_s16le
size=      36kB time=00:00:02.27 bitrate= 128.3kbits/s speed= 526x
video:0kB audio:36kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.214227%
SYD_Calculator提取文件到C语言

WAV文件的再次转换和使用SYD_Calculator软件来转换wav,这里一步到位直接替换文件里面的数组内容,非常实用快捷
因为单片机使用的是8KHZ 8BIT的文件,所以ffmpeg生成的wav还是不能够直接使用,没办法只能够再次用,请看如下文章:
https://blog.csdn.net/chengdong1314/article/details/126885337
实验测试过程的资料如下:https://download.csdn.net/download/chengdong1314/86540409

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/2991719.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-09-23
下一篇 2022-09-23

发表评论

登录后才能评论

评论列表(0条)

保存