格式工厂转出的avi格式视频声音有4s延迟,怎么处理?

格式工厂转出的avi格式视频声音有4s延迟,怎么处理?,第1张

提供一种方式(对于已经编码好的视频)

第一步:先用mkvtoolnix将编码好的视频的音频部分设定延时封装成mkv

第二步:用ffmpeg将mkv封装成avi,命令行参考(需要ffmpeg.exe和输入文件、bat在同一文件夹下,将下面的复制到记事本保存后将后缀名改为bat):

"ffmpeg.exe" -i 输入.mkv -vcodec copy -acodec copy 输出.avi

PS:mkvtoolnix需要另行下载,ffmpeg在格式工厂的文件里面就有

PS2:格式工厂的大部分功能靠ffmpeg实现,而且提供的可设置的内容较少,而且格式工厂在ffmpeg的耻辱柱上(至少是曾经再过,最近ffmpeg官网部分内容维护,暂时查不到,所以无法确定现在是否还在)

PS3:如果要个好的效果的话,我劝你放弃格式工厂吧

视频编码是短视频平台一个重要的部分,如果把整个流媒体比喻成一个物流系统,那么编解码就是其中配货和装货的过程,这个过程非常重要,它的速度和压缩比对物流系统的意义非常大,影响物流系统的整体速度和成本。同样,对流媒体传输来说,编码也非常重要,它的编码性能、编码速度和编码压缩比会直接影响整个流媒体传输的用户体验和传输成本。

视频编码的意义

原始视频数据存储空间大:一个 1080P 的 7 s 视频需要 817 MB;

原始视频数据传输占用带宽大:10 Mbps 的带宽传输上述 7 s 视频需要 11 分钟。

而经过 H.264 编码压缩之后,视频大小只有 708 k 、10 Mbps 的带宽仅仅需要 500 ms ,可以满足实时传输的需求,所以从视频采集传感器采集来的原始视频势必要经过视频编码。

1、确保 Codec 开启了最低延迟的设置。Codec 一般都会有低延迟优化的开关,对于 H.264 来说其效果尤其明显。很多人可能不知道 H.264 的解码器正常情况下会在显示之前缓存一定的视频帧,对于 QCIF 分辨率大小的视频(176 × 144)一般会缓存 16 帧,对于 720P 的视频则缓存 5 帧。对于第一帧的读取来说,这是一个很大的延迟。如果你的视频不是使用 H.264 来编码压缩的,确保没有使用到 B 帧,它对延迟也会有较大的影响,因为视频中 B 帧的解码依赖于前后的视频帧,会增加延迟。

2、编码器一般都会有码控造成的延迟,一般也叫做初始化延迟或者视频缓存检验器 VBV 的缓存大小,把它当成编码器和解码器比特流之间的缓存,在不影响视频质量的情况下可以将其设置得尽可能小也可以降低延迟。

3、如果是仅仅优化首开延迟,可以在视频帧间插入较多的关键帧,这样客户端收到视频流之后可以尽快解码。但如果需要优化传输过程中的累计延迟,尽可能少使用关键帧也就是 I 帧(GOP 变大),在保证同等视频质量的情况下,I 帧越多,码率越大,传输所需的网络带宽越多,也就意味着累计延迟可能越大。这个优化效果可能在秒级延迟的系统中不是很明显,但是在 100 ms 甚至更低延迟的系统中就会非常明显。同时,尽量使用 ACC-LC Codec 来编码音频,HE-ACC 或者 HE-ACC 2 虽然编码效率高,但是编码所需时间更长,而产生更大体积的音频造成的传输延迟对于视频流的传输来说影响更小。

4、不要使用视频 MJPEG 的视频压缩格式,至少使用不带 B 帧的 MPEG4 视频压缩格式(Simple profile),甚至最好使用 H.264 baseline profile(X264 还有一个「-tune zerolatency」的优化开关)。这样一个简单的优化可以降低延迟,因为它能够以更低的码率编码全帧率视频。

5、如果使用了 FFmpeg,降低「-probesize 」和「 -analyze duration」参数的值,这两个值用于视频帧信息监测和用于监测的时长,这两个值越大对编码延迟的影响越大,在直播场景下对于视频流来说 analyzeduration 参数甚至没有必要设定。

6、固定码率编码 CBR 可以一定程度上消除网络抖动影响,如果能够使用可变码率编码 VBR 可以节省一些不必要的网络带宽,降低一定的延迟。因此建议尽量使用 VBR 进行编码。

最近有一个需求,需要将多个音频文件延时插入到一段视频中,经过学习,得到以下命令:

-y -i videoSource.mp4 -i test1.mp3 -i test2.mp3 -i test3.mp3 -filter_complex [1]adelay=5000|5000=[s1][2]adelay=15000|15000=[s2][3]adelay=25000|25000=[s3][0:a][s1][s2][s3]amix=4[a] -map 0:v -map [a] -c:v copy result.mp4

如果不需要视频原声,则修改命令为:

-y -i videoSource.mp4 -i test1.mp3 -i test2.mp3 -i test3.mp3 -filter_complex [1]adelay=5000|5000=[s1][2]adelay=15000|15000=[s2][3]adelay=25000|25000=[s3][s1][s2][s3]amix=3[a] -map 0:v -map [a] -c:v copy result.mp4

以上命令为Android使用,如果需要在windows使用,则需要修改为:

-y -i videoSource.mp4 -i test1.mp3 -i test2.mp3 -i test3.mp3 -filter_complex "[1]adelay=5000|5000=[s1][2]adelay=15000|15000=[s2][3]adelay=25000|25000=[s3][s1][s2][s3]amix=3[a]" -map 0:v -map "[a]" -c:v copy result.mp4

其中

[1]adelay=5000|5000=[s1]的意思为:取第二个输入文件的音轨(下标从0开始)并延时5000毫秒

[0:a]的意思为:第一个输入文件的音频资源


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/tougao/7834558.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-10
下一篇 2023-04-10

发表评论

登录后才能评论

评论列表(0条)

保存