FLV格式分析

FLV格式分析,第1张

Rtmp 分析参见: >

一、直播的技术架构:

直播视频采集SDK(PC/IOS/Anddroid)——直播CDN

(直播流分发加速)——直播视频播放器SDK(PC/IOS/Android)

二、音视频处理的一般流程:

数据采集→数据编码→数据传输(流媒体服务器)→解码数据→播放显示

1、数据采集:

摄像机及拾音器收集视频及音频数据,此时得到的为原始数据

涉及技术或协议

摄像机:CCD、CMOS

拾音器:声电转换装置(咪头)、音频放大电路

2、数据编码:

使用相关硬件或软件对音视频原始数据进行编码处理(数字化)及加工(如音视频混合、打包封装等),得到可用的音视频数据

涉及技术或协议:

编码方式:CBR、VBR

编码格式

视频:H265、H264、MPEG-4等,封装容器有TS、MKV、AVI、MP4等

音频:G711μ、AAC、Opus等,封装有MP3、OGG、AAC等

3、数据传输:

将编码完成后的音视频数据进行传输,早期的音视频通过同轴电缆之类的线缆进行传输,IP网络发展后,使用IP网络优传输

涉及技术或协议:

传输协议:RTP与RTCP、RTSP、RTMP、>

控制信令:SIP和SDP、SNMP等

4、解码数据:

使用相关硬件或软件对接收到的编码后的音视频数据进行解码,得到可以直接显示的图像/声音

涉及技术或协议:

一般对应的编码器都会带有相应的解码器,也有一些第三方解码插件等

5、播放显示:

在显示器(电视、监视屏等)或扬声器(耳机、喇叭等)里,显示相应的图像画面或声音

涉及技术或协议:

显示器、扬声器、3D眼镜等

三、常见的视频直播相关协议:

1、RTMP(RealTimeMessagingProtocol,实时消息传送协议)

RTMP是AdobeSystems公司为Flash播放器和服务器之间音频、视频和数据传输开发的开放协议。它有三种变种:

1)、工作在TCP之上的明文协议,使用端口1935;

2)、RTMPT封装在>

3)、RTMPS类似RTMPT,但使用的是>

RTMP协议是被Flash用于对象、视频、音频的传输。这个协议建立在TCP协议或者轮询>

2、RTSP(RealTimeStreamingProtocol,实时流传输协议)

RTSP定义了一对多应用程序如何有效地通过IP网络传送多媒体数据。RTSP提供了一个可扩展框架,数据源可以包括实时数据与已有的存储的数据。该协议目的在于控制多个数据发送连接,为选择发送通道如UDP、组播UDP与TCP提供途径,并为选择基于RTP上发送机制提供方法。

RTSP语法和运作跟>

3、RTP(Real-timeTransportProtocol,实时传输协议)

RTP是针对多媒体数据流的一种传输层协议,详细说明了在互联网上传递音频和视频的标准数据包格式。RTP协议常用于流媒体系统(配合RTCP协议),视频会议和一键通系统(配合H323或SIP),使它成为IP电话产业的技术基础。

RTP是建立在UDP协议上的,常与RTCP一起使用,其本身并没有提供按时发送机制或其它服务质量(QoS)保证,它依赖于低层服务去实现这一过程。

RTP并不保证传送或防止无序传送,也不确定底层网络的可靠性,只管发送,不管传输是否丢包,也不管接收方是否有收到包。RTP实行有序传送,RTP中的序列号允许接收方重组发送方的包序列,同时序列号也能用于决定适当的包位置,如在视频解码中,就不需要顺序解码。

4、RTCP(Real-timeTransportControlProtocol,实时传输控制协议)

RTCP是RTP的配套协议,为RTP媒体流提供信道外的控制。RTCP和RTP一起协作将多媒体数据打包和发送,定期在多媒体流会话参与者之间传输控制数据。

RTCP的主要功能是为RTP所提供的服务质量(QoS)提供反馈,收集相关媒体连接的统计信息,例如传输字节数,传输分组数,丢失分组数,单向和双向网络延迟等等。网络应用程序可以利用RTCP所提供的信息来提高服务质量,比如限制流量或改用压缩比小的编解码器。

你双击这个rar文件,winrar在打开的时候,你看右边的窗口,往往那里会写着下载网站的说明,说明里一般会带解压密码,而且多数是用网站网址当解压密码,如果没有,你在压缩包里找找,有没有txt文件,在这个文件里也会有压缩密码,如果都没有,那就到下载页找找,那里一般会写着解压密码。如果以上都不行,那就只能暴力破解了,网上虽然提供了许多破解软件,不过几乎不可能破,4位的密码,破解需要20几分钟,到5位已经几个小时,如果设置的密码没有规律,并且超过8位几乎是不可能的。另外如果你完全不知道密码大致怎么样,也没有比较完善的字典,基本上不可能破得了,除非你有一台银河亿次机慢慢测试。所以如果遇到有密码的压缩文件,如果需要暴力破解,还是删除为妙,重新去下载没密码的。

FLV是一个二进制文件,简单来说,其是由一个文件头(FLV header)和很多tag组成(FLV body)。

tag又可以分成三类:audio,video,script,分别代表音频流,视频流,脚本流,而每个tag又由tag header和tag data组成。

FLV整体结构图:

1、FLV文件头结构分析

      FLV文件头结构图:

        FLV文件头由9bytes组成,前3个bytes是文件类型,总是“FLV”,也就是(0x46 0x4C 0x56)。第4btye是版本号,目前一般是0x01。第5byte是流的信息,倒数第一bit是1表示有视频(0x01),倒数第三bit是1表示有音频(0x4),有视频又有音频就是0x01 | 0x04(0x05),其他都应该是0。最后4bytes表示FLV 头的长度,3+1+1+4 = 9。

2、 FLV body结构分析

        FLV body由若干个tag 组成。每一个tag第一部分是tag header,tag header长度为11bytes,但是每个tag header前面有4bytes记录着上一个tag的长度。

        tag结构图:

        tag header:

        1)第1个byte为记录着tag的类型,音频(0x8),视频(0x9),脚本(0x12);

        2)第2到4bytes是数据区的长度,也就是tag data的长度;

        3)再后面3个bytes是时间戳,单位是毫秒,类型为0x12则时间戳为0,时间戳控制着文件播放的速度,可以根据音视频的帧率类设置;

        4)时间戳后面一个byte是扩展时间戳,时间戳不够长的时候用;

        5)最后3bytes是streamID,但是总为0,再后面就是数据区了(tag data),也即是h264的裸流;

        6)tag header 长度为1+3+3+1+3=11。

        音频TagData结构分析:

        音频参数中各字段的值及其意义如下表所示:

        视频TagData结构:

        Script TagData结构

        Script Tag通常被称为Metadata Tag,会放一些关于FLV视频和音频的元数据信息如:duration、width、height等。通常此类型Tag会跟在File Header后面作为第一个Tag出现,而且只有一个。

        第一个AMF包:

        第1个字节表示AMF包类型,一般总是0x02,表示字符串。第2-3个字节为UI16类型值,标识字符串的长度,一般总是 0x000A(“onMetaData”长度)。后面字节为具体的字符串,一般   为“onMetaData”(6F,6E,4D,65,74,61,44,61,74,61)。

所以第一个AMF包总共占13字节。

        第二个AMF包结构图:

        第1个字节表示AMF包类型,一般总是0x08,表示数组。第2-5个字节为UI32类型值,表示数组元素的个数,后面即为各数组元素的封装。数组元素为元素名称和值组成的对。“数组元素结构”部分是推测,已经确认适用于duration、width、height等常见元素,但并不确认适用于所有元素。常见的数组元素如下表所示。

附上一个flv的查看工具: 地址


>

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13341207.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-18
下一篇 2023-07-18

发表评论

登录后才能评论

评论列表(0条)

保存