FLV格式分析_安全

Rtmp 分析参见: >

一、直播的技术架构：

直播视频采集SDK（PC/IOS/Anddroid）——直播CDN

（直播流分发加速）——直播视频播放器SDK（PC/IOS/Android）

二、音视频处理的一般流程：

数据采集→数据编码→数据传输(流媒体服务器)→解码数据→播放显示

1、数据采集：

摄像机及拾音器收集视频及音频数据，此时得到的为原始数据

涉及技术或协议：

摄像机：CCD、CMOS

拾音器：声电转换装置（咪头）、音频放大电路

2、数据编码：

使用相关硬件或软件对音视频原始数据进行编码处理（数字化）及加工（如音视频混合、打包封装等），得到可用的音视频数据

涉及技术或协议：

编码方式：CBR、VBR

编码格式

视频：H265、H264、MPEG-4等，封装容器有TS、MKV、AVI、MP4等

音频：G711μ、AAC、Opus等，封装有MP3、OGG、AAC等

3、数据传输：

将编码完成后的音视频数据进行传输，早期的音视频通过同轴电缆之类的线缆进行传输，IP网络发展后，使用IP网络优传输

涉及技术或协议：

传输协议：RTP与RTCP、RTSP、RTMP、>

控制信令：SIP和SDP、SNMP等

4、解码数据：

使用相关硬件或软件对接收到的编码后的音视频数据进行解码，得到可以直接显示的图像/声音

涉及技术或协议：

一般对应的编码器都会带有相应的解码器，也有一些第三方解码插件等

5、播放显示：

在显示器（电视、监视屏等）或扬声器（耳机、喇叭等）里，显示相应的图像画面或声音

涉及技术或协议：

显示器、扬声器、3D眼镜等

三、常见的视频直播相关协议：

1、RTMP(RealTimeMessagingProtocol，实时消息传送协议)

RTMP是AdobeSystems公司为Flash播放器和服务器之间音频、视频和数据传输开发的开放协议。它有三种变种：

1）、工作在TCP之上的明文协议，使用端口1935；

2）、RTMPT封装在>

3）、RTMPS类似RTMPT，但使用的是>

RTMP协议是被Flash用于对象、视频、音频的传输。这个协议建立在TCP协议或者轮询>

2、RTSP(RealTimeStreamingProtocol，实时流传输协议)

RTSP定义了一对多应用程序如何有效地通过IP网络传送多媒体数据。RTSP提供了一个可扩展框架，数据源可以包括实时数据与已有的存储的数据。该协议目的在于控制多个数据发送连接，为选择发送通道如UDP、组播UDP与TCP提供途径，并为选择基于RTP上发送机制提供方法。

RTSP语法和运作跟>

3、RTP(Real-timeTransportProtocol，实时传输协议)

RTP是针对多媒体数据流的一种传输层协议，详细说明了在互联网上传递音频和视频的标准数据包格式。RTP协议常用于流媒体系统（配合RTCP协议），视频会议和一键通系统（配合H323或SIP），使它成为IP电话产业的技术基础。

RTP是建立在UDP协议上的，常与RTCP一起使用，其本身并没有提供按时发送机制或其它服务质量（QoS）保证，它依赖于低层服务去实现这一过程。

RTP并不保证传送或防止无序传送，也不确定底层网络的可靠性，只管发送，不管传输是否丢包，也不管接收方是否有收到包。RTP实行有序传送，RTP中的序列号允许接收方重组发送方的包序列，同时序列号也能用于决定适当的包位置，如在视频解码中，就不需要顺序解码。

4、RTCP(Real-timeTransportControlProtocol，实时传输控制协议）

RTCP是RTP的配套协议，为RTP媒体流提供信道外的控制。RTCP和RTP一起协作将多媒体数据打包和发送，定期在多媒体流会话参与者之间传输控制数据。

RTCP的主要功能是为RTP所提供的服务质量（QoS）提供反馈，收集相关媒体连接的统计信息，例如传输字节数，传输分组数，丢失分组数，单向和双向网络延迟等等。网络应用程序可以利用RTCP所提供的信息来提高服务质量，比如限制流量或改用压缩比小的编解码器。

你双击这个rar文件，winrar在打开的时候，你看右边的窗口，往往那里会写着下载网站的说明，说明里一般会带解压密码，而且多数是用网站网址当解压密码，如果没有，你在压缩包里找找，有没有txt文件，在这个文件里也会有压缩密码，如果都没有，那就到下载页找找，那里一般会写着解压密码。如果以上都不行，那就只能暴力破解了，网上虽然提供了许多破解软件，不过几乎不可能破，4位的密码，破解需要20几分钟，到5位已经几个小时，如果设置的密码没有规律，并且超过8位几乎是不可能的。另外如果你完全不知道密码大致怎么样，也没有比较完善的字典，基本上不可能破得了，除非你有一台银河亿次机慢慢测试。所以如果遇到有密码的压缩文件，如果需要暴力破解，还是删除为妙，重新去下载没密码的。

FLV是一个二进制文件，简单来说，其是由一个文件头（FLV header）和很多tag组成（FLV body）。

tag又可以分成三类:audio,video,script，分别代表音频流，视频流，脚本流，而每个tag又由tag header和tag data组成。

FLV整体结构图：

1、FLV文件头结构分析

FLV文件头结构图：

        FLV文件头由9bytes组成，前3个bytes是文件类型，总是“FLV”，也就是（0x46 0x4C 0x56）。第4btye是版本号，目前一般是0x01。第5byte是流的信息，倒数第一bit是1表示有视频（0x01），倒数第三bit是1表示有音频（0x4），有视频又有音频就是0x01 | 0x04（0x05），其他都应该是0。最后4bytes表示FLV 头的长度，3+1+1+4 = 9。

2、 FLV body结构分析

      FLV body由若干个tag 组成。每一个tag第一部分是tag header，tag header长度为11bytes，但是每个tag header前面有4bytes记录着上一个tag的长度。

        tag结构图：

        tag header：

        1）第1个byte为记录着tag的类型，音频（0x8），视频（0x9），脚本（0x12）；

        2）第2到4bytes是数据区的长度，也就是tag data的长度；

        3）再后面3个bytes是时间戳，单位是毫秒，类型为0x12则时间戳为0，时间戳控制着文件播放的速度，可以根据音视频的帧率类设置；

        4）时间戳后面一个byte是扩展时间戳，时间戳不够长的时候用；

        5）最后3bytes是streamID，但是总为0，再后面就是数据区了（tag data），也即是h264的裸流；

        6）tag header 长度为1+3+3+1+3=11。

        音频TagData结构分析：

        音频参数中各字段的值及其意义如下表所示：

        视频TagData结构：

        Script TagData结构

        Script Tag通常被称为Metadata Tag，会放一些关于FLV视频和音频的元数据信息如：duration、width、height等。通常此类型Tag会跟在File Header后面作为第一个Tag出现，而且只有一个。

        第一个AMF包：

        第1个字节表示AMF包类型，一般总是0x02，表示字符串。第2-3个字节为UI16类型值，标识字符串的长度，一般总是 0x000A（“onMetaData”长度）。后面字节为具体的字符串，一般为“onMetaData”（6F,6E,4D,65,74,61,44,61,74,61）。

所以第一个AMF包总共占13字节。

第二个AMF包结构图：

        第1个字节表示AMF包类型，一般总是0x08，表示数组。第2-5个字节为UI32类型值，表示数组元素的个数，后面即为各数组元素的封装。数组元素为元素名称和值组成的对。“数组元素结构”部分是推测，已经确认适用于duration、width、height等常见元素，但并不确认适用于所有元素。常见的数组元素如下表所示。

附上一个flv的查看工具: 地址

FLV格式分析

>

欢迎分享，转载请注明来源：内存溢出
原文地址: http://outofmemory.cn/yw/13341207.html

发表评论

评论列表（0条）

FLV格式分析

> 欢迎分享，转载请注明来源：内存溢出原文地址: http://outofmemory.cn/yw/13341207.html

发表评论

评论列表（0条）

>

欢迎分享，转载请注明来源：内存溢出
原文地址: http://outofmemory.cn/yw/13341207.html