百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

超强详解FLV解复?实战之FlvParser源码分析

cac55 2024-11-02 10:56 45 浏览 0 评论

1.环境准备

下载flvparser的源码:https://github.com/riverlight/FlvParser

qt工具设置如下:

在以下这个函数打下端点:

这个函数很长,只截出了一部分。


打印的媒体数据如下,与MediaInfo输出的一致:


如下图,是FLVParser的源码结构图:

1.main函数调用Process输出。

2.在process方法,把解析的数据存到内存里。


3.看看这个Parser方法。使用CheckBuffer、CreateFlvHeader检测9字节header。


4.进入CreateFlvHeader方法,观察flvHeader及其debug的数据结构。

pHeader->pFlvHeader = new uint8_t[pHeader->nHeadSize];
 memcpy(pHeader->pFlvHeader, pBuf, pHeader->nHeadSize);

//把这9个字节拷贝起来,然后再缓存起来,最终写到文件里。

flvHeader描述的就是一些flv header的信息,与MediaInfo分析出的信息一样。


还有TagHeader。

关于TAG的父类结构体。

子类CVideoTag、CAudioTag、CMetaDataTag都是继承上面父类的TAG。如下:

其中int ParseH264Configuration(CFlvParser *pParser, uint8_t *pTagData);这里一般就是一个AVC头部信息的解析,这里就是int ParseNalu(CFlvParser *pParser, uint8_t *pTagData)的数据NALU的解析;。int ParseAudioSpecificConfig(CFlvParser *pParser, uint8_t *pTagData);这里一般就是一个AAC音频头的解析,int ParseRawAAC(CFlvParser *pParser, uint8_t *pTagData);对于AAC数据的解析。


这里就会分析出相关信息。


关于媒体脚本数据就是解析视频宽高,采样率等。源码如下。



这里就是一些字段信息。



5.需要有完整的15个字节才能检查出TAG Header。15个字节的来源就是nPrevSize(4字节) + Tag header(11字节)。没有15个字节,就不一定能够检查出来,就需要使用return返回。


识别不同的TAG,然后进行解析。返回,不管是什么类型的TAG,然后插入到队列中。这里可以看出,音视频的裸流是没有时间戳。

6.分别详细看看VideoTag,AudioTag,ScriptTag。


初始化是把头部和body信息一起拷贝了。这里的_pTagData就是body信息。这里表示只处理AVC类型。


再来看看ParseH264Tag的数据包做了什么。

nAVCPacketType = pd[1]表示数据包类型,视频数据被压缩之后被打包成数据包在网上传输。根据包类型,分别去解析视频配置信息,还是真正的视频数据包。

注意:有两种类型的数据包:视频信息包(sps、pps等)和视频数据包(视频的压缩数据)。

那我们接下来,继续看看H264的配置信息,也就是具体解析AVC sequence header。要解析H264的配置信息,那么需要跨过 Tag Data的5个字节,比如VIDEODATA(1字节) AVCVIDEOPACKET(AVCPacketType(1字节) 和CompositionTime(3字节) 4字节),这样才能找到相关的配置信息结构体AVCDecoderConfigurationRecord。

注意:这里还有添加TAG Header的start code。

AVCDecoderConfigurationRecord结构体:


这里要说明下,为什么NALU的长度信息,需要4字节长度对齐。

_nNalUnitLength 这个变量告诉我们用几个字节来存储NALU的长度,如果NALULengthSizeMinusOne是0,那么每个NALU使用一个字节的前缀来指定长度,那么每个NALU包的最大长度是255字节,这个明显太小了,使用2个字节的前缀来指定长度,那么每个NALU包的最大长度是64K字节,也不一定够,一般分辨率达到1280*720 的图像编码出的I帧,可能大于64K;3字节是比较完美的,但是因为一些原因(例如对齐)没有被广泛支持;因此4字节长度的前缀是目前使用最多的方式。

注意下:这几个数据结构的说明。一般的flv和MP4文件都是不带startcode,所以解析的时候就需要添加startcode,这样dump下来的裸流才能够正确播放。

接下来再看看,真正解析H264的视频数据,ParseNalu。这里也需要跨过Tag Data的5个字节,分别是VIDEODATA(1字节) AVCVIDEOPACKET(AVCPacketType和CompositionTime 4字节。132 - 5 = 127 = _nNalUnitLength(4字节) + NALU(123字节)=startcode(4字节) + NALU(123字节) = 127。所以一般NALU数据的也包含了NALU的长度。 计算NALU(视频数据被包装成NALU在网上传输)的长度,一个tag可能包含多个nalu(所以可能就有多帧), 所以每个nalu前面有NalUnitLength字节表示每个nalu的长度,来去表示不同的数据长度。这里的switch就描述了,NALU的长度用多少个字节去描述。

大概就是类似这样的图:


这里有个文件是,用户可以根据自己的需要,对该函数进行修改或者扩展,功能大致就是往视频中写入SEI信息等。如果起始码后面的两个字节是0x05或者0x06,那么表示IDR图像或者SEI信息。


继续看看音频的AudioTag, CAudioTag 音频Tag Data区域开始的第一个字节包含了音频数据的参数信息,这里的第一个字节的信息,就仅供参考了,正真的还是要看AACsecuquence里面的参数配置。从第二个字节开始为音频流数据,但第二个字节对于AAC也要判断是AAC sequence header还是AAC raw。可以对照代码看。


第一个字节:SoundFormat 4bit 音频格式 0 = Linear PCM, platform endian
                        1 =ADPCM; 2 = MP3; 3 = Linear PCM, little endian
                        4 = Nellymoser 16-kHz mono ; 5 = Nellymoser 8-kHz mono
                        6 = Nellymoser;  7 = G.711 A-law logarithmic PCM
                        8 = G.711 mu-law logarithmic PCM; 9 = reserved
                        10 = AAC ; 11  Speex 14 = MP3 8-Khz
                        15 = Device-specific sound
              SoundRate 2bit 采样率 0 = 5.5-kHz; 1 = 11-kHz; 2 = 22-kHz; 3 = 44-kHz
                        对于AAC总是3。但实际上AAC是可以支持到48khz以上的频率。
              SoundSize 1bit 采样精度  0 = snd8Bit; 1 = snd16Bit
                        此参数仅适用于未压缩的格式,压缩后的格式都是将其设为1
              SoundType 1bit  0 = sndMono 单声道; 1 = sndStereo 立体声,双声道
                        对于AAC总是1

这里还要根据数据包类型去解析配置信息还是解析音频数据。

在ParseAudioSpecificConfig才会正真拿到解析配置信息,虽然关于媒体脚本包里面也有音频的相关值,比如采样率,通道数,但是最终还是以这里获取处理的值为准。

接下来在ParseRawAAC就是为了解析AAC的真实的数据,这里正如前面文章分析的,如果输入文件是flv或MP4的时候,一样要每帧裸数据前添加adts头,也就是代码注释中制作元数据的地方。最终把裸流和ADTS头一起拼装起来。

注意: memcpy(_pMedia + 7, pTagData + 2, dataSize),这里 pTagData + 2,表示跳过了2个字节,表示分别跳过了AAC header和AAC RAW里的packet type,他们加在一起是2个字节,这里就是跳过了2个字节。

  // 是bits的最高8bit,实际为0  
  p64[0] = (uint8_t)(bits >> 56); 
   // 才是ADTS起始头 0xfff的高8bit
    p64[1] = (uint8_t)(bits >> 48); 
    p64[2] = (uint8_t)(bits >> 40);
    p64[3] = (uint8_t)(bits >> 32);
    p64[4] = (uint8_t)(bits >> 24);
    p64[5] = (uint8_t)(bits >> 16);
    p64[6] = (uint8_t)(bits >> 8);
    p64[7] = (uint8_t)(bits);


再来看看CMetaDataTag,画红色框的部分,这里的m_amf1_type一定是2,否则就视为错误。如果是2,就去解析MetaDataTag。

这里的不同颜色部分,就表示不同的amf包,就表示一个完整的字段。

看看parseMeta具体解析做了什么工作。为什么这里 uint32_t offset = 13,是偏移了13个字节呢?

根据MediaInfo信息,这里Type是1个字节,Value_Size是2个字节,Value是占用了10个字节,一共就是13个字节,所以就需要偏移13个字节,这个值一般也是固定值。



前面已经把相应字段的名字和value值都读取出来了,就是可以去赋值给相应的字段了。

这里pd[offset++] == 0x08就需要判断类型,读4个字节,就偏移4个字节。


通过分析上面的,每个字段都有一个数据长度,然后才是具体字段的值。结合上面代码的注释看,就是结合不同类型,去读取不同的值,然后获取相应的长度,得到相应的偏移值。

为了解析方便,加上这个打印函数,就可以打印出如下值:


截取dump flv数据的一部分。

DumpH264:

这种dump数据,也是非常实用。


本篇解析源码,也花了很长时间整理,如果对你有用,欢迎关注,点赞,转发,收藏。

如果需要源码注释版本,可以关注,私信。

相关推荐

Protel电路设计常用设计编辑器案例2——创建元件

#大有学问#今天介绍一下Protel常用设计编辑器的电气连接工具栏。单击主工具栏上的工具按钮或选择【查看】|【工具栏】|【配线工具栏】菜单命令可以关闭或打开【电气连接(WiringTools)】工具...

Protel调整元器件的位置(1)——移动和对齐元器件

今天介绍调整元器件位置的方法。首先介绍移动和对齐元器件的方法。在绘制电路原理图时,放置完了的电路图可能位置不太合适,需要进行移动。原理图中的所有对象都可以被移动,移动方法相似。对于元器件的移动来说又分...

电路仿真软件详谈(八),proteus电路仿真软件和protel的区别

电路仿真软件是常用工具类型之一,proteus更是电路仿真软件中的佼佼者。但是对于proteus电路仿真软件和protel,二者总是被弄混淆。例如,protel是电路仿真软件吗?proteus电路仿真...

PCB文件转换生产文件Protel 99SE_pcb格式转换

为何要将PCB文件转换为GERBER文件和钻孔数据?因为GERBER文件是一种国际标准的光绘格式文件,它包含RS-274-D和RS-274-X两种格式,其中RS-274-D称为基本GERBER格式,并...

PCB设计项目教程 -PDF_pcb设计作品

PCB设计项目教程》及相关PCB设计教材详细介绍:一、核心教材《PCB设计项目教程》该教材由徐凯、王威担任主编,于2017年由北京理工大学出版社出版。其采用“项目导向、任务驱动”的教学模式,...

最受欢迎的pcb设计软件Protel99se到底怎么样?

Protel99se是一款国内非常实用且流行的设计行业的pcb设计软件,其由pcb原理图设计和多层板电路设计两大功能组成,其最大的特点是好获取,在网上可以随便的找到,且Protel99se软件适用于w...

人人都是网络雇佣兵,一种基于路由器的ddos平台设计思路

本文灵感来自于三个方面优酷路由宝,迅雷宝这种路由器流量兑现方式Anonymous匿名者的ddos方式传统木马ddos方案先说路由宝迅雷宝,这种以用户网络为节点的CDN网络中,会传输大量的流量,我上月优...

接口性能测试工具Locust介绍_接口和性能的测试要点

接口性能测试工具其实挺多的,小型有apache的ab工具,大型的有Jmeter、Locust......这里要介绍的是Locust,相对于Jmeter进行了比较完善的封装,Locust可以就显的更自...

华硕笔记本电脑安装系统实战心得体会

故障:某某的电脑叫人安装系统至一半就蓝屏死机.拿来给我安装,发现光驱无效,不能用光盘安装.电脑启动蓝屏.解决方法:用了半天时间安装也出现类似问题.后来考虑用U盘来装.1.首先制作U盘系统,把U盘资...

dos命令systeminfo图文教程,显示操作系统配置信息msinfo32

大家好,我是老盖,首先感谢观看本文,本篇文章做的有视频,视频讲述的比较详细,也可以看我发布的视频。今天我们学习systeminfo命令,该工具显示本地或远程机器(包括服务包级别)的操作系统配置的信息,...

玩家展示现代硬件上运行的MS-DOS 拥有令人难以置信的向后兼容性

一位YouTuber展示了在现代计算机硬件上直接运行古老的MS-DOS操作系统和经典游戏的能力。这段视频由YouTuberInkbox发布,向观众展示了如何启动古老的、前Windows...

比微PE还干净还强大,带网络:USBOS V3.0超级PE装机工具20221031

期待已久的USBOSV3.0超级PE装机工具20221031又和大家见面了,用过的朋友都知道他的确很强大,对于新旧电脑的支持很好,目前为止还没有电脑不支持的,包括苹果PC。很多朋友还在用诸如大白菜、...

大童保险李晓婧:保险的本位是风险管理应在四方面进行建设

经济观察网记者姜鑫5月17日,大童保险服务宣布升级了风险管理模式,推出DOSM(DemandOriented,SolutionModel)需求导向型解决方案5.0版本。新解决方案从原有“六位...

DOS常用命令及简介_dos常用命令大全及用法

DOS是英文DiskOperatingSystem的缩写,意思是“磁盘操作系统”。我是在95年开始学的电脑,当时学校的机房里,还没有一台WINDOWS操作系统的电脑,当时都是用DOS、UC-DOS...

Windows 忘记开机密码?不用任何工具,1招轻松破解

出现忘记Windows密码的情况,概率有多大?对此,小电只能回答忘记开机密码的情况,说来就来,没有规律,也不会提前告诉你一声~而忘记Windows开机密码的时候,很多朋友都会想起可以使用u盘启动盘来破...

取消回复欢迎 发表评论: