网站建设西安,网店平台网站建设需求,餐饮品牌设计服务,宝山网站制作1.视频比特率 视频的比特率是指传输过程中单位时间传输的数据量。可以理解为视频的编码采样率。单位是kbps#xff0c;即每秒千比特。视频比特率是决定视频清晰度的一个重要指标。比特率越高#xff0c;视频越清晰#xff0c;但数据量也会越大。比如一部100分钟的电影#…1.视频比特率 视频的比特率是指传输过程中单位时间传输的数据量。可以理解为视频的编码采样率。单位是kbps即每秒千比特。视频比特率是决定视频清晰度的一个重要指标。比特率越高视频越清晰但数据量也会越大。比如一部100分钟的电影如果比特率是700kbps那么它的文件大小就是410MB。(100分钟6000秒然后将6000秒乘以700kb/s的比特率得到的数据量为4200000kb换算后约为410MB当然视频分辨率越高要求的比特率就越高。因此如果想提高视频的清晰度需要在相同的分辨率下提高比特率。 采样比特率有两种方式一种是固定比特率cbr即每秒采样的数据量是固定的还有可变比特率vrb根据每帧视频的复杂程度改变采样。如果视频中有很多快速移动的图片会提高比特率以获得更多的这部分图片的采样数据这样图片会变得更清晰。当图片信息较少时比特率会适当降低。所以这个编码效率比较高同时兼顾了视频清晰度和文件大小。是目前主流的比特率采样方式。
例一段1080P的视频长度为100分钟大小为1GB那么该视频的比特率是多少 100min 100*60s 6000s; 1G 1024M 1024*1024KB 1024*1024*1024Bit 1024*1024*1024*8bit 8589934592bit;比特率 8589934592/6000s 1431655b/s 1.4Mbit/s; 这个视频的码率大概为1.4Mbit/s, 一般主流视频平台的最高码率在1Mbit左右比如直播网站斗鱼的高清选项实际播放的视频码率是900Kbit/s(0.9Mbit)。对于时间长度相同的视频码率越大视频的大小越大视频的画质就越清晰(不考虑各种压缩算法的优劣)这是最直观的感觉。码率对于视频是非常重要的。 2.分辨率 视频分辨率是横坐标上像素数乘以纵坐标上的像素数可以简单理解为视频的大小。那么为什么分辨率可以决定视频的文件大小和清晰度呢视频尺寸越大(这里指的是拍摄和录制的视频分辨率)它在画面中需要填充的像素就越多所以数据量越大输出的文件就越大清晰度就越高。 视频分辨率是指视频成像产品所成图像的大小或尺寸它的表达式为“水平像素数垂直像素数”。常见的图像分辨率有QCIF176×144CIF352×288D1704×576720P1280×720, 1080P19201080。摄像机成像的最大分辨率是由CCD或CMOS感光器件决定的。现在有些摄像机支持修改分辨率是通过摄像机自带软件裁剪原始图像生成的。
3.帧率 帧率也是影响视频清晰度和大小的因素之一。它是视频中包含的帧数帧率越高视频越清晰(帧率达到一定值时影响越小)。当然相应的数据量也会更大。帧率、比特率和分辨率是相互关联的。在帧率和分辨率相同的情况下比特率越大视频越清晰文件越大。在分辨率和比特率不变的情况下帧率越高视频会越清晰但是在帧率和比特率相同的情况下分辨率越高视频会越不清晰。这是因为当视频尺寸变大时如果对应的编码样本保持不变只相当于放大了视频。
4.DTS和PTS DTS(Decoding Time Stamp) : 即解码时间戳是解码器进行解码时相对于SCR(系统参考时间)的时间戳。它主要标识读入内存的bit流在什么时候开始送入解码器中进行解码。 PTS(Presentation Time Stamp) : 即显示时间戳是显示帧时相对于SCR的时间戳。它主要是度量解码后的视频什么时候被显示出来。 DTS主要用于视频的解码在解码阶段使用。PTS主要用于视频的同步和输出在 display 的时候使用。在没有B帧的情况下DTS和PTS的输出顺序是一样的。
5.音视频同步 在媒体流中除了视频以外通常还包括音频。音频的播放也有 DTS、PTS 的概念但是音频没有类似视频中 B 帧不需要双向预测所以音频帧的 DTS、PTS 顺序是一致的。 音频视频混合在一起播放就呈现了通常看到的广义的视频。在音视频一起播放的时候需要面临怎么去同步它们以免出现画不对声的情况。 要实现音视频同步通常需要选择一个参考时钟参考时钟上的时间是线性递增的编码音视频流时依据参考时钟上的时间给每帧数据打上时间戳。在播放时读取数据帧上的时间戳同时参考当前参考时钟上的时间来安排播放。时间戳就是PTS。可以选择同步视频到音频、同步音频到视频、同步音频和视频到外部时钟。
6.视频格式和编码格式 视频格式是一个容器常见的格式包括百AVI、MPG、WMV、MKV、TS、TP、RMVB、MOV、MP4、3GP、等等。是视频文件的存在形式也可以来说是封装压缩视频和音频文件的容器。 编码格式是向这个容器放度入东西的问方法、视频文件压缩过程中的运算方法例如可以横放、竖放、侧放等等。常答见的编码包括H.261、H.263、H.264、MPEG4、MPEG2、mpeg1、xvid、divx、VC-1、wmv1(9、realvideo8)10等等。 H264编码原理以及I帧B帧P帧
H264编码原理 H264是新一代的编码标准以高压缩高质量和支持多种网络的流媒体传输著称在编码方面参照一段时间内图像的统计结果表明在相邻几幅图像画面中一般有差别的像素只有10%以内的点,亮度差值变化不超过2%而色度差值的变化只有1%以内。对于一段变化不大图像画面可以先编码出一个完整的图像帧A随后的B帧就不编码全部图像只写入与A帧的差别这样B帧的大小就只有完整帧的1/10或更小B帧之后的C帧如果变化不大可以继续以参考B的方式编码C帧这样循环下去。这段图像称为一个序列序列就是有相同特点的一段数据当某个图像与之前的图像变化很大无法参考前面的帧来生成就结束上一个序列开始下一段序列也就是对这个图像生成一个完整帧A1随后的图像就参考A1生成只写入与A1的差别内容。 在H264协议里定义了三种帧完整编码的帧叫I帧参考之前的I帧生成的只包含差异部分编码的帧叫P帧还有一种参考前后的帧编码的帧叫B帧。H264采用的核心算法是帧内压缩和帧间压缩帧内压缩是生成I帧的算法帧间压缩是生成B帧和P帧的算法。
对序列的说明 在H264中图像以序列为单位进行组织一个序列是一段图像编码后的数据流以I帧开始到下一个I帧结束。一个序列的第一个图像叫做 IDR 图像立即刷新图像IDR 图像都是 I 帧图像。H.264 引入 IDR 图像是为了解码的重同步当解码器解码到 IDR 图像时立即将参考帧队列清空将已解码的数据全部输出或抛弃重新查找参数集开始一个新的序列。这样如果前一个序列出现重大错误在这可获得重新同步机会。IDR图像之后的图像永远不会使用IDR之前图像的数据来解码。 一个序列就是一段内容差异不太大的图像编码后生成的一串数据流。当运动变化比较少时一个序列可以很长因为运动变化少就代表图像画面的内容变动很小所以就可以编一个I帧然后一直P帧、B帧了。当运动变化多时可能一个序列就比较短了比如就包含一个I帧和3、4个P帧。
对三种帧的介绍 帧内编码帧I帧 I帧表示关键帧你可以理解为这一帧画面的完整保留解码时只需要本帧数据就可以完成。I 帧通常是每个GOPMPEG 所使用的一种视频压缩技术的第一个帧经过适度地压缩做为随机访问的参考点可以当成图象。I帧可以看成是一个图像经过压缩后的产物。
它是一个全帧压缩编码帧。它将全帧图像信息进行JPEG压缩编码及传输
解码时仅用I帧的数据就可重构完整图像
I帧描述了图像背景和运动主体的详情不需要参考其他画面而生成
I帧是P帧和B帧的参考帧(其质量直接影响到同组中以后各帧的质量)
I帧是帧组GOP的基础帧(第一帧),在一组中只有一个I帧
I帧不需要考虑运动矢量所占数据的信息量比较大 前向预测编码帧P帧。P帧表示的是这一帧跟之前的一个关键帧或P帧的差别解码时需要用之前缓存的画面叠加上本帧定义的差别生成最终画面。通过充分将低于图像序列中前面已编码帧的时间冗余信息来压缩传输数据量的编码图像也叫预测帧。
P帧是I帧后面相隔1~2帧的编码帧
P帧采用运动补偿的方法传送它与前面的I或P帧的差值及运动矢量(预测误差)
解码时必须将I帧中的预测值与预测误差求和后才能重构完整的P帧图像
P帧属于前向预测的帧间编码。它只参考前面最靠近它的I帧或P帧
P帧可以是其后面P帧的参考帧,也可以是其前后的B帧的参考帧
由于P帧是参考帧,它可能造成解码错误的扩散差值传送,P帧的压缩比较高 双向预测内插编码帧B帧既考虑与源图像序列前面已编码帧也顾及源图像序列后面已编码帧之间的时间冗余信息来压缩传输数据量的编码图像也叫双向预测帧
B帧是由前面的I或P帧和后面的P帧来进行预测的
B帧传送的是它与前面的I或P帧和后面的P帧之间的预测误差及运动矢量
B帧是双向预测编码帧压缩比最高,只反映丙参考帧间运动主体的变化情况,预测比较准确
B帧不是参考帧,不会造成解码错误的扩散 I、B、P各帧是根据压缩算法的需要是人为定义的,它们都是实实在在的物理帧。一般来说I帧的压缩率是7跟JPG差不多P帧是20B帧可以达到50。可见使用B帧能节省大量空间节省出来的空间可以用来保存多一些I帧这样在相同码率下可以提供更好的画质。
H264的压缩方法
分组:把几帧图像分为一组(GOP也就是一个序列),为防止运动变化,帧数不宜取多。定义帧:将每组内各帧图像定义为三种类型,即I帧、B帧和P帧;预测帧:以I帧做为基础帧,以I帧预测P帧,再由I帧和P帧预测B帧;数据传输:最后将I帧数据与预测的差值信息进行存储和传输。 7.视频质量评价指标
客观评价Objective 客观评价是以标准的数学公式计算原视频与解码出的视频之间的差异当今被广泛使用的评判标准是PSNR其全称为Peak Signal to Noise Ratio原理是利用原视频与有损压缩后产生的损失之间的比例来判断的。公式为 其中MAX为视频使用的信号的最大值如视频是8比特的话那MAX就为255。单位是分贝(db)MSE为均方误差Mean Squared Error即原始图像与解码后的重建图像之间的误差误差越小则表示还原后的质量越好那PSNR就越大。PSNR的计算仅仅适用于有损压缩对于无损压缩因为MSE值将为0则除式的值将为无穷大所以对于无损压缩PSNR是不适用的。
主观评价Subjective MOS测试Mean Opinion Score Test组织一定数量的人尽可能地组织不同类型的人尽量给实验制造随机性多样性使实验更具有一般性可信性。 进行客观性评价的时候测试对象坐于显示器前每位测试对象可以坐得有远近方向角度有不同尽量模仿实际生活中的人群操作者在前方显示器上播放影像当然播放也是有规矩的。 按时间顺序一共分为两个阶段一个是左边的前期测试阶段没有任何标注另一个是右边的投票阶段标注有vote其中T1T3时间段均是播放影像的时间T2T4均是休息的时候显示器上显示灰色。 在测试中一共有两种影像一个是原始影像没有失真的一个是测试影像带有失真的上图中第一个T1和第二个T1播放同一种影像第一个T3和第二个T3播放同一种影像到底是原始影像还是测试影像随机测试者无法提前得知。等过完前面的前期测试阶段后在Vote阶段被测试者们就需要对影像进行打分了即Vote打分的图一般采用DSCQS方式评分图。 上面就是DSCQS打分图2728293031是视频编号这里可以对五组原图测试视频进行打分针对每一对当进行到Vote阶段的时候Vote阶段第一个T1过完在A栏打分Vote阶段T3过完给B栏打分。 打分栏分为五个级别即Excellent非常好Good好Fair一般般Poor差Bad很差五个级别打分的时候在每个级别对应的区域划线或者打勾即可。实验完成后后由测试者收集进行统计作为主观评判结果。 当然主观性测试也是有它的缺点的一来是要组织这么一群人人工费少不了二来组织人来进行测试不能做到实时进行只是用已经编码好的影像进行播放来进行测试。