📄 视频编码新标准h.264的技术亮点.txt

📁 关于h.264的一些论文
💻 TXT
📖 第 1 页 / 共 2 页
字号:
上一页 12
没有“反变换误差”。 变换的单位是4×4块，而不是以往常用的8×8块。由于用于
变换块的尺寸缩小，运动物体的划分更精确，这样，不但变换计算量比较小，而且
在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式对图像中较
大面积的平滑区域不产生块之间的灰度差异，可对帧内宏块亮度数据的16个4×4块
的DC系数（每个小块一个，共16个）进行第二次4×4块的变换，对色度数据的4个4
×4块的DC系数（每个小块一个，共4个）进行2×2块的变换。

　　H.264为了提高码率控制的能力，量化步长的变化的幅度控制在12.5%左右，而
不是以不变的增幅变化。变换系数幅度的归一化被放在反量化过程中处理以减少计
算的复杂性。为了强调彩色的逼真性，对色度系数采用了较小量化步长。

　　统一的VLC

　　H.264中熵编码有两种方法，一种是对所有的待编码的符号采用统一的VLC（UV
LC ：Universal VLC），另一种是采用内容自适应的二进制算术编码（CABAC：Con
text-Adaptive Binary Arithmetic Coding）。CABAC是可选项，其编码性能比UVL
C稍好，但计算复杂度也高。UVLC使用一个长度无限的码字集，设计结构非常有规则
，用相同的码表可以对不同的对象进行编码。这种方法很容易产生一个码字，而解
码器也很容易地识别码字的前缀，UVLC在发生比特错误时能快速获得重同步。

　　这里，x0，x1，x2，…是INFO比特，并且为0或1。图4列出了前9种码字。如：
第4号码字包含INFO01，这一码字的设计是为快速再同步而经过优化的，以防止误码
。

　　帧内预测

　　在先前的H.26x系列和MPEG-x系列标准中，都是采用的帧间预测的方式。在H.2
64中，当编码Intra图像时可用帧内预测。对于每个4×4块（除了边缘块特别处置以
外），每个像素都可用17个最接近的先前已编码的像素的不同加权和（有的权值可
为0）来预测，即此像素所在块的左上角的17个像素。显然，这种帧内预测不是在时
间上，而是在空间域上进行的预测编码算法，可以除去相邻块之间的空间冗余度，
取得更为有效的压缩。

　　4×4方块中a、b、...、p为16 个待预测的像素点，而A、B、...、P是已编码的
像素。如m点的值可以由（J＋2K＋L＋2）/ 4 式来预测，也可以由（A+B+C+D+I+J+
K+L）/ 8 式来预测，等等。按照所选取的预测参考的点不同，亮度共有9类不同的
模式，但色度的帧内预测只有1类模式。　　面向IP和无线环境

　　H.264 草案中包含了用于差错消除的工具，便于压缩视频在误码、丢包多发环
境中传输，如移动信道或IP信道中传输的健壮性。

　　为了抵御传输差错，H.264视频流中的时间同步可以通过采用帧内图像刷新来完
成，空间同步由条结构编码（slice structured coding）来支持。同时为了便于误
码以后的再同步，在一幅图像的视频数据中还提供了一定的重同步点。另外，帧内
宏块刷新和多参考宏块允许编码器在决定宏块模式的时候不仅可以考虑编码效率，
还可以考虑传输信道的特性。

　　除了利用量化步长的改变来适应信道码率外，在H.264中，还常利用数据分割的
方法来应对信道码率的变化。从总体上说，数据分割的概念就是在编码器中生成具
有不同优先级的视频数据以支持网络中的服务质量QoS。例如采用基于语法的数据分
割（syntax-based data partitioning）方法，将每帧数据的按其重要性分为几部
分，这样允许在缓冲区溢出时丢弃不太重要的信息。还可以采用类似的时间数据分
割（temporal data partitioning）方法，通过在P帧和B帧中使用多个参考帧来完
成。

　　在无线通信的应用中，我们可以通过改变每一帧的量化精度或空间/时间分辨率
来支持无线信道的大比特率变化。可是，在多播的情况下，要求编码器对变化的各
种比特率进行响应是不可能的。因此，不同于MPEG-4中采用的精细分级编码FGS（F
ine Granular Scalability）的方法（效率比较低），H.264采用流切换的SP帧来代
替分级编码。

　　三、TML-8性能

　　TML-8为H.264的测试模式，用它来对H.264的视频编码效率进行比较和测试。测
试结果所提供的PSNR已清楚地表明，相对于MPEG-4（ASP：Advanced Simple Profi
le）和H.263++（HLP：High Latency Profile）的性能，H.264的结果具有明显的优
越性，如图5所示。

　　H.264的PSNR比MPEG-4（ASP）和H.263++（HLP）明显要好，在6种速率的对比测
试中，H.264的PSNR比MPEG-4（ASP）平均要高2dB，比H.263（HLP）平均要高3dB。
6个测试速率及其相关的条件分别为：32 kbit/s速率、10f/s帧率和QCIF格式；64 
kbit/s速率、15f/s帧率和QCIF格式；128kbit/s速率、15f/s帧率和CIF格式；256k
bit/s速率、15f/s帧率和QCIF格式；512 kbit/s速率、30f/s帧率和CIF格式；1024
 kbit/s速率、30f/s帧率和CIF格式。

　　四、实现难度

　　对每个考虑实际应用的工程师而言，在关注H.264的优越性能的同时必然会衡量
其实现难度。从总体上说，H.264性能的改进是以增加复杂性为代价而获得的。但是
，随着技术的发展，这种复杂性的增加是在我们当前或不久的将来的技术可接受的
范围之内的。实际上，考虑到复杂性的限制，H.264对一些计算量特别大的改进算法
未予采用，如H.264未采用全局运动补技术，这在MPEG-4的ASP中是采用的，并增加
了相当的编码复杂性。

　　H.264和MPEG-4两者都包括了B帧和比MPEG-2、H.263或MPEG-4的SP（Simple pr
ofile）更为精确、更为复杂的运动内插滤波。为了更好地完成运动估计，H.264显
著地增加了可变块尺寸的种类和可变参考帧的数目。

　　H.264的RAM需求主要用于参考帧图像，大多数编码视频使用3～5帧参考图像。
它对ROM的需求并不比通常的视频编码器更多，因为H.264的UVLC对所有的各类数据
采用了一个结构良好的查找表。

　　五、结束语

　　H.264具有广阔的应用前景，例如实时视频通信、因特网视频传输、视频流媒体
服务、异构网上的多点通信、压缩视频存储、视频数据库等。

　　H.264建议的技术特点可以归纳为三个方面，一是注重实用，采用成熟的技术，
追求更高的编码效率，简洁的表现形式；二是注重对移动和IP网络的适应，采用分
层技术，从形式上将编码和信道隔离开来，实质上是在源编码器算法中更多地考虑
到信道的特点；三是在混合编码器的基本框架下，对其主要关键部件都做了重大改
进，如多模式运动估计、帧内预测、多帧预测、统一VLC、4×4二维整数变换等。

　　迄今为止，H.264尚未最后定稿，但因其更高的压缩比，更好的信道适应性，必
将在数字视频的通信或存储领域得到越来越广泛的应用，其发展潜力不可限量。

　　最后，必须说明的是，H.264优越性能的获得不是没有代价的，其代价是计算复
杂度的大大增加，据估计，编码的计算复杂度大约相当于H.263的3倍，解码复杂度
大约相当于H.263的2倍。
上一页 12
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -