DV压缩浅析（1）[总提示我字数超多只有分两篇发]

基因 · 发表于 2011-8-17 00:43:59

本帖最后由基因于 2011-8-17 00:49 编辑

众所周知，DVCAM以及DVCPRO都是基于DV的。一个记录格式是由几部分组成的，例如磁带的规格、磁记录的规格、视频信号的处理以及音频信号的处理等。不容否认的是，磁带的设计、磁记录的方式以及数据冗余度的处理都必然会对数据的记录和读取造成一定的影像，但这些并不是影像图像质量的主要因素，真正对视频信号的质量起决定性作用的是压缩。所以，我们不妨把主要精力集中到这里。

首先，我们应该了解到DV是一种分量信号记录格式，所谓分量实际是指Y/R-Y/B-Y三个分量，即亮度与两个色差。而国际电信联盟的数字电视演播室标准ITU-R BT.601建议，对于长宽比为4:3的电视信号，以13.5MHz的频率对分量信号进行PCM编码（限于篇幅关系，601建议中的细节部分从略）。DV正是采用了这种方法，对于525/60和625/50两种系统来说，其中亮度信号都是以13.5MHz进行取样，也就是说每个有效行中都取720个亮度信号样本。但对色差信号的处理方式对两种系统就有些不同了。在525/60系统中，对每个色差信号（Cr/Cb）都以3.375MHz的频率取样，即每行传送360个色差样值，每个分量各半，这就是通常所说的4:1:1取样结构；在625/50系统中，则采用了另一种方式，即对色差信号以6.75MHz的频率取样，但每一行只传送两种色差信号之中的一种（360个样值），两种色差信号每行交替传送，这就是4:2:0取样结构。但在两种系统中，Cr和Cb取样的起点和Y是相同的。

取样后的视频信号以5:1的比例被压缩，从而形成25Mb/s的码流。这种帧内压缩采用了离散余弦变换（Discrete Cosine Transform）和可变长编码（Variable Length Coding）。为了在25Mb/s的码流基础上实现优越的图像质量，DV压缩在编码前还采用了一种打乱顺序的技术，对于任何形式的图像，这种技术都可以最大的效率进行压缩，并保持恒定的图像质量。下图为简化的视频处理框图。

从图中可以看到，视频处理的第一个步骤是Blocking。在DV格式中，取样以后的视频数据是以所谓的宏块（macro block）为基础的。Blocking就是准备这些宏块单元的过程。首先，水平和垂直方向上的空白区域的数据被删除，然后，图像区域被分成8乘8点的块，为稍后进行的DCT做准备。对于625/50系统，一个宏块由四个上下左右相邻的亮度块和两个色度块构成；而对于525/60系统，宏块则是由水平方向相邻的两个亮度块和两个色度块所组成的。换句话说，无论对于哪种系统，宏块的大小都必须满足构成最小的8乘8的色度块，如下图所示。

27个相邻的宏块组成一个所谓的超块（Super Block）。引进超块，是为了平均图像细节以达到更好的压缩效果。在625/50系统中，一帧图像由12条磁迹组成，从一帧图像的顶部开始，每1/12帧的数据用一条磁迹记录在磁带上。超块的大小与这种屏幕到磁迹的数据分配有关系。

以625/50系统为例，每帧在垂直方向上有576个有效行，按照以上原则，一个超块的高度为576÷12=48，因为一个宏块的高度为16，所以每个超块的高度是宏块的3倍。又因为最终要在逻辑上达到5:1的压缩比，所以超块的宽度为整个图像的1/5。还以625/50系统为例，如上所述，一个宏块的宽度为16点，所以整个图像在水平方向上由45个宏块组成，因此一个超块的宽度为宏块的9倍。

在DV格式中，压缩是基于来自五个不同超块的五个宏块进行的，这五个宏块组成了所谓的视频段。首先，选择5个超块，然后来自每个超块内部同一位置的宏块被结合在一起，便形成了视频段，这个过程就是交错（Shuffling）。

交错技术的使用可以大大增强压缩的效率。这是因为在大多数图像中，细节的量并不连续，一些地方信息较多，而另一些地方信息则较少。另一个很重要的问题是，图像的中心不应有过度的压缩，因为重要的内容常出现在这里。如果交错过程不在压缩之前进行的话，要压缩的信息量就会因图像区域（或宏块）而异.因为压缩是以固定码率进行的，所以压缩后的图像的不同区域（宏块）看起来会不同。通过采用交错技术，每帧图像的信息都被平均了，并在图像内部保持一致。

在blocking和shuffling两个过程之后，每个8乘8的块都被送入到DCT编码器。DCT编码器将8乘8的基带块从时间域变换到频率域。这种变换的结果得到了8乘8的DCT块，其中的系数代表了块内不同频率分量的能量。在一个DCT块内，左上角的一个系数称为直流（DC）系数，其他的都称为交流（AC）系数。距离直流系数越远的系数代表的频率越高。在DC系数右边的系数比其左边的系数代表的水平频率要高；同样，在DC系数下边的系数比其上边的系数代表的垂直频率要高，在对角线方向上，距离右下角越近的系数，它所代表的水平和垂直频率也越高。

除了极其复杂的图像，大多数视频图像都的主要内容都在低频区，而高频区所含的内容极少。也就是说，在DCT块内，距离直流系数较近的系数比右下角的系数的值要大。由于使用了帧内压缩，DV格式在处理帧内的图像运动时有两种方式，8-8和2-4-8方式。当****到帧内无运动或奇数场与偶数场的变化很小时，就选用8-8模式，反之则选用2-4-8方式。这种模式的选择是很重要的，无论图像是运动的还是静止的，这样做都可以保持良好的图像质量。

天空一朵云 · 发表于 2011-11-18 20:00:11

太专业了，先收藏，慢慢体会。

帐号		自动登录	找回密码
密码			注册

DV压缩浅析（1）[总提示我字数超多 只有分两篇发]

DV压缩浅析（1）[总提示我字数超多只有分两篇发]