为此,MPEG系统时间识别信息和同步信息等各种有关信息与前面提到的编码器输出基本码流一起,在系统规范中打包,构成已打包单元码流(PacketisedElementaryStreams,PES)。有关系统部分的规范可参考下面要讲的MPEG2标准。
2.MPEG2标准
MPEG制定的MPEG2标准已应用于广阔的领域中,成为重要的统一标准。
1)MPEG2标准的应用范围
MPEG2作为一种统一的标准,广泛地应用于从卫星到家庭的广播服务以及电缆电视、电缆数字音频分配、数字声音广播、数字地面电视广播、电子影院、电子新闻采集(包括卫星新闻采集)、家庭电视剧院、个人通信(电视会议及可视电话)、交互存储媒体(光盘等)、新闻及时事、网络数据库业务(通过ATM等)、遥控视频图像监视等方面。同时,这里要特别提出,数字化高清晰度电视(HDTV)已经进入家庭,而人们所关注的HDTV制式中,电视图像的压缩编码方式采用的就是MPEG2标准。MPEG2标准已经广泛地应用于各种领域及多媒体世界中。
2)MPEG2的技术规范
MPEG2数字图像压缩标准分11种规格。在划分这11种规格时,引用了“型(Profile)”和“级(Level)”的概念。型是对比特(bit)流的定义,而在某种型之下,级是对比特流参数的限制。型与级的组合构成了MPEG2技术规格,但不是所有的组合都有用,MPEG2只规定了其中的11种组合,如表310所示。
由表310可以看到,简单型中没有B帧(即内插帧),这样可以节省内存(RAM)。这种简单型下只有主级。主型中有内插帧,它包括所有4级,其中低级类似于H.261的CIF或MPEG1,主级相当于目前的一般电视,高1440级相当于每行1440像素点的HDTV,高级则对应1920像素点/行的HDTV。在表310中还分别规定了主型B帧下的各级数据率。MainPlus型B帧及Next型B帧就不再说明了,只是应指出,有人将主型B帧又分为SNR分级型(信号噪声比分级)和空间清晰度分级(SpatiallyScalableProfile)。因它们的分级、色度格式、图像类型及传输速率都一样,故在表310中只作为一种型来考虑。3)MPEG2标准的构成
MPEG2标准十分详细,共有三大部分:MPEG2系统部分(ISO/IECIS138181)、MPEG2图像部分(ISO/IECIS138182)和MPEG2声音部分(ISO/IECIS138183)。下面仅对其中某些部分作简要介绍。①利用运动补偿预测编码方法去掉图像中的时间冗余信息。
第一种是去除空间冗余信息的帧内编码,又称为IPictures。图像的帧内编码只能获得中等的压缩比。
第二种是预测编码产生的预测编码图像,简称为PPictures。它是由最近的前一个IPicture或PPicture经运动补偿预测而产生的图像,利用这种预测编码可得到较高的压缩效率。这种用前一帧图像进行预测的方法叫做前向(或正向)预测。同时,PPictures本身又作为基准,用以产生下面的PPictures或BPictures(双向预测图像或内插帧)。第三种是双向预测编码,由这种方法产生的图像称为双向预测编码图像,又叫做BPictures。它是同时利用前面的IPictute或PPictures和后面的IPictute或PPicture作为基准,通过运动补偿预测编码而得到的,这也是其称为双向预测的由来。这种编码可以获得更大的压缩比。
MPEG2规范利用DCT--离散余弦变换进行编码。MPEG2规范也提出用熵编码--可变长度编码对运动向量及DCT变换系数进行编码。上述这些方法在前面MPEG1中已作了说明。
MPEG2标准允许把隔行扫描的一帧看做是一幅图像,也可以把一帧作为一幅图像对其进行编码。MPEG2规定可选的帧速率有多种,如表311所示。
与MPEG1的图像部分类似,经过图像编码可以产生图336所示的压缩数据输出,此数据可接到下面要介绍的系统部分。
②MPEG2的系统部分将一个或多个图像、声音及其他附属数据组合成单一或多个码流,以便进行存储或传送。系统部分包括如下几种功能:
多个压缩码流的同步;
缓冲器的控制;
解码的缓冲预置;
时间识别等。
MPEG2的系统部分定义了节目数据流和传输数据流两种可相互代替的方法。其中,节目数据流是为相对无错码环境设计的,而传输数据流则是为有错码环境设计的。MPEG2所规定的数据包传送框图如图338所示。
由图338可以看到,来自编码部分的输出数据,加到属于系统部分的数据打包器上,经打包产生已打包的基本码流(PacketisedElementaryStreams,PES)。已打包的基本码流,即视频数据包PES与打包的音频数据包PES以及附属数据包一同加到节目流多路调制器和传输流多路调制器上,分别产生MPEG2节目码流数据包和MPEG2传输码流数据包。这样一来,我们就对MPEG2标准下动态图像的处理有了整体的认识。首先,动态图像信号进入视频编码器(见前面MPEG1所述),音频信号进入音频编码器;然后,它们的输出及附属信息(如时基信号,各种同步信号等)一同加到各自的数据打包器上;最后,经多路调制器输出可用于存储的节目码流数据和用于传输的传输码流数据。
为了进一步加深理解,现将视频编码器的另一种框图画出,如图339所示。图中的数据打包与图338中所表示的数据打包相一致,这样就可以将它们联系在一起来看,从中理解信号的流向。
下面就来考虑。存储在媒体上的节目码流数据如何还原为原始图像。
首先,存储在数字存储媒体上的信号经图340所示的节目码流数据解码器还原为视频PES数据包、音频PES数据包及其他有用的附加信号。
由节目码流数据解码器输出的信号,再分别进入下一步进行处理。其中,视频PES数据包再进入视频解码器,通过视频解码器就可以还原图像,获得所要得到的图像。一种由视频PES数据包输入,经视频解码器进行处理,最后获得图像输出的视频解码器框图如图341所示。
从图341可以看到,框图中所做的工作就是前面所提到的MPEG视频编码器中所用到的编码方法的逆过程。
在系统部分,对形成的节目码流数据的构成格式,MPEG2标准(ISO/IECIS138181)有详细的规定。在这里,仅简单表示节目码流的数据结构,如图342所示。
可以看到,图342所示的节目码流是层次结构。这种节目码流可以记录在存储媒体中,例如,硬磁盘、光盘等,但在记录时,还要再一次对节目码流进行加工,以便形成某种文件所规定的格式。在解码时,先利用媒体特殊解码器(见图340)将存储在数字存储媒体上的信号变换为节目码流,而后,再依次进行解码。
同样,MPEG2标准也规定了用于传输的传输码流的数据格式,其简单结构如图343所示。由于传输码流在传输过程中可能会产生错误,故在形成传输码流时就要加上一些标志,并且规定传输码流的一个数据包为定长的188字节。
节目码流数据与传输码流数据在结构上是不一样的,但从产生前的数据流程来看,它们又是关系十分密切的。因此,两者之间可以互相转换,即可以从传输码流转换为节目码流,也可以把节目码流转换成传输码流。
思考与练习题
一、名词解释
数据冗余信息量信息熵统计编码预测编码变换编码JPEGMPEG
二、不定项选择题
1.1992年,运动图像专家组提出MPEG1标准,用于实现全屏幕压缩编码及解码,它。
A.由三个部分组成,包括MPEG音频、MPEG视频、MPEG系统
B.由两个部分组成,包括MPEG音频、MPEG系统
C.由两个部分组成,包括MPEG音频、MPEG视频
D.由三个部分组成,包括MPEG音频、MPEG视频、MPEG动画
2.下列属于JPEG压缩算法的是。
A.基于自动差分脉冲码调制的有失真压缩算法
B.基于自动差分脉冲码调制的无失真压缩算法
C.基于离散余弦DCT的有失真压缩算法
D.基于离散余弦DCT的无失真压缩算法
3.有损压缩的特点是。
A.被损失的信息是冗余信息,即对内容影响极小的细节信息
B.被损失的冗余信息在解压缩过程中是可以恢复的
C.有损压缩相对于无损压缩而言,具有较高的压缩比
D.有损压缩中,被损失的信息是不可恢复的
4.下列说法中,正确的是。
A.冗余压缩法不会减少信息量,可以原样恢复原始数据
B.冗余压缩法减少了冗余,不能原样恢复原始数据
C.冗余压缩法是有损压缩法,具有较高的压缩比
D.冗余压缩法的压缩比一般都比较小
5.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是。
A.空间冗余B.时间冗余C.信息熵冗余D.视觉冗余
6.下列说法中,不正确的是。
A.预测编码是一种只能针对空间冗余进行压缩的方法
B.预测编码是根据某一种模型进行的
C.预测编码需将预测的误差进行存储或传输
D.预测编码中典型的压缩方法有DPCM、ADPCM
7.下列说法中,正确的是。
A.信息量等于数据量与冗余量之和B.信息量等于信息熵与数据量之差
C.信息量等于数据量与冗余量之差D.信息量等于信息熵与冗余量之和
8.在MPEG中为了提高数据压缩比,采用的方法有。
A.运动补偿与运行估计B.减少时域冗余与空间冗余
C.帧内图像数据与帧间图像数据压缩D.向前预测与向后预测
9.在JPEG中使用了两种熵编码方法。
A.统计编码和算术编码B.PCM编码和DPCM编码
C.预测编码和变换编码D.哈夫曼编码和自适应二进制算术编码
10.衡量数据压缩技术性能的重要指标是。
A.压缩比B.算法复杂度C.恢复效果D.标准化
11.下列是图像和视频编码国际标准的是()。
A.JPEGB.MPEGC.ADPCMD.H.261
三、填空题
1.预测编码是针对统计冗余进行压缩的,常运用“”的概念解决动态系统的输出问题。其基本原理是:根据离散信号之间存在着一定的特点,利用前面的一个或多个信号对下一个信号进行,然后对实际值和预测值的差进行编码,由于差值比实际值小得多,从而达到压缩数据量的目的。
2.所谓变换编码,是指先对信号进行,从一种信号空间变换到(如将图像光强矩阵的时域信号变换到频域的系数空间上)进行处理的方法。
3.矢量量化是近年来发展起来的一种新的编码方法。这是一种的编码方案,其主要思想是先将输入的按一定方式分组,再把这些分组数据看成一个,对它进行量化。这区别于直接对一个数据的标量作量化的方法。
4.子带编码中,首先用一组将输入的音频信号分成若干个连续的频段,这些频段称为;而后,再分别对这些子带中的音频分量进行;最后,再将各子带的编码信号组织到一起,进行信道上传送。
5.JPEG的主要思路是对进行压缩编码,将压缩的数据进行。同时,还要考虑对已压缩的图像数据进行,以便重建原始图像。
6.JPEG标准定义了两种基本压缩算法。一是基于离散余弦变换(DCT)的;二是基于空间线性预测技术的算法。
7.从80年代开始,一些国际标准组织协同工作,已建立起三个压缩编码标准架,即联合图片专家组(JointPhotographicExpertsGroup)制定的,动态图像专家组(MovingPictureExpertsGroup)制定的以及国际标准化组织ISO和国际电话电报咨询委员会CCITT制定的标准。
四、简答题
1.简述多媒体数据压缩的必要性。
2.数据冗余指的是什么?常见的数据冗余类型有哪些?
3.有损压缩编码和无损压缩编码的区别是什么?
4.对信源X=\[x1=0.25,x2=0.25,x3=0.2,x4=0.15,x5=0.10,x6=0.05\]进行Huffman编码。
5.简述游程编码的思想和方法。
6.已知信源X=\[x1=1/4,x2=3/4\],若x1=1,x2=0,试对1011进行算术编码。