#12002/4/2 16:41:16
鉴于某些朋友在视频压缩格式方面存在着一些误区,我贴一个小文章出来,希望能够帮助一些朋友解决这个问题。请注意文章中的Mb和MB 的区别。1MB==8Mb。
一、 前言
模拟视频的分配是很简单的,信号电平定义明确而为大家所理解。视频工程师用波形监视器对模拟信号的属性如振幅、信噪比和频响等进行监测。当N TSC和PAL彩色电视制式被开发出来以后,附加以彩色副载波对微分相位和微分增益的特殊要求后,新的视频标准便可以通过与先前的黑白电视标准相同的界面发布。这种早期的视频压缩格式后来在模拟和数字域都让位于分量存储和分配。
模拟视频接口在分配中会出现信号劣化。数字分配的最初好处是信号可以没有丝毫损伤地传送。尽管迄今人们仍在广泛使用复合模拟视频,但I TU-R BT.601串行数字接口(SDI)已经成为公用的分配手段。现在有许多种数字录制和压缩格式可供选择,它们使得新形式的视频信号分配可以无损地传输。压缩视频信号能够通过同步S DTI和Firewire接口转换成原来的编码形式,或者在网络上异步转换成媒体文件。将这些信号转换成通过SDI分配的基带需要额外的压缩循环,而由此导致的信号劣化在数字分配中应予以避免。
二、选择——一切都是压缩的
所有录制格式都有某种水平的压缩。你也可以争论说:D1和D5是不压缩的磁带格式,但视频被按取样值8b或10b量化,色差信号被用于减小色度内容的带宽, 带有相当于2/3原始规格的4:2:2亚取样分量。按照601建议书,通过SDI传送的信号,在传输过程中不会有进一步的信号质量损失。的确,压缩通常被用于视频,这是一件好事。应该接受并利用它,小心地进行分配。
1. 压缩标准
视频工业中有三种主要的压缩技术,即M-JPEG、DV和MPEG,它们都基于DCT。图像被转换成归一、量化和可变长度编码的频域系数。D V和典型的M-JPEG是帧内编码。对于给定的图像质量,利用MPEG-2压缩能实现更高的压缩比;这主要是借助运动估计和补偿,对相继帧之间的冗余进行时间压缩而实现。M PEG-2用于编辑时,一般仅限于I帧编码,能够在不了解前一帧和后一帧的情况下,在边缘进行帧切换。DV和MPEG-2压缩使用运动自适应处理实现有效的帧内编码。
M-JPEG由于其廉价的集成芯片解决方案可供利用而最早被用于硬盘录像机或服务器。M-JPEG由单个图像的JPEG文件规范演变而来,没有连续的帧序列和已定义的结构来保证比特流的互操作性。因为硬盘录像机制造商采用了不同的实施方案,可以认为M -JPEG是一种专用压缩格式。
2. 全都转向磁带
在制作链路中VTR到处可见,甚至直播制作也是先录制在磁带上,再提交给后期制作整理和再加工。压缩磁带的录制格式要求每帧有一固定的码量,以允许可预测的帧精度编辑。如果能免除录制到磁带上的要求,一种专用压缩格式才有可能被接受。如果想维持与大部分V TR制造商所采用的压缩格式兼容,就要采纳他们的标准。
3. 标准清晰度压缩磁带格式
第一种通用的成功的数字压缩格式是数字Betacam。图像质量是那么好以致很多人认为它是一种不压缩的格式。Sony并没有打算对存储在磁带上的压缩数据提供访问手段,而只是为数字B eta VTR提供了与SDI的连接性。这意味着数字Betacam是一种专用格式,若没有附加的压缩循环,便不能在制作链路的设备之间进行转换。
DV压缩最早是由标准和高清晰度家用VCR制造商的一个联盟研发的。松下在其DVCPRO系列专业VTR中采用了DV压缩,并将这种压缩从标准的2 5Mb/s比特率扩展到DVCPRO50中的50Mb/s。Sony则提供基于DV压缩的DVCAM系列VTR。在压缩格式和接口方面,这两家制造商都采用了不同于原先家用磁带格式的轨宽和他们自己的转速。S ony在525行系统中采用标准的25Mb/s比特率、4:1:1亚取样结构;在625系统中采用4:2:0的取样,而松下在625行系统中采用4:1:1亚取样。松下的D VCPRO50以较小的压缩比和两倍数据率,采用4:2:2取样结构。JVC D9的1/2"格式也采用DVCPRO50的压缩格式。这些VTR制造商都提供用于交换的压缩视频接口,这些都已标准化,且对其它制造商是开放的。
Sony 的Betacam SX 在数据率为18Mb/s的2帧GOP IB的短结构中采用MPEG-2压缩。Sony现在将其1/2"标准扩展到MPEG IMX格式,使用I帧,额定情况下,仅以50Mb/s、4:2:2取样结构录制。
4. 高清晰度压缩磁带格式
松下首先采用D5磁带格式推出了一种经济的高清晰度压缩格式。HDP500是一种外部处理器,将基于场的DCT压缩用于1080i的高清信号,实现经3 60Mb/s的SMPTE 267M-18接口的数据传输。D5录像机在360Mb/s输入的有效行区域存储数据而不是视频。后来,松下将这种压缩技术扩展到720p高清格式,后继产品直接将这种压缩技术集成到V TR平台,以彻底消除对外部编解码器的需求。这些集成VTR再也不需要提供对360Mb/s压缩数据接口的访问手段。
Sony 的HDCAM格式采用一种基于帧结构DCT,并带有图像预滤波的压缩方案,以提高编码效率。HDW-500 VTR能够访问标准SMPTE 305M 270Mb/s的SDTI接口上的压缩数据流。
松下现已将其DV压缩技术扩展到100Mb/s DVCPRO HD,用于高清晰度录制。压缩数据接口采用DIF打包结构,以离散的块来分配压缩视频、音频和辅助数据。DIF流结构经过很好的定义,并同所有D VCPRO产品兼容。
5. 混合压缩格式的级联误差
由数字压缩导致的图像损伤大多发生在最初的编码循环。当前从VTR制造商们可得到的DV和MPEG I帧压缩格式都经过了优化,以便将压缩人为缺陷减至最少,并且经过多代相同格式的编码后,图像质量仍维持在可接受水平。典型的情况是经过不超过7 代相同压缩格式的编解码循环,图像质量仍然是可接受的。很多情况下,对于基带压缩转换的循环而言,不需要多少代,就会发展到图像质量恶化到可觉察的程度。采用M PEG、DV、M-JPEG压缩格式等进行混和编码时,由于编码的人为缺陷,将加速图像质量恶化。
6. DCT块的空间对准
影响经多次压缩的图像质量的因素有好几个,最显著之一就是在两个压缩循环之间,DCT块边缘的空间漂移。这将导致后继的DCT转换在不同的象素值阵列下进行。如果运用一个模拟分量接口来作格式转换,就不可避免地会在新的模拟同步位置和最初的取样结构之间引入计时误差。模拟转换在信号中引入噪声。模拟复合转换会导致彩色副载波解码人为缺陷,今后不应再采用。
如果转换接口是SDI数字分量空间DCT阵列,采用混合压缩格式或进行外部信号处理时就会发生漂移。特技处理引入象素相移,而且常常数字图像会从外部相移,以便对准视频和色键分量。向基于M -JPEG的专用系统转换,总是会导致DCT块漂移。
7. MPEG GOP漂移
在长GOP MPEG压缩情况下,如果GOP结构在相邻两次编码间隔内变化,质量损伤就会被放大。先前编码的预估B和P帧在下一代复制时可能会变成固定I 帧。可以将辅助数据插入SDI接口中,以存储运动矢量和来自编码循环的GOP结构信息;但是在一个MPEG-2压缩系统中改变比特率,常常会影响G OP结构的保存。
8. 色差亚取样结构
通过一个标准的SDI 4:2:2数字分量接口,在不同的压缩格式平台之间传送信号,所得到的结果可能是不同的。色差亚取样结构随压缩格式的不同而不同。MPE G-2 4:2:2型、DVCPRO50和M-JPEG都采用4:2:2取样结构,而其色差信号被滤波到亮度取样带宽的一半。DVCPRO 25Mb/s压缩采用4:1:1取样,不同于DVCAM 625行DV所采用的4:2:0。MPEG-2主型也采用4:2:0。
在4:1:1和4:2:2取样格式间混合,将会得到可接受的4:1:1质量,所需之水平滤波是由精确的数字滤波器实现的,它在作内插或整理色度取样结构时,只引入极少量的频响不规则现象。在4 :1:1和4:2:0取样格式间混合时,得不到最小公分母的质量。4:2:0彩色是垂直亚取样的,不具备易于实现多点平坦响应数字滤波器的优点。其后在不同格式之间的传送进一步引入了垂直频响失常,导致低于4 :1:0质量。
从4:1:1到4:2:0的变换被保存下来,应仅用于最后传送给一个长GOP MPEG-2格式,以供传输之用。在此类情况下,一般而言比特率是足够低的,在色差带宽方面因转换系数量化需作让步。
三、 SDTI技术回顾——非磁带化之路
数字VTR是同步设备,可以传送固定码率的、由序列数据组成的比特流。串行数据传输接口或SDTI是由VTR制造商开发的、作为在机器与机器之间,无需解压缩/ 压缩循环的一种压缩数据传送方式。其I/O端口有时被简称为“Dub In/Out”。SDTI还允许以高达4倍于实时的速率来传输。SDTI使用由SMPTE 259M和ITU-R BT.656定义的标准SDI接口。早期的SDTI为VTR制造商们所专用,但是现在已经按SMPTE 305M标准化。
SMPTE 305M SDTI标准定义了在SDI传输接口的有效画面或载荷区的视频、音频和其它数据的载送格式。载荷数据可以采用ECC和CRC。为每一有效载荷行插入一个S DTI包头,作为水平辅助数据包,以包涵行数、源地址和目标地址,并作为固定或可变规格块的有效载荷指示器。
压缩视频数据的SDTI传送,是采用了现有的同轴电缆和数字视频机构的SDI路由设施,很易为视频工程师所理解。其连接方式是码率可预测的同步传送。由于可以按4 倍速复制来自一台VTR的素材,因此允许在摄录一体机采集和编辑平台之间实现快速、不失真的传送。
1. DV压缩的SDTI格式
有两类SDTI用于DV压缩媒体输送。由SMPTE 321M定义的DVCPRO采用标准DIF数据结构。由SMPTE 322M定义的DVCAM则将独立的视频、音频和子码数据类型结合在一起。
2. DVCPRO SDTI
DVCPRO SDTI 标准采用了170个字的固定字长数据块,对每行的16个80B DIF数据块进行打包。DIF序列以SMPTE 314和IEC61834所定义的相同接续数据结构来传输,因而使得这些数据能够很容易在接收时被解析,从而重新生成完整的DIF结构。
270Mb/s 接口允许1、2或4个信道单元以1帧单位发送。每一个信道单元代表1帧视频所对应的一个完整的DIF结构。DVCPRO50传输能够容纳2和4个信道单元,以1 倍或2倍速输送。100Mb/s的DVCPRO HD数据流需要全部4个信道单元以1倍速传输。
3. DVCAM SDTI
Sony 的DVCAM SDTI接口以一个完全不同的序列将DIF数据结构格式化,并能够容纳多达5帧的压缩数据(目前的设备允许25Mb/s DV数据流的4倍速输送)。SDI有效载荷数据采用由SMPTE 305定义的可变块规格格式;而每一DV帧的数据在长达280B的“狭槽”中分配。在每一有效载荷行上,280B的数据被分配给“狭槽1”、 280B 的数据被分配给 “狭槽2”,等等。这些以这种模式对数据进行复用,因而每一帧的一小段都可以到达每一行。但这也意味着,只有等到整个SDTI帧到达后,才可能得到用于第一个压缩帧的全部D V数据。
DV数据是分组的,以便每一个子组的数据的一半发送到每一场的相继行。编码视频数据首先被分组,紧接着是子码和VAUX数据,再接下去是音频块。每一压缩帧数据的分配都要越过每一有效载荷行上的“狭槽”。 由于DIF序列中的块排序得不到维持,这使得很难为重新排序成标准的DIF数据结构,而在接收期间解析序列。
4. SDTI内容包(SDTI-CP)
SMPTE 326M 标准为SDTI上的内容打包(CP)传输规范了格式。一个内容包最多有4个项目,即系统、图像、音频和辅助项。这些项目采用可变字长块SDT I有效载荷数据结构加以格式化。
SDTI-CP采用由SMPTE 331M定义的元素和元数据格式。音频项目支持8个信道的音频数据,各个取样从每个信道复用而得。
SDTI-CP有一种双计时模式,允许数据在第2场中传输。SDTI-CP用在Sony的MPEG IMX VTR上,传送MPEG I帧压缩数据。这种接口很容易在压缩帧边缘切换以便于剪辑。尽管SDTI-CP的主要动机是传送MPEG-2媒体,但此结构也可用于其它比特流打包。
5. 高清晰度SDTI格式
松下的HD-D5 1080i和720p格式采用通用接口,在SMPTE 267M-18 360Mb/s接口的有效画面或载荷区发送压缩视频数据。这种格式是在SMPTE RP209中提出的,不符合SMPTE 305M SDTI标准。水平辅助空间供SMPTE 272嵌入音频和辅助时间码(ATC)用,但不含有SDTI数据包头。
DVCPRO HD压缩运行于100Mb/s,并以4个完整的DIF数据结构进行分配。SMPTE 321M SDTI标准用于1倍速时的分配。
6. HDCAM SDTI
Sony的HDCAM VTR采用一种兼容SDTI接口的SMPTE 305M来传输HDCAM压缩数据。视频数据在有效载荷区传送,与SMPTE 272兼容的24b音频嵌入水平区域。附加的水平辅助数据包用于时码和格式信号。
Sony最近开发出HDCAM压缩系列以包容24P和25P格式。SDTI接口可以扩展到有效载荷区的音频和辅助数据。
四、络文件输送
就像标准SDTI接口在发送着多种格式压缩数据一样,在平台之间,或是在标准的本地网和广域网之间,为传送压缩和非压缩媒体文件,有更多的文件格式可供利用。S DTI传输利用了现有机构的现成同轴电缆分配基础设施。运用TCP/IP协议的吉比特以太网能利用现有的网络结构,并提供更宽的带宽,通过标准F TP协议,进行比实时更快的文件传送。
1. Pluto Technologies选择吉比特以太网
当初以太网的设计是为非常高效地处理TCP/IP,现在它已是应用最为广泛的网络技术,占全球网络的90%以上。从10Mb/s发展到100Mb /s快速以太网,这一技术已经成熟。
吉比特以太网采用兼容技术和国际标准,提供了一种自然升级的途径,以提升网络性能。现在用10/100 Base-T以太网建成的LAN,可以通过相同的、大家熟悉的网络拓扑,增强为吉比特以太网。各平台和操作系统之间的互操作性由标准IP以太网协议保证。
Pluto Technologies通过使用网络接口硬件,进一步发挥了吉比特以太网的优点,这些硬件是根据应用订制的,但保留有国际标准接口。网络接口卡通过下载硬件得以重新编程,以提高内部系统处理自家的数据传送效率。这一效能结合芯片上T CP求和校验和中断集合等效能,将CPU的介入减至最小,并且提高了数据传送性能。通常,当输送在视频媒体中常见的大的数据文件时,使用加大的帧规格,可进一步减小C PU的开销,这些加大的数据帧(Jumbo帧),比以太网标准帧大6倍,得到多个吉比特以太网设备供应商的支持。对Jumbo帧的支持每次连接时都需要协商,还没有提出兼容性问题。
2. 服务器
服务器是集合了SDTI和网络文件传送效能的集线器。LAN具有非确定性短期文件传送的性能。需要一个硬盘系统来存储数据,以调整网络上的数据码流。硬盘服务器通常会将音视频文件夹保存为带有文件标识符和保存时间的文件。
最近完成了保存这些文件的元数据的标准化。这“关于数据的数据”是用来储存A/V格式、时间码、EDL、比色法,和包括主题、作者和原始日期等的数据库信息。媒体数据或基本元素/ 元数据都包含在一个数据包中。存储数据包可用于存储和编辑平台之间的原始文件输送。流式数据包用于对时间敏感的输送,包括互联层开销、用于直播的复用或交织的基本元数据结构。在不同平台之间进行传送时,要求对媒体文件进行处理,以便转换成原始的硬盘格式。
Pluto Technologies使用I/O卡上的FPGA技术,很容易升级I/O硬件,以容纳演变的SDTI接口。这一I/O硬件需要一些特殊电路,作为连接FPGA逻辑( 和主板上的内存相连)一般配置的串行数字音、视频接口。这一结构便于服务器硬件适应不同的SDTI和压缩标准。该I/O硬件的功能性可在对该卡初始化时通过软件来升级并编程。
五 结论
视频磁带录制是采集、制作和分配链路上的固有过程。现在的VTR制造商所提供的压缩格式非常现代化,能够产生极高的图像质量。这种标准格式受到多家硬盘录像机制造商的支持,减少了对其他专有格式的需求。混合压缩格式需要在基带上传送,由于级联误差,加速了图像质量的损失。
SDTI提供了一种将原有压缩数据向/从VTR平台传送、实现了数据在磁带与磁带间,或从磁带向硬盘系统无损复制的方法。用于制作和播出的硬盘视频服务器平台允许在网络上传送压缩媒体文件。这两种技术都无需为在平台间传送媒体而向基带转换,因而减少了额外的压缩循环。
基于帧的压缩格式允许在帧边缘进行简单的剪辑。在过渡、字符和图形迭加或进行键控、以及在图像变换点进行特技编辑或对基带信号进行特技处理时,需要一个附加的解压缩/ 再压缩循环。理想情况下,图像在摄录一体机通过SDTI向服务器/NLE传送时,需要压缩一次;然后解压一次变为依循601标准的信号,以作特技处理;再压缩一次进行传输、数据磁带存档或S DTI视频磁带存档。所有这些可以仅仅在一个压缩循环中完成。
MPEG-2和DV都是很好的视频压缩格式。在任一种情况下,要得到可接受的结果,关键在于尽量减少连续的压缩循环,连续的压缩将会进一步破坏图像。为了得到最好的结果,选出一种压缩格式,并坚持在整个制作链路中使用这种格式,在不同平台间小心进行传送。