??? 1. MPEG標(biāo)準(zhǔn)的發(fā)展
??? MPEG是Moving Pictures Experts Group(動態(tài)圖像專家組)的縮寫,。是一個致力于數(shù)字視頻,、音頻技術(shù)發(fā)展及標(biāo)準(zhǔn)化的杰出組織,它是ISO(International Standard Organization)與IEC(International Electronic Committee)在1988年聯(lián)合成立的,,正規(guī)的組織代號是ISO/IEC JTCI/SC29/WG11,,成員專家來自于不同國家的最有業(yè)界影響力的研發(fā)機(jī)構(gòu)。?
??? 在十多年的時間里,,MPEG組織取得了豐碩的成果,,自身也有了很大的發(fā)展。1992年11月,,MPEG-1被批準(zhǔn),,并于1993年被ISO組織接納為國際標(biāo)準(zhǔn);1994年11月,,MPEG-2標(biāo)準(zhǔn)發(fā)布,,并在1995年成為國際標(biāo)準(zhǔn);MPEG-4標(biāo)準(zhǔn)則于1999年和2001年分別有了版本1和版本2,;目前,,H.264/MPEG-4 AVC(即 ISO MPEG-4 Part 10)正在制定之中。?
??? 2. ISO MPEG-1 標(biāo)準(zhǔn)?
??? MPEG-1 制定于1992年,,為工業(yè)級標(biāo)準(zhǔn)而設(shè)計,,編號為ISO/IEC 11172。MPEG-1針對CIF標(biāo)準(zhǔn)分辨率(NTSC制為352×240,;PAL制為352×288)的圖像進(jìn)行壓縮,,并在標(biāo)準(zhǔn)中規(guī)定了視音頻" title="視音頻">視音頻信息經(jīng)過壓縮后的數(shù)據(jù)碼率最大為1.5Mbps。MPEG-1可實現(xiàn)在不同帶寬的設(shè)備,,如CD-ROM,、Video-CD等數(shù)字媒體上進(jìn)行存儲,也可以在局域網(wǎng),、ISDN網(wǎng)上進(jìn)行視音頻信息的傳輸,。?
??? 3. ISO MPEG-2 標(biāo)準(zhǔn)?
??? MPEG組織在1994年推出了MPEG-2壓縮標(biāo)準(zhǔn),并在1995年成為國際標(biāo)準(zhǔn),,編號為ISO/IEC13818,。MPEG-2標(biāo)準(zhǔn)是針對標(biāo)準(zhǔn)數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,,編碼碼率可達(dá)100Mbps,。MPEG-2不是MPEG-1的簡單升級,,它在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2特別適用于廣播級的數(shù)字電視的編碼和傳送,,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn),。?
??? (1)MPEG-2標(biāo)準(zhǔn)的構(gòu)成?
??? MPEG-2標(biāo)準(zhǔn)目前分為9個部分,各部分的內(nèi)容描述如下:?
??? 1) 第一部分-ISO/IEC13818-1,,System:系統(tǒng),,描述多個視頻,音頻和數(shù)據(jù)基本碼流合成傳輸碼流和節(jié)目碼流的方式,。?
??? 2) 第二部分-ISO/IEC13818-2,,Video:視頻,描述視頻編碼方法,。?
??? 3) 第三部分-ISO/IEC13818-3,,Audio:音頻,描述與MPEG-1音頻標(biāo)準(zhǔn)反向兼容的音頻編碼" title="音頻編碼">音頻編碼方法,。?
??? 4) 第四部分-ISO/IEC13818-4,,Compliance:符合測試,描述測試一個編碼碼流是否符合MPEG-2碼流的方法,。?
??? 5) 第五部分-ISO/IEC13818-5,,Software:軟件,描述了MPEG-2標(biāo)準(zhǔn)的第一,、二,、三部分的軟件實現(xiàn)方法。?
??? 6) 第六部分-ISO/IEC13818-6,,DSM-CC:數(shù)字存儲媒體-命令與控制,,描述交互式多媒體網(wǎng)絡(luò)中服務(wù)器與用戶間的會話信令集。?
??? 以上六個部分均已獲得通過,,成為正式的國際標(biāo)準(zhǔn),,并在數(shù)字電視等領(lǐng)域中得到了廣泛的實際應(yīng)用。此外,,MPEG-2標(biāo)準(zhǔn)還有三個部分:第七部分規(guī)定與MPEG-1音頻非反向兼容的多通道音頻編碼,;第八部分現(xiàn)已停止;第九部分規(guī)定了傳送碼流的實時接口,。?
??? (2)MPEG-2編解碼原理?
??? MPEG-2視頻壓縮的原理是利用了圖像中的兩種特性:空間相關(guān)性和時間相關(guān)性,。這兩種相關(guān)性使得圖像中存在大量的冗余信息。為了能夠有效的去除圖像中的冗余信息,,MPEG-2標(biāo)準(zhǔn)中將編碼圖像被分為三類,,分別稱為I幀,,P幀和B幀。I幀圖像采用幀內(nèi)編碼方式,。P幀和B幀圖像采用幀間編碼方式,。P幀圖像只采用前向時間預(yù)測,B幀圖像采用雙向時間預(yù)測,,可以大大提高壓縮倍數(shù),。?
??? MPEG-2的編碼碼流分為六個層次,從上至下依次為:視頻序列層(Sequence),,圖像組層(GOP:Group of Picture),,圖像層(Picture),像條層(Slice),,宏塊層(MacroBlock)和像塊層(Block),。?
??? 在幀內(nèi)編碼的情況下,編碼圖像僅經(jīng)過DCT,,量化器和比特流編碼器即生成編碼比特流,。在幀間編碼的情況下,原始圖像首先與幀存儲器中的預(yù)測圖像進(jìn)行比較,,計算出運動矢量,,由此運動矢量和參考幀生成原始圖像的預(yù)測圖像。而后,,將原始圖像與預(yù)測像素差值所生成的差分圖像數(shù)據(jù)進(jìn)行DCT變換,,再經(jīng)過量化器和比特流編碼器生成輸出的編碼比特流。?
??? (3)MPEG-2中的Profile@Level?
??? 現(xiàn)有MPEG-2視頻標(biāo)準(zhǔn)的技術(shù)規(guī)范集包括5類(Profile)4級(Level)組成,,并采用分級編碼,。類和集的若干組合構(gòu)成MPEG-2標(biāo)準(zhǔn)在某種特定應(yīng)用下的子集。?
??? 級(Level)是指MPEG-2的輸入格式,,標(biāo)識從有限清晰度的VHS 質(zhì)量圖像到HDTV圖像,,每一種輸入格式編碼后都有一個相應(yīng)的范圍。共分4級:?
??? 1) 低級LL(Low Level),,圖像輸入格式的像素是ITU-R Rec.BT 601格式的1/4,,即352×240×30或352×288×25。?
??? 2) 主級ML(Main Level),,圖像輸入格式符合ITU-R Rec.BT 601格式,,即720×480×30或720×576×25。?
??? 3) 1440高級H14L(High 1440 Level),,圖像寬高比為4∶3,,采用1440×1080×30的高清晰度格式。?
??? 4) 高級HL(High Level),,圖像寬高比為16∶9,,采用1920×1080×30的高清晰度格式,。?
??? 類(Profile)是指MPEG-2的不同處理方法,每一類都包括壓縮和處理方法的一個集合,,較高的類意味著采用較多的編碼工具集,,進(jìn)行更精細(xì)的處理,達(dá)到更好的圖像質(zhì)量,,同時實現(xiàn)的代價也更大,。共分5類:?
??? 1) 簡單類SP(Simple Profile),,使用最少的編碼工具集,。?
??? 2) 主類MP(Main Profile),它比簡單類增加了一種雙向預(yù)測方法,,在相同比特率的情況下,,將給出比簡單類更好的圖像。?
??? 3) 信噪比可分級類SNRP(SNR Scaleable Profile)和空域可分級類SPP(Spatially Scaleable Profile),,這兩種類允許將編碼的視頻數(shù)據(jù)分為基本層和附加層,,提供了一種多種廣播的方式。?
??? 4) 高級類HP(High Profile),,應(yīng)用于圖像質(zhì)量,、比特率要求更高的場合。?
??? (4)MPEG-2的特點及應(yīng)用?
??? MPEG-2具有以下幾個突出特點:①支持的圖像分辨率最高,,包括符合ITU-RRec.601(CCIR601)格式的標(biāo)準(zhǔn)分辨率的數(shù)字電視和更高分辨率的HDTV,。②支持包括高速體育運動在內(nèi)的各種活動圖像。③支持的應(yīng)用最為廣泛,,既包括存儲媒體中的DVD,,廣播電視中的數(shù)字廣播電視和HDTV,還可應(yīng)用于交互式的視頻點播(VOD)和準(zhǔn)視頻點播(NVOD),。④還能夠適配ATM等寬帶通信網(wǎng),。?
??? 4. ISO MPEG-4標(biāo)準(zhǔn)?
??? MPEG-4于1998年10月定案,在1999年1月成為一個國際性標(biāo)準(zhǔn),,隨后為擴(kuò)展用途又進(jìn)行了第二版的開發(fā),,于2001年有了其第二個版本。MPEG-4的國際標(biāo)準(zhǔn)編號為ISO/IEC14496,。MPEG-4的特點是其更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控,,是一個有交互性的動態(tài)圖像標(biāo)準(zhǔn)。?
??? (1)MPEG-4標(biāo)準(zhǔn)的構(gòu)成?
??? 1) 多媒體傳送整體框架(DMIF):主要解決交互網(wǎng)絡(luò)中,、廣播環(huán)境下以及磁盤應(yīng)用中多媒體應(yīng)用的操作問題,。通過DMIF,MPEG-4可以建立起具有特殊品質(zhì)服務(wù)(QoS)的信道和面向每個基本流的帶寬,。?
??? 2) 數(shù)據(jù)平面:MPEG-4中的數(shù)據(jù)平面可以分為傳輸關(guān)系和媒體關(guān)系兩部分,,并引用了對象描述(OD)和流圖桌面(SMT)的概念,,使基本流和AV對象在同一場景中出現(xiàn)。?
??? 3) 緩沖區(qū)管理和實時識別:MPEG-4定義了一個系統(tǒng)解碼模式(SDM),,該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置,,它要求特殊的緩沖區(qū)和實時模式。通過有效地管理,,可以更好地利用有限的緩沖區(qū)空間,。?
??? 4) 視頻編碼:MPEG-4支持對自然和合成的視覺對象的編碼,合成的視覺對象包括2D,、3D動畫和人面部表情動畫等,。?
??? 5) 音頻編碼:MPEG-4不僅支持自然聲音,而且支持合成聲音,。它將音頻的合成編碼和自然聲音的編碼相結(jié)合,,并支持音頻的對象特征。?
??? 6) 場景描述:場景描述主要用于描述各AV對象在具體AV場景下,,如何組織與同步等問題,,同時還有AV對象與AV場景的知識產(chǎn)權(quán)保護(hù)等問題。?
??? (2)MPEG-4編解碼原理?
??? a. 基本思想?
??? MPEG-4編解碼的基本思想是基于圖像內(nèi)容的第二代視頻編解碼方案,,并將基于合成的編碼方案也結(jié)合在標(biāo)準(zhǔn)中,。它根據(jù)圖像的內(nèi)容將圖像分割成不同的視頻對象VO(Video Object),在編碼過程中對前景對象和后景對象采用不同的編碼策略,,對于人們所關(guān)心的前景對象,,則盡可能的保持對象的細(xì)節(jié)及平滑,而對不大關(guān)心的后景對象采用大壓縮比" title="壓縮比">壓縮比的編碼策略,。?
??? b. 編解碼的數(shù)據(jù)結(jié)構(gòu)?
??? MPEG-4按照如下五個層次組織要編碼的圖像,,從上至下依次為:視頻段VS(Video Session)、視頻對象VO(Video Object),、視頻對象層VOL(Video Object Layer),、視頻對象組層GOV(Group of Video Object Plane)、視頻對象平面VOP(Video Object Plane),。?
??? 在MPEG-4中,,VO主要被定義為畫面中分割出來的不同物體,每個VO有三類信息來描述:運動信息,、形狀信息,、紋理信息。VO的構(gòu)成依賴于具體應(yīng)用和系統(tǒng)實際所處環(huán)境,,在要求超低比特率的情況下,,VO可以是一個矩形幀(即傳統(tǒng)MPEG-1中的矩形幀),從而與原來的標(biāo)準(zhǔn)兼容;對于基于內(nèi)容的表示要求較高的應(yīng)用來說,,VO可能是場景中的某一物體或某一層面,,如新聞節(jié)目中的解說員的頭肩像 ;VO也可能是計算機(jī)產(chǎn)生的二維,、三維圖形等,。?
??? c. VOP編碼器結(jié)構(gòu)?
??? 編碼器主要由兩部分組成:形狀編碼和傳統(tǒng)的運動紋理編碼,其中形狀編碼是MPEG-4在編碼任意形狀的VOP時所必須的,。?
??? d. MPEG-4的編解碼流程及框架?
??? MPEG-4的編碼流程:第一步是VO的形成(VO Formation),,先要從原始視頻流中分割出VO,之后由編碼控制(Coding control)機(jī)制為不同的VO以及各個VO的三類信息分配碼率,,之后各個VO分別獨立編碼,,最后將各個VO的碼流復(fù)合成一個位流。其中,,在編碼控制和復(fù)合階段可以加入用戶的交互控制或由智能化的算法進(jìn)行控制?,F(xiàn)在的MPEG-4包含了基于網(wǎng)格模型的編碼和Sprite技術(shù)。在進(jìn)行圖像分析后,,先考察每個VO是否符合一個模型,典型的如人頭肩像,,如是就按模型編碼,;再考慮背景能否采用Sprite技術(shù),如是則將背景生產(chǎn)一幅大圖,,為每幀產(chǎn)生一個仿射變換和一個位置信息即可,;最后才對其余的VO按上述流程編碼。MPEG-4的解碼流程則基本上為編碼器的反過程,,這里不再贅述,。?
??? (3)MPEG-4中的Profile@Level?
??? (4)MPEG-4的主要應(yīng)用場合?
??? 從目前的情況看,MPEG-4主要被用于三個領(lǐng)域:數(shù)字電視,、交互式的圖形應(yīng)用(包括內(nèi)容上的合成技術(shù)),、交互式多媒體領(lǐng)域等。?
??? (5)MPEG-4的特點及優(yōu)勢?
??? 1) MPEG-4是做為一個國際化的標(biāo)準(zhǔn)來制定研究的,,因而具有很好的兼容性及開放性,。?
??? 2) MPEG-4提供高壓縮比的同時,對數(shù)據(jù)的損失很小,,達(dá)到以最小的數(shù)據(jù)獲得最佳的圖像質(zhì)量的目的,。?
??? 3) MPEG-4是個開放標(biāo)準(zhǔn),因其高質(zhì)量的數(shù)字影像,,以及允許內(nèi)容創(chuàng)建者從MPEG-2質(zhì)量一直到極低帶寬的Internet流式內(nèi)容全程進(jìn)行品質(zhì)和帶寬的均衡,,而被全世界的無線、電腦及娛樂公司廣泛采用。?
??? 4) 正如MPEG-2將使數(shù)字電視最終完全取代現(xiàn)有的模擬電視那樣,,隨著MPEG-4新標(biāo)準(zhǔn)的不斷推出,,數(shù)據(jù)壓縮和傳輸技術(shù)必將趨向更加規(guī)范化。?
??? 5. H.264/MPEG-4 AVC(ISO MPEG-4 Part 10)?
??? H.264(ITU-T命名),,或稱之為MPEG-4 AVC(ISO/IEC命名),,是一種由ITU-T與ISO/IEC正在聯(lián)合進(jìn)行開發(fā)的視頻編解碼方案,即將成為MPEG-4標(biāo)準(zhǔn)的第10部分(ISO MPEG-4 Part 10),。關(guān)于該技術(shù)的視頻編碼方案,,現(xiàn)在正式命名為ITU-T H.264或'JVT/AVC草案'。H.264/MPEG-4 AVC作為MPEG-4標(biāo)準(zhǔn)的擴(kuò)展(MPEG-4 Part 10),,充分利用了現(xiàn)有MPEG-4標(biāo)準(zhǔn)中的各個環(huán)節(jié),。H.264/MPEG-4 AVC就在現(xiàn)有MPEG-4 Advanced Simple Profile的基礎(chǔ)之上進(jìn)行發(fā)展的。?
??? H.264/MPEG-4 AVC的編解碼方案流程主要包括如下5個部分:精密運動估計與幀內(nèi)估計(Estimation),、變換(Transform)及逆變換,、量化(Quantization)及逆量化、環(huán)路濾波器(Loop Filter),、熵編碼(Entropy Coding),。?
??? 盡管H.264/MPEG-4 AVC這項技術(shù)雖然還沒有得到正式批準(zhǔn),但是其可以降低50%或更多帶寬的能力,,能以少于1Mbps的數(shù)據(jù)率傳輸基于互聯(lián)網(wǎng)協(xié)議(IP)的廣播質(zhì)量級的視頻內(nèi)容,,這是目前正式頒布的ISO MPEG-4及MPEG-2編解碼方案根本所不能比擬的。因而,,H.264/MPEG-4 AVC將對所有要求高壓縮率,、高質(zhì)量的應(yīng)用領(lǐng)域產(chǎn)生深遠(yuǎn)的影響。?
??? 目前Amphion Semiconductor,、Envivio,、Equator Technologies、iVAST,、德州儀器,、UB Video和VideoLocus等芯片制造商以及軟件技術(shù)供應(yīng)商都對該項技術(shù)進(jìn)行了相關(guān)的研究及產(chǎn)品開發(fā),其中VideoLocus公司推出了VLP4000系統(tǒng)用于H.264/MPEG-4 AVC編解碼,、流媒體" title="流媒體">流媒體方案及性能的評估,。?
??? 6. DV標(biāo)準(zhǔn)?
??? 數(shù)字?jǐn)z像機(jī)記錄視頻不是以模擬信號,而是以壓縮的數(shù)字信號的方式,。為避免出現(xiàn)不兼容的情況,,這種技術(shù)的主要產(chǎn)品都符合一個數(shù)字壓縮標(biāo)準(zhǔn):DV。很多國際知名的視頻廠商都發(fā)展和提供DV格式的產(chǎn)品,,這其中的傳輸標(biāo)準(zhǔn)被稱為FireWire(IEEE 1394),。DV是一種將DCT壓縮的數(shù)字視頻信號記錄到盒式錄像帶的方法。?
??? (1)DV涉及的指標(biāo)?
??? 1) 取樣頻率及取樣比:DV使用的是4∶2∶0的數(shù)字分量記錄系統(tǒng),視頻亮度取樣頻率為13.5MHz,,色差信號取樣頻率是3.375MHz,。?
??? 2) 量化深度:DV對取樣后的亮度及色差信號進(jìn)行8-bit量化。?
??? 3) 視頻信號壓縮比:DV格式采用的是幀內(nèi)壓縮方法,,壓縮比為5∶1,,壓縮后視頻碼流在進(jìn)一步處理后記錄在磁帶上。?
??? (2)DV(IEEE l394)接口?
??? IEEE l394是標(biāo)準(zhǔn)的高速,、短距數(shù)據(jù)傳輸交換協(xié)議,。IEEE1394已經(jīng)被數(shù)字VCR聯(lián)盟確認(rèn)為標(biāo)準(zhǔn)的數(shù)字接口,被數(shù)字視頻協(xié)會確認(rèn)為數(shù)字傳輸標(biāo)準(zhǔn),。VESA(視頻專家標(biāo)準(zhǔn)協(xié)會)認(rèn)同1394用于家庭網(wǎng)絡(luò),,并且歐洲數(shù)字視頻廣播(DVB)也認(rèn)同將IEEE1394用于數(shù)字電視接口。?
??? (3)DV的特點?
??? 1) DV格式具有優(yōu)異的圖像質(zhì)量,,它具有高清晰度,,寬色度帶寬,能還原色彩絢麗的圖像,、無抖動的穩(wěn)定畫面等特點,。?
??? 2) DV格式能對聲音進(jìn)行數(shù)字記錄,為了與優(yōu)越的圖像相配合,,DV格式提供了優(yōu)質(zhì)的PCM音頻記錄,。?
??? 3) DV格式基于它的應(yīng)用特點,不能調(diào)整輸出碼率,。?
??? 4) 支持DV的MiniDV盒帶比VHS盒帶小巧許多,使得MiniDV的帶倉,、磁鼓和帶盤機(jī)構(gòu)等也相應(yīng)變得更加精巧,。?
??? 7. MXF格式標(biāo)準(zhǔn)?
??? 素材交換格式(Media eXchange Format, MXF)是廠商之間和主要組織(如Pro-MPEG、EBU和AAF協(xié)會)之間合作的巨大進(jìn)展,。MXF是一種在服務(wù)器,、數(shù)據(jù)流磁帶機(jī)和數(shù)字檔案之間交換節(jié)目素材的文件格式。其內(nèi)容可能為完整的節(jié)目以及整套廣播電視節(jié)目或片段,。MXF可自成體系運用,,無需外部素材即可保存完整的內(nèi)容。目前素材交換格式(MXF)標(biāo)準(zhǔn)化工作已發(fā)展到第9版本,。?
??? (1)MXF文件格式?
??? MXF把統(tǒng)稱為實體的視頻,、音頻和節(jié)目數(shù)據(jù)(如文本)與元數(shù)據(jù)" title="元數(shù)據(jù)">元數(shù)據(jù)捆綁在一起,并將它們置于一個包內(nèi),,其主體基于碼流并攜帶實體和某些元數(shù)據(jù),。它保存視頻幀的一個片段,每個片段輔之于有關(guān)的音頻和數(shù)據(jù)實體以及基于幀的元數(shù)據(jù)。后者一般包含時間碼和每個視頻幀的文件格式信息,。主體可基于若干不同類型的素材(實體),,包括MPEG、DV和非壓縮視頻/音頻,,它還使用SMPTE KLV數(shù)據(jù)編碼系統(tǒng),,這使之具有成為公認(rèn)標(biāo)準(zhǔn)的優(yōu)勢。?
??? MXF是音頻/視頻/元數(shù)據(jù)的打包結(jié)構(gòu),,由文件頭,、文件尾、文件體以及可選的索引部分組成,。索引部分包括部分元數(shù)據(jù)和文件參數(shù)用于文件訪問,,文件體部分可以是多種視音頻格式,如MPEG,,DV和非壓縮的AV數(shù)據(jù),。文件體由若干場景文件構(gòu)成,每個場景文件都是由圖像,、聲音和元數(shù)據(jù)組成的,。?
??? (2)MXF的元數(shù)據(jù)(Metadata)?
??? 1) 元數(shù)據(jù)的含義?
??? 元數(shù)據(jù)就是與視音頻數(shù)據(jù)結(jié)合在一起的輔助信息,它記錄了與節(jié)目制作相關(guān)的數(shù)據(jù),,如:拍攝時間,、拍攝地點、人物,、場景編號及其他相關(guān)信息,。這些信息在節(jié)目制作、傳送,、復(fù)制及播出的各個階段,,始終與視音頻信號密切結(jié)合。?
??? 2) 元數(shù)據(jù)的作用?
??? 元數(shù)據(jù)(Metadata)在日后的素材管理,、資料查找,、交互式節(jié)目制作與播出等應(yīng)用中,將大大提高我們的工作效率,,并起到舉足輕重的作用,。利用元數(shù)據(jù),我們可以輕松的實現(xiàn)素材查找,。除了可以直接觀看視頻畫面之外,,還可以通過元數(shù)據(jù)查看其他相關(guān)數(shù)據(jù),獲得更直觀,、更豐富,、更形象的資訊,。?
??? (3)MXF與AAF的關(guān)系?
??? AAF是Advanced Authoring Format的縮寫,意為'先進(jìn)制作格式',。AAF是一個協(xié)會,,它包括了目前世界上主要的電子設(shè)備供應(yīng)商、計算機(jī)軟硬件廠家和一些廣播機(jī)構(gòu),。協(xié)會主要負(fù)責(zé)制定用于增強(qiáng)的編輯和制作的通用AV文件格式標(biāo)準(zhǔn),,即AAF格式。AAF格式是一種用于多媒體創(chuàng)作及后期制作,、面向企業(yè)界的開放式標(biāo)準(zhǔn),。?
??? AAF是一種帶標(biāo)簽和地址的圖像/聲音/元數(shù)據(jù)打包方式,?
??? MXF與AAF這兩種格式具有互補(bǔ)性,。AAF可以對現(xiàn)有的各種媒體文件格式進(jìn)行集成和補(bǔ)充,;而MXF對AAF文件和現(xiàn)有的各種流媒體格式都有這樣的效能。MXF和AAF都可以單獨使用,,它們在各自的應(yīng)用領(lǐng)域各有所長,;與此同時,用戶對任何一者無須有依賴性,。例如,,一個單純的廣播系統(tǒng)可以使用MXF格式;一個后期制作室可以只使用AAF格式,;而一個帶有后期制作設(shè)施的廣播機(jī)構(gòu),,則可以同時使用這兩種格式。?
??? MXF與AAF這兩種文件格式在很多方面非常相似,,從這兩種文件的關(guān)系上來看MXF是AAF的子集,。?
??? (4)MXF的作用?
??? 1) 使用MXF文件,我們可以利用成熟,、實用且構(gòu)造簡單,、價格并不昂貴的IT網(wǎng)絡(luò)傳送高質(zhì)量的視音頻數(shù)據(jù)。?
??? 2) 應(yīng)用MXF文件技術(shù),,可以在所有支持即將成為國際標(biāo)準(zhǔn)的MXF文件格式的各個廠家設(shè)備(錄像機(jī)、服務(wù)器,、非線性制作設(shè)備)之間傳送視頻數(shù)據(jù),。?
??? 3) 除了提供更好的互操作性,即在不同的設(shè)備和不同的應(yīng)用之間處理視頻和音頻,。MXF另外的貢獻(xiàn)是傳送元數(shù)據(jù),。從一開始就把MXF作為一種新文件格式來開發(fā),因此對元數(shù)據(jù)應(yīng)用加以大量的關(guān)注,。這不僅對MXF文件的恰當(dāng)運行非常重要,,而且還將導(dǎo)致功能強(qiáng)大的新型媒體管理工具的出現(xiàn),。?
??? 二 流媒體標(biāo)準(zhǔn)?
??? 1. ISMA MPEG-4流媒體標(biāo)準(zhǔn)?
??? ISMA是國際互聯(lián)網(wǎng)流媒體聯(lián)盟(Internet Streaming Media Alliance)的簡稱,它是由蘋果,、思科,、IBM、Sun,、Philips,、Kasenna等產(chǎn)業(yè)界巨人于2000年12月14日發(fā)起并宣布成立,目前其正式成員達(dá)到30家以上,。ISMA聯(lián)盟的宗旨為推動開發(fā)與使用IP端到端媒體流解決方案的國際開放性標(biāo)準(zhǔn),。其官方網(wǎng)站(www.ISM-Alliance.org)作用在于發(fā)表各項完成的規(guī)范并發(fā)布聯(lián)盟的活動信息。?
??? 由于MPEG-4作為MPEG-1及MPEG-2的替代技術(shù)標(biāo)準(zhǔn),,可以將較大的流媒體文件在保證視音頻質(zhì)量情況下壓縮的非常小,,更利于在網(wǎng)絡(luò)上傳播?;诖?,ISMA MPEG-4標(biāo)準(zhǔn)正是由ISMA制定并發(fā)布的基于ISO MPEG-4的流媒體新標(biāo)準(zhǔn)。?
??? ISMA發(fā)布了新標(biāo)準(zhǔn)的第一個規(guī)范說明--ISMA 1.0,。該規(guī)范說明允許用戶僅下載一個插件,,就可以使用不同公司的播放器欣賞網(wǎng)絡(luò)音頻與視頻;而且使用范圍不局限于PC機(jī),,還包括各種掌上無線設(shè)備(如PDA,、手機(jī)等)。?
??? ISMA 1.0目前有兩個版本:Profile 0和Profile 1,。前者是為了無線網(wǎng)絡(luò)及帶寬較窄的網(wǎng)絡(luò)準(zhǔn)備的,,可以適用于手機(jī)、PDA等掌上無線設(shè)備,;后者是為了寬帶設(shè)計的,,可以應(yīng)用于機(jī)頂盒以及PC機(jī)。ISMA希望MPEG-4 能夠最終代替MPEG-2標(biāo)準(zhǔn),,但是新標(biāo)準(zhǔn)在視頻效果及交互性方面有待改進(jìn),,目前仍在不斷的發(fā)展及提高之中。?
??? 2. QuickTime?
??? (1)QuickTime MOV格式?
??? Apple公司的QuickTime MOV文件格式是數(shù)字媒體領(lǐng)域的工業(yè)標(biāo)準(zhǔn),。QuickTime MOV文件格式定義了存儲數(shù)字媒體內(nèi)容的標(biāo)準(zhǔn)方法,,使用這種文件格式不僅可以存儲單個的媒體內(nèi)容(如視頻幀或音頻采樣),而且能保存對該媒體作品的完整描述,。?
??? QuickTime MOV文件格式被設(shè)計用來適應(yīng)為與數(shù)字化媒體一同工作需要存儲的各種數(shù)據(jù),。它將媒體描述和媒體數(shù)據(jù)分開存儲,媒體描述包含軌道數(shù)目,、視頻壓縮格式和時間信息等,,同時包含媒體數(shù)據(jù)存儲區(qū)域的索引,。媒體數(shù)據(jù)是指所有的采樣數(shù)據(jù),如視頻幀和音頻采樣,。由于這種文件格式能用來描述幾乎所有的媒體結(jié)構(gòu),,是應(yīng)用程序間(不管運行平臺如何)交換數(shù)據(jù)的理想格式。?
??? (2)QuickTime支持的ISO/ISMA MPEG4流媒體格式?
??? Apple公司的QuickTime從5.0版本開始采用MPEG-4相關(guān)的壓縮技術(shù),,并且在其最新版本QuickTime 6中率先提出支持ISO/ISMA MPEG-4流媒體格式(mp4文件格式),,而且是世界上用于創(chuàng)建、流化和觀看MPEG-4內(nèi)容的首款完全媒體解決方案,。?
??? QuickTime在ISO/ISMA MPEG-4的流媒體應(yīng)用方面具有以下明顯特征:?
??? 1) 采用完全符合ISO MPEG-4標(biāo)準(zhǔn)的視頻編解碼,,用于MPEG-4影像內(nèi)容的編碼和解碼。?
??? 2) 符合互聯(lián)網(wǎng)流式媒體聯(lián)盟(ISMA)的1.0規(guī)范,,并全面支持ISMA 1.0標(biāo)準(zhǔn)中的兩個版本:ISMA Profile 0 和ISMA Profile 1,。?
??? 3) 采用Instant-On Streaming(即時通媒體流)技術(shù),其特點是可消除緩沖延時,,達(dá)到即時進(jìn)退,、幀進(jìn)、幀退,、拖動間播放,、停止播放后還能進(jìn)行自由定位瀏覽等功能,使用戶能簡捷快速地掃過流式媒體內(nèi)容而定位到要觀看的特定部分,。這是RealVideo和Windows Media目前根本不能達(dá)到的功能,。?
??? 4) 在MPEG-4中采用高級音頻編碼(AAC)的音頻編碼技術(shù),能夠以小得多的文件提供比MP3好得多的音質(zhì),,也比Windows Media Audio(WMA)更強(qiáng),。?
??? 3. Windows Media Technologies?
??? Microsoft Windows Media 技術(shù)是一個能適應(yīng)多種網(wǎng)絡(luò)帶寬條件的流式多媒體信息的發(fā)布平臺,提供密切結(jié)合的一系列服務(wù)和工具用以創(chuàng)造,、管理,、廣播和接收通過 Internet 和企業(yè) Intranet 傳送的極其豐富的流式化多媒體演示內(nèi)容,包括了流式媒體的制作,、發(fā)布,、播放和管理的一整套解決方案。另外,,還提供了開發(fā)工具包(SDK)供二次開發(fā)使用,。?
??? (1)Windows Media 9 Series Platform?
??? Microsoft Windows Media 9 Series Platform是一套涉及編解碼、服務(wù)器,、播放器、軟件開發(fā)包等各個方面的完整多媒體解決平臺,。它作為多媒體領(lǐng)域的最新核心技術(shù),,在編解碼質(zhì)量,、穩(wěn)定性、集成性,、流媒體性能,、功能等方面都有了較大的提高,同時該平臺緊密的和Windows操作系統(tǒng)結(jié)合在一起,,將在廣播,、電視、網(wǎng)絡(luò),、遠(yuǎn)程教學(xué),、遠(yuǎn)程服務(wù)等方面有著廣泛應(yīng)用。?
??? (2)Windows Media Video 9(WMV 9)?
??? Windows Media Video 9(WMV 9)是Microsoft視頻媒體技術(shù)的首要Codec,,它派生于MPEG-4,,幾個專有擴(kuò)展功能使其可在給定碼率下提供更好的圖像質(zhì)量,在這種意義下,,Windows Media Video 9是流式視頻中質(zhì)量最高的Codec之一,。?
??? WMV 9的主要優(yōu)點包括:本地或網(wǎng)絡(luò)回放、圖像質(zhì)量優(yōu)秀,、可擴(kuò)充的媒體類型,、部件下載、可伸縮的媒體類型,、流的優(yōu)先級化,、多碼率合成、多語言支持,、環(huán)境獨立性,、豐富的流間關(guān)系以及擴(kuò)展性等。但是WMV 9也具有一些缺陷,,如系統(tǒng)平臺只能采用Windows操作系統(tǒng),,跨平臺支持能力差;轉(zhuǎn)碼生成WMV 9的效率較低,;流式媒體內(nèi)容的瀏覽沒有采用QuickTime瀏覽 ISO/ISMA MPEG-4視頻內(nèi)容的方便等,。?
??? 4. RealNetworks的RealVideo技術(shù)?
??? RealNetworks公司所制定的視音頻壓縮規(guī)范稱為RealMedia,是目前在Internet上相當(dāng)流行的跨平臺的,、客戶/服務(wù)器結(jié)構(gòu)的多媒體應(yīng)用標(biāo)準(zhǔn),,它采用音頻/視頻流和同步回放技術(shù)來實現(xiàn)在Internet上全帶寬地提供優(yōu)質(zhì)的多媒體,同時也能夠在Internet上以28.8kbit/s的傳輸速率提供立體聲和連續(xù)視頻,。?
??? RealVideo技術(shù)的整套流媒體解決方案主要包括:?
??? 1) 客戶端播放軟件RealPlayer,,可以獨立運行,也可以作為插件在瀏覽器中運行,,目前最新版本為RealOne Player,。?
??? 2) 制作端產(chǎn)品是內(nèi)容制作軟件RealProducer,,它將其他各種媒體格式的文件壓縮轉(zhuǎn)換為Real流媒體格式文件,目前最新版本為Helix Producer Plus 9.0,。第三方開發(fā)者可以通過RealNetworks公司提供的SDK將它們的媒體格式轉(zhuǎn)換成RealMedia文件格式,。?
??? 3) 服務(wù)器端軟件RealServer用于提供流式服務(wù),目前最新版本為Helix Server 9.0?
??? 5. DivX MPEG-4?
??? DivX MPEG-4的基礎(chǔ)技術(shù)來源于微軟的MPEG-4 V3版本,,由DivXNetworks發(fā)起一個開放源碼項目ProjectMayo而開發(fā)出來的,。?
??? DivX MPEG-4具有以下特點:MPEG-4算法采用完全符合ISO MPEG-4標(biāo)準(zhǔn)的OpenDivX Codec;畫質(zhì)優(yōu)秀,、容量?。徊シ怒h(huán)境簡單方便,;直接可以采用AVI文件進(jìn)行流媒體播放等應(yīng)用,。?
??? 三 音頻編碼標(biāo)準(zhǔn)?
??? 1. LPCM?
??? LPCM(線性脈沖編碼調(diào)制)是一種非壓縮音頻數(shù)字化技術(shù),是一種未壓縮的原音重現(xiàn),,在普通CD,、DVD及其他各種要求最高音頻質(zhì)量的場合中已經(jīng)得到廣泛的應(yīng)用。?
??? 各種應(yīng)用場合中的LPCM原理是一樣的,,區(qū)別在于采樣頻率和量化精度不同,。普通CD規(guī)格為16bit/44.1kHz,DVD的規(guī)格則有多種,,量化精度可分為16bit,、20bit、24bit,,采樣頻率分為48kHz,、96kHz。此外,,LPCM信號中可錄入杜比環(huán)繞聲信息,,供現(xiàn)有的杜比定向邏輯環(huán)繞聲系統(tǒng)使用。?
??? 2. MP3(MPEG Audio Layer-3)?
??? MP3是MPEG Audio Layer-3的簡稱,,是從MPEG-1標(biāo)準(zhǔn)衍生的,、開放的編碼方案,1993年由德國夫朗和費研究院和法國湯姆生公司合作發(fā)展成功,。?
??? MP3音頻壓縮技術(shù)是一種失真壓縮,,其原理是把聲音頻率中人耳幾乎聽不到的音域在音頻中去除,采用高效率的變換編碼音頻壓縮算法對聲音進(jìn)行壓縮,,從而使得文件體積大為縮小,,可達(dá)到12∶1的壓縮比。?
??? MP3的頻率范圍最高為44kHz,最低為20Hz,。在128Kbps的碼率下,,MP3可以達(dá)到接近CD音質(zhì)的聲音質(zhì)量。但是由于損失了音頻中的甚高,、甚低音部分(盡管人耳不是非常敏感),使MP3畢竟要比CD稍遜一些,。?
??? 3. WMA(Windows Media Audio)?
??? WMA為Windows Media Audio的縮寫,,是微軟公司制定的音樂文件格式。WMA Codec 是Microsoft音頻技術(shù)的首要Codec,。據(jù)微軟自身發(fā)表的聲明,,目前最新的版本W(wǎng)MA 9.0相對于WMA 8,在壓縮率上有著20%的提升,。?
??? WMA類似于MP3,,同樣是一種失真壓縮,損失了聲音中人耳極不敏感的甚高,、甚低音部分,。但與MP3相比較起來,仍然具有不少優(yōu)勢,。?
??? 1) 它具有與MP3相當(dāng)?shù)囊糍|(zhì),,但容量更小。?
??? 2) 更先進(jìn)的壓縮算法在給定速率下可獲得更好的質(zhì)量,。?
??? 3) 特別適合于低速率傳輸,。?
??? 4) 除了損失了的音頻成份外,WMA比起MP3在頻譜結(jié)構(gòu)上更接近于原始音頻,,因而相對起來具有更好的聲音保真度,。?
??? 4. AAC(Advanced Audio Coding)?
??? AAC是高級音頻編碼(Advanced Audio Coding)的縮寫。AAC是由動態(tài)圖像專家組(MPEG)開發(fā)的,,已經(jīng)被國際標(biāo)準(zhǔn)化組織(ISO)討論通過,,成為了MPEG-2國際標(biāo)準(zhǔn)的一部分,同時它也是一種開放的音頻編碼標(biāo)準(zhǔn),。?
??? (1)AAC的編碼原理及特點?
??? 1) AAC是一種高壓縮比的音頻壓縮算法,,但它的壓縮比要遠(yuǎn)超過較老的音頻壓縮算法,如AC-3,、MP3等,。并且其質(zhì)量可以同未壓縮的CD音質(zhì)相媲美。?
??? 2) 同其他類似的音頻編碼算法一樣,,AAC也是采用了變換編碼算法,,但AAC使用了分辨率更高的濾波器組,因此它可以達(dá)到更高的壓縮比。?
??? 3) AAC使用了臨時噪聲重整,、后向自適應(yīng)線性預(yù)測,、聯(lián)合立體聲技術(shù)和量化哈夫曼編碼等最新技術(shù),這些新技術(shù)的使用都使壓縮比得到進(jìn)一步的提高,。?
??? 4) AAC支持更多種采樣率和比特率,、支持1個到48個音軌、支持多達(dá)15個低頻音軌,、具有多種語言的兼容能力,、還有多達(dá)15個內(nèi)嵌數(shù)據(jù)流。?
??? 5) AAC支持更寬的聲音頻率范圍,,最高可達(dá)到96kHz,,最低可達(dá)8Hz,遠(yuǎn)寬于MP3 20-44kHz的范圍?
??? 6) 不同于MP3及WMA,,AAC幾乎不損失聲音頻率中的甚高,、甚低頻率成分,并且比WMA在頻譜結(jié)構(gòu)上更接近于原始音頻,,因而聲音的保真度更好,。專業(yè)評測中表明,AAC比WMA聲音更清晰,,而且更接近原音,。?
??? 7) AAC采用優(yōu)化的算法達(dá)到了更高的解碼效率,解碼時只需較少的處理能力,。?
??? (2)專業(yè)評價?
??? 1) AAC以128Kbps(立體聲)的速率對音樂進(jìn)行壓縮,,然后經(jīng)由專家辨認(rèn),結(jié)論是其結(jié)果同原始未壓縮時的聲音'區(qū)別不出來',。?
??? 2) AAC以96Kbps的速度壓縮音樂,,通常其壓縮后的質(zhì)量比MP3在128Kbps壓縮后的質(zhì)量還要高。AAC在128Kbps壓縮音樂后的性能比MP3在相同速度壓縮音樂后得到的性能高很多,。?
??? 3) AAC是唯一一個在歐洲廣播聯(lián)盟主辦的64Kbps聽力測試中被評為'優(yōu)秀'的因特網(wǎng)音頻數(shù)字多媒體編解碼器,。?
??? 4) 鑒于其卓越的性能和質(zhì)量,AAC已成為MPEG-4規(guī)范的核心,,同時它還是因特網(wǎng),、無線網(wǎng)以及數(shù)字廣播網(wǎng)領(lǐng)域中的新一代音頻數(shù)字解碼器的選擇。?
??? 四 靜態(tài)圖像壓縮標(biāo)準(zhǔn)?
??? 1. JPEG標(biāo)準(zhǔn)?
??? JPEG標(biāo)準(zhǔn),,即國際多灰度靜止圖像數(shù)字壓縮編碼標(biāo)準(zhǔn),,由JPEG專家組(Joint Photographic Experts Group)于1991年3月提出的ISO CD10918號建議草案而來,其標(biāo)準(zhǔn)號為ISO 10918-1,。JPEG是一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn),。?
??? (1)JPEG標(biāo)準(zhǔn)的組成部分?
??? JPEG標(biāo)準(zhǔn)包括基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮編碼,,基于DCT(離散余弦變換)和Fuffman編碼的有損壓縮算法兩個部分。前者不會產(chǎn)生失真,,但壓縮比很?。缓笠环N算法進(jìn)行圖像壓縮信息雖有損失,,但壓縮比可以很大,,例如壓縮20倍左右時,人眼基本上看不出失真,。目前我們對JPEG標(biāo)準(zhǔn)的應(yīng)用主要是其高壓縮比的有損壓縮算法,。?
??? (2)JPEG算法的三個基本步驟?
??? JPEG算法操作可分成以下三個基本步驟:?
??? 1) 通過離散余弦變換(DCT)去除數(shù)據(jù)冗余。?
??? 2) 使用量化表對DCT系數(shù)進(jìn)行量化,,量化表是根據(jù)人類視覺系統(tǒng)和壓縮圖像類型的特點進(jìn)行優(yōu)化的量化系數(shù)矩陣。?
??? 3) 對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小,,熵編碼采用Fuffman可變字長編碼,。?
??? (3)JPEG的應(yīng)用?
??? 鑒于JPEG優(yōu)良的品質(zhì),使得它在短短的幾年內(nèi)就獲得極大的成功,,目前絕大多數(shù)的圖像都是采用JPEG的壓縮標(biāo)準(zhǔn),,各類瀏覽器、圖片瀏覽處理工具均支持JPEG圖像格式,。同時由于JPEG格式的文件尺寸較小,,Web頁有可能以較短的下載時間提供大量精美的圖像,使得JPEG成為網(wǎng)絡(luò)上最受歡迎的圖像格式,。?
??? 2. JPEG2000標(biāo)準(zhǔn)?
??? 隨著多媒體應(yīng)用領(lǐng)域的激增,,傳統(tǒng)JPEG壓縮技術(shù)已無法滿足人們對多媒體圖像資料的要求。因此,,更高壓縮率以及更多新功能的新一代靜態(tài)圖像壓縮技術(shù) JPEG 2000 隨之誕生,。?
??? JPEG2000標(biāo)準(zhǔn)同樣由JPEG 組織負(fù)責(zé)制定。自1997年3月開始籌劃,,于2000年3月出臺,。其標(biāo)準(zhǔn)號為ISO 15444。?
??? (1)JPEG2000編碼原理?
????
??? JPEG 2000與傳統(tǒng) JPEG 最大的不同,,在于它放棄了 JPEG 所采用的以離散馀弦轉(zhuǎn)換(DCT)為主的區(qū)塊編碼方式,,而改采用以小波轉(zhuǎn)換(Wavelet transform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來,,分別加以控制及編碼,。?
??? (2)JPEG2000的優(yōu)點:?
??? 1) JPEG2000作為JPEG升級標(biāo)準(zhǔn),高壓縮比(低碼率)是其目標(biāo),,其壓縮率比JPEG高約 30%左右,。?
??? 2) JPEG2000同時支持有損和無損壓縮,其無損壓縮具有很好的實用價值,因此它適合保存重要圖片,。?
??? 3) JPEG2000的一個極其重要的特征就是采用小波變換后,,JPEG2000 能實現(xiàn)漸進(jìn)傳輸,這也就是我們常說的'漸現(xiàn)'特性,。它先傳輸圖像的輪廓,,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,,讓圖像由朦朧到清晰顯示,,而不必是像現(xiàn)在的 JPEG 一樣,由上到下慢慢顯示,。?
??? 4) JPEG2000能方便的實現(xiàn)對碼流的隨機(jī)存取與處理,,保證位錯誤的魯棒性。?
??? 5) JPEG2000支持所謂的'感興趣區(qū)域'特性,,你可以任意指定圖像上你感興趣區(qū)域的壓縮質(zhì)量,,還可以選擇指定的部份先解壓縮,這樣我們就可以很方便的突出圖片中的重點進(jìn)行瀏覽,。?
??? (3)JPEG2000圖片的壓縮?
??? 目前有很多公司,、機(jī)構(gòu)提供了JPEG2000的壓縮工具及編解碼器。主要有LuraWave SmartCompress Freeware for Windows,、Elecard Wavelet Image Compressor等,。其中以LuraTech的LuraWave SmartCompress 及相應(yīng)編碼器生成的LuraWave(lwf)格式最有名。?
??? (4)常用軟件對JPEG2000的支持?
??? 鑒于JPEG2000圖片不能直接通過一些常用軟件顯示的問題,,眾多廠家已經(jīng)開發(fā)出了各種的插件來解決該問題,。在這方面,同樣以LuraTech開發(fā)的插件最有名,。ACDSee 4.0以上的版本已經(jīng)能夠通過LuraTech的插件直接支持JPEG2000圖片(lwf格式)的顯示,。LuraTech公司還推出了一系列讓 PHOTOSHOP 、IE 等常用影像,、網(wǎng)絡(luò)軟件支持JPEG2000圖片的插件,,較有效解決了JPEG2000圖片不能直接通過一些常用軟件顯示的問題。