當前位置首頁 > 行業資訊 > 技術應用 > 正文

非線性編輯系統中的數字視頻壓縮技術

發布日期:2015-04-06 來源: 壓縮機產業網 查看次數: 1025
核心提示:  數字視頻技術已廣泛地應用于演播室節目制作,例如編輯、特技效果等。但視頻數字化后的數據量非常巨大,例如1秒NTSC制式視頻
    
  數字視頻技術已廣泛地應用于演播室節目制作,例如編輯、特技效果等。但視頻數字化后的數據量非常巨大,例如1秒NTSC制式視頻流的數據量為超35格式的電影數據量約為9G bit字視頻的存儲、處理和傳輸來說,視頻壓縮是一項非常關鍵的技術。
  視頻壓縮技術除了利用空間冗余、頻譜冗余和心理視覺冗余對視頻圖像進行幀內壓縮外,還利用相鄰圖像幀之間的相似性而產生的時間冗余對視頻圖像進行幀間壓縮,進一步提高壓縮效率節目制作要求達到廣播級質量視頻數據進行精確到幀的隨機訪問頻壓縮標準雖然較多,但多數是用于視頻數據的傳輸一些標準可以用于節目制作,但僅為少數公司所支持(例如BetacamSX、DV DVCPRO等)。壓縮格式的兼容性給節目制作系統的設計和實現帶來較大的問題,本文主要分析了適用于節目制作的視頻壓縮技術Motion JPEG和MPEG2 PML的特點,以及方正視音頻制作系統中針對壓縮格式兼容性問題的解決方案。
  2基本概念2.1非線性編輯通常將基于計算機、專業視頻卡、高速硬盤的節目制作系統稱為非線性編輯系統,非線性編輯(以下簡稱NLE)是相對于線性編輯而言。
  人眼對亮度的敏感程度高于對色度的敏感程度,當觀看圖像的細節時,人眼對亮度差別較敏感,而對色度的差別較不敏感。ITUR BT.601演播室數字電視編碼參數建議標準利用了這一特點,將電視信號分解為一個亮度分量(Y)和兩個色度分量(CrCb),并給亮度分量分配更高的采樣頻率,亮度色度空間YCrCb形式與彩色空間RGB形式的關系為:計算機應用Motion JPEG是一種幀內壓縮算法,采用JPEG壓縮標準對視頻圖像序列中的每一幀圖像進行壓縮。
  YCrCb空間中對視頻數據進行壓縮處理,它采用兩個量化矩陣,一個量化矩陣對應亮度分量,另一個量化矩陣對應2個色度分量,并分配更多的數據位來表示視覺上更重要的亮度系數,從而把人眼的視覺特點融入到壓縮處理中。
  MPEG2主要是為視頻傳輸開發的,應用于節目制作還有許多問題,例如:圖像數據流的一個個GOP(圖像組)中包含具有獨立整幀信息的I幀和預測信息的P幀及B幀,存在多幀傳輸延時問題,難以實現幀精度視頻編輯處理最大數據傳輸率為15Mbps ,即使采用較小的GOP(圖像組),也難以提供演播室要求的節目質量4∶2∶0采樣需對色度數據進行插值,這樣經過多代(這里一代表示一個壓縮解壓縮周期)之后,圖像質量無法滿足節目制作的要求。
  MPEG2標準中增加了MPEG2 P ML子集,功能包括:通過縮短MPEG2數據流的GOP(最短時只有I幀),以滿足演播室對幀精度視頻編輯的要求保持了全色度帶寬,納入消隱行,每幀由576行增加到608行,突破15Mb s的限制,最高碼率增加到50Mb s ,能夠提供節目制作要求的廣播級質量同時支持4∶2∶2和4∶2∶0采樣,經過多代編解碼后,圖像質量仍能達到廣播級。
  3壓縮算法性能分析Motion JPEG是目前節目制作中使用最廣泛的壓縮標準,我們采用Matrox公司的DigiLE視頻卡實現視頻流的實時Motion JPEG壓縮解壓縮功能,組成原型系統以測試Motion JPEG壓縮算法的性能,得到如下結果。
  壓縮比對應的模擬視頻指標每GB存儲的視頻時間1分37秒由于僅采用幀內壓縮,便于進行幀精度的編輯,可以實現質量可調的有損壓縮。但由于沒有利用視頻流的時間冗余,因此壓縮比受到限制,當壓縮比較大時,圖像有明顯方塊效應。壓縮比小于8∶1時可以達到演播室要求的廣播級節目質量,為保證經過多次壓縮解壓縮后節目質量仍保持廣播級,壓縮比應小于4∶1.表1是Motion JPEG壓縮比、視頻質量、以及存儲空間之間的關系。
  對于圖像數據交換而言, Motion JPEG不是一個完整的結構, Motion JPEG數據流的定義是根據譯碼器為解壓縮數據流所需要的內容來定義的,因此Motion JPEG沒有標準的文件格式。例如ReelTime卡產生的壓縮數據不能由DigiLE卡解壓縮,反之亦然,這樣造成了不同數字視頻制作系統間數據交換的困難(注:ReelTime為Pinnacle公司生產的視頻卡,采用MotionJPEG壓縮算法,視頻質量達到廣播級,并且提供實時雙通道視音頻I O和標準的實時切換特技)。
  由于目前市場上還沒有支持MPEG2 PML壓縮標準的視頻卡,我們無法直接測試MPEG2 PML壓縮算法在節目制作方面的性能,這里僅引用Tek tronix公司提供的實驗數據對MPEG2 PML壓縮算法的性能做一個比較。
  MPEG2 PML的圖像質量數據率曲線存在一個拐點,當數據率小于8Mbps時,圖像質量下降將加快。在提供同樣圖像質量的情況下,MPEG2 PML用于多代編解碼的應用時(例如節目制作),4∶2∶2采樣提供比4∶2∶0更好的性能。
  只要遵守MPEG2 PML壓縮標準,基于不同視頻卡的節目制作系統間可以進行數據交換。在節目制作中采用MPEG2 PML壓縮標準還可以使節目采集(攝制)、存儲、傳輸、制作的數據格式統一起來,通過選擇不同數據率和GOP中的I P B幀結構,來適應不同的應用范圍,以減少因格式轉換造成的質量損失和時間延遲。
  4非線性編輯系統的設計根據以上分析,要解決視頻壓縮格式的不兼容性,最好辦法是使系統具有較強的硬件獨立性。我們設計并實現了一個基于Motion JPEG的非線性編輯系統,采用Matrox公司的DigiLE卡提供實時雙通道視音頻IO和實時切換特技,在系統設計中加入一統對特定視頻卡的依賴性,便于以后使系統能夠支持多種視頻硬件和壓縮格式,能夠隨著視頻硬件的發展,迅速地將系統移植到性能更好的視頻卡上,系統總體框架如圖1所示,應用層是NLE系統應用程序,硬件平臺層包括硬件廠家提供的視頻卡以及開發程序包,在我們的系統里是DigiLE和DigiLE API.
  硬件抽象層(HAL)采用部件對象模型(COM)技術實現,將視頻卡(DigiLE)提供的所有功能以面向對象的方法進行封裝。應用層不直接與DigiLEAPI打交晏陽:非線性編輯系統中的數字視頻壓縮技術先考慮它。它包括以下兩條:devClass定義了驅動程序的類,包括NIC driver vice),例如NT轉向器。
  bindable指定了ndisTransport類組件可以綁定到ndisdriver類組件, LmNetService類組件可以綁定到各組件的NetRules定義的是組件特定的綁定規則,它包括:class允許組件定義一個或多個新的組件類bindable允許組件定義更多可能的綁定組合type指明該組件所屬的類(或多個類),它使得NCPA判斷該組件屬于綁定層次的哪一層。
  當NCPA根據上述規則確定完所有的綁定關系后,就創建或更新鍵HKEY Linkage下的值,包括:Bind該組件將要綁定到的下層組件的設備名Export列出將要由該組件增加到NT對象名空間的設備名,以便其它組件存取Route這是一個字符串列表,每一個串描述了穿過由綁定形成的組件堆棧的確切通路。
  在系統啟動時, NT服務控制器使用注冊表中的信息,根據綁定的層次,從底端向上加載網絡組件。
  在每個組件被加載的時候,它們有機會進行初始化,它們通過讀取Bind子鍵下的信息知道應該綁定到哪一個下層組件上。
  4結語對于廣大志在從事NT網絡工作的計算機愛好者,本文給出了一個切入內幕的介紹,描述了組成一個NT網絡的各個部分,它們的功能,相互關系,它們是如何構成一個整體并向外提供系統服務的。由于NT網絡組成的復雜性,建議在實際工作中多借助有價值的參考資料北京:機械工業出版社, 1997.
  邵元慶。WindowsNT網絡系統[ M] .北京:電子工業出道,而是通過HAL提供的接口調用視頻卡的功能。
  這樣系統移植時只需修改硬件抽象層,而無需改動NLE系統應用程序的代碼,保證了移植的效率和系統的穩定性。
  硬件抽象層(HAL)包括播放、采集、壓縮解壓縮和HAL接口4個部件(component),如圖2所示,播放部件提供對視音頻素材和圖文字幕素材的播放功能,播放時可以加入多種實時特技,包括切換特技、位移、放縮、摳像、動態背景等,播放畫面同時在計算機屏幕和專業監視器上顯示采集部件提供手動采集和批處理采集功能,可以分別通過人工控制錄像機(VTR)或計算機遙控錄像機進行視音頻信號采集壓縮解壓縮部件可以將播放的視音頻信號通過壓縮生成視音頻文件存儲到硬盤上,便于以后的反復使用。HAL接口部件對播放、采集、壓縮解壓縮三個部件提供的功能進行封裝,為應用層提供一個統一的接口,由于部件對象模型(COM)中不同的部件可以獨立進行升級而不會互相影響,將HAL接口做為一個獨立的部件保證了面向應用層接口的一致性。
  5結束語數字視頻壓縮是非線性編輯系統中的關鍵技術,Motion JPG和MPEG2 PML是兩種使用于節目制作的視頻壓縮格式,由于Motion JPEG不同硬件平臺之間的不兼容性以及不同壓縮格式之間的不兼容性,為非線性編輯系統的設計和實現帶來較大的困難,針對這一問題在非線性編輯系統的設計中加入硬件抽象層,減少應用系統對視頻硬件的依賴性,是較好的解決辦法。
  

網頁評論共有0條評論

在線客服系統
排列五合买