1 資料壓縮 Data Compression 資料壓縮可節省空間與加快網路傳送速度
2 學習目標 了解壓縮的意義 了解壓縮的目的 了解壓縮的格式 了解壓縮程式 了解如何壓縮與解壓縮 了解影像壓縮 了解失真與非失真壓縮 了解聲音壓縮 了解 MP3 的製作
3 前言 壓縮 (Compression): 是將原始的檔案資料, 透過各種不同的數學演算法處理後, 使檔案資料所需的儲存空間減少 解壓縮 (Decompression) : 將壓縮後的資料恢復原狀
4 章節 壓縮的目的 資料壓縮的種類 常見的檔案壓縮與壓縮程式 靜態影像的壓縮 聲音的壓縮 MP3 簡介 動畫影像的壓縮
5 壓縮的目的 減少檔案佔有的儲存空間 : 透過資料壓縮的方式可達到善用有限的儲存空間, 並常常有將資料妥善整理的效果 使檔案更好攜帶傳遞 : 太大的檔案都將影響區域網路傳輸品質與網頁作品的呈現, 透過資料壓縮的技巧將可改善這些問題, 且壓縮軟體也有提供保密的功能, 增加資料傳遞的安全性
Data Compression- Entropy Entropy is the measure of information content in a message. Messages with higher entropy carry more information than messages with lower entropy. How to determine the entropy Find the probability p(x) of symbol x in the message The entropy H(x) of the symbol x is: H(x) = - p(x) log 2 p(x) The average entropy over the entire message is the sum of the entropy of all n symbols in the message
7 熵 (Entropy) - 資訊理論 熵的概念最早起源於物理學, 用於度量一個熱力學系統的無序程度 在資訊理論裡面, 熵是對不確定性的測量 但是在資訊世界, 熵越高, 則能傳輸越多的資訊, 熵越低, 則意味著傳輸的資訊越少
8 熵 (Entropy) - 資訊理論 如果壓縮是無損的, 即通過解壓縮可以百分之百地恢復初始的消息內容, 那麼壓縮後的訊息攜帶的資訊和未壓縮的原始訊息是一樣的多 而壓縮後的訊息可以通過較少的位元傳遞, 因此壓縮訊息的每個位元能攜帶更多的資訊, 也就是說壓縮資訊的熵更加高 熵更高意味著比較難於預測壓縮訊息攜帶的資訊, 原因在於壓縮訊息裡面沒有冗餘, 即每個位元的訊息攜帶了一個位元的資訊
9 熵 (Entropy) - 資訊理論 夏農的資訊理論揭示了, 任何無損壓縮技術不可能讓一位元的訊息攜帶超過一位元的資訊 訊息的熵乘以訊息的長度決定了訊息可以攜帶多少資訊 克勞德 艾爾伍德 夏農 (Claude Elwood Shannon,1916 年 4 月 30 日 - 2001 年 2 月 26 日 ), 美國數學家 電子工程師和密碼學家, 被譽為資訊理論的創始人 夏農是密西根大學學士, 麻省理工學院博士
資料壓縮的種類 10
11 資料壓縮的種類 無失真壓縮法 (Lossless compression) 例如 PCX GIF TIFF TGA PNG 等影像格式, 或者是 ZIP,RAR 等的資料壓縮都屬於這類 破壞性壓縮法 (Lossy compression) 例如 JPEG(Joint Photographic Coding Expert Group) VQ(Vector Quantization) 等影像檔案,MP 音樂檔案等都是屬於這類
12 資料壓縮的種類 資料在經過壓縮後, 可以透過解壓縮 ( 或稱反壓縮, Decompression uncompression) 的演算法再還原 如果還原後的資料或圖像和原始的資料或圖像沒有差異這種方式叫做 無失真壓縮法 (Lossless compression) 還原後的資料或圖像, 因為提高壓縮比率, 使得和原始資料有少許差異卻可得到較高的壓縮效果, 這種叫做 破壞性壓縮法 (Lossy compression)
Run-length encoding Simplest method of compression.
Huffman Coding Example
Huffman Coding Encoding Decoding
16 常見的檔案壓縮與壓縮程式 ZIP RAR
17 壓縮程式 ZIP: 運用最廣的檔案壓縮格式, 從 DOS 系統 Unix 系統, 到現在的 Windows 系統都有其相關的程式來進行 ZIP 的檔案壓縮與解壓縮 壓縮檔案的時候速度會比 RAR 格式的檔案更快
18 壓縮程式 RAR: RAR 格式在大多數情況下比 ZIP 能夠提供更好的壓縮比, 還支援其他壓縮格式的壓縮檔 使用最多的程式就是 WINRAR WinRAR 下載試用版本網址 : http://www.rarlab.com/
19 靜態影像的壓縮 無失真壓縮法的檔案格式 破壞性的壓縮方式 關於壓縮影像的一些建議 WindowsXP 上轉圖檔工具
20 無失真壓縮法的檔案格式 PCX: 是 ZSOFT 公司在開發圖像處理軟件 Paintbrush 時開發的一種格式 以長度編碼法 (Run Length Encoding ) 做為檔案壓縮的核心技術 優點是演算法簡單, 所以被廣泛的運用在影像儲存方面 缺點則是不能保持一定的壓縮水準, 有時遇到重複性極低的影像資料
21 無失真壓縮法的檔案格式 TGA: 由 AT&T 所研發 在做影像擷取時以一列像素 (Pixel) 為基本單位 並以類似 PCX 的變動長度編碼法來做壓縮, 具備儲存全彩圖形的能力 優點是比 PCX 可儲存更多的圖形模式, 檔案架構的延展性亦較高, 使用者可自定 TGA 格式來做壓縮儲存的動作
22 無失真壓縮法的檔案格式 TIFF(Tagged Image File Format) : 是由 Aldus Corporation 的 Aldus Developers 於 1986 年所公佈的, 特色是支援多種壓縮策略 包括藍波 - 立夫 - 衛曲編碼法 (Lempel-Ziv-Welch) 霍夫曼編碼法 (Huffman Coding) 及變動長度編碼法 (Run Length Encoding), 並對各種色彩模式都支援 廣泛的被運用在各種平台上 由於太過多變與複雜, 所以很難有程式可以完全處理其特點
23 無失真壓縮法的檔案格式 GIF(Graphics Interchange Format) : 是 CompuServe 在 1987 年所建的影像壓縮格式 檔案格式的著名特性是它的壓縮率, 以及可儲存並顯示多個影像 壓縮方法是 藍波 - 立夫 - 衛曲編碼法, 由於只提供 256 色來表示其圖案, 所以比較適合用來儲存比較不複雜的影像 可利用像 Ulead GIF Animator 的軟體來製作簡易的動態檔案
24 無失真壓縮法的檔案格式 PNG(Portable Network Graphics) : 是新興的一種靜態影像格式 Thomas Boutell Tom Lane 等人為了取代 GIF 與 JPEG 所發展 具有 GIF 和 JPEG 的許多特點, 還可支援用於遮罩的 alpha 色頻 色彩校正的 gamma 並可儲存 48 位元的彩色影像 利用類似 Jpeg 的壓縮方式, 卻是非失真方式的模式 無法製作動態檔案
25 破壞性的壓縮方式 JPEG(Joint Photographic Experts Group) : 由國際標準組織 (International Organization for Standardization, 簡稱 ISO) 及國際電話電報諮詢委員會 (International Telegraph and Telephone Consultative Committee, 簡稱 CCITT) 共同擬定 可支援 24 位元全彩影像, 一千六百多萬色, 影像品質很高 使用了數位餘弦轉換法 (Discrete Cosine Transform, 簡稱 DCT) 將影像資料先切割成 8X8 各區域, 再依照每一個區域中的資料較不重要的色彩部份予以去除, 僅保留重要明度的資訊, 以達到高壓縮率的目的 是目前網路使用率最高的一種
26 破壞性的壓縮方式 VQ(Vector (Quantization) : 是一種非常基本的失真影像壓縮法 先將壓縮的影像分割成許多大小相同的小方格, 按著查詢事先完成的編碼書 (Code book), 找出跟每一個影像方格最接近 ( 即最相似 ) 的編碼字 (Code word), 再利用這些最接近的編碼字之索引值, 組成一張索引表, 如此即完成影像的壓縮, 而這張索引表即是 VQ 壓縮後的結果 VQ 的壓縮率通常是十六分之一 ( 約 6%) VQ 的影像品質決定於編碼書內編碼字的數量之多寡及代表性之優劣
27 MP3- 數位音訊編碼和失真壓縮格式 是 ISO-MPEG Audio Layer-3 的簡稱 1987 年的數位音訊廣播 (Digital Audio Broadcasting) 計畫中, 所發明出來的音訊壓縮演算法 1991 年, 位於德國埃爾朗根的研究組織 Fraunhofer-Gesellschaft 的一組工程師發明和標準化 它被設計來大幅降低音訊資料量 捨棄 PCM 音訊資料中, 對人類聽覺不重要的資料, 從而達到了壓縮成較小的檔案
28 動畫影像的壓縮 國際標準組織 (International Standard Organization, ISO) 的動畫專家小組 (Motion Pictures Experts Group,MPEG) 制定的視訊標準, 稱為 MPEG 目前主要的規格有 MPEG-1 MPEG-2 MPEG-4 MPEG-7 還有正在發展中的 MPEG-21
29 動畫影像的壓縮 MPEG-1: 主要用於一些電腦遊戲, 以及 1.1 及 2.0 版 Video CD MPEG-2: 主要被用來製作 DVD MPEG-3: 原本是想要應用於 High-Definition TV (HDTV), 但是 MPEG-2 的訊號和解碼的方式, 可以涵蓋 處理這些高頻寬的訊號, 因此 MPEG3 便併入 MPEG2 規格之中
30 動畫影像的壓縮 MPEG-4:1999 年研發團隊使用蘋果電腦的 Quicktime 規格作為檔案結構的基礎, 發展出這個壓縮標準 最常見於網路串流影音 MPEG-7: 焦點放在描述影像資料的格式上 目的是希望使用者能夠快速且有效地搜索出所需的各種不同類型的音訊 視訊資料 建立在 XML 的基礎上, 故其被稱作多媒體內容描述介面或 MCDI(Multimedia Content Description Interface)