Nguyên tắc cơ bản của đa phương tiện, chương 7Chương 7Thuật toán nén lossless7.1 giới thiệu7.2 khái niệm cơ bản của lý thuyết thông tin7.3 quản-độ dài mã hóa7.4 biến-độ dài mã hóa (VLC)7,5 dictionary dựa trên mã hóa7,6 mã hóa số học7.7 hình ảnh lossless nén7.8 tiếp tục thăm dò1 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 77.1 giới thiệu• Nén: quá trình mã hóa mà sẽ có hiệu quảgiảm số lượng bit cần thiết để đại diện cho một sốthông tin.Mã hóa(nén)Bộ giải mã(giải nén)Lưu trữ hoặcmạng lướiĐầu vào đầu radữ liệu dữ liệuHình 7.1: Một chương trình nén dữ liệu nói chung.2 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Giới thiệu (cont 'd)• Nếu các quá trình nén và giải nén gây nothông tin giảm cân, sau đó các chương trình nén là lossless;Nếu không, nó là lossy.• Tỷ lệ nén:tỉ lệ nén =B0B1(7.1)B0-số bit trước khi nénB1-số bit sau khi nén3 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 77.2 khái niệm cơ bản của lý thuyết thông tin• Entropy η của một nguồn thông tin với chữ cái S ={s1, s2,..., sn} là:Η = H (S) =n!i = 1Pi log21 pi(7.2)= −n!i = 1Pi log2 pi (7.3)Pi-xác suất biểu tượng si sẽ xảy ra trong S.log2 1Pi-cho biết số lượng thông tin (thông tin tựtheo định nghĩa của Shannon) chứa trong si, tương ứngsố lượng bit cần thiết để mã hóa si.4 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Phân phối của cường độ cấp độ xám0 0255 25512/31/31/256(a) (b).tôi tôipi piHình 7.2 Histograms cho hai cấp độ màu xám hình ảnh.• Hình 7.2(a) cho thấy biểu đồ của một hình ảnh với các phân phối đồng đều của cường độ xám cấp, ví dụ, ∀i pi = 1/256.Do đó, dữ liệu ngẫu nhiên của hình ảnh này là:log2 256 = 8 (7.4)5 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Entropy và mã dài• Có thể nhìn thấy ở Eq. (7.3): entropy η là một weighted-tổng hợptrong điều khoản log2 1Pi; do đó, nó đại diện cho số lượng trung bìnhthông tin cho mỗi biểu tượng trong mã nguồn S.• Η dữ liệu ngẫu nhiên chỉ định ràng buộc thấp nhất số bit để mã mỗi biểu tượng thuộc S, tức là, Trung bìnhΗ ≤ ¯ l (7,5)¯ l - độ dài trung bình (đo bằng các bit) của các codewordssản xuất bởi các bộ mã hóa.6 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 77.3 quản-độ dài mã hóa• Nguồn memoryless: một nguồn thông tin được phân phối một cách độc lập. Cụ thể, giá trị của các biểu tượng hiện tạikhông phụ thuộc vào giá trị của xuất hiện trước đóCác biểu tượng.• Thay vì giả định nguồn memoryless, chiều dài chạy mã hóa(RLC) khai thác bộ nhớ hiện diện trong các nguồn thông tin.• Các lý do cho RLC: nếu các nguồn thông tin có tính chất biểu tượng có xu hướng để tạo thành các nhóm liên tục, sau đó như vậybiểu tượng và chiều dài của các nhóm có thể được mã hoá.7 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 77.4 biến-độ dài mã hóa (VLC)Thuật toán Shannon-Fano-một cách tiếp cận từ trên xuống1. sắp xếp biểu tượng theo tần số đếm của họCác sự kiện.2. đệ quy các biểu tượng phân chia thành hai phần, mỗi khoảng cùng một số đếm, cho đến khi tất cả các bộ phận chứa chỉ có một biểu tượng.Ví dụ: mã hóa của "Xin CHÀO"Biểu tượng H E L OĐếm 1 1 2 1Tần số của các biểu tượng trong "Xin CHÀO".8 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7L:(2)(5)H,E,O:(3)(a)0 1(b)L:(2)(5)H:(1) E,O:(2)(3)0 10 1L:(2)O:(1)(5)E:(1)H:(1)(c)(2)(3)0 10 10 1Hình 7.3: Mã hóa cây cho HELLO của Shannon-Fano.9 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Bảng 7.1: Kết quả thực hiện Shannon-Fano trên HELLOBiểu tượng tính log2 1PiMã số bit được sử dụngL 2 1.32 0 2H 1 2,32 10 2E 1 2,32 110 3O 1 2,32 111 3TỔNG số bit: 1010 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7(5)(a)L,H:(3) E,O:(2)0 1(5)(3)H:(1) E:(1) O:(1)(2)L:(2)0 1(b)0 10 1Hình 7.4 mã hóa một cây cho HELLO của Shannon-Fano.11 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Bảng 7.2: Một kết quả thực hiện Shannon-Fanotrên HELLO (xem hình 7.4)Biểu tượng tính log2 1PiMã số bit được sử dụngL 2 1.32 00 4H 1 2,32 01 2E 1 2,32 10 2O 1 2,32 11 2TỔNG số bit: 1012 Li & Drew! c Prentice Hall 2003Fundamentals đa phương tiện, chương 7Mã hóa HuffmanThuật TOÁN 7.1 các thuật toán mã hóa Huffman-một cách tiếp cận bottomup1. khởi tạo: Đặt tất cả các biểu tượng trên một danh sách được sắp xếp theotần số của họ đếm.2. lặp lại cho đến khi danh sách chỉ có một biểu tượng còn lại:(1) từ danh sách lựa chọn các biểu tượng hai với số lượng tần số thấp nhất.Tạo thành một subtree Huffman có các biểu tượng hai như nút convà tạo ra các nút cha mẹ.(2) Ấn định tổng số trẻ em
đang được dịch, vui lòng đợi..