2.3.2 Xác suất Mô hình
Mô hình thống kê đơn giản cho nguồn là giả định rằng mỗi lá thư được tạo ra bởi
các nguồn độc lập của từng bức thư khác, và từng xảy ra với xác suất như nhau.
Chúng ta có thể gọi đây là mô hình của sự thiếu hiểu biết, vì nó sẽ nói chung là chỉ có ích khi chúng ta biết
gì về nguồn gốc. (Tất nhiên, đó thực sự có thể là đúng, trong trường hợp này chúng ta có một thay
tên không may cho các mô hình!) Các bước tiếp theo trong sự phức tạp là để giữ sự độc lập
giả định, nhưng loại bỏ các giả định xác suất bằng nhau và gán một xác suất
xảy ra để mỗi chữ cái trong bảng chữ cái. Đối với một nguồn mà tạo ra chữ từ một bảng chữ cái
? =? A1? A2? ? ? ? ? aM ?, chúng ta có thể có một mô hình xác suất? =? P? A1 ?? P? A2 ?? ? ? ? ? P? AM ??.
Với một mô hình xác suất (và các giả định độc lập), chúng ta có thể tính toán
entropy của nguồn sử dụng phương trình (2.4). Như chúng ta sẽ thấy trong các chương tiếp theo sử dụng
các mô hình xác suất, chúng ta cũng có thể xây dựng một số mã rất hiệu quả để đại diện cho các chữ cái
trong?. Tất nhiên, những mã này chỉ hiệu quả nếu giả định toán học của chúng tôi là phù hợp
với thực tế
đang được dịch, vui lòng đợi..
