Vấn đề này là tiếp tục làm trầm trọng hơn bởi thực tế là ngộ khác nhau của nguồn
đầu ra có thể thay đổi đáng kể về mô hình lặp đi lặp lại. Vì vậy, mô hình hóa ngữ cảnh
trong các chương trình nén văn bản có xu hướng được một chiến lược thích ứng trong đó xác suất cho
biểu tượng khác nhau trong các bối cảnh khác nhau được cập nhật ngay khi họ đang gặp phải. Tuy nhiên,
điều này có nghĩa rằng chúng tôi sẽ thường xuyên gặp phải những biểu tượng chưa được gặp phải trước khi cho
bất kỳ bối cảnh nhất định (điều này được gọi là vấn đề tần số zero). Càng lớn
bối cảnh, thường xuyên hơn này sẽ xảy ra. Vấn đề này có thể được giải quyết bằng cách gửi mã
để cho thấy các biểu tượng sau đây đã bị bắt gặp lần đầu tiên, tiếp theo là
mã chuẩn bị trước cho biểu tượng đó. Điều này sẽ làm tăng đáng kể độ dài của mã
cho các biểu tượng trên xuất hiện đầu tiên của mình (trong bối cảnh nhất định). Tuy nhiên, nếu tình trạng này không
xảy ra quá thường xuyên, các phí liên quan đến sự cố như vậy sẽ là rất nhỏ so với
tổng số các bit được sử dụng để mã hóa đầu ra của nguồn. Thật không may, trong bối cảnh dựa trên
mã hóa, vấn đề tần số zero được gặp thường xuyên, đủ để chi phí là
một vấn đề, đặc biệt là cho các bối cảnh còn. Giải pháp cho vấn đề này được trình bày bởi ppm
(dự đoán với trận đấu một phần) thuật toán và các biến thể của nó (được mô tả chi tiết trong Chương 6).
đang được dịch, vui lòng đợi..
