4.6.6 Giảm Lỗi
Thay vì cho phép một hoặc hai của mỗi thùng kích thước, giả sử chúng ta cho phép một trong hai r-1 hoặc r của từng kích thước ngày càng tăng theo cấp số nhân 1,2,4, ..., đối với một số nguyên r> 2 . Để đại diện cho bất kỳ số có thể có của 1, chúng ta phải thư giãn tình trạng này cho thùng kích thước 1 và thùng kích thước lớn nhất hiện nay, có thể có bất kỳ số, từ 1 đến r, xô các kích cỡ. Các quy tắc để kết hợp xô về cơ bản giống như trong mục 4.6.5. Nếu chúng ta có r + 1 thùng kích thước 2j, kết hợp cả hai tận cùng bên trái vào một cái xô có kích thước 2j 1. Có thể, lần lượt, gây ra có được r + 1 thùng kích thước 2j +1, và nếu như vậy, chúng tôi tiếp tục kết hợp thùng kích thước lớn hơn. Đối số được sử dụng trong mục 4.6.4 cũng có thể được sử dụng ở đây. Tuy nhiên, do có nhiều thùng kích thước nhỏ hơn, chúng ta có thể có được một mạnh mẽ ràng buộc về lỗi. Chúng ta đã thấy có các sai số tương đối lớn nhất xảy ra khi chỉ có một 1 từ xô tận cùng bên trái b là trong phạm vi truy vấn, và do đó chúng tôi đánh giá quá cao số thật. Giả sử thùng b có kích thước 2j. Sau đó, số lượng thật sự là ít nhất
154 CHƯƠNG 4. KHAI THÁC dòng dữ liệu
Bucket kích cỡ và Ripple-Tiến bộ cộng
Có một mô hình để phân phối các thùng kích thước như chúng tôi thực hiện các thuật toán cơ bản của mục 4.6.5. Hãy suy nghĩ của hai xô kích thước 2j như một "1" ở vị trí j và một xô kích thước 2j là "0" ở vị trí đó. Sau đó là 1 của đến trong dòng suối, thùng kích thước sau mỗi 1 hình thức số nguyên nhị phân liên tiếp. Các chuỗi dài thỉnh thoảng kết hợp xô là tương tự như các gợn sóng dài thỉnh thoảng mang khi chúng ta đi từ một số nguyên như 101.111-110.000. Các ước lượng quá cao là 2j-1 -1. Do đó, lỗi phân đoạn là không có vấn đề gì k là, phần này được bao bọc bởi trên 1 / (r - 1). Như vậy, bằng cách chọn r đủ lớn, chúng ta có thể hạn chế lỗi cho bất kỳ ǫ mong muốn> 0.
đang được dịch, vui lòng đợi..