4.4.3 kết hợp các ước tính
thật không may, có là một cái bẫy liên quan đến các chiến lược cho kết hợp các ước tính của m, số lượng các yếu tố khác biệt, mà chúng tôi có được bằng cách sử dụng nhiều chức năng băm different. Chúng tôi giả định chính sẽ là rằng nếu chúng tôi có mức trung bình của giá trị 2R rằng chúng tôi nhận được từ mỗi hàm băm, chúng tôi sẽ nhận được một giá trị đó phương pháp tiếp cận đúng m, các chức năng băm thêm chúng tôi sử dụng. Tuy nhiên, đó không phải là trường hợp, và lý do đã làm với influence một overestimate đã trên mức trung bình. Xem xét một giá trị của r sao cho 2r là lớn hơn nhiều so với m. Đó là một số p xác suất mà chúng tôi sẽ khám phá ra r là số 0, lớn nhất của ở phần cuối của giá trị băm cho bất kỳ yếu tố dòng m. Sau đó, xác suất của finding r 1 là số 0 của, lớn nhất thay vào đó là ít p/2. Tuy nhiên, nếu chúng ta tăng bởi 1 số 0 vào một giá trị băm, giá trị của 2R đôi. Do đó, sự đóng góp từ mỗi R lớn nhất có thể với giá trị kỳ vọng của 2R phát triển như R phát triển, và giá trị kỳ vọng của 2R là thực sự infinite.3 một cách khác để kết hợp các ước tính là phải trung bình tất cả ước tính. Trung bình không phải là affected bởi giá trị outsized thỉnh thoảng của 2R, để lo lắng mô tả ở trên mức trung bình nên không mang với trung bình. Unfortu-nately, suffers trung bình từ một khiếm khuyết: nó luôn luôn là một sức mạnh của 2. Vì vậy, không có vấn đề bao nhiêu chức năng băm chúng tôi sử dụng, nên giá trị chính xác m nằm giữa hai cường quốc của 2, nói 400, sau đó nó sẽ không thể để có được một ước tính gần gũi. Đó là một giải pháp cho vấn đề, Tuy nhiên. Chúng tôi có thể kết hợp hai phương pháp. Đầu tiên, nhóm chức năng băm vào nhóm nhỏ, và mất của họ trung bình. Sau đó, mất trung bình Trung bình. Đó là sự thật rằng một 2R outsized thỉnh thoảng sẽ thiên vị một số các nhóm và làm cho họ quá lớn. Tuy nhiên, tham gia trung vị của nhóm trung bình sẽ làm giảm influence này effect gần như để không có gì. Hơn nữa, nếu các nhóm mình đủ lớn, sau đó trung bình có thể là về cơ bản là bất kỳ số lượng, mà cho phép chúng tôi tiếp cận m giá trị đích thực miễn là chúng tôi sử dụng chức năng băm đủ. Để đảm bảo rằng bất kỳ là có thể có thể được lấy, nhóm nên kích thước tối thiểu một nhiều nhỏ của log2 m.
đang được dịch, vui lòng đợi..