Trong bối cảnh của vấn đề miền trang web phân loại của chúng tôi, mỗi nở
flter đại diện cho một loại web. Các flter được xây dựng như là một mảng của m bit.
Chúng tôi chọn k hàm băm độc lập. Mỗi chức năng sẽ vạch một từ khóa
cho một phần tử mảng trong khoảng 1 m. Lý do cho việc lựa chọn k hàm băm độc lập là để giảm va chạm. Nó có thể cho một hàm băm duy nhất để băm hai từ khóa khác nhau vào cùng một khe cắm (hoặc vị trí bit) và
gây ra một vụ va chạm. Trong một trường hợp như vậy, các bit không thể đại diện cho một từ khóa duy nhất.
Tuy nhiên, với nhiều hơn một chức năng băm, một từ khóa được biểu diễn như là một tập hợp
của các bit và do đó làm giảm đáng kể xác suất va chạm. Trong nở phổ biến
triển khai flter, các hàm băm thường được sử dụng bao gồm Jenkins
băm, Murmur băm, Fowler-Noll-Võ (FNV) loạt băm, và MD5 băm.
Hình 5-1 minh họa việc xây dựng một flter nở cho một thể loại web
chứa bốn từ khoá và ba chức năng băm độc lập.
đang được dịch, vui lòng đợi..
