4.3 Lọc Streams
Một quá trình phổ biến trên các dòng là lựa chọn, hoặc lọc. Chúng tôi muốn chấp nhận những bộ dữ liệu trong dòng đáp ứng một tiêu chuẩn. Tuples chấp nhận được thông qua một quá trình như một dòng suối, trong khi bộ dữ liệu khác được giảm. Nếu tiêu chí lựa chọn là một tài sản của tuple có thể được tính (ví dụ, các thành phần đầu tiên là dưới 10), sau đó lựa chọn là dễ dàng để làm. Vấn đề trở nên khó khăn hơn khi các tiêu chí liên quan đến việc tra cứu cho các thành viên trong tập hợp. Nó là đặc biệt khó khăn, khi thiết lập đó là quá lớn để lưu trữ trong bộ nhớ chính. Trong phần này, chúng ta sẽ thảo luận về các kỹ thuật được gọi là "Bloom lọc" như là một cách để loại bỏ hầu hết các bộ dữ liệu không đáp ứng các tiêu chí.
đang được dịch, vui lòng đợi..