Việc phát hiện luật kết hợp thường được thực hiện trong hai giai đoạn. Giai đoạn đầu tiên tìm thấy tất cả
các tập phổ biến; tức là, bộ đáp ứng các ngưỡng hỗ trợ, và sau đó họ
được sau xử lý trong giai đoạn thứ hai để tìm ra quy tắc tin cậy cao. Các
giai đoạn trước đây là tính toán đắt tiền nhất, và nhiều nghiên cứu được
thực hiện trong việc phát triển các thuật toán hiệu quả cho nó. Một khảo sát so sánh tất cả các
kỹ thuật hiện tại được đưa ra trong [JHKK00]. Một tính năng quan trọng của các thuật toán nằm
trong phương pháp của họ về việc kiểm soát sự phức tạp hàm mũ của tổng số
các tập phổ biến (2 | I
|). Tóm lại, tất cả đều sử dụng tài sản chống-monotone của một tập phổ biến
hỗ trợ, trong đó nói rằng một tập phổ biến là thường xuyên chỉ khi tất cả các tiểu tập phổ biến của nó
là thường xuyên. Apriori thuật toán [AS94] tiên phong trong việc sử dụng tài sản này để
tìm kiếm một cách hệ thống các không gian hàm mũ của tập phổ biến. Trong một k lặp lại, nó
tạo ra tất cả các ứng cử viên k-tập phổ biến (có độ dài k) như vậy mà tất cả họ (k - 1) -
tập con thường xuyên. Số lần xuất hiện của các ứng cử viên sau đó được
tính vào cơ sở dữ liệu giao dịch, để xác định thường xuyên k-tập phổ biến. Hiệu quả
cấu trúc dữ liệu được sử dụng để thực hiện đếm nhanh.
đang được dịch, vui lòng đợi..