Thuật toán: Apriori. Tìm tập phổ biến cách sử dụng một phương pháp tiếp cận trình độ khôn ngoan lặp dựa trên thế hệ ứng cử viên.
Input:
D, một cơ sở dữ liệu của các giao dịch;
min sup, ngưỡng hỗ trợ tối thiểu số.
Output: L, tập phổ biến trong D.
Phương pháp:
(1) L1 = tìm thấy thường xuyên 1-tập phổ biến (D); (2) cho (k = 2; Lc-1 / = φ; k ++) {
(3) Ck = apriori gen (Lk-1);
(4) cho mỗi giao dịch t ∈ D {// quét D cho đếm
(5 ) Ct = tập hợp con (Ck, t); // Có được các tập con của t là các ứng viên
(6) cho mỗi ứng viên c ∈ Ct
(7) c.count ++;
(8)}
(9) Lc = {c ∈ Ck | c.count ≥ min sup}
(10) }
(11) return L = ∪k Lc;
thủ tục apriori gen (Lc 1: thường xuyên (k - 1) -itemsets)
(1) cho mỗi tập phổ biến l1 ∈ Lk-1
(2) cho mỗi tập phổ biến l2 ∈ Lk-1
(3) if (l1 [1] = l2 [1]) ∧ (l1 [2] = l2 [2])
∧ ... ∧ (l1 [k - 2] = l2 [k - 2]) ∧ (l1 [k - 1] <l2 [k - 1]) sau đó {
(4) c = l1 ✶ l2; // Tham gia bước: tạo ra các ứng cử viên
(5) nếu có tập con không thường xuyên (c, Lk-1) sau đó
(6) xóa c; // Mận bước: loại bỏ ứng cử viên không kết quả
(7) khác thêm c để Ck;
(8)}
(9) trở Ck;
thủ tục có tập con không thường xuyên (c: ứng cử viên k-itemset;
Lk-1: thường xuyên (k - 1) - tập phổ biến); // Sử dụng kiến thức
(1) cho mỗi (k - 1) -subset s của c
(2) nếu s / ∈ Lk-1 sau đó
(3) trả về TRUE;
(4) trả về FALSE;
Hình 6.4 Thuật toán Apriori để khám phá thường xuyên tập phổ biến để khai thác luật kết hợp Boolean.
Một thủ tục có thể được gọi là để tạo ra các luật kết hợp từ các tập phổ biến. Như một thủ tục được mô tả trong phần 6.2.2.
Các thủ tục apriori gen thực hiện hai loại hành động, cụ thể là, tham gia và mận, như được mô tả trước đây. Trong thành phần tham gia, Lk-1 được nối với Lk-1 để tạo ra các ứng cử viên tiềm năng (bước 1-4). Các thành phần prune (bước 5-7) sử dụng tài sản Apriori
để loại bỏ các ứng cử viên có một tập hợp con đó không phải là thường xuyên. Các thử nghiệm cho các tập con không thường xuyên được thể hiện trong quy trình có tập con không thường xuyên.
đang được dịch, vui lòng đợi..
