Trước khi các tiện ích cao vấn đề khai thác tập phổ biến đã được chính thức đề xuất [25] như trên, một biến thể của vấn đề
đã được nghiên cứu, cụ thể là vấn đề giải nén phần tập phổ biến [6, 13, 12] mà không thay đổi định nghĩa các
tiện ích bên ngoài của từng hạng mục như 1. ZP [6], ZSP [6], FSH [13], ShFSH [12], và DCG [11] thuật toán cho phần
khai thác tập phổ biến cũng có thể được sử dụng để tôi tập phổ biến tiện ích cao. Kể từ khi tài sản đóng cửa đi xuống không thể được áp dụng trực tiếp, Liu et al. đề xuất một tài sản quan trọng [17] cho cắt tỉa không gian tìm kiếm các tiện ích cao khai thác tập phổ biến vấn đề. Fig. 3 cho thấy các tiện ích giao dịch trọng của tất cả 1 tập phổ biến. Ví dụ, itemset {f} được chứa trong T4 và T6, và do đó TWU ({f}) = tu (T4) + tu (T6) = 9 + 18 = 27.If một minutil bằng 30, tất cả các supersets {f} không cao ích theo tài sản 1. Các thuật toán hai giai đoạn [18, 17] đầu tiên thông qua tài sản 1 để tỉa không gian tìm kiếm. Sau đó, các hạng mục bị cô lập loại bỏ chiến lược (IIDs) được đề xuất [14], và các chiến lược có thể được kết hợp trong các thuật toán trên để cải thiện hiệu suất của họ, ví dụ, FUM [14] và DCG + [14] thuật toán tốt hơn ShFSH và DCG, tương ứng. ZP, ZSP, FSH, ShFSH, DCG, Hai-pha, FUM, và DCG + mỏ tập phổ biến tiện ích cao như Apriori nổi tiếng thuật toán [4] mìn tập phổ biến. Với một cơ sở dữ liệu, trước hết, tất cả 1 tập phổ biến là ứng cử viên tập phổ biến tiện ích cao. Sau khi quét các cơ sở dữ liệu, các thuật toán loại bỏ không hứa hẹn 1-tập phổ biến và tạo ra 2 tập phổ biến từ còn lại 1-tập phổ biến như ứng cử viên tập phổ biến cao. Sau khi quét thứ hai trên cơ sở dữ liệu, không hứa hẹn 2 tập phổ biến được loại bỏ và 3 tập phổ biến như các ứng cử viên được tạo ra từ còn lại 2 tập phổ biến .. Các thủ tục được thực hiện lặp đi lặp lại cho đến khi không có ứng cử viên itemset tạo ra.
đang được dịch, vui lòng đợi..