Năm 1993, Agrawal et al. [2] người đầu tiên đưa vấn đề của việc tìm kiếm thường xuyên itemsets trong mô hình của họ khai thác mỏ Hiệp hội quy tắc. Thật vậy, việc tìm kiếm thường xuyên itemsets đóng một vai trò quan trọng trong lĩnh vực khai thác dữ liệu. Thường xuyên itemsets là rất cần thiết cho nhiều dữ liệu khai thác vấn đề, chẳng hạn như việc phát hiện ra Hiệp hội quy tắc [3,12], mối tương quan dữ liệu [20,21], và tuần tự mẫu [18,23].Vấn đề khai thác mỏ itemset thường xuyên có thể được chính thức phát biểu như sau: Hãy để tôi là một tập hợp các mục khác biệt. Mỗi giao dịch T trong cơ sở dữ liệu D là một tập hợp con của tôi. Chúng tôi gọi X tôi một itemset. Một itemset với k mục được gọi là k itemset. Sự hỗ trợ của X, ký hiệu là supp(X), là các phần của các giao dịch có chứa X. Nếu supp(X) là không ít hơn một người dùng xác định hỗ trợ tối thiểu e, X được gọi là một itemset thường xuyên. Hãy để FI biểu thị các thiết lập của tất cả các itemsets thường xuyên. X đóng cửa nếu nó đã không có superset thích hợp với sự hỗ trợ tương tự. Hãy để FCI biểu thị các thiết lập của tất cả thường xuyên đóng itemsets [16,25]. X được gọi là một thường xuyên itemset tối đa nếu nó đã không có superset thích hợp mà là thường xuyên. Các thiết lập của tất cả itemsets tối đa thường xuyên được kí hiệu bởi MFI [1,14,4,6,9,10]. X là một chiều dài tối đa thường xuyên itemset nếu X có chứa một số lượng tối đa của các mục trong FI. Chính thức, nó có thể được định nghĩa như sau: cho D là một cơ sở dữ liệu giao dịch trên một tập hợp các mục khác biệt với tôi. Cho một người dùng xác định hỗ trợ tối thiểu e, một itemset X là một chiều dài tối đa thường xuyên itemset nếu supp (X) P e và cho tất cả itemset Y, nếu supp(Y) P e sau đó | X| P | Y|, nơi | Y| và | X| biểu thị số mục được chứa trong Y và X tương ứng.
đang được dịch, vui lòng đợi..
