3. CÁC THUẬT TOÁN CỦA KHAI THÁC MỎ ITEMSET THƯỜNG XUYÊNChúng tôi phân loại các thuật toán đại diện tám thành ba nhóm. Nhóm đầu tiên là các dự kiến sẽ dựa trên hỗ trợ thường xuyên thuật toán. Các thuật toán này nhằm mục đích tìm tất cả các dự kiến sẽ dựa trên hỗ trợ thường xuyên itemsets. Đối với mỗi itemset, các thuật toán này chỉ xem xét hỗ trợ dự kiến để đo tần số của nó. Sự phức tạp của máy tính hỗ trợ dự kiến của một itemset là O(N), trong đó N là số lượng giao dịch. Nhóm thứ hai là chính xác xác suấtthuật toán thường xuyên. Các thuật toán này khám phá tất cả các xác suất thường xuyên itemsets và báo cáo chính xác thường xuyên xác suất cho mỗi itemset. Do sự phức tạp của tính toán chính xác xác suất thường xuyên thay vì kỳ vọng đơn giản, các thuật toán này cần phải chi tiêu ít O(NlogN) tính toán chi phí cho mỗi itemset. Hơn nữa, để tránh chế biến dự phòng, cắt tỉa ràng buộc dựa trên Chernoff là một cách để giảm thời gian chạy của nhóm này của thuật toán.Nhóm thứ ba là gần đúng các thuật toán xác suất thường xuyên. Do roperties âm thanh của phân phối Poisson nhị thức, nhóm này của thuật toán có thể có được xác suất thường xuyên gần đúng với chất lượng cao bằng cách chỉ mua lại thời điểm đầu tiên (kỳ vọng) và secondmoment (phương sai). Vì vậy, các loại thứ ba của thuật toán đã tính toán O(N) chi phí và trở lại thông tin đầy đủ xác suất khi cơ sở dữ liệu không chắc chắn là đủ lớn. Tổng kết, các loại thứ ba của thuật toán thực sự xây dựng một cầu nối giữa hai định nghĩa khác nhau của itemsets thường xuyên trên cơ sở dữ liệu không chắc chắn.
đang được dịch, vui lòng đợi..