Tóm tắt. Chúng tôi nghiên cứu vấn đề của khai thác mỏ itemsets thường xuyên từ không chắc chắndữ liệu theo một khuôn khổ xác suất. Chúng tôi xem xét giao dịchmục có liên quan đến xác suất hiện sinh và cung cấp cho một chính thứcđịnh nghĩa của các mô hình thường xuyên theo một mô hình dữ liệu không chắc chắn.Chúng tôi thấy rằng các thuật toán truyền thống cho khai thác mỏ thường xuyên itemsets làhoặc không thể dùng được hoặc computationally không hiệu quả theo một mô hình.Một khuôn khổ trang trí dữ liệu đề nghị để cải thiện hiệu quả khai thác mỏ.Thông qua thử nghiệm rộng rãi, chúng tôi thấy rằng kỹ thuật trang trí dữ liệucó thể đạt được tiết kiệm đáng kể chi phí CPU và I/O chi phí.
đang được dịch, vui lòng đợi..