TÓM TẮTNăm gần đây, do các ứng dụng nhiều dữ liệu không chắc chắn, khai thác mỏ itemsets thường xuyên trên cơ sở dữ liệu không chắc chắn đã thu hút nhiều sự chú ý. Trong cơ sở dữ liệu không chắc chắn, sự hỗ trợ của một itemset là một biến ngẫu nhiên thay vì một sự xuất hiện cố định tính của itemset này. Vì vậy, không giống như các vấn đề tương ứng trong cơ sở dữ liệu xác định nơi itemset thường xuyên có một định nghĩa độc đáo, itemset thường xuyên trong môi trường không chắc chắn có hai định nghĩa khác nhau cho đến nay. Định nghĩa đầu tiên, được gọi là dự kiến sẽ dựa trên hỗ trợ thường xuyên itemset, sử dụng những kỳ vọng của sự hỗ trợ của một itemset để đo cho dù itemset này là thường xuyên. Định nghĩa thứ hai, được gọi là thường xuyên itemset xác suất, sử dụng khả năng hỗ trợ một itemset để đo tần số của nó. Do đó, hiện tại công việc khai thác mỏitemsets thường xuyên trên cơ sở dữ liệu không chắc chắn được chia thành hai nhóm khác nhau và không có nghiên cứu được tiến hành để toàn diện so sánh hai định nghĩa khác nhau. Ngoài ra, kể từ khi không có nền tảng thử nghiệm thống nhất tồn tại, các giải pháp hiện tại để định nghĩa tương tự thậm chí tạo ra kết quả không phù hợp. Trong bài báo này, trước hết chúng tôi mong muốn làm rõ mối quan hệ giữa hai định nghĩa khác nhau. Thông qua thử nghiệm rộng rãi, chúng tôi xác minh rằng các định nghĩa hai có mộtkết nối chặt chẽ và có thể là thống nhất cả cô ấy khi kích thước của dữ liệu là đủ lớn. Thứ hai, chúng tôi cung cấp đường cơ sở triển khai trong tám giải thuật sẵn có đại diện và thử nghiệm của buổi biểu diễn với các biện pháp thống nhất khá. Cuối cùng, theo các bài kiểm tra công bằng trong nhiều bộ dữ liệu điểm chuẩn khác nhau, chúng tôi làm rõ một số kết luận sẵn có không phù hợp và thảo luận về một số những phát hiện mới.
đang được dịch, vui lòng đợi..
