ABSTRACTIn recent years, due to the

ABSTRACT
In recent years, due to the wide applications of uncertain data, mining frequent itemsets over uncertain databases has attracted much attention. In uncertain databases, the support of an itemset is a random variable instead of a fixed occurrence counting of this itemset. Thus, unlike the corresponding problem in deterministic databases where the frequent itemset has a unique definition, the frequent itemset under uncertain environments has two different definitions so far. The first definition, referred as the expected support-based frequent itemset, employs the expectation of the support of an itemset to measure whether this itemset is frequent. The second definition, referred as the probabilistic frequent itemset, uses the probability of the support of an itemset to measure its frequency. Thus, existing work on mining
frequent itemsets over uncertain databases is divided into two different groups and no study is conducted to comprehensively compare the two different definitions. In addition, since no uniform experimental platform exists, current solutions for the same definition even generate inconsistent results. In this paper, we firstly aim to clarify the relationship between the two different definitions. Through extensive experiments, we verify that the two definitions have a
tight connection and can be unified toget her when the size of data is large enough. Secondly, we provide baseline implementations of eight existing representative algorithms and test their performances with uniform measures fairly. Finally, according to the fair tests over many different benchmark data sets, we clarify several existing inconsistent conclusions and discuss some new findings.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

TÓM TẮTNăm gần đây, do các ứng dụng nhiều dữ liệu không chắc chắn, khai thác mỏ itemsets thường xuyên trên cơ sở dữ liệu không chắc chắn đã thu hút nhiều sự chú ý. Trong cơ sở dữ liệu không chắc chắn, sự hỗ trợ của một itemset là một biến ngẫu nhiên thay vì một sự xuất hiện cố định tính của itemset này. Vì vậy, không giống như các vấn đề tương ứng trong cơ sở dữ liệu xác định nơi itemset thường xuyên có một định nghĩa độc đáo, itemset thường xuyên trong môi trường không chắc chắn có hai định nghĩa khác nhau cho đến nay. Định nghĩa đầu tiên, được gọi là dự kiến sẽ dựa trên hỗ trợ thường xuyên itemset, sử dụng những kỳ vọng của sự hỗ trợ của một itemset để đo cho dù itemset này là thường xuyên. Định nghĩa thứ hai, được gọi là thường xuyên itemset xác suất, sử dụng khả năng hỗ trợ một itemset để đo tần số của nó. Do đó, hiện tại công việc khai thác mỏitemsets thường xuyên trên cơ sở dữ liệu không chắc chắn được chia thành hai nhóm khác nhau và không có nghiên cứu được tiến hành để toàn diện so sánh hai định nghĩa khác nhau. Ngoài ra, kể từ khi không có nền tảng thử nghiệm thống nhất tồn tại, các giải pháp hiện tại để định nghĩa tương tự thậm chí tạo ra kết quả không phù hợp. Trong bài báo này, trước hết chúng tôi mong muốn làm rõ mối quan hệ giữa hai định nghĩa khác nhau. Thông qua thử nghiệm rộng rãi, chúng tôi xác minh rằng các định nghĩa hai có mộtkết nối chặt chẽ và có thể là thống nhất cả cô ấy khi kích thước của dữ liệu là đủ lớn. Thứ hai, chúng tôi cung cấp đường cơ sở triển khai trong tám giải thuật sẵn có đại diện và thử nghiệm của buổi biểu diễn với các biện pháp thống nhất khá. Cuối cùng, theo các bài kiểm tra công bằng trong nhiều bộ dữ liệu điểm chuẩn khác nhau, chúng tôi làm rõ một số kết luận sẵn có không phù hợp và thảo luận về một số những phát hiện mới.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

TÓM TẮT
Trong những năm gần đây, do sự ứng dụng rộng rãi của dữ liệu không chắc chắn, khai thác tập phổ biến trên cơ sở dữ liệu không chắc chắn đã thu hút nhiều sự chú ý. Trong cơ sở dữ liệu không chắc chắn, sự hỗ trợ của một tập phổ biến là một biến ngẫu nhiên thay vì một đếm xuất cố định của tập phổ biến này. Vì vậy, không giống như các vấn đề tương ứng trong cơ sở dữ liệu xác định nơi các tập phổ biến có một định nghĩa duy nhất, các tập phổ biến trong các môi trường không chắc chắn có hai định nghĩa khác nhau cho đến nay. Các định nghĩa đầu tiên, gọi là hỗ trợ dựa trên dự kiến tập phổ biến, sử dụng kỳ vọng của sự hỗ trợ của một tập phổ biến để đo lường xem liệu tập phổ biến này là thường xuyên. Định nghĩa thứ hai, gọi là tập phổ biến xác suất, sử dụng xác suất của sự hỗ trợ của một tập phổ biến để đo tần số của nó. Như vậy, công việc hiện tại vào khai thác
tập phổ biến trên cơ sở dữ liệu không chắc chắn được chia thành hai nhóm khác nhau và không có nghiên cứu được tiến hành để so sánh toàn diện hai định nghĩa khác nhau. Ngoài ra, vì không có nền tảng thực nghiệm thống nhất tồn tại, giải pháp hiện nay cho các định nghĩa tương tự thậm chí tạo ra kết quả không phù hợp. Trong bài báo này, chúng ta trước hết nhằm mục đích để làm rõ mối quan hệ giữa hai định nghĩa khác nhau. Thông qua thí nghiệm rộng rãi, chúng tôi xác minh rằng hai định nghĩa có một
kết nối chặt chẽ và có thể được thống nhất toget cô khi kích thước của dữ liệu là đủ lớn. Thứ hai, chúng tôi cung cấp triển khai thực hiện cơ bản của tám đại diện các thuật toán hiện hành và kiểm tra màn trình diễn của họ với các biện pháp đồng bằng. Cuối cùng, theo các thử nghiệm công bằng hơn nhiều bộ dữ liệu điểm chuẩn khác nhau, chúng tôi làm rõ một số kết luận không phù hợp hiện tại và thảo luận một số phát hiện mới.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.