Thiết lập quan hệ mà chúng ta đang xem xét cũng mang lại những thách thức bổ sung. Ví dụ, chúng ta hãy xem xét các mục-
tập hợp {(C.project = Y)} S.SID có hỗ trợ 67%. Đối với một
ngưỡng hỗ trợ thấp hơn này sẽ là một tập phổ biến,
nhưng nó không nhất thiết phải là một trong những thú vị. Giả sử chúng ta cũng thấy rằng {(C.project = Y)} nắm giữ 30% của khóa học.
Tùy thuộc vào sự kết nối của sinh viên và các khóa học, hỗ trợ 67% thậm chí có thể là giá trị kỳ vọng. Ví dụ, nếu học sinh thường mất một khóa học sau đó sự hỗ trợ dự kiến (nếu giả định không thiên vị) sẽ là 30%. Tuy nhiên, nếu họ có mỗi hai khóa học, nó tăng lên đến 51,2%, trong ba khóa học này sẽ trở thành 66,1%, vv Vì vậy, trong trường hợp trung bình của ba khóa học mỗi học sinh, hỗ trợ 67% dự kiến, và do đó chúng ta có thể xem xét mô hình này là nhàm chán. Do đó, trong
để xác định xem {(C.project = Y)} S.SID là thú vị, chúng tôi
sử dụng các kết nối và hỗ trợ trong C.CID để tính toán hỗ trợ dự kiến của {(C.project = Y)} S. SID, và chúng tôi loại bỏ
các tập phổ biến nếu hỗ trợ thực sự của nó không chênh lệnh nhiều so hỗ trợ dự kiến của nó.
đang được dịch, vui lòng đợi..
