3. thuật toán: SMURFIG
trong phần này chúng tôi trình bày hai các thuật toán cho khai thác mỏ rela-tế itemsets. Chúng tôi lần đầu tiên xây dựng một thuật toán ngây thơ dựa trên tính toán tham gia đầy đủ bên ngoài. Sau đó, chúng tôi trình bày các thuật toán SMuRFIG (đơn giản Multi-Relational thường xuyên Itemset Generator). Thuật toán cả hai sử dụng danh sách KeyID, tương tự như các danh sách tid (giao dịch định danh) được sử dụng trong các thuật toán Eclat nổi tiếng [12].
lần đầu tiên, chúng tôi xem xét cách tiếp cận ngây thơ. Đầu vào của các thuật toán ngây thơ là một thể hiện của một đề án quan hệ đơn giản và một minsup ngưỡng hỗ trợ tương đối. Truy vấn hỗ trợ từ định nghĩa 3 dàng bị phân hủy thành ba phần, tức là tham gia một, một sự lựa chọn, và một chiếu. Đầu tiên, một tham gia bảng J được xây dựng, trong đó sự hỗ trợ chính xác có thể tìm thấy. Tuy nhiên, tham gia này là khác nhau cho mỗi itemset, và thực hiện tất cả các tham gia có thể là infeasible. Thay vào đó, chúng tôi tạo ra một bảng duy nhất tham gia lớn bằng cách sử dụng tất cả các thực thể và mối quan hệ. Để xây dựng J, chúng tôi không thể sử dụng một thiết bị-tham gia. Thật vậy, nếu một tuple không được kết nối với bất kỳ tuples trong bảng khác, nó không xuất hiện trong đầy đủ equi-tham gia của tất cả các bảng tổ chức, có nghĩa là chúng ta mất đi một số thông tin. Để tránh điều này, chúng tôi kết hợp các thực thể và mối quan hệ bằng cách sử dụng một tham gia đầy đủ bên ngoài, kết hợp tất cả kết nối không tuples với NULL-giá trị.
sau đó, một thợ mỏ thiết lập tiêu chuẩn thường xuyên, Eclat, được áp dụng cho J bằng cách sử dụng một ngưỡng mới. Thay vì sử dụng thân nhân hỗ trợ ngưỡng minsup, chúng ta phải sử dụng một ngưỡng tuyệt đối mới
abssup = minsup × mỏ |E| cho J. Sự hỗ trợ tuyệt đối của
một itemset trong J là ít cao như sự hỗ trợ tuyệt đối
của rằng itemset cho bất kỳ khóa K, vì vậy bất kỳ itemset thường xuyên trong một số phím K đối với minsup cũng sẽ thường xuyên trong J đối với abssup. Theo cách một, các thuật toán Eclat
đang được dịch, vui lòng đợi..
