1. giới thiệu
Itemset khai thác mỏ thuật toán có thể là các thuật toán nổi tiếng nhất trong lĩnh vực khai thác mỏ mô hình thường xuyên. Nhiều giải pháp hiệu quả đã được phát triển cho lớp này tương đối đơn giản của mô hình. Trong khi nhiệm vụ khai thác mỏ itemsets thường xuyên trong một mối quan hệ duy nhất nghiên cứu, chỉ một vài giải pháp tồn tại cho khai thác mỏ itemsets thường xuyên ở bất kỳ quan hệ cơ sở dữ liệu, mà thường có nhiều hơn một mối quan hệ [4, 5, 9, 10]. Những phương pháp này xem xét một itemset quan hệ là một tập hợp các mặt hàng, nơi mỗi mục là một cặp giá trị thuộc tính, thuộc về quan hệ một hoặc nhiều trong cơ sở dữ liệu. Để cho hai hay một số mục từ quan hệ khác nhau để trong itemset tương tự, họ phải được kết nối. Hai bài được coi là được kết nối nếu có tồn tại một tham gia của quan hệ hai trong cơ sở dữ liệu kết nối chúng. Nói chung, một itemset nói để xảy ra trong cơ sở dữ liệu, nếu có tồn tại một tuple trong một tham gia của các mối quan hệ, chứa itemset. Trong bài này chúng tôi cũng áp dụng khái niệm này của sự xuất hiện.
A định nghĩa tốt của một đơn vị trong đó sự hỗ trợ của một mô hình được thể hiện tức là những gì được tính là một yêu cầu chính để khai thác bất kỳ loại mô hình thường xuyên. Trong tác phẩm hiện tại trên quan hệ itemset khai thác [4, 9, 10], tần số của một itemset qua nhiều quan hệ được thể hiện trong số lần xuất hiện trong một tham gia của cơ sở dữ liệu quan hệ. Tuy nhiên, định nghĩa này hỗ trợ itemset là khó để giải thích, bởi vì rất nhiều phụ thuộc vào tốt như thế nào các mục trong các thiết lập được kết nối. Trong bài này, chúng tôi giả định rằng quan trọng phụ thuộc được xác định trong các đề án quan hệ cơ sở dữ liệu đầu vào. Chúng tôi xác định sự hỗ trợ của một itemset bằng cách đếm duy nhất quan trọng giá trị trong tuples nơi itemset xảy ra. Xem xét cơ sở dữ liệu quan hệ trong hình 1, chúng tôi sẽ sử dụng như là một ví dụ chạy-ning trong suốt giấy. Cơ sở dữ liệu này, các
phím được sử dụng là {Professor.PID, Course.CID, Student.SID, Study.YID}. Này hỗ trợ mới đếm kỹ thuật cho phép
interpretable itemsets thường xuyên, vì nó đi mà không nói rằng
itemsets thường xuyên trong Professor.PID có ngữ nghĩa khác nhau hơn itemsets thường xuyên trong Course.CID. Cách tiếp cận này cho phép một thuật toán hiệu quả sâu đầu tiên tạo ra thú vị itemsets quan hệ thường xuyên được dễ dàng để hiểu.
đang được dịch, vui lòng đợi..
