có thể xác định các trường hợp đóng cửa itemsets trong khai thác mỏ. Cắt tỉa chiến lược bao gồm:Mục kết hợp: Nếu mỗi giao dịch có chứa một thường xuyên itemset X cũng có chứa một itemset Y nhưng không phải bất kỳ superset thích hợp của Y, sau đó X ∪ Y tạo thành một itemset đóng cửa thường xuyên và không cần thiết để tìm kiếm bất kỳ itemset chứa X nhưng Y không có.Ví dụ, trong bảng 6,2 6,5 ví dụ, là cơ sở dữ liệu dự kiến có điều kiện cho tiền tố itemset {I5:2} {{I2, I1}, {I2, I1, I3}}, từ đó chúng ta có thể thấy rằng mỗi giao dịch của nó chứa itemset {I2, I1} nhưng không thích hợp superset của {I2, I1}. Itemset {I2,I1} có thể được sáp nhập với {I5} để tạo thành itemset khép kín, {I5, I2, I1: 2}, và chúng tôi không cần phải khai thác cho đóng cửa itemsets chứa I5 nhưng không {I2, I1}.Sub-itemset cắt tỉa: nếu một thường xuyên itemset X là một tập hợp con thích hợp đã tìm thấy fre-quent đóng cửa itemset Y và hỗ trợ số (X) = count(Y) hỗ trợ, thì X và tất cả x con cháu trong cây thiết lập đếm có thể không là thường xuyên đóng itemsets và do đó có thểđược bớt.Tương tự như 6,2 ví dụ, giả sử cơ sở dữ liệu giao dịch đã chỉ hai trans-hành động: {(a1, a2,..., a100), (a1, a2,..., a50)}, và hỗ trợ tối thiểu tính là min sup = 2. Phim chiếu trên mục đầu tiên là a1, có nguồn gốc itemset thường xuyên, {a1, a2,..., a50: 2}, dựa trên itemset kết hợp tối ưu hóa. Bởi vì support({a2}) =hỗ trợ ({a1, a2,..., a50}) = 2, và {a2} là một tập hợp con thích hợp của {a1, a2,..., a50}, không cần phải xem xét a2 và cơ sở dữ liệu dự kiến của nó. Cắt tỉa tương tự có thể được thực hiện cho a3,..., a50 là tốt. Vì vậy, mỏ đóng itemsets thường xuyên trong này thiết lập dữ liệuchấm dứt sau khi cơ sở dữ liệu dự kiến khai thác a1.Bỏ qua các mục: trong khai thác chiều sâu đầu tiên của itemsets khép kín, ở mỗi cấp, sẽ có một tiền tố itemset X liên kết với một tiêu đề bảng và cơ sở dữ liệu dự kiến. Nếu một địa phương thường xuyên mục p có hỗ trợ cùng một trong một số tiêu đề bảng ở các cấp độ khác nhau, chúng tôi có thể an toàn prune p từ các tiêu đề bảng ở cấp độ cao hơn.Xem xét, ví dụ, cơ sở dữ liệu giao dịch trước đó có chỉ hai trans-hành động: {(a1, a2,..., a100), (a1, a2,..., a50)}, trong đó min sup = 2. Bởi vì a2 a1 của cơ sở dữ liệu dự kiến có sự hỗ trợ tương tự như a2 trong bảng tiêu đề toàn cầu, a2 có thể được bớt từ toàn cầu tiêu đề bảng. Cắt tỉa tương tự có thể được thực hiện cho a3,..., a50. Đó là không cần để khai thác bất cứ điều gì nhiều hơn sau khi cơ sở dữ liệu dự kiến khai thác a1.Bên cạnh việc cắt tỉa không gian tìm kiếm trong quá trình khai thác mỏ đóng itemset, tối ưu hóa quan trọng khác là để thực hiện việc kiểm tra hiệu quả của mỗi itemset thường xuyên có nguồn gốc mới được nhìn thấy cho dù nó được đóng lại. Điều này là bởi vì trong quá trình khai thác mỏ không thể đảm bảo rằng mỗi itemset thường xuyên được tạo ra đóng cửa.Khi một itemset thường xuyên mới có nguồn gốc, nó là cần thiết để thực hiện hai loại đóng cửa kiểm tra: (1) kiểm tra, kiểm tra mà nếu này itemset mới thường xuyên là một superset của một số đã tìm thấy đóng itemsets với sự hỗ trợ tương tự, và (2) tập con kiểm tra, kiểm tra xem itemset vừa được tìm thấy là một tập hợp con của một itemset khép kín đã tìm thấy với sự hỗ trợ cùng một superset.Nếu chúng ta áp dụng mục kết hợp phương pháp cắt tỉa theo một phân chia và chinh phục khung giờ làm việc, sau đó kiểm tra superset là thực sự được xây dựng trong và không không cần phải rõ ràng
đang được dịch, vui lòng đợi..