Công việc trước đây về luật kết hợp [1] [2] [5] [6] [7] đã không xem xét sự hiện diện của nguyên tắc phân loại và hạn chế các mặt hàng trong các luật kết hợp với các mục lá cấp trong phân loại. Tuy nhiên, việc tìm kiếm quy tắc trên cấp độ khác nhau của phân loại là rất có giá trị vì:
• Quy định ở mức thấp có thể không có tối thiểu sup-port. Rất ít người có thể mua áo Jacket với Hiking Boots, nhưng nhiều người có thể mua Áo khoác với Hiking Boots. Vì vậy, nhiều mối liên quan có thể không được phát hiện ra nếu chúng ta hạn chế quy tắc để các mặt hàng tại các lá của cách phân loại. Kể từ khi các cửa hàng hoặc siêu thị thường có hàng trăm hàng ngàn mặt hàng, sự hỗ trợ cho các quy tắc liên quan đến chỉ mục lá (thường UPC hoặc mã SKU) có xu hướng vô cùng nhỏ.
• tắc phân loại có thể được sử dụng để tỉa quy tắc nhàm chán hay dư thừa. Chúng tôi sẽ thảo luận thêm tại mục 2.1.
Nhiều nguyên tắc phân loại có thể có mặt. Ví dụ, có thể là một nguyên tắc phân loại cho giá các mặt hàng (giá rẻ, đắt tiền, vv), và một cho các thể loại. Nhiều nguyên tắc phân loại có thể được mô hình hóa như một nguyên tắc phân loại duy nhất mà là một DAG (đồ thị acyclic đạo diễn). Một ứng dụng phổ biến, sử dụng nhiều nguyên tắc phân loại là phân tích lỗ lãnh đạo. Ngoài các nguyên tắc phân loại thông thường mà phân loại các mặt hàng có nhãn hiệu, chủng loại, nhóm sản phẩm, vv, có một nguyên tắc phân loại thứ hai, nơi các mặt hàng đang được bán được coi là con của một thể loại "mặt hàng-on-sale", và người dùng nhìn cho các quy tắc có chứa các "mục-on-sale" mục.
Trong bài báo này, chúng tôi giới thiệu các vấn đề khai thác luật kết hợp tổng quát. Thức, đưa ra một tập hợp các giao dịch và phân loại tư duy, chúng ta muốn tìm luật kết hợp các mục có thể được từ bất kỳ mức độ phân loại. Chúng tôi cung cấp một mô tả vấn đề chính trong phần 2. Một nhược điểm người sử dụng kinh nghiệm trong việc áp dụng luật kết hợp với các vấn đề thực tế là họ có xu hướng để có được rất nhiều quy tắc nhàm chán hay dư thừa cùng với các quy tắc thú vị. Chúng tôi giới thiệu một lãi biện pháp sử dụng các nguyên tắc phân loại để tỉa quy dự phòng.
đang được dịch, vui lòng đợi..
