1. giới thiệu
phân loại là một nhiệm vụ quan trọng trong khai thác dữ liệu, mà
nhằm mục đích để dự đoán các lớp học của các đối tượng dữ liệu trong tương lai. Ở
phân loại, một trong xây dựng một mô hình (bộ quy tắc) từ một nhóm
của dữ liệu phân loại đào tạo các đối tượng để thời các lớp học
trước đây unseen dữ liệu đối tượng. Tập hợp dữ liệu được sử dụng để tìm hiểu các
mô hình được gọi là tập hợp dữ liệu đào tạo và tập hợp dữ liệu được sử dụng để
thước đo chất lượng của các mô hình được gọi là tập hợp dữ liệu thử nghiệm.
Hiệp hội quy tắc khám phá là một nhiệm vụ quan trọng trong dữ liệu
khai thác mỏ, nhằm mục đích tìm thấy tương quan giữa các mục trong một
giao dịch cơ sở dữ liệu. Các mối tương quan được đại diện như
quy tắc đơn giản, i.e.X!Y, mà có thể sử dụng để hướng dẫn chiến lược
quyết định liên quan đến sản phẩm kệ, bán hàng khuyến mãi,
tiếp thị, và lập kế hoạch [1,8,21]. Sự khác biệt chính giữa
Hiệp hội quy tắc khám phá và phân loại là là có không
lớp để dự đoán trong trước đây, trong khi năm sau đó, cuối cùng
mục tiêu là để dự đoán các nhãn lớp của bài kiểm tra dữ liệu đối tượng.
phân loại kỹ thuật chẳng hạn như quy tắc cảm ứng và bao gồm-ing [3,4], lấy được rõ ràng nhất lớp tương quan đến một quy tắc và
chỉ đơn giản là bỏ qua các lớp học khác. Họ xem xét việc xây dựng các
loại một cách heuristic. Một khi một quy tắc được tạo ra, tất cả đào tạo
dữ liệu các đối tượng liên kết với nó được loại bỏ, và do đó một đào tạo
đối tượng được bao phủ bởi chỉ có một quy tắc. Do đó, các phương pháp tiếp cận
thường sản xuất máy phân loại kích thước nhỏ. Trong vài năm qua một
cách tiếp cận mới hybrid sử dụng Hiệp hội quy tắc khám phá
Các phương pháp để xây dựng các máy phân loại được gọi là kết hợp classification
(AC), đã là đề xuất [9,10,17]. AC là hứa hẹn một
cách tiếp cận phân loại, mà đã được chứng minh để xây dựng thêm
các thiết lập chính xác của các quy tắc hơn phương pháp tiếp cận truyền thống phân loại
[2,9,10,15,20].
Hiệp hội quy tắc khám phá phương pháp tiếp cận xem xét correla-tion trong số tất cả các mục có thể trong một cơ sở dữ liệu giao dịch và
do đó, quy tắc tạo ra các đối tượng đào tạo chia sẻ. Nói cách khác,
một đối tượng dữ liệu giao dịch duy nhất có thể được sử dụng trong các
sản xuất nhiều hiệp hội quy tắc. Kể từ khi, phương pháp tiếp cận AC
sử dụng Hiệp hội quy tắc khám phá phương pháp để khám phá các quy tắc, các
các quy tắc có nguồn gốc ở loại chia sẻ đào tạo dữ liệu đối tượng như là tốt.
điều này dẫn đến quy tắc phụ thuộc nơi một số quy tắc phụ thuộc vào
khác cao hơn xếp hạng quy định trong loại. Khác hơn nữa
vấn đề quan trọng mà có thể là kết quả của quy tắc chia sẻ đào tạo
đối tượng là các lớp học liên quan đến nhiều quy tắc học được trong
giai đoạn đào tạo không phải là những chính xác nhất.
đang được dịch, vui lòng đợi..
