Các quy trình thực hiện các phương pháp này thường tương tự. Thứ nhất, một bộ hoàn chỉnh các luật kết hợp lớp
(CAR) được khai thác từ các tập dữ liệu huấn luyện. Sau đó, một tập hợp con của CAR được chọn để tạo thành các phân loại. Tuy nhiên, các bộ hoàn chỉnh các CAR thường là rất lớn vì nó có chứa nhiều quy tắc dư thừa hoặc không đáng kể. Những quy định này vô dụng không chỉ lưu trữ chất thải
không gian và làm giảm hiệu suất của một bộ phân loại, nhưng họ cũng có một ảnh hưởng tiêu cực về việc ra quyết định.
Để giải quyết vấn đề này, nỗ lực đã được dành để cắt tỉa quy dự phòng hoặc các quy tắc xếp hạng. Các trường hợp điển hình của dự phòng
quy tắc là quy tắc cover [36], trong đó một nguyên tắc là không cần thiết nếu nó được bao phủ bởi những người khác. Khái niệm về tiểu tắc đã được phát triển
[23,29,39]. Một cách tiếp cận để tỉa bớt các quy tắc dự phòng để phân tích mối quan hệ giữa các quy định đối với các đối tượng với
đã được đề xuất bởi Liu et al. [24]. Các tác giả đã sử dụng các kết nối Galois giữa các đối tượng và các quy tắc để xác định phụ thuộc vào
mối quan hệ giữa các quy tắc. Nghiên cứu của họ cho thấy một quy tắc là tương đương với nhau nếu chúng được hỗ trợ bởi cùng một
đối tượng. Bên cạnh chiến lược cắt tỉa, một số nhà nghiên cứu đã báo cáo rằng các cơ chế xếp hạng cũng rất quan trọng cho CAR
khai thác mỏ ở phân loại kết hợp kể từ khi họ trực tiếp ảnh hưởng đến độ chính xác phân loại. Do đó, một số quy tắc xếp hạng
các phương pháp đã được phát triển và Li Cercone [19] áp dụng lý thuyết tập thô để khám phá và xếp hạng quy tắc quan trọng
Najeeb et al. [26] đề xuất một phương pháp lai cho quy tắc xếp hạng dựa trên một thuật toán tiến hóa Cai et al. [8] xếp hạng
các lý thú của quy tắc trong một nhóm quy tắc tương ứng cho các gen phân loại biểu hiện sử dụng hai lý thú đề xuất
các biện pháp gọi là Max-Subrule-Conf và Min-Subrule-Conf Chen et al. [9] cải thiện hiệu suất của một kết hợp
phân loại theo nguyên tắc ưu tiên. Họ đề xuất các thuật toán MLRP, mà lại xếp thứ tự thực hiện các CAR sử dụng quy tắc
ưu tiên để giảm ảnh hưởng của quy luật phụ thuộc.
Mặc dù quy tắc cắt tỉa và loại trừ các phương pháp xếp hạng có thể giúp loại bỏ các quy định không cần thiết và có được quy tắc quan trọng,
nâng cao hiệu suất phân loại, có có được thành công ít quan tâm đến việc khám phá các quy tắc thú vị hoặc hữu ích từ với
quan điểm của một người dùng cuối của xem. Trong thế giới thực, người dùng thường xem xét các quy tắc mà hậu quả quy định cụ thể chứa một
lớp. Ví dụ, trong khi phân tích dữ liệu HIV / AIDS, dịch tễ học thường tập trung vào các quy định mà quy tắc hậu quả
là HIV dương tính. Tương tự như vậy, trong khi khai thác dữ liệu ngân hàng, cán bộ tín ngân hàng thường chú ý đến các quy tắc
phân loại một đơn vay vào '' nguy hiểm '' lớp. Dưới bối cảnh này, các nghiên cứu này đề xuất một cuốn tiểu thuyết và phương pháp nhanh chóng cho
CAR khai thác với việc xem xét những hạn chế về lớp.
Những đóng góp của bài báo này được ghi nhận như sau:
(1) Một cấu trúc cây mới được gọi là cây Novel tương đương lớp Rule (NECR-tree ) được đề xuất cho khai thác có hiệu quả CAR
với những hạn chế lớp. Mỗi nút trong NECR-cây có chứa các giá trị thuộc tính và thông tin của họ.
(2) Một số định lý để nhanh chóng cắt tỉa các nút mà không thể tạo ra quy tắc thoả mãn các ràng buộc lớp được
phát triển.
(3) Một cuốn tiểu thuyết và thuật toán hiệu quả cho CAR khai thác hạn chế dựa trên cung cấp các định lý được trình bày.
Phần còn lại của bài viết này được tổ chức như sau. Trong phần 2, một số khái niệm sơ bộ về khai thác CAR được cho một thời gian ngắn.
Phần 3 thảo luận về việc có liên quan đến nhiều hạn chế khai thác luật kết hợp và khai thác mỏ CAR. Những đóng góp chính của bài báo
được trình bày trong phần 4, trong đó các cấu trúc cây mới, được gọi là NECR-tree, được trình bày, và một số định lý để loại bỏ
các nút cây không cần thiết được cung cấp. Các thuật toán đề xuất cho khai thác mỏ CAR với việc xem xét các ràng buộc lớp
cũng được trình bày. Kết quả thí nghiệm sẽ được thảo luận trong phần 5. Các kết luận và những ý tưởng cho công việc trong tương lai được đưa ra trong mục 6
đang được dịch, vui lòng đợi..
