Các đóng góp khác của giấy này là để cung cấp một so sánh thử nghiệm toàn diện của SMOTE-IPF với những chung chung. Hơn nữa, yếu tố dữ liệu khác nhau sẽ được xem xét trong các bộ phận của nghiên cứu thử nghiệm này. Một phần đầu tiên sẽ được thực hiện với datasets tổng hợp đặc biệt có chứa các hình dạng khác nhau của các dân tộc thiểu số lớp ranh giới ví dụ và các cấp độ của các ví dụ đường biên giới, như được coi là trong các nghiên cứu liên quan đến [22,28,29,40]. Ngoài ra, một tập hợp các datasets thực thế giới mà còn được gọi bị ảnh hưởng bởi ví dụ ồn ào và đường biên giới sẽ được xem xét. Tất cả đã được sử dụng trong [40] và có sẵn trong kho lưu trữ số liệu KEEL [1]. Tuy nhiên, các đóng góp khác của bài viết này sẽ giới thiệu tiếng ồn lớp hoặc thuộc tính bổ sung vào các datasets thực thế giới và để nghiên cứu tác động của nó trên so SMOTE chung chung. Sau khi chuẩn bị-quy trình-ing những datasets, diễn xuất của máy phân loại được xây dựng với C4.5 [41] sẽ được đánh giá và họ sẽ còn được trong sự tương phản bằng cách sử dụng các bài kiểm tra thống kê thích hợp theo khuyến cáo trong các tài liệu chuyên ngành [14,19,25]. Các đặc tính của IPF phân biệt nó từ các bộ lọc khác và một cuộc thảo luận về những thế mạnh và điểm yếu của IPF trong việc đối phó với mất cân bằng dữ liệu bộ với ồn ào và đường biên giới ví dụ sẽ được phân tích ở phần 6
đang được dịch, vui lòng đợi..
