Tuy nhiên, một số nhà nghiên cứu đã chỉ ra rằng tỷ lệ mất cân bằng lớp không phải là một vấn đề riêng của mình. Mặc dù các quan sát của một hiệu suất fi cation phân loại thấp trong một số vấn đề cụ thể mất cân bằng có thể bị ảnh hưởng bởi các chương trình xác nhận sử dụng để ước tính hiệu suất của các phân loại [35], sự xuống cấp hiệu suất phân loại thường liên quan đến các yếu tố khác liên quan đến phân phối dữ liệu [28, 22,40]. Trong số đó, trong [40] ảnh hưởng của các ví dụ ồn ào và đường biên giới trên thực hiện phân loại trong bộ dữ liệu mất cân bằng được thực nghiệm nghiên cứu. ví dụ đường biên giới được định nghĩa như là ví dụ nằm hoặc là rất gần với ranh giới quyết định giữa thiểu số và các lớp học đa số hoặc nằm trong khu vực xung quanh ranh giới lớp học, nơi các lớp chồng lên nhau. Các tác giả của [33,40] tham khảo ví dụ ồn ào như những người từ một lớp nằm sâu bên trong các khu vực của các lớp khác. Hơn nữa, bài báo này, xem xét ví dụ ồn ào theo nghĩa rộng hơn của [57,43], trong đó họ được đối xử như những ví dụ hỏng hoặc trong các giá trị thuộc tính hoặc các nhãn lớp.
đang được dịch, vui lòng đợi..
