Classification datasets thường có một phân phối bất bình đẳng cấp trong ví dụ của họ. Vấn đề này được gọi là classification mất cân bằng. Tổng hợp kỹ thuật lấy mẫu trên mặt dân tộc thiểu số (SMOTE) là một trong những nổi tiếng nhất dữ liệu trước khi chế biến các phương pháp đối phó với nó để cân bằng và một số khác nhau ví dụ của mỗi lớp. Tuy nhiên, như tác phẩm gần đây tuyên bố, sự mất cân bằng lớp không phải là một vấn đề trong chính nó và sự xuống cấp hiệu suất cũng được liên kết với các yếu tố khác liên quan đến việc phân phối của dữ liệu. Một trong số này là sự hiện diện của ví dụ ồn ào và đường biên giới, người sau này nằm ở khu vực xung quanh lớp ranh giới. Một số hạn chế nội tại của SMOTE có thể làm trầm trọng thêm vấn đề sản xuất bởi các loại của các ví dụ và các chung chung hiện tại của SMOTE không thích nghi một cách chính xác để điều trị của họ
đang được dịch, vui lòng đợi..
