Để ước tính chất lượng của máy phân loại được xây dựng từ dữ liệu mất cân bằng, nhiều biện pháp đã được đề xuất trong tài liệu [24]. Điều này là bởi vì các biện pháp thực nghiệm được sử dụng rộng rãi nhất, chính xác tổng số, không phân biệt giữa số lượng các nhãn chính xác của các lớp khác nhau, mà trong phạm vi của vấn đề mất cân bằng có thể dẫn đến kết luận sai lầm. Bài viết này sẽ xem xét việc sử dụng các biện pháp Area Under the ROC Curve (AUC) [6], cung cấp một bản tóm tắt một số cho hiệu suất của học thuật toán và nó được khuyến khích trong nhiều tác phẩm khác trong các tài liệu [4,15]
đang được dịch, vui lòng đợi..
