Dekel et. al. đề xuất một phương pháp cắt tỉa dựa trên hai bước, mà là rất giống với quần tỉa
phương pháp tập thảo luận ở trên (xem phần 2.4). Về mặt lý thuyết và thực nghiệm đã chỉ ra rằng
phương pháp này có khả năng xử lý tình huống rất thưa thớt, ngay cả với các lớp học nhiều hơn các trường hợp [36].
Trong bước học tập, bất kỳ phân loại tùy ý, h được đào tạo về các dữ liệu huấn luyện. Trong bước bài học, mục tiêu là để tìm thấy một chức năng chuyển đổi nhãn, φ để phân loại cuối cùng là tổng hợp của hai, φ ◦ h. Chuyển đổi nhãn này trong trường hợp này được định nghĩa là một tập hợp các quy tắc cắt tỉa nhãn φ và giảm thiểu các rủi ro tổng thể của φ ◦ h. Một lý thuyết phân tích rủi ro thực nghiệm cuối cùng, R nguy thức, R φ cho thấy một quy tắc cắt tỉa đơn giản như sau, 'cắt tỉa bất kỳ nhãn nào mà tỷ lệ dương tính giả để tích cực thực sự vượt quá một số ngưỡng cửa ", làm giảm nguy cơ tổng thể trong điều kiện nhẹ. Quan trọng hơn, không giống như hầu hết các phương pháp khác, phương pháp này cho phép số lượng nhãn, k để phát triển như một chức năng của số trường hợp, n. Trong khi phương pháp này có vẻ làm việc cạnh tranh tốt ngay cả với các tên miền lớn, Wikipedia, với 2,9 triệu bài viết và gần 1,5 triệu loại, một lời chỉ trích tiềm năng chống lại phương pháp này là tiềm ẩn nhãn độc lập giả định. Ngoài ra, kết hợp quy tắc cắt tỉa phức tạp hơn trong hệ thống là trái như là một câu hỏi nghiên cứu trong tương lai.
đang được dịch, vui lòng đợi..
