• Trong một số ứng dụng, dữ liệu đào tạo với các đối tượng dữ liệu bình thường và bất thường được cung cấp
• Có thể có nhiều bình thường và / hoặc các lớp học bất thường
• Thông thường, vấn đề phân loại là rất không cân bằng
- Semi-giám sát Kịch bản
• Trong một số ứng dụng, chỉ đào tạo dữ liệu cho lớp học bình thường (es) (hoặc chỉ lớp bất thường (es)) được cung cấp
- kịch bản có giám sát
• trong hầu hết các ứng dụng không có dữ liệu huấn luyện sẵn
• trong hướng dẫn này, chúng tôi tập trung vào kịch bản không giám sát
• có giá trị ngoại lai chỉ là một sản phẩm phụ của một số ? thuật toán phân cụm
- Nhiều thuật toán phân nhóm không chỉ định tất cả các điểm đến cụm nhưng chiếm tới đối tượng tiếng ồn
- Hãy tìm giá trị ngoại lai bằng cách áp dụng một trong những thuật toán và lấy tiếng ồn thiết
- vấn đề:
• thuật toán Clustering được tối ưu hóa để tìm cụm chứ không phải là giá trị ngoại lai
• Độ chính xác phát hiện outlier phụ thuộc vào cách thức tốt các thuật toán phân nhóm bắt cấu trúc của cụm
đang được dịch, vui lòng đợi..
