Kịch bản ứng dụng chung
- kịch bản được giám sát
• Trong một số ứng dụng, dữ liệu đào tạo với các đối tượng dữ liệu bình thường và bất thường được cung cấp
• Có thể có nhiều bình thường và / hoặc các lớp học bất thường
• Thông thường, vấn đề phân loại là rất không cân bằng
- Semi-giám sát Kịch bản
• Trong một số ứng dụng , chỉ đào tạo dữ liệu cho các lớp học bình thường (es) (hoặc chỉ lớp bất thường (es)) được cung cấp
- kịch bản có giám sát
• Trong hầu hết các ứng dụng không có dữ liệu huấn luyện sẵn
• Trong hướng dẫn này, chúng tôi tập trung vào kịch bản không có giám sát
là giá trị ngoại lai chỉ ? một sản phẩm phụ của một số thuật toán phân cụm
- Nhiều thuật toán phân nhóm không chỉ định tất cả các điểm đến cụm nhưng chiếm tới đối tượng tiếng ồn
- Hãy tìm giá trị ngoại lai bằng cách áp dụng một trong những thuật toán và lấy tiếng ồn thiết
- vấn đề:
• thuật toán Clustering được tối ưu hóa để tìm các cụm chứ không phải là giá trị ngoại lai
• Độ chính xác của phát hiện outlier phụ thuộc vào cách thức tốt các thuật toán phân nhóm bắt cấu trúc của cụm
• một tập hợp của nhiều đối tượng dữ liệu bất thường tương tự như nhau sẽ được công nhận là một cụm chứ không phải là tiếng ồn / giá trị ngoại lai
đang được dịch, vui lòng đợi..