Là giá trị ngoại lai chỉ là một sản phẩm phụ của một số thuật toán clustering?
- Nhiều thuật toán phân nhóm không chỉ định tất cả các điểm đến cụm nhưng chiếm tới đối tượng tiếng ồn
- Hãy tìm giá trị ngoại lai bằng cách áp dụng một trong những thuật toán và lấy tiếng ồn thiết
- Vấn đề:
• thuật toán Clustering được tối ưu hóa để tìm cụm chứ không phải là giá trị ngoại lai
• Độ chính xác của phát hiện outlier phụ thuộc vào cách thức tốt các thuật toán phân nhóm bắt cấu trúc của cụm
• một tập hợp của nhiều đối tượng dữ liệu bất thường tương tự như nhau sẽ được công nhận là một cụm chứ không phải là tiếng ồn / giá trị ngoại lai
đang được dịch, vui lòng đợi..