K-lân cận gần nhất. K-NN là một kỹ thuật phân nhóm trong đó các sự kiện mới được phân loại theo đa số phiếu bầu của K láng giềng gần nhất của họ trong không gian vector được đào tạo. Trong đó K là số người hàng xóm mà có được một cuộc bỏ phiếu, và các khái niệm về "gần nhất" được tính bằng các phương pháp như Euclide hay khoảng cách Mahalanobis khoảng cách. Một lợi thế của phương pháp tiếp cận KNN là tính linh hoạt của nó. Một bất lợi là các tính toán phức tạp tính toán K láng giềng gần nhất của mỗi điểm dữ liệu. Trong [Eskin et al 2002], không gian tìm kiếm lần đầu tiên được nhóm lại thành các tập con để giảm thời gian cần thiết để xác định các thiết lập hàng xóm. Trong [Bouzida et al 2004] Nguyên tắc phân tích thành phần lần đầu tiên được áp dụng cho các đầu vào thiết lập để giảm số chiều của không gian vector. Một cải tiến của phương pháp tiếp cận KNN cơ bản đã được đề xuất trong [Li et al 2007], nơi các kỹ thuật dẫn truyền [Gammerman và Vovk 2002] đã được áp dụng để tính toán một "kỳ lạ" biện pháp. Cách tiếp cận này giảm sai tích cực hơn phương pháp K-NN khác và làm giảm nhu cầu đối với các tập dữ liệu đào tạo nhãn.
đang được dịch, vui lòng đợi..
