Các bài viết gần nhất được xác định bằng cách tính toán khoảng cách Euclide. Như chúng ta đã làmkhông chỉ định nó, loại được khởi tạo với mặc định giá trị p = 2, là cáctham số trong khoảng cách Minkowski. Điều này có nghĩa rằng tất cả các tính năng bảy là điều trịtương tự như vậy. kNN không thực sự biết rằng, ví dụ, NumTextTokens là tốt đểcó nhưng ít quan trọng hơn NumLinks. Chúng ta hãy xem xét những điều sau đây haiBài viết, A và B, chỉ khác nhau ở các tính năng sau đây, và làm thế nào họ so sánhđến một bài đăng mới
đang được dịch, vui lòng đợi..