(3) Xác định khối lượng nội suy. Kinh nghiệm của chúng tôi
đã chỉ ra sự khác biệt nhỏ giữa các chiến lược lựa chọn hàng xóm
(ví dụ, khoảng cách dựa trên so với tương quan-based). Tuy nhiên,
hai thành phần khác, cụ thể là bình thường hóa dữ liệu và
nội suy trọng, đã chứng minh quan trọng cho sự thành công của
chương trình này. Theo đó, chúng tôi lại hai thành phần này
và đề xuất phương pháp mới để cải thiện đáng kể độ chính xác
của phương pháp tiếp cận KNN mà không có ý nghĩa ảnh hưởng đến
thời gian chạy. Ba đóng góp chính của chúng tôi là:
1. Đó là phong tục để chuẩn hóa dữ liệu trước khi kích hoạt
một phương pháp KNN. Điều này mang đến xếp hạng khác nhau cho một gần hơn
mức cho phép một tốt hơn trộn hiện. Thông thường
điều này đạt được bằng cách điều chỉnh cho các xếp hạng trung bình khác nhau
trên người sử dụng và / hoặc các mặt hàng. Trong phần 3 chúng tôi cung cấp một
sự bình thường hóa toàn diện hơn mà xem xét thêm
các hiệu ứng có sẵn trong hầu như tất cả các
bộ dữ liệu xếp hạng. Điều này cho phép chúng tôi để giải thích và loại bỏ
phần lớn các biến nhiễu từ các dữ liệu
và làm việc với phần dư được thuận lợi hơn để
suy lẫn nhau.
2. Phương pháp KNN quá khứ liên quan các mặt hàng (hoặc người sử dụng) bởi nhiều
biến thể dựa trên kinh nghiệm của các hệ số tương quan, cho phép
nội suy trực tiếp từ điểm số nước láng giềng. Trong
phần 4, chúng tôi cung cấp một lựa chọn khắt khe để những suy
trọng dựa trên tối ưu hóa toàn cầu của một chi phí
chức năng liên quan đến tất cả các trọng cùng một lúc. Điều này
dẫn đến một sự cải thiện về chất lượng dự toán
với một sự gia tăng nhỏ trong thời gian chạy.
3. Cách tiếp cận KNN có thể tận dụng hai khác nhau
các loại thông tin: mục-mục, làm thế nào người sử dụng đối tượng
đánh giá các mặt hàng tương tự; và người dùng sử dụng, cách mục đối tượng
được đánh giá bởi người sử dụng như đầu óc. Bởi vì có thường
được nhiều người sử dụng hơn các mục trong một hệ thống, các
phương pháp tiếp cận hướng người dùng được gọi là chậm hơn và kém chính xác.
Trong phần 5, chúng tôi thảo luận về lợi ích của việc cũng sử dụng
một cách tiếp cận hướng người sử dụng, và chúng tôi cung cấp một cuốn tiểu thuyết
phương pháp để làm giảm bớt vốn có biệt tính toán
ficulties của cách tiếp cận hướng người sử dụng.
Một đánh giá đáng khích lệ của các kết quả trên Netflix
sử dụng phim bộ dữ liệu giải [3] được cung cấp tại mục 6.
đang được dịch, vui lòng đợi..
