Bảng 2 cho thấy sự so sánh hiệu suất của phương pháp sử dụng các số liệu chuẩn cho một hệ thống xếp hạng (độ chính xác ở mức 5 và 15 và MAP 15). Nói chung, tất cả các đường cơ sở thực hiện tồi tệ hơn so với báo cáo trong y văn, khẳng định sự phức tạp cao hơn
của công việc chú thích hashtag so với nhiệm vụ truyền thống. Điều thú vị đủ, sử dụng tương đồng địa phương của chúng tôi đã tạo ra kết quả tốt hơn so với Tagme và Wikiminer. Mô hình địa phương fm việc tốt hơn đáng kể cả các đường cơ sở trong tất cả các số liệu. Kết hợp những điểm tương đồng cải thiện hiệu suất thậm chí còn nhiều hơn significantly.2 So với các đường cơ sở, IPL cải thiện hiệu suất bằng 17-28%. Thời gian giống nhau đạt được kết quả cao nhất so với đề cập và bối cảnh tương đồng dựa trên nội dung khác. Điều này hỗ trợ của chúng tôi giả định rằng kết hợp từ vựng không phải luôn luôn là chiến lược tốt nhất để liên kết các thực thể trong tweets. Các chuỗi thời gian dựa trên số liệu phát sinh chi phí thấp hơn so với những người khác, nhưng nó tạo ra một hiệu suất đáng kể tốt. Tương bối cảnh dựa trên chỉnh sửa Wikipedia không mang lại nhiều cải tiến. Điều này có thể được giải thích theo hai cách. Đầu tiên, thông tin trong Wikipedia phần lớn là thiên vị cho các tổ chức phổ biến, nó không thành công để nắm bắt nhiều đối tượng ở đuôi dài. Thứ hai, mô hình ngôn ngữ phụ thuộc vào các đại diện từ trực tiếp, đó là khác nhau giữa Twitter và Wikipedia. Đây là một lợi thế của các biện pháp nội dung không như f
t.
đang được dịch, vui lòng đợi..