Sự xuất hiện của các từ mới Để phân tích sự xuất hiện và thay đổi lời hiệu quả để phân loại tweets, chúng tôi tính toán các số liệu thống kê χ2c chi-squared (xem chi tiết trong [39]) của tất cả các từ cho mỗi lớp học c trong mỗi ngày, và đã nhận được hàng ngày Đầu 100 từ về χ2c cho mỗi lớp. Fig. 4 chương trình (a) những điểm tương đồng giữa các cosin hàng ngày trên 100 từ trên 13 tháng 9 năm 2011 và tất cả những ngày khác và (b) số lượng tích lũy của phân biệt hàng ngày trên 100 từ. Các kết quả của hình. 4 được tính trung bình trong lớp học. Chúng ta có thể nhìn thấy từ hình. 4b rằng lời hiệu quả để phân loại tweets nổi lên liên tục. Đặc biệt, những chữ trên các dữ liệu truyền hình thiết lập những thay đổi đáng kể. Hơn nữa, hàng ngày trên 100 từ trong dữ liệu truyền hình thiết lập thay đổi định kỳ do ảnh hưởng của các ngày trong tuần, như thể hiện trong hình. 4a. Tóm lại, mô hình phân loại phải xử lý từ ngữ mới nổi cũng như định kỳ và chủ đề định kỳ hiệu quả.
đang được dịch, vui lòng đợi..
