2. CÁC MỨC ĐỘ CỦA TÌNH CẢMPHÂN TÍCH2.1. tài liệu cấp tình cảm phân tíchĐơn vị thông tin cơ bản là một tài liệu duy nhất củakhăng khăng văn bản. Trong phân loại cấp tài liệu này, mộtbài đánh giá duy nhất về một chủ đề duy nhất xem xét. Nhưng trong cáctrường hợp của diễn đàn hoặc blog, so sánh câu có thể xuất hiện.Khách có thể so sánh một sản phẩm khác cóđặc điểm tương tự và do đó phân tích cấp tài liệu làkhông mong muốn trong diễn đàn và blog. Những thách thức trong cácphân loại cấp tài liệu là tất cả câu trong một tài liệu có thể không được có liên quan trong thể hiện ý kiếnvề một thực thể. Do đó chủ quan/khách quanphân loại là rất quan trọng trong loại phân loại.Các câu không liên quan phải được loại bỏ từ cácxử lý công trình.Cả hai giám sát và không có giám sát học tập phương pháp có thểđược sử dụng để phân loại cấp tài liệu. Bất kỳ giám sáthọc các thuật toán như ngây thơ Bayes, hỗ trợ VectorMáy móc, có thể được sử dụng để đào tạo hệ thống. Đào tạo vàkiểm tra dữ liệu, người xem đánh giá (trong hình thức 1-5 sao),có thể được sử dụng. Các tính năng mà có thể được sử dụng cho máy tínhhọc tập là tần số thuật ngữ, tính từ từ một phần của bài phát biểugắn thẻ, ý kiến từ và cụm từ, negations,phụ thuộc vv. Ghi nhãn cực của tài liệutheo cách thủ công là tốn thời gian và do đó người dùng đánh giácó sẵn có thể được thực hiện sử dụng. Có thể không có giám sát học tậpđược thực hiện bằng cách chiết các ý kiến từ bên trong một tài liệu.Các point-wise lẫn nhau thông tin có thể được thực hiện việc sử dụng đểTìm ngữ nghĩa của các từ được trích xuất. Do đó cáctài liệu mức độ tình cảm phân loại có riêng của mìnhlợi thế và bất lợi. Lợi thế là chúng tôi nhận được mộttổng thể phân cực ý kiến văn bản về một thực thể cụ thể từmột tài liệu. Bất lợi là những cảm xúc khác nhauvề các tính năng khác nhau của một thực thể có thể không được giải nénmột cách riêng biệt.tài liệu có thể không được có liên quan trong thể hiện ý kiếnvề một thực thể. Do đó chủ quan/khách quanphân loại là rất quan trọng trong loại phân loại.Các câu không liên quan phải được loại bỏ từ cácxử lý công trình.Cả hai giám sát và không có giám sát học tập phương pháp có thểđược sử dụng để phân loại cấp tài liệu. Bất kỳ giám sáthọc các thuật toán như ngây thơ Bayes, hỗ trợ VectorMáy móc, có thể được sử dụng để đào tạo hệ thống. Đào tạo vàkiểm tra dữ liệu, người xem đánh giá (trong hình thức 1-5 sao),có thể được sử dụng. Các tính năng mà có thể được sử dụng cho máy tínhhọc tập là tần số thuật ngữ, tính từ từ một phần của bài phát biểugắn thẻ, ý kiến từ và cụm từ, negations,phụ thuộc vv. Ghi nhãn cực của tài liệutheo cách thủ công là tốn thời gian và do đó người dùng đánh giácó sẵn có thể được thực hiện sử dụng. Có thể không có giám sát học tậpđược thực hiện bằng cách chiết các ý kiến từ bên trong một tài liệu.Các point-wise lẫn nhau thông tin có thể được thực hiện việc sử dụng đểTìm ngữ nghĩa của các từ được trích xuất. Do đó cáctài liệu mức độ tình cảm phân loại có riêng của mìnhlợi thế và bất lợi. Lợi thế là chúng tôi nhận được mộttổng thể phân cực ý kiến văn bản về một thực thể cụ thể từmột tài liệu. Bất lợi là những cảm xúc khác nhauvề các tính năng khác nhau của một thực thể có thể không được giải nénmột cách riêng biệt.tài liệu có thể không được có liên quan trong thể hiện ý kiếnvề một thực thể. Do đó chủ quan/khách quanphân loại là rất quan trọng trong loại phân loại.Các câu không liên quan phải được loại bỏ từ cácxử lý công trình.Cả hai giám sát và không có giám sát học tập phương pháp có thểđược sử dụng để phân loại cấp tài liệu. Bất kỳ giám sáthọc các thuật toán như ngây thơ Bayes, hỗ trợ VectorMáy móc, có thể được sử dụng để đào tạo hệ thống. Đào tạo vàkiểm tra dữ liệu, người xem đánh giá (trong hình thức 1-5 sao),có thể được sử dụng. Các tính năng mà có thể được sử dụng cho máy tínhhọc tập là tần số thuật ngữ, tính từ từ một phần của bài phát biểugắn thẻ, ý kiến từ và cụm từ, negations,phụ thuộc vv. Ghi nhãn cực của tài liệutheo cách thủ công là tốn thời gian và do đó người dùng đánh giácó sẵn có thể được thực hiện sử dụng. Có thể không có giám sát học tậpđược thực hiện bằng cách chiết các ý kiến từ bên trong một tài liệu.Các point-wise lẫn nhau thông tin có thể được thực hiện việc sử dụng đểTìm ngữ nghĩa của các từ được trích xuất. Do đó cáctài liệu mức độ tình cảm phân loại có riêng của mìnhlợi thế và bất lợi. Lợi thế là chúng tôi nhận được mộttổng thể phân cực ý kiến văn bản về một thực thể cụ thể từmột tài liệu. Bất lợi là những cảm xúc khác nhauvề các tính năng khác nhau của một thực thể có thể không được giải nénmột cách riêng biệt.
đang được dịch, vui lòng đợi..
