Một kỹ thuật là một trong những bộ quần áo đồng kết hợp các
kết quả đầu ra của một số mô hình phân loại cơ sở để hình thành một
đầu ra tích hợp. Rui Xia (2011) sử dụng phương pháp này và
đã thực hiện một nghiên cứu so sánh hiệu quả của các
kỹ thuật phân loại quần áo đồng bộ cho tình cảm của
hiệu quả tích hợp bộ tính năng khác nhau và
các thuật toán phân loại để tổng hợp một chính xác hơn
trình phân loại. Trong công việc của mình, hai loại tính năng
bộ được thiết kế để phân loại tình cảm, cụ thể là các
bộ tính năng dựa part-of-speech và word-mối quan hệ
dựa trên bộ tính năng. Sau đó, ba phân loại văn bản
thuật toán, cụ thể là ngây thơ Bayes, entropy và tối đa
máy vector hỗ trợ, được sử dụng như là cơ sở-phân loại
cho từng tính năng thiết để dự đoán điểm phân loại.
Ba loại phương pháp ấn tượng, cụ thể là cố định
kết hợp, kết hợp trọng và meta -classifier
kết hợp, được đánh giá đối với ba chiến lược quần
là quần của bộ tính năng, bộ quần áo đồng của
các thuật toán phân loại, và quần thể của cả hai tính năng
tập hợp và phân loại các thuật toán.
Trong hầu hết các nghiên cứu so sánh nó được tìm thấy rằng
SVM nhanh hơn so với các phương pháp học máy khác trong
phân loại tình cảm . Ziqiong Zhang (2011) đã cho thấy một
sự mâu thuẫn trong việc thực hiện của SVM. Họ tập trung
sự quan tâm của họ về bản tiếng Quảng Đông, một loạt các văn bản của
Trung Quốc. Họ đã đề xuất một phương pháp trong đó sử dụng
giám sát máy hoàn toàn trước khi kiến thức miễn phí
phương pháp học tập và chứng minh rằng máy chọn
mô hình học tập có thể là có thể rút ra kết luận riêng của mình
từ sự phân bố của các yếu tố từ vựng trong một mảnh của
Quảng Đông xem xét. Mặc dù độc lập giả định không thực tế của nó, là phân loại Bayes ngây thơ đáng ngạc nhiên
đạt hiệu suất tốt hơn so với SVM.
Sentiment phân loại được thực hiện bằng cách xây dựng một văn bản
phân loại bằng cách chiết xuất các luật kết hợp là kết hợp các
điều khoản của một tài liệu, chủng loại của nó, bằng cách mô hình hóa các
tài liệu văn bản là một bộ sưu tập của giao dịch trong đó mỗi
giao dịch đại diện cho một tài liệu văn bản, và các mặt hàng trong
các giao dịch là các thuật ngữ được lựa chọn từ các tài liệu
và các loại tài liệu được giao cho. Sau đó, các
hệ thống phát hiện ra mối liên hệ giữa các từ trong
văn bản và các nhãn được gán cho họ. Mỗi
thể loại được coi như một bộ sưu tập văn bản riêng biệt và
khai thác luật kết hợp được áp dụng cho nó. Các quy tắc
tạo ra từ tất cả các hạng mục riêng biệt được kết hợp
với nhau để tạo thành các phân loại (Weitong Huang, 2008).
Sau đó, các tập huấn luyện được sử dụng để đánh giá phân loại
chất lượng, phân loại các tài liệu văn bản thử nghiệm, các
số quy tắc bảo hiểm, và xác suất tính từ thuộc được
sử dụng. Yulan Anh (2010) đã cố gắng để tạo ra một cuốn tiểu thuyết
tình cảm cho khung phân loại học tập từ
các tài liệu không có nhãn. Quá trình bắt đầu với một
tập hợp các văn bản un-chú thích và một từ vựng tình cảm.
Công cụ phân loại ban đầu được đào tạo bằng cách kết hợp trước khi
thông tin từ vựng tình cảm trong đó bao gồm
một danh sách các từ được đánh dấu với cực tương ứng của họ. Các
tính năng được dán nhãn sử dụng chúng trực tiếp để hạn chế mô hình "s
các dự báo về các trường hợp không có nhãn bằng tổng quát
tiêu chí mong đợi. Bộ phân loại ban đầu được đào tạo sử dụng
kỳ vọng tổng quát sau đó được áp dụng trên unannotated
văn bản và các tài liệu có nhãn với cao
sự tự tin được đưa vào tính năng tự học được vắt
để có được tính năng tên miền phụ thuộc vào tự động.
tính năng tự học như vậy, tiếp tục được sử dụng để đào tạo
khác phân loại sau đó được áp dụng trên các thiết lập thử nghiệm để
có được kết quả cuối cùng.
Một vài nghiên cứu gần đây trong lĩnh vực này giải thích việc sử dụng
mạng nơron trong các phân loại tình cảm. Zhu Jian
(2010) đề xuất một mô hình cá nhân dựa trên nhân tạo
các mạng thần kinh để phân chia các bộ phim xem xét corpus thành
tích cực, tiêu cực và mờ giai điệu mà là dựa trên các
tiến đệ quy bình phương tối thiểu lại tuyên truyền
thuật toán huấn luyện. Long-Sheng Chen (2011) đã đề xuất một
phương pháp tiếp cận dựa trên mạng thần kinh, trong đó kết hợp các
ưu điểm của kỹ thuật máy học và các
kỹ thuật truy vấn thông tin.
Định hướng 3.2.Semantic
Cách tiếp cận định hướng Semantic để Sentiment
phân tích là "" học không giám sát "bởi vì nó không
yêu cầu đào tạo trước khi ra để khai thác dữ liệu. Thay vào đó, nó
đo cách xa một chữ nghiêng theo hướng tích cực và
tiêu cực.
Phần lớn các nghiên cứu trong tình cảm không có giám sát
phân loại làm cho việc sử dụng các nguồn lực có sẵn từ vựng.
Kamps et al (2004) tập trung vào việc sử dụng các mối quan hệ từ vựng
trong phân loại tình cảm. Andrea Esuli và Fabrizio
Sebastiani (2005) đề xuất học bán giám sát
phương pháp bắt đầu từ việc mở rộng một loạt hạt giống ban đầu sử dụng
WordNet. Giả định cơ bản của họ là điều khoản tương tự với
định hướng xu hướng có nhũ tương tự. Họ xác định
các hạn hạt giống mở rộng "của định hướng ngữ nghĩa thông qua
phân loại bóng bằng kỹ thuật thống kê.
Khi xem xét nơi một quan điểm nằm trong, không thể
cung cấp đủ thông tin theo ngữ cảnh để xác định các
định hướng dư luận, Chunxu Wu (2009) đề xuất một
cách tiếp cận khu nghỉ mát để khác các ý kiến thảo luận về
một chủ đề nhằm thông tin theo ngữ cảnh hữu của tôi, sau đó
sử dụng các biện pháp tương tự ngữ nghĩa để đánh giá định hướng
dư luận. Họ đã cố gắng để giải quyết vấn đề này bằng
việc định hướng của bối cảnh ý kiến độc lập,
sau đó xem xét những ý kiến phụ thuộc vào ngữ cảnh sử dụng
quy tắc ngôn ngữ để suy ra định hướng của bối cảnh distinctdependent
ý kiến, sau đó trích xuất thông tin theo ngữ cảnh
từ các ý kiến khác, bình luận về các sản phẩm cùng
tính năng để đánh giá bối cảnh không rõ ràng phụ thuộc vào
ý kiến.
đang được dịch, vui lòng đợi..