4.2.3.1. Thông tin kinh. Tầm quan trọng của diễn ngôn trong
SA đã được tăng thời gian gần đây. Thông tin Discourse có thể được
tìm thấy hoặc giữa các câu hoặc các điều khoản trong cùng một
câu. Niềm tin chú thích ở mức độ giảng đã được nghiên cứu
trong [95,96]. Asher et al. [95] đã sử dụng năm loại quan hệ tu từ:
Contrast, chỉnh, hỗ trợ, kết quả, và Tiếp tục
với thông tin tình cảm gắn cho chú thích. Somasundaran
et al. [96] đã đề xuất một khái niệm gọi là khung ý kiến. Các
thành phần của khung ý kiến là ý kiến và là mối quan hệ
giữa các mục tiêu của họ [3]. Họ đã tăng cường công tác
điều tra và lựa chọn thiết kế để mô hình hóa một chương trình giảng
để cải thiện tình cảm phân loại [97].
Lý thuyết cấu trúc tu từ (RST) [98] mô tả làm thế nào để
phân chia ra thành nhiều nhịp, từng đại diện cho một phần có ý nghĩa
của văn bản. Heerschop et al. [29] đã đề xuất một khuôn khổ
mà thực hiện tài liệu SA (một phần) dựa trên một tài liệu
cấu trúc luận đã thu được bằng cách áp dụng RST trên
câu. Họ đưa ra giả thuyết rằng họ có thể cải thiện hiệu suất của một bộ phân loại tình cảm bằng cách tách một văn bản vào
nhịp văn bản quan trọng và ít quan trọng. Họ đã sử dụng lexiconbased
phân loại đánh giá phim. Kết quả cho thấy
sự cải thiện trong SC chính xác so với một cơ sở mà
không mất cấu trúc luận vào tài khoản.
Một cách tiếp cận mới để phát hiện không có giám sát trong nội bộ câu
quan hệ discourse cấp để loại bỏ sự mơ hồ cực
đã được trình bày bởi Zhou et al. [28]. Đầu tiên, họ đã xác định một
chương trình giảng với những hạn chế về ngôn cực dựa
trên RST. Sau đó, họ sử dụng một tập hợp nhỏ của cụm từ dựa trên cue
mẫu để thu thập một số lượng lớn các trường hợp ngôn mà
đã được chuyển đổi để đại diện tuần tự ngữ nghĩa (SSR).
Cuối cùng, họ đã áp dụng một phương pháp để tạo ra không có giám sát,
cân nhắc và lọc SSRs mới mà không có cụm từ cue công nhận
quan hệ diễn ngôn. Họ đã làm việc trên dữ liệu huấn luyện của Trung Quốc.
Kết quả cho thấy các phương pháp đề xuất có hiệu quả công nhận
quan hệ luận xác định và đạt được đáng kể
cải thiện.
Zirn et al. [30] đã trình bày một khuôn khổ hoàn toàn tự động
cho hạt mịn SA vào mức độ tiểu câu, kết hợp nhiều
lexicons tình cảm và vùng lân cận cũng như giảng
quan hệ. Họ sử dụng logic Markov để tích hợp điểm cực
từ lexicons tình cảm khác nhau sử dụng các thông tin về
mối quan hệ giữa các bộ phận lân cận. Họ đã làm việc trên
đánh giá sản phẩm. Kết quả cho thấy rằng việc sử dụng các cấu trúc
tính năng cải thiện tính chính xác của các dự đoán cực đạt được
điểm số chính xác lên tới 69%.
Tính hữu ích của RST trong bảng xếp hạng quy mô cực lớn các
bài đăng trên blog đã được khám phá bởi Chenlo et al. [61]. Họ đã áp dụng
phương pháp câu cấp để lựa chọn các câu quan trọng mà chuyển tải
các chủ đề trên tình cảm chung của một bài đăng blog. Sau đó, họ
áp dụng phân tích RST để những câu cốt lõi để hướng dẫn việc
phân loại các cực của họ và do đó để tạo ra một tổng thể
ước lượng của các cực tài liệu liên quan đến một cụ thể với
chủ đề. Họ phát hiện ra rằng các blogger có xu hướng thể hiện của họ
tình cảm trong một thời trang rõ ràng hơn trong việc xây dựng và
gán các đoạn văn bản hơn trong lõi của văn bản
chính nó. Kết quả cho thấy RST cung cấp thông tin giá trị
về cấu trúc diễn ngôn của văn bản có thể được
sử dụng để tạo ra một bảng xếp hạng chính xác hơn về các tài liệu về
tâm lý ước tính của họ trong blog đa chủ đề.
4.3. Các kỹ thuật khác
Có những kỹ thuật mà không thể được tạm phân loại như ML
cách tiếp cận hoặc tiếp cận dựa trên từ vựng. Formal Concept Phân tích
(FCA) là một trong những kỹ thuật. FCA đã được đề xuất bởi
Wille [99] là một phương pháp toán học được sử dụng cho cấu trúc, phân tích
và mô phỏng dữ liệu, dựa trên một khái niệm nhị nguyên được gọi là
kết nối Galois [100]. Các dữ liệu bao gồm một tập hợp các thực thể
và các tính năng của nó được cấu trúc thành trừu tượng hóa chính thức được gọi là
khái niệm chính thức. Họ cùng nhau tạo thành một mạng khái niệm ra lệnh
bằng một quan hệ thứ tự từng phần. Các Lưới khái niệm được xây dựng
bằng cách xác định các đối tượng và thuộc tính tương ứng của họ đối với
một lĩnh vực cụ thể, được gọi là cấu trúc tư tưởng, và sau đó là mối quan hệ
giữa họ được hiển thị. Fuzzy Formal Concept
Analysis (FFCA) đã được phát triển để đối phó với sự không chắc chắn
và thông tin không rõ ràng. Nó đã được áp dụng thành công
trong các ứng dụng thông tin tên miền khác nhau [101].
FCA và FFCA đã được sử dụng trong nhiều ứng dụng SA như
được trình bày bởi Li và Tsai [51]. Trong công việc của họ, họ đề xuất một
khuôn khổ phân loại dựa trên FFCA để khái niệm tài liệu
thành một dạng trừu tượng của khái niệm. Họ đã sử dụng đào tạo
ví dụ để cải thiện kết quả tùy ý gây ra bởi
các điều khoản mơ hồ. Họ đã sử dụng FFCA để đào tạo một phân lớp sử dụng
khái niệm thay vì tài liệu để giảm vốn có
mơ hồ. Họ đã làm việc trên một chiếc giường benchmark thử nghiệm (Reuters
21.578) và hai bộ dữ liệu cực ý kiến về bộ phim và sách điện tử
đánh giá. Kết quả của họ cho thấy hiệu suất cao trong tất cả các
bộ dữ liệu và chứng minh khả năng của mình để làm giảm độ nhạy cảm với
tiếng ồn, cũng như khả năng thích ứng của nó trong các ứng dụng miền chéo.
Kontopoulos et al. [55] đã sử dụng FCA còn để xây dựng một
mô hình miền ontology. Trong công việc của họ, họ đề nghị
sử dụng các kỹ thuật ontology dựa trên hướng tới một tình cảm hiệu quả hơn
phân tích của bài viết twitter bằng cách phá bỏ mỗi tweet
vào một tập hợp các khía cạnh liên quan đến chủ đề. Họ đã làm việc về
lĩnh vực điện thoại thông minh. Kiến trúc của họ mang lại nhiều
phân tích chi tiết của bài ý kiến về một chủ đề cụ thể
như phân biệt các tính năng của tên miền và gán
điểm số tương ứng với nó.
hệ thống phân tích tình cảm khái niệm cấp khác đã được
phát triển gần đây. Mudinas et al. [114] đã trình bày các
giải phẫu của pSenti. pSenti là một khái niệm phân tích tâm lý cấp
hệ thống được tích hợp vào khai thác ý kiến từ vựng dựa trên
cách tiếp cận và học tập dựa trên. Hệ thống của họ đạt được cao
độ chính xác trong tình cảm phân cực cũng như tình cảm
phát hiện sức mạnh so với các hệ thống từ vựng dựa trên tinh khiết.
Họ làm việc trên hai bộ dữ liệu thế giới (CNET
đánh giá phần mềm và IMDB đánh giá bộ phim). Họ vượt trội so với
các phương pháp lai đề xuất trên nhà nước-of-the-nghệ thuật
các hệ thống như SentiStrength.
đang được dịch, vui lòng đợi..