Phương pháp thống kê được sử dụng trong nhiều ứng dụng liên quan đến
SA. Một trong số đó là phát hiện các thao tác đánh giá bằng cách tiến hành
một thử nghiệm thống kê ngẫu nhiên được gọi là Chạy thử nghiệm. Hu
và Bose [31] Dự kiến các phong cách viết của các đánh giá
sẽ là ngẫu nhiên do các nguồn gốc khác nhau của khách hàng,
nếu đánh giá được viết bởi khách hàng thực sự. Họ
đã làm việc về Sách xét từ amazon.com và phát hiện ra
rằng khoảng 10,3% các sản phẩm có thể trực tuyến
đánh giá thao tác.
Latent Semantic Analysis (LSA) là một phương pháp thống kê
được sử dụng để phân tích mối quan hệ giữa một tập hợp các tài liệu
và các điều khoản được đề cập trong các tài liệu này để
tạo ra một tập hợp các mô hình có ý nghĩa liên quan đến các tài liệu
và các điều kiện [66]. Cao và Duẩn [18] đã sử dụng LSA để
tìm ra những đặc ngữ nghĩa từ văn bản xem xét lại để xem xét
tác động của các tính năng khác nhau. Mục tiêu của công việc của họ
là để hiểu lý do tại sao một số ý kiến nhận được nhiều sự hữu ích
phiếu, trong khi những người khác nhận được ít hoặc không có phiếu nào cả. Vì vậy,
thay vì dự đoán một mức độ hữu ích để đánh giá mà không có
phiếu, họ điều tra những yếu tố quyết định số
phiếu hồi hướng mà đánh giá đặc biệt nhận được (bao gồm
cả '' yes '' và '' không '' phiếu). Họ đã làm việc trên các chương trình phần mềm
thông tin phản hồi của người sử dụng từ CNET Download.com. Họ
cho thấy các đặc điểm ngữ nghĩa có nhiều ảnh hưởng
hơn so với những đặc điểm khác trong ảnh hưởng đến bao nhiêu sự hữu ích
đánh giá phiếu nhận được.
định hướng ngữ nghĩa của một từ là một phương pháp thống kê được sử dụng
cùng với các phương pháp PMI. Ngoài ra còn có một thực hiện của
không gian ngữ nghĩa gọi là Hyperspace Analogue để Language (HAL)
đã được đề xuất bởi Lund và Burgess [93]. Không gian ngữ nghĩa
là không gian trong những từ được biểu diễn bởi điểm; vị trí
của mỗi điểm cùng với mỗi trục là bằng cách nào đó có liên quan đến
ý nghĩa của từ. Xu và [6] Peng đã phát triển một
phương pháp tiếp cận dựa trên HAL gọi Sentiment Hyperspace
tương tự sang ngôn ngữ (S-HAL). Trong mô hình của họ, các ngữ nghĩa
thông tin định hướng của từ được đặc trưng bởi một cụ
không gian vector, và sau đó một phân loại đã được đào tạo để xác định các
định hướng ngữ nghĩa từ ngữ (từ hoặc cụm từ). Các giả thuyết
đã được xác nhận qua các phương pháp ngữ nghĩa định hướng suy luận
từ PMI (SO-PMI). Phương pháp của họ đã tạo ra một tập hợp các tính năng trọng dựa trên các từ xung quanh. Họ đã làm việc
trên các trang tin tức và sử dụng một văn Trung Quốc. Kết quả cho thấy
rằng họ vượt trội so với SO-PMI và cho thấy lợi thế trong
mô hình đặc điểm định hướng ngữ nghĩa khi so sánh
với các mô hình HAL gốc.
4.2.2.2. Cách tiếp cận ngữ nghĩa. Các cách tiếp cận ngữ nghĩa cho tình cảm
giá trị trực tiếp và dựa trên các nguyên tắc khác nhau để tính toán
sự tương tự giữa các từ. Nguyên tắc này tương tự cho
các giá trị tình cảm để từ ngữ nghĩa chặt chẽ. WordNet cho
ví dụ cung cấp các loại khác nhau của các mối quan hệ ngữ nghĩa
giữa các từ được sử dụng để tính toán cực tình cảm. WordNet
có thể được sử dụng quá cho việc thu thập một danh sách các từ tình cảm bằng cách lặp đi lặp lại
việc mở rộng các thiết lập ban đầu với các từ đồng nghĩa và trái nghĩa
và sau đó xác định các cực tình cảm cho một người vô danh
từ bằng cách tính tương đối của các từ đồng nghĩa tích cực và tiêu cực
của từ này [86].
Các Semantic Phương pháp được sử dụng trong nhiều ứng dụng để
xây dựng một mô hình từ vựng cho các mô tả của những động từ, danh từ và
tính từ có thể được sử dụng trong SA là công việc trình bày bởi Maks
và Vossen [7]. Mô hình của họ được mô tả chi tiết các chủ thể
quan hệ giữa các chủ thể trong một câu thể hiện riêng biệt
thái độ đối với từng diễn viên. Những mối quan hệ chủ quan được dán nhãn
với các thông tin liên quan đến cả hai sắc thái độ của
chủ sở hữu và định hướng (tích cực so với tiêu cực) của các
thái độ. Mô hình của họ bao gồm một phân loại thành ngữ nghĩa
danh mục liên quan đến SA. Nó cung cấp phương tiện cho việc xác định
thái độ của chủ sở hữu, sự phân cực của thái độ và cũng
mô tả những cảm xúc và tình cảm của nhau
diễn viên tham gia trong các văn bản. Họ đã sử dụng WordNet Hà Lan tại của họ
làm việc. Kết quả cho thấy rằng chủ quan của người nói và
đôi khi chủ quan của nam diễn viên có thể được xác định một cách tin cậy.
Semantics của WOM điện tử (eWOM) nội dung được sử dụng để
kiểm tra eWOM phân tích nội dung như đề xuất của Pai và
Chu [59]. Họ lấy đánh giá cả tích cực và tiêu cực,
và giúp người tiêu dùng trong việc ra quyết định của họ. Phương pháp của họ
có thể được sử dụng như một công cụ để hỗ trợ tốt hơn các công ty trong
các đánh giá về sản phẩm hoặc dịch vụ sự hiểu biết, và theo đó
dịch các ý kiến vào kinh doanh thông minh sẽ được sử dụng
làm cơ sở để cải tiến sản phẩm / dịch vụ. Họ đã làm việc
trên Đài Loan đánh giá thức ăn nhanh. Kết quả cho thấy rằng
cách tiếp cận của họ là có hiệu quả trong việc cung cấp các đánh giá eWOM
liên quan đến các dịch vụ và sản phẩm.
phương pháp ngữ nghĩa có thể được trộn lẫn với các phương pháp thống kê
để thực hiện nhiệm vụ SA là công việc trình bày bởi Zhang và Xu [38]
đã sử dụng cả hai phương pháp để tìm điểm yếu sản phẩm từ trực tuyến
đánh giá. Công cụ tìm điểm yếu của họ chiết xuất các tính năng và nhóm
tính năng rõ ràng bằng cách sử dụng phương pháp dựa trên hình vị để xác định
từ tính năng từ những nhận xét. Họ đã sử dụng Hownet dựa trên
biện pháp tương tự để tìm ra rõ ràng thường xuyên và không thường xuyên
các tính năng mà mô tả các khía cạnh như nhau. Họ đã xác định các
tính năng tiềm ẩn với lựa chọn cách sắp xếp từ số liệu thống kê dựa trên
phương pháp PMI. Họ đã được nhóm sản phẩm tính năng từ vào
khía cạnh tương ứng bằng cách áp dụng phương pháp ngữ nghĩa. Họ
đã sử dụng phương pháp dựa trên SA câu để xác định các
cực của mỗi khía cạnh trong câu có tính đến
tác động của các phó từ chỉ mức độ. Họ có thể tìm thấy những điểm yếu
của sản phẩm, vì nó có lẽ là khía cạnh không hài lòng nhất trong
đánh giá của khách hàng, hoặc các khía cạnh đó là không hài lòng hơn
khi so sánh với đánh giá sản phẩm đối thủ cạnh tranh của họ.
Kết quả của họ thể hiện hiệu suất tốt của sự yếu kém
cụ tìm.
4.2. 3. Lexicon dựa trên và xử lý ngôn ngữ tự nhiên các kỹ thuật
xử lý ngôn ngữ tự nhiên (NLP) kỹ thuật đôi khi được
sử dụng với các phương pháp tiếp cận dựa trên từ vựng để tìm các cú pháp
cấu trúc và giúp đỡ trong việc tìm kiếm các mối quan hệ ngữ nghĩa [94]. Moreo
và Romero [37] đã sử dụng kỹ thuật NLP như tiền xử lý
giai đoạn trước khi họ sử dụng từ vựng dựa trên SA thuật toán đề xuất của họ.
Hệ thống đề xuất của họ bao gồm một nét tự động
phát hiện mô-đun và một mô-đun phân tích tâm lý có khả năng
đánh giá ý kiến người sử dụng các chủ đề trong mục tin tức mà sử dụng
một nguyên tắc phân loại, từ vựng được thiết kế đặc biệt để phân tích tin tức.
Kết quả của họ đã được hứa hẹn trong kịch bản mà ngôn ngữ giao tiếp
ngôn ngữ chiếm ưu thế.
đang được dịch, vui lòng đợi..
