4.2.3.1. Discourse information. The importance of discourse inSA has b dịch - 4.2.3.1. Discourse information. The importance of discourse inSA has b Việt làm thế nào để nói

4.2.3.1. Discourse information. The

4.2.3.1. Discourse information. The importance of discourse in
SA has been increasing recently. Discourse information can be
found either among sentences or among clauses in the same
sentence. Sentiment annotation at the discourse level was studied
in [95,96]. Asher et al. [95] have used five types of rhetorical relations:
Contrast, Correction, Support, Result, and Continuation
with attached sentiment information for annotation. Somasundaran
et al. [96] have proposed a concept called opinion frame. The
components of opinion frames are opinions and are the relationships
between their targets [3]. They have enhanced their work
and investigated design choices in modeling a discourse scheme
for improving sentiment classification [97].
Rhetorical Structure Theory (RST) [98] describes how to
split a text into spans, each representing a meaningful part
of the text. Heerschop et al. [29] have proposed a framework
that performed document SA (partly) based on a document’s
discourse structure which was obtained by applying RST on
sentence level. They hypothesized that they can improve the performance of a sentiment classifier by splitting a text into
important and less important text spans. They used lexiconbased
for classification of movie reviews. Their results showed
improvement in SC accuracy compared to a baseline that does
not take discourse structure into account.
A novel unsupervised approach for discovering intra-sentence
level discourse relations for eliminating polarity ambiguities
was presented by Zhou et al. [28]. First, they defined a
discourse scheme with discourse constraints on polarity based
on RST. Then, they utilized a small set of cue phrase-based
patterns to collect a large number of discourse instances which
were converted to semantic sequential representations (SSRs).
Finally, they adopted an unsupervised method to generate,
weigh and filter new SSRs without cue phrases for recognizing
discourse relations. They worked on Chinese training data.
Their results showed that the proposed methods effectively recognized
the defined discourse relations and achieved significant
improvement.
Zirn et al. [30] have presented a fully automatic framework
for fine-grained SA on the sub-sentence level, combining multiple
sentiment lexicons and neighborhood as well as discourse
relations. They use Markov logic to integrate polarity scores
from different sentiment lexicons using information about
relations between neighboring segments. They worked on
product reviews. Their results showed that the use of structural
features improved the accuracy of polarity predictions achieving
accuracy scores up to 69%.
The usefulness of RST in large scale polarity ranking of
blog posts was explored by Chenlo et al. [61]. They applied
sentence-level methods to select the key sentences that conveyed
the overall on-topic sentiment of a blog post. Then, they
applied RST analysis to these core sentences to guide the
classification of their polarity and thus to generate an overall
estimation of the document polarity with respect to a specific
topic. They discovered that Bloggers tend to express their
sentiment in a more apparent fashion in elaborating and
attributing text segments rather than in the core of the text
itself. Their results showed that RST provided valuable information
about the discourse structure of the texts that can be
used to make a more accurate ranking of documents in terms
of their estimated sentiment in multi-topic blogs.
4.3. Other techniques
There are techniques that cannot be roughly categorized as ML
approach or lexicon-based Approach. Formal Concept Analysis
(FCA) is one of those techniques. FCA was proposed by
Wille [99] as a mathematical approach used for structuring, analyzing
and visualizing data, based on a notion of duality called
Galois connection [100]. The data consists of a set of entities
and its features are structured into formal abstractions called
formal concepts. Together they form a concept lattice ordered
by a partial order relation. The concept lattices are constructed
by identifying the objects and their corresponding attributes for
a specific domain, called conceptual structures, and then the relationships
among them are displayed. Fuzzy Formal Concept
Analysis (FFCA) was developed in order to deal with uncertainty
and unclear information. It has been successfully applied
in various information domain applications [101].
FCA and FFCA were used in many SA applications as
presented by Li and Tsai [51]. In their work they proposed a
classification framework based on FFCA to conceptualize documents
into a more abstract form of concepts. They used training
examples to improve the arbitrary outcomes caused by
ambiguous terms. They used FFCA to train a classifier using
concepts instead of documents in order to reduce the inherent
ambiguities. They worked on a benchmark test bed (Reuters
21578) and two opinion polarity data sets on movie and eBook
reviews. Their results indicated superior performance in all
data sets and proved its ability to decrease the sensitivity to
noise, as well as its adaptability in cross domain applications.
Kontopoulos et al. [55] have used FCA also to build an
ontology domain model. In their work, they proposed the
use of ontology-based techniques toward a more efficient sentiment
analysis of twitter posts by breaking down each tweet
into a set of aspects relevant to the subject. They worked on
the domain of smart phones. Their architecture gives more
detailed analysis of post opinions regarding a specific topic
as it distinguishes the features of the domain and assigns
respective scores to it.
Other concept-level sentiment analysis systems have been
developed recently. Mudinas et al. [114] have presented the
anatomy of pSenti. pSenti is a concept-level sentiment analysis
system that is integrated into opinion mining lexicon-based
and learning-based approaches. Their system achieved higher
accuracy in sentiment polarity classification as well as sentiment
strength detection compared with pure lexicon-based systems.
They worked on two real-world data sets (CNET
software reviews and IMDB movie reviews). They outperformed
the proposed hybrid approach over state-of-the-art
systems like SentiStrength.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
4.2.3.1. discourse thông tin. Tầm quan trọng của discourse trongSA đã tăng lên gần đây. Discourse thông tin có thểtìm thấy trong câu hoặc trong các điều khoản trong cùng mộtcâu. Tình cảm chú thích ở mức độ discourse được nghiên cứutại [95,96]. Asher et al. [95] đã sử dụng năm loại rhetorical quan hệ:Độ tương phản, chỉnh sửa, hỗ trợ, kết quả, và tiếp tụcvới tình cảm đính kèm các thông tin cho chú thích. Somasundaranet al. [96] đã đề xuất một khái niệm gọi là ý kiến khung. Cácthành phần của khung ý kiến ý kiến và là các mối quan hệgiữa mục tiêu của họ [3]. Họ đã nâng cao công việc của họvà sự lựa chọn tra thiết kế trong mô hình một đề án discourseđể cải thiện phân loại tình cảm [97].Rhetorical cấu trúc lý thuyết (RST) [98] mô tả làm thế nào đểtách một văn bản vào kéo dài, mỗi đại diện cho một phần có ý nghĩavăn bản. Heerschop et al. [29] đã đề xuất một khuôn khổmà thực hiện tài liệu SA (một phần) dựa trên một tài liệucấu trúc discourse mà thu được bằng cách áp dụng RST ngàymức độ câu. Họ đưa ra giả thuyết rằng họ có thể cải thiện hiệu suất của một loại tình cảm thông qua việc tách một văn bản vàovăn bản quan trọng và ít quan trọng kéo dài. Họ đã sử dụng lexiconbasedXếp hạng của phim nhận xét. Kết quả của họ cho thấycải thiện độ chính xác SC so với một đường cơ sở nàokhông có cấu trúc discourse vào tài khoản.Một cách tiếp cận không có giám sát mới để khám phá câu nộicấp discourse quan hệ cho loại bỏ phân cực ambiguitiesđã được trình bày bởi chu et al. [28]. Trước tiên, họ xác định mộtdiscourse đề án với discourse khó khăn về phân cực dựatrên RST. Sau đó, họ sử dụng một tập hợp nhỏ các cue dựa trên cụm từCác mô hình để thu thập một số lớn các discourse trường hợp màđược cải biến để đại diện tuần tự ngữ nghĩa (SSRs).Cuối cùng, họ đã thông qua một phương pháp không có giám sát để tạo ra,cân nhắc và lọc SSRs mới mà không có cụm từ cue công nhậnquan hệ discourse. Họ làm việc trên dữ liệu Trung Quốc đào tạo.Kết quả của họ cho thấy rằng các phương pháp được đề xuất có hiệu quả công nhậnCác định nghĩa discourse quan hệ và đạt được đáng kểcải thiện.Zirn et al. [30] đã trình bày một khuôn khổ hoàn toàn tự độngcho SA hạt mịn trên cấp độ tiểu câu, kết hợp nhiềutình cảm lexicons và khu phố cũng như các discoursequan hệ. Họ sử dụng Markov logic để tích hợp cực điểmtừ lexicons tình cảm khác nhau bằng cách sử dụng thông tin vềquan hệ giữa giáp ranh các phân đoạn. Họ làm việc trênđánh giá sản phẩm. Kết quả của họ cho thấy rằng việc sử dụng các kết cấutính năng cải tiến độ chính xác của dự báo phân cực đạt đượcđộ chính xác điểm tới 69%.Tính hữu dụng của RST trong bảng xếp hạng cực lớn quy mô củabài đăng trên blog được khám phá bởi Chenlo et al. [61]. Họ áp dụngcâu cấp phương pháp để chọn các câu chính chuyển tảitình cảm tổng thể trên chủ đề của một bài đăng blog. Sau đó, họRST phân tích ứng dụng để những câu cốt lõi để hướng dẫn cácphân loại trong phân cực của họ và như vậy để tạo ra một tổng thểước tính của tài liệu cực đối với một cụ thểchủ đề. Họ phát hiện ra rằng blogger có xu hướng nhận của họtình cảm trong một cách rõ ràng hơn trong xây dựng vàattributing phân đoạn văn bản hơn là ở cốt lõi của văn bảnchính nó. Kết quả của họ cho thấy rằng RST cung cấp thông tin giá trịvề cấu trúc discourse của những văn bản mà có thểđược sử dụng để làm cho một thứ hạng chính xác hơn của tài liệu trong điều khoảncủa tình cảm của họ ước tính trong nhiều chủ đề blog.4.3. khác kỹ thuậtCó những kỹ thuật không thể được phân loại khoảng là MLphương pháp tiếp cận hoặc lexicon dựa trên phương pháp tiếp cận. Phân tích chính thức khái niệm(FCA) là một trong những kỹ thuật. FCA được đề xuất bởiWille [99] như là một phương pháp toán học được sử dụng cho cơ cấu, phân tíchvà hình dung dữ liệu, dựa trên một khái niệm của duality được gọi làGalois các kết nối [100]. Các dữ liệu bao gồm một tập hợp các thực thểvà các tính năng được xây dựng vào abstractions chính thức được gọi làkhái niệm chính thức. Cùng nhau chúng tạo thành một lưới khái niệm đã ra lệnhbởi một mối quan hệ một phần đơn đặt hàng. Lưới khái niệm được xây dựngbằng cách xác định các đối tượng và thuộc tính tương ứng của họ chomột miền cụ thể, được gọi là khái niệm cấu trúc, và sau đó các mối quan hệtrong số đó được hiển thị. Khái niệm chính thức mờPhân tích (FFCA) đã được phát triển để đối phó với sự không chắc chắnvà thông tin không rõ ràng. Nó đã được áp dụng thành côngtrong các tên miền thông tin ứng dụng [101].FCA và FFCA đã được sử dụng trong nhiều ứng dụng SA làtrình bày bởi Li và Tsai [51]. Trong công việc của họ đề xuất mộtkhuôn khổ phân loại dựa trên FFCA để khái niệm tài liệuvào một hình thức trừu tượng hơn của khái niệm. Họ sử dụng đào tạoVí dụ để cải thiện kết quả tùy ý dothuật ngữ mơ hồ. Họ đã sử dụng FFCA để đào tạo một loại bằng cách sử dụngCác khái niệm thay vì tài liệu để làm giảm các vốn cóambiguities. Họ làm việc trên một điểm chuẩn thử nghiệm giường (Reuters21578) và hai ý kiến phân cực dữ liệu bộ phim và eBookgiá của khách. Kết quả của họ chỉ ra các hiệu suất vượt trội trong tất cảdữ liệu bộ và chứng minh khả năng của mình để giảm độ nhạy cảm vớitiếng ồn, cũng như khả năng thích ứng của nó trong qua miền ứng dụng.Kontopoulos et al. [55] đã sử dụng các FCA cũng là để xây dựng mộtCác mô hình miền ontology. Trong công việc của họ, họ đề xuất cácsử dụng các ontology dựa trên kỹ thuật đối với một tình cảm hiệu quả hơnphân tích của twitter bài viết bằng cách phá vỡ xuống mỗi tweetvào một tập hợp các khía cạnh liên quan đến chủ đề. Họ làm việc trêntên miền của điện thoại thông minh. Kiến trúc của họ cung cấp cho nhiều hơn nữaCác phân tích chi tiết của bài ý kiến liên quan đến một chủ đề cụ thểvì nó phân biệt các tính năng của tên miền và đặtđiểm số tương ứng với nó.Hệ thống phân tích mức độ khái niệm tình cảm khác đãphát triển mới. Mudinas et al. [114] đã trình bày cácgiải phẫu của pSenti. pSenti là một phân tích khái niệm cấp tình cảmHệ thống được tích hợp vào quan điểm khai thác dựa trên lexiconvà học tập dựa trên phương pháp tiếp cận. Hệ thống của họ đạt được cao hơnđộ chính xác trong tình cảm phân cực phân loại cũng như tình cảmphát hiện sức mạnh so với tinh khiết lexicon dựa trên hệ thống.Họ làm việc trên hai bộ dữ liệu thực tế (CNETđánh giá phần mềm và IMDB phim đánh giá). Họ tốt hơncách tiếp cận được đề xuất lai qua nhà nước-of-the-nghệ thuậtHệ thống như SentiStrength.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
4.2.3.1. Thông tin kinh. Tầm quan trọng của diễn ngôn trong
SA đã được tăng thời gian gần đây. Thông tin Discourse có thể được
tìm thấy hoặc giữa các câu hoặc các điều khoản trong cùng một
câu. Niềm tin chú thích ở mức độ giảng đã được nghiên cứu
trong [95,96]. Asher et al. [95] đã sử dụng năm loại quan hệ tu từ:
Contrast, chỉnh, hỗ trợ, kết quả, và Tiếp tục
với thông tin tình cảm gắn cho chú thích. Somasundaran
et al. [96] đã đề xuất một khái niệm gọi là khung ý kiến. Các
thành phần của khung ý kiến là ý kiến và là mối quan hệ
giữa các mục tiêu của họ [3]. Họ đã tăng cường công tác
điều tra và lựa chọn thiết kế để mô hình hóa một chương trình giảng
để cải thiện tình cảm phân loại [97].
Lý thuyết cấu trúc tu từ (RST) [98] mô tả làm thế nào để
phân chia ra thành nhiều nhịp, từng đại diện cho một phần có ý nghĩa
của văn bản. Heerschop et al. [29] đã đề xuất một khuôn khổ
mà thực hiện tài liệu SA (một phần) dựa trên một tài liệu
cấu trúc luận đã thu được bằng cách áp dụng RST trên
câu. Họ đưa ra giả thuyết rằng họ có thể cải thiện hiệu suất của một bộ phân loại tình cảm bằng cách tách một văn bản vào
nhịp văn bản quan trọng và ít quan trọng. Họ đã sử dụng lexiconbased
phân loại đánh giá phim. Kết quả cho thấy
sự cải thiện trong SC chính xác so với một cơ sở mà
không mất cấu trúc luận vào tài khoản.
Một cách tiếp cận mới để phát hiện không có giám sát trong nội bộ câu
quan hệ discourse cấp để loại bỏ sự mơ hồ cực
đã được trình bày bởi Zhou et al. [28]. Đầu tiên, họ đã xác định một
chương trình giảng với những hạn chế về ngôn cực dựa
trên RST. Sau đó, họ sử dụng một tập hợp nhỏ của cụm từ dựa trên cue
mẫu để thu thập một số lượng lớn các trường hợp ngôn mà
đã được chuyển đổi để đại diện tuần tự ngữ nghĩa (SSR).
Cuối cùng, họ đã áp dụng một phương pháp để tạo ra không có giám sát,
cân nhắc và lọc SSRs mới mà không có cụm từ cue công nhận
quan hệ diễn ngôn. Họ đã làm việc trên dữ liệu huấn luyện của Trung Quốc.
Kết quả cho thấy các phương pháp đề xuất có hiệu quả công nhận
quan hệ luận xác định và đạt được đáng kể
cải thiện.
Zirn et al. [30] đã trình bày một khuôn khổ hoàn toàn tự động
cho hạt mịn SA vào mức độ tiểu câu, kết hợp nhiều
lexicons tình cảm và vùng lân cận cũng như giảng
quan hệ. Họ sử dụng logic Markov để tích hợp điểm cực
từ lexicons tình cảm khác nhau sử dụng các thông tin về
mối quan hệ giữa các bộ phận lân cận. Họ đã làm việc trên
đánh giá sản phẩm. Kết quả cho thấy rằng việc sử dụng các cấu trúc
tính năng cải thiện tính chính xác của các dự đoán cực đạt được
điểm số chính xác lên tới 69%.
Tính hữu ích của RST trong bảng xếp hạng quy mô cực lớn các
bài đăng trên blog đã được khám phá bởi Chenlo et al. [61]. Họ đã áp dụng
phương pháp câu cấp để lựa chọn các câu quan trọng mà chuyển tải
các chủ đề trên tình cảm chung của một bài đăng blog. Sau đó, họ
áp dụng phân tích RST để những câu cốt lõi để hướng dẫn việc
phân loại các cực của họ và do đó để tạo ra một tổng thể
ước lượng của các cực tài liệu liên quan đến một cụ thể với
chủ đề. Họ phát hiện ra rằng các blogger có xu hướng thể hiện của họ
tình cảm trong một thời trang rõ ràng hơn trong việc xây dựng và
gán các đoạn văn bản hơn trong lõi của văn bản
chính nó. Kết quả cho thấy RST cung cấp thông tin giá trị
về cấu trúc diễn ngôn của văn bản có thể được
sử dụng để tạo ra một bảng xếp hạng chính xác hơn về các tài liệu về
tâm lý ước tính của họ trong blog đa chủ đề.
4.3. Các kỹ thuật khác
Có những kỹ thuật mà không thể được tạm phân loại như ML
cách tiếp cận hoặc tiếp cận dựa trên từ vựng. Formal Concept Phân tích
(FCA) là một trong những kỹ thuật. FCA đã được đề xuất bởi
Wille [99] là một phương pháp toán học được sử dụng cho cấu trúc, phân tích
và mô phỏng dữ liệu, dựa trên một khái niệm nhị nguyên được gọi là
kết nối Galois [100]. Các dữ liệu bao gồm một tập hợp các thực thể
và các tính năng của nó được cấu trúc thành trừu tượng hóa chính thức được gọi là
khái niệm chính thức. Họ cùng nhau tạo thành một mạng khái niệm ra lệnh
bằng một quan hệ thứ tự từng phần. Các Lưới khái niệm được xây dựng
bằng cách xác định các đối tượng và thuộc tính tương ứng của họ đối với
một lĩnh vực cụ thể, được gọi là cấu trúc tư tưởng, và sau đó là mối quan hệ
giữa họ được hiển thị. Fuzzy Formal Concept
Analysis (FFCA) đã được phát triển để đối phó với sự không chắc chắn
và thông tin không rõ ràng. Nó đã được áp dụng thành công
trong các ứng dụng thông tin tên miền khác nhau [101].
FCA và FFCA đã được sử dụng trong nhiều ứng dụng SA như
được trình bày bởi Li và Tsai [51]. Trong công việc của họ, họ đề xuất một
khuôn khổ phân loại dựa trên FFCA để khái niệm tài liệu
thành một dạng trừu tượng của khái niệm. Họ đã sử dụng đào tạo
ví dụ để cải thiện kết quả tùy ý gây ra bởi
các điều khoản mơ hồ. Họ đã sử dụng FFCA để đào tạo một phân lớp sử dụng
khái niệm thay vì tài liệu để giảm vốn có
mơ hồ. Họ đã làm việc trên một chiếc giường benchmark thử nghiệm (Reuters
21.578) và hai bộ dữ liệu cực ý kiến về bộ phim và sách điện tử
đánh giá. Kết quả của họ cho thấy hiệu suất cao trong tất cả các
bộ dữ liệu và chứng minh khả năng của mình để làm giảm độ nhạy cảm với
tiếng ồn, cũng như khả năng thích ứng của nó trong các ứng dụng miền chéo.
Kontopoulos et al. [55] đã sử dụng FCA còn để xây dựng một
mô hình miền ontology. Trong công việc của họ, họ đề nghị
sử dụng các kỹ thuật ontology dựa trên hướng tới một tình cảm hiệu quả hơn
phân tích của bài viết twitter bằng cách phá bỏ mỗi tweet
vào một tập hợp các khía cạnh liên quan đến chủ đề. Họ đã làm việc về
lĩnh vực điện thoại thông minh. Kiến trúc của họ mang lại nhiều
phân tích chi tiết của bài ý kiến về một chủ đề cụ thể
như phân biệt các tính năng của tên miền và gán
điểm số tương ứng với nó.
hệ thống phân tích tình cảm khái niệm cấp khác đã được
phát triển gần đây. Mudinas et al. [114] đã trình bày các
giải phẫu của pSenti. pSenti là một khái niệm phân tích tâm lý cấp
hệ thống được tích hợp vào khai thác ý kiến từ vựng dựa trên
cách tiếp cận và học tập dựa trên. Hệ thống của họ đạt được cao
độ chính xác trong tình cảm phân cực cũng như tình cảm
phát hiện sức mạnh so với các hệ thống từ vựng dựa trên tinh khiết.
Họ làm việc trên hai bộ dữ liệu thế giới (CNET
đánh giá phần mềm và IMDB đánh giá bộ phim). Họ vượt trội so với
các phương pháp lai đề xuất trên nhà nước-of-the-nghệ thuật
các hệ thống như SentiStrength.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: