5. OPINION MINING AND SENTIMENTANALYSISThe sentiment analysis problem  dịch - 5. OPINION MINING AND SENTIMENTANALYSISThe sentiment analysis problem  Việt làm thế nào để nói

5. OPINION MINING AND SENTIMENTANAL

5. OPINION MINING AND SENTIMENT
ANALYSIS
The sentiment analysis problem is met using some of the
techniques using natural language processing technique,
proximity method etc. Following are a brief study on a few
of them.
A notable approach in [3] uses a sentence level sentiment
analysis. The word level feature extraction is done using
Naive Bayesian Classifier. The semantic orientation of the
individual sentences is retrieved from the contextual
information. This machine learning approach on average
claims an accuracy rate of 83%. For classifying and
analyzing of the sentiment from the reviews, machine
learning and lexical contextual information are used. The
paper focuses on sentence level to check whether the
sentences are objective or subjective and to classify the
polarity of the sentences to positive or negative opinion.
The naive bayes approach is used to annotate each sentence
as positive and negative on the bases of useful word level
feature. SVM classifier is trained on the annotated sentences
for the positive and negative classification. Contextual
information is used to calculate the polarity of sentence and
mark it as either negative or positive. The paper[4] presents
experiments for sentiment analysis to automatically
distinguish prior and contextual polarity. Beginning with a
large stable of clues marked with prior polarity, method
identifies the contextual polarity of the phrases that contain
instances of those clues in the corpus.
A two-step process is used that employs machine learning
and a variety of features. Firstly the method classifies each
phrase containing a clue as neutral or polar. Secondly it
takes all phrases marked in previous step as polar and
disambiguates their contextual polarity (positive, negative,
both, or neutral). The method describes a system that
automatically identifies the contextual polarity for a large
subset of sentiment expressions, achieving reliable results.
Another significant work is the implementation of both
Natural Language understanding and Generation in
Sentiment analysis [5]. A couple of algorithms to search and
predict the orientation of opinions are specified in this
research work. In their system there is a review database that
stores the opinionated texts. The method then finds frequent
features that many people have expressed their opinions on.
After that, the opinion words are extracted using the
resulting frequent features, and semantic orientations of the
opinion words are identified with the help of WordNet. The
system then finds those infrequent features.
The orientation of each opinion sentence is identified and a
final text summary is generated in this work. The part of speech tagging from natural language processing is used to
find opinion features. The output of the above paper is a text
summary of opinions. Thus Summarization of text is also
done as a subsystem. But this summarization work is truly
dependent on the features and hence is far from the
automatic summarization work in the field of NLP. The
paper proposes a method by utilizing the adjective synonym
set and antonym set in WordNet to predict the semantic
orientations of adjectives. The paper also describes the need
of pronoun resolution in opinion mining even though it is
not addressed.
A method of sentiment analysis which does not use
conventional natural language rules is specified in [6]. The
work uses a machine learning approach (Naive Bayesian)for
classification. The class association rules is used to extract
the associations between term features appearing in
consumer review opinions and product features for a
particular consumer product.
A set of pre-classified opinion sentences is utilized as
training data to develop class association rules. Each
sentence is labeled with one or more product features, fj , or
no product feature, none. The f-measure is used as metric
for evaluation, and claims efficiency up to 70%. In the
paper, the review sentences are divided into various classes
according to the association rules. The classification of the
opinionated text is done using both class association rules
and naive Bayesian classifier. After which the experiments
done proves that Class association rules perform better than
the traditional naïve Bayesian classifiers. In [7], the authors
present an approach for opinion mining which relies on
natural language processing techniques. The work is
accomplished by the sentiment lexicon and a pattern
database. The two feature selection algorithms discussed in
this work are based on mixture model and the likelihood
ratio. They propose a sentiment pattern based analysis for
the sentiment classification work.
In [8], an in-depth study of dependency relations among the
words of a sentence is discussed. In their work, the
dependencies are classified as short range and long range
dependencies. They use a clustering approach after the
parsing is done. In the paper [9] a combined model of
sentiment analysis is done. Considering every levels of
analysis like phrase level, sentence level and document level
have their own advantages. But a combination model
including all the three may achieve better performance.
A combined model based on phrase and sentence level
analyses and a description on the implementation of
different levels of analyses are presented. For the phraselevel
sentiment analysis, a template is used. The newly
defined template is Left-Middle-Right template. The
Conditional Random Fields are used to extract the sentiment
words. The Maximum Entropy model is used in the
sentence-level sentiment analysis. The combination model
with specific combination of features performs slightly
better than the traditional single level models. Another
paper which studies the mining of on-line reviews in the
movie domain is [10]. In the paper they come up with a
proposal of a model called S-PLSA(Sentiment Probabilistic
Latent Semantic Analysis). This is a generative model for
sentiment analysis that does a deeper comprehension of the
sentiments in blogs.
The model S-PLSA is used for summarizing sentiment
information from reviews. From the S-PLSA model, they
developed ARSA(Autoregressive Sentiment-Aware model),
a model for predicting sales performance based on the
sentiment information and the product’s past sales
performance. They have considered the role of review
quality in sales performance prediction. The model predicts
the quality rating of a review. The quality factor is then
incorporated into a another model called ARSQA
(Autoregressive Sentiment and Quality Aware model). Two
models, ARSA and ARSQA models are designed for
product sales prediction. These models reflect the effect of
sentiments, and past sales performance on future sales
performance. Sentiment analysis problem is attempted to be
solved using a clustering approach in [11]. This paper also
discusses application of TF-IDF weighting method, voting
mechanism and importing term scores and claims almost
stable results. A feature level Sentiment analysis is
discussed in [12]. Here the work has been concentrated on
Chinese product reviews.
The feature selection process is based on an apriori
algorithm. The Apriori association mining rules is used to
extract the candidate product features. Then the orders of
some candidate product feature words are adjusted. Finally,
point-wise mutual information (PMI) methods are used to
filter feature words so as to obtain the meaningful product
feature words. The work is very simple and not upto
satisfaction. But the feature extraction done in this work is
mentionable. A very distinguishable approach to opinion
mining is put forward in [13]. The model is based on nouns
and adverb-adjective-noun (AAN) combinations in
sentiment analysis .
The AAN based sentiment analysis technique deploys
linguistic analysis of adverbs of degree , domain specific
adjective and abstract noun. A set of general axioms (based
on a classification of adverbs of degree into five categories,
classification of adjective into ten specific domain,
classification of abstract noun in two categories) for opinion
analysis is also defined. The way in which the adjectives and
adverbs are found and scored is interesting. Unary and
binary AAN algorithms are also mentioned in the work.
Another new approach is a proximity based sentiment
analysis [14].
The idea is based on the findings about the way in which
humans express their thoughts. When a person starts writing
positively about a topic or subject they continue with this
positive trend for a period of time. Later inflexion words
like “however” are used and then start writing in negative
sense about the topic. In a paragraph people usually do not
repeatedly write one positive and one negative word
together. Typically segments of a written text (e.g.paragraphs or sentences) capture a concept or trend of
thought over a short period of time. Such trends could
fluctuate as one moves along the written document. The
average distance between positive-oriented (or negativeoriented)
words is expected to be small for segments bearing
positive (negative) sentiments. Consequently, the average
distance between positive-oriented (negative-oriented)
words is relatively large for segments bearing negative
(positive) sentiments. This is the principle on which the
model is developed. Three different proximity-based
features, proximity distributions, mutual information
between proximity types, and proximity patterns are used
for sentiment analysis.
Support Vector Machine Classifier is made use of in [15].
The approach emphasizes the use of a variety of diverse
information sources, and SVMs provide the ideal tool to
bring these sources together. The methods are used to assign
values to selected words and phrases, and bring them
together to create a model for the classification of texts. In
this paper, The sentiment orientation of a phrase is
determined based upon the phrase’s point wise mutual
information (PMI) with the words like excellent and poor.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
5. QUAN ĐIỂM KHAI THÁC VÀ TÌNH CẢMPHÂN TÍCHVấn đề phân tích tình cảm được đáp ứng bằng cách sử dụng một số cáckỹ thuật bằng cách sử dụng ngôn ngữ tự nhiên chế biến kỹ thuật,gần các phương pháp vv. Sau đây là một nghiên cứu ngắn gọn về một vàicủa họ.Sử dụng một phương pháp đáng chú ý trong [3] một tình cảm cấp câuphân tích. Từ cấp tính năng khai thác được thực hiện bằng cách sử dụngNgây thơ Bayes loại. Ngữ nghĩa định hướng của cácCâu cá nhân Lấy từ những ngữ cảnhthông tin. Máy tính này, học cách tiếp cận trung bìnhtuyên bố một tỷ lệ chính xác của 83%. Cho phân loại vàphân tích của tình cảm từ những nhận xét, máyhọc tập và từ vựng thông tin theo ngữ cảnh được sử dụng. Cácgiấy tập trung vào câu cấp để kiểm tra xem cáccâu được mục tiêu hoặc chủ quan và để phân loại cáccực của câu để ý kiến tích cực hay tiêu cực.Phương pháp tiếp cận bayes ngây thơ được sử dụng để chú thích mỗi câulà tích cực và tiêu cực trên các căn cứ của hữu ích từ cấptính năng. SVM loại được đào tạo về các câu chú thíchcho việc phân loại tích cực và tiêu cực. Theo ngữ cảnhthông tin được sử dụng để tính toán cực của câu vàđánh dấu nó như là tiêu cực hay tích cực. Những món quà giấy [4]thử nghiệm cho tình cảm phân tích để tự độngphân biệt trước và theo ngữ cảnh cực. Bắt đầu với mộtổn định lớn của những đầu mối được đánh dấu bằng phân cực trước, phương phápxác định cực theo ngữ cảnh của các cụm từ có chứatrường hợp những manh mối trong các văn thể.Một quá trình hai bước được sử dụng sử dụng máy học tậpvà một loạt các tính năng. Trước hết các phương pháp phân loại mỗicụm từ có một đầu mối như trung lập hoặc cực. Thứ hai nómất tất cả cụm từ được đánh dấu ở bước trước như cực vàdisambiguates của phân cực theo ngữ cảnh (tích cực, tiêu cực,cả hai, hoặc trung lập). Các phương pháp mô tả một hệ thống màtự động xác định cực theo ngữ cảnh cho một lớntập hợp con của biểu hiện tình cảm, đạt được kết quả đáng tin cậy.Công việc quan trọng khác là việc thực hiện của cả haiSự hiểu biết ngôn ngữ tự nhiên và các thế hệ trongPhân tích tình cảm [5]. Một số thuật toán để tìm kiếm vàtiên đoán hướng của ý kiến được quy định trong điều nàyviệc nghiên cứu. Trong hệ thống của họ đó một bài đánh giá cơ sở dữ liệu màMua sắm các văn bản khăng khăng. Các phương pháp sau đó tìm thấy thường xuyêntính năng mà nhiều người đã bày tỏ ý kiến của mình trên.Sau đó, ý kiến từ được trích ra bằng cách sử dụng cáckết quả các tính năng thường xuyên, và ngữ nghĩa định hướng của cácý kiến từ được xác định với sự giúp đỡ của WordNet. CácHệ thống sau đó tìm thấy những tính năng không thường xuyên.Định hướng của mỗi câu ý kiến được xác định và mộtcuối cùng văn bản tóm tắt được tạo ra trong công việc này. Một phần của bài phát biểu gắn thẻ từ xử lý ngôn ngữ tự nhiên được sử dụng đểtìm thấy ý kiến tính năng. Đầu ra trên giấy là một văn bảntóm tắt ý kiến. Do đó cũng là tổng hợp của văn bảnthực hiện như một hệ thống phụ. Nhưng công trình tổng hợp này là thực sựphụ thuộc vào các tính năng và do đó là xa cáctự động tổng hợp các công việc trong lĩnh vực NLP. Cácgiấy đề xuất một phương pháp bằng cách sử dụng mục từ đồng nghĩathiết lập và từ trái nghĩa đặt trong WordNet để dự đoán các ngữ nghĩađịnh hướng của tính từ. Giấy cũng mô tả sự cần thiếtnghị quyết Đại từ trong ý kiến và khai thác mỏ mặc dù nó làkhông được giải quyết.Một phương pháp phân tích tình cảm mà không sử dụngquy tắc thông thường các ngôn ngữ tự nhiên được chỉ định trong [6]. Cácviệc sử dụng một máy học phương pháp tiếp cận (ngây thơ Bayes) chophân loại. Các quy tắc Hiệp hội lớp được sử dụng để trích xuấtCác Hiệp hội giữa các thuật ngữ tính năng xuất hiện trongngười tiêu dùng xem xét ý kiến và tính năng sản phẩm cho mộtsản phẩm tiêu dùng đặc biệt.Một tập hợp các phân loại trước ý kiến câu được sử dụng nhưđào tạo các dữ liệu để phát triển lớp Hiệp hội quy tắc. Mỗicâu được dán nhãn với một hoặc nhiều tính năng sản phẩm, fj, hoặckhông có sản phẩm tính năng, không có. F-biện pháp được sử dụng như là số liệuđể đánh giá, và tuyên bố hiệu quả lên đến 70%. Trong cácgiấy, đánh giá câu được chia thành các lớp học khác nhautheo quy định của Hiệp hội. Phân loại của cáckhăng khăng văn bản được thực hiện bằng cách sử dụng cả hai quy tắc Hiệp hội lớpvà ngây thơ Bayes loại. Sau đó các thí nghiệmchứng minh rằng lớp Hiệp hội quy tắc hoạt động tốt hơn so vớiMáy phân loại Bayes truyền thống ngây thơ. [7], các tác giảtrình bày một cách tiếp cận cho khai thác mỏ ý kiến mà dựa vàokỹ thuật xử lý ngôn ngữ tự nhiên. Công việcthực hiện bởi lexicon tình cảm và một mô hìnhcơ sở dữ liệu. Các thuật toán lựa chọn hai tính năng thảo luận trongcông trình này được dựa trên mô hình hỗn hợp và khả năngtỷ lệ. Họ đề xuất một phân tích mô hình dựa trên tình cảm choviệc phân loại tình cảm.[8], một nghiên cứu chuyên sâu của mối quan hệ phụ thuộc giữa cáclời của một câu được thảo luận. Trong công việc của họ, cácphụ thuộc được phân loại là tầm ngắn và tầm xaphụ thuộc. Họ sử dụng một cách tiếp cận kết cụm sau khi cácphân tích được thực hiện. Trong giấy [9] một mô hình kết hợp củatình cảm phân tích được thực hiện. Xem xét mọi cấp độ củaphân tích như cụm từ mức độ, mức độ câu và cấp tài liệucó lợi thế riêng của họ. Nhưng một mô hình kết hợpbao gồm tất cả ba có thể đạt được hiệu suất tốt hơn.Một mô hình kết hợp dựa trên cụm từ và câu cấpphân tích và một mô tả về việc thực hiệncác cấp độ khác nhau của phân tích được trình bày. Cho phraselevelphân tích tình cảm, một bản mẫu được sử dụng. Các mớimẫu được xác định là trái-Trung-phải mẫu. CácTrường ngẫu nhiên có điều kiện được sử dụng để trích xuất tình cảmtừ. Các mô hình tối đa Entropy được sử dụng trong cácphân tích câu cấp tình cảm. Các mô hình kết hợpvới các kết hợp cụ thể của tính năng thực hiện một chúttốt hơn so với đĩa đơn truyền thống cấp mô hình. Khácgiấy mà nghiên cứu khai thác trực tuyến đánh giá trong cácphim miền là [10]. Trong giấy họ đi lên với mộtđề nghị của một mô hình được gọi là S-PLSA(Sentiment ProbabilisticTiềm ẩn ngữ nghĩa phân tích). Đây là một mô hình thể sinh chophân tích tình cảm mà thực hiện một hiểu sâu hơn về cáctình cảm trong blog.Mô hình S-PLSA được sử dụng để tổng kết tình cảmthông tin từ đánh giá. Từ mô hình S-PLSA, họphát triển ARSA (mô hình Autoregressive tình cảm-nhận thức),một mô hình dự đoán hiệu suất bán hàng dựa trên cáctình cảm thông tin và các sản phẩm bán hàng trong quá khứhiệu suất. Họ đã xem xét vai trò của nhận xétchất lượng bán hàng hiệu suất dự đoán. Các mô hình dự báoCác đánh giá chất lượng của một bài đánh giá. Các yếu tố chất lượng là sau đókết hợp thành một mô hình khác được gọi là ARSQA(Autoregressive tình cảm và nhận thức được chất lượng mẫu). HaiMô hình, mô hình ARSA và ARSQA được thiết kế chosản phẩm bán hàng dự đoán. Các mô hình này phản ánh ảnh hưởng củatình cảm, và hiệu suất bán hàng trước đây về tương lai kinh doanhhiệu suất. Tình cảm phân tích vấn đề là cố gắng đểgiải quyết bằng cách sử dụng một cách tiếp cận kết cụm trong [11]. Điều này giấy cũngthảo luận về ứng dụng của các phương pháp cân lực lượng đặc nhiệm-IDF, bỏ phiếucơ chế và nhập khẩu hạn điểm và yêu cầu bồi thường gần nhưkết quả ổn định. Một mức độ tính năng phân tích tình cảm làthảo luận trong [12]. Ở đây các công việc đã được tập trung vàoĐánh giá sản phẩm Trung Quốc.Quá trình lựa chọn tính năng dựa trên một apriorithuật toán. Quy tắc khai thác mỏ Hiệp hội Apriori là được sử dụng đểtrích xuất các tính năng sản phẩm ứng cử viên. Sau đó các đơn đặt hàng củamột số ứng cử viên sản phẩm tính năng từ được điều chỉnh. Cuối cùng,Point-Wise lẫn nhau thông tin (PMI) phương pháp được sử dụng đểbộ lọc tính năng từ để có được các sản phẩm có ý nghĩatính năng từ. Công việc là rất đơn giản và không tối đasự hài lòng. Nhưng việc khai thác tính năng thực hiện trong công việc này làmentionable. Một cách tiếp cận rất phân biệt ý kiếnkhai thác mỏ được đưa ra trong [13]. Các mô hình dựa trên từ tiếng Anhvà kết hợp Phó từ tính từ tính từ (AAN)phân tích tình cảm.Kỹ thuật phân tích tình cảm AAN dựa triển khaiphân tích ngôn ngữ của trạng từ học, tên miền cụ thểtính từ và danh từ trừu tượng. Một tập hợp các tiên đề chung (dựatrên một phân loại của trạng từ học vào năm loại,phân loại các tính từ thành mười tên miền cụ thể,phân loại của các danh từ trừu tượng trong hai loại) ý kiếnphân tích cũng được xác định. Cách thức mà các tính từ vàtrạng từ được tìm thấy và ghi là thú vị. Unary vànhị phân AAN thuật toán cũng được đề cập trong công việc.Một cách tiếp cận mới là một tình cảm gần dựaphân tích [14].Ý tưởng dựa trên những phát hiện về cách thức mà trong đócon người bày tỏ suy nghĩ của mình. Khi một người bắt đầu viếttích cực về một chủ đề hoặc chủ đề họ tiếp tục với điều nàyxu hướng tích cực cho một khoảng thời gian. Sau đó trọng từgiống như "Tuy nhiên" được sử dụng và sau đó bắt đầu viết tiêu cựcý thức về chủ đề. Trong một đoạn người thường làm khôngnhiều lần viết là một tích cực và một trong những từ phủ địnhvới nhau. Thông thường các phân đoạn của một văn bản văn (e.g.paragraphs hoặc câu) nắm bắt một khái niệm hoặc các xu hướng củasuy nghĩ trong một khoảng thời gian ngắn. Xu hướng như vậy có thểdao động như là một di chuyển dọc theo các tài liệu văn. CácTrung bình khoảng cách giữa theo định hướng tích cực (hoặc negativeoriented)từ dự kiến sẽ được nhỏ cho phân đoạn mangtình cảm tích cực (tiêu cực). Do đó, mức trung bìnhkhoảng cách giữa theo định hướng tích cực (định hướng tiêu cực)từ là tương đối lớn cho phân đoạn mang tiêu cựctình cảm (tích cực). Đây là nguyên tắc mà trên đó cácMô hình được phát triển. Ba khác nhau dựa trên vùng lân cậntính năng, bản phân phối gần, thông tin chunggiữa các loại gần nhau, và gần mẫu được sử dụngđể phân tích tình cảm. Hỗ trợ Vector Machine loại được thực hiện sử dụng [15].Cách tiếp cận nhấn mạnh việc sử dụng của một loạt đa dạngnguồn thông tin, và SVMs cung cấp công cụ lý tưởng đểmang lại những nguồn cùng. Các phương pháp được sử dụng để chỉ địnhCác giá trị để chọn từ và cụm từ, và mang lại cho họvới nhau để tạo ra một mô hình để phân loại văn bản. Ởbài báo này, định hướng tình cảm của một cụm từ làxác định dựa trên các cụm từ điểm khôn ngoan lẫn nhauthông tin (PMI) với các từ như tuyệt vời và người nghèo.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
KHAI THÁC 5. Ý KIẾN và tình cảm
PHÂN TÍCH
Vấn đề phân tích tình cảm được đáp ứng bằng cách sử dụng một số các
kỹ thuật sử dụng kỹ thuật xử lý ngôn ngữ tự nhiên,
phương pháp gần gũi vv Sau đây là một nghiên cứu ngắn gọn về một vài
trong số họ.
Một cách tiếp cận đáng chú ý trong [3] sử dụng cấp độ câu tâm lý
phân tích. Các tính năng khai thác cấp độ từ được thực hiện bằng cách sử dụng
Naive Bayes Classifier. Các định hướng ngữ nghĩa của
câu cá được lấy từ các ngữ cảnh
thông tin. Cách tiếp cận với máy tính học tập trung bình
tuyên bố một tỷ lệ chính xác là 83%. Để phân loại và
phân tích của tình cảm từ những nhận xét, máy
học tập và các thông tin theo ngữ cảnh từ vựng được sử dụng. Các
giấy tập trung vào mức độ câu để kiểm tra xem các
câu là khách quan hay chủ quan và để phân loại các
phân cực của các câu với quan điểm tích cực hay tiêu cực.
Cách tiếp cận Naive Bayes được sử dụng để ghi chú thích mỗi câu
là tích cực và tiêu cực trên cơ sở các cấp độ từ hữu ích
tính năng. SVM phân loại được đào tạo về các câu chú thích
cho việc phân loại tích cực và tiêu cực. Theo ngữ cảnh
thông tin được sử dụng để tính toán sự phân cực về bản án và
đánh dấu nó như là tiêu cực hay tích cực. Giấy [4] trình bày
thí nghiệm để phân tích tình cảm để tự động
phân biệt cực trước và theo ngữ cảnh. Bắt đầu với một
ổn định lớn các manh mối được đánh dấu với cực trước, phương pháp
xác định sự phân cực theo ngữ cảnh của các cụm từ có chứa
các trường hợp của những manh mối trong corpus.
Một quá trình hai bước được sử dụng mà sử dụng máy học
và một loạt các tính năng. Thứ nhất phương pháp phân loại từng
cụm từ có chứa một đầu mối là trung tính hoặc cực. Thứ hai nó
có tất cả các cụm từ được đánh dấu ở bước trước đó là cực và
disambiguates cực theo ngữ cảnh của họ (tích cực, tiêu cực,
cả hai, hoặc trung tính). Phương pháp này mô tả một hệ thống
tự động nhận dạng phân cực theo ngữ cảnh cho một lượng lớn
tập hợp con của các biểu thức tình cảm, đạt được kết quả đáng tin cậy.
Một công việc quan trọng là việc thực hiện cả
sự hiểu biết ngôn ngữ tự nhiên và thế hệ trong
phân tích Sentiment [5]. Một vài thuật toán để tìm kiếm và
dự đoán hướng của ý kiến này được quy định trong
công tác nghiên cứu. Trong hệ thống của họ có một cơ sở dữ liệu tổng quan mà
lưu trữ các văn bản ngoan. Phương pháp này sau đó phát hiện thường xuyên
các tính năng mà nhiều người đã bày tỏ ý kiến của họ về.
Sau đó, từ quan điểm được chiết xuất bằng cách sử dụng
các tính năng thường xuyên kết quả và định hướng ngữ nghĩa của các
từ quan điểm được xác định với sự giúp đỡ của WordNet. Các
hệ thống sau đó tìm thấy những tính năng không thường xuyên.
Định hướng của mỗi câu quan điểm được xác định và một
bản tóm tắt văn bản cuối cùng được tạo ra trong công việc này. Các phần của bài phát biểu gắn thẻ từ xử lý ngôn ngữ tự nhiên được sử dụng để
tìm các tính năng ý kiến. Đầu ra của giấy trên là một văn bản
tóm tắt ý kiến. Như vậy tổng kết của văn bản cũng được
thực hiện như là một hệ thống phụ. Nhưng công việc tổng kết này là thật sự
phụ thuộc vào các tính năng và do đó là xa
việc tổng hợp tự động trong các lĩnh vực của NLP. Các
giấy đề nghị một phương pháp bằng cách sử dụng các từ đồng nghĩa tính từ
trái nghĩa và thiết lập thiết lập trong WordNet để dự đoán ngữ nghĩa
định hướng của các tính từ. Tờ báo này cũng mô tả các nhu cầu
của Nghị quyết đại trong khai thác ý kiến, dù cho nó
không được giải quyết.
Một phương pháp phân tích tình cảm mà không sử dụng
quy tắc ngôn ngữ tự nhiên thông thường được quy định trong [6]. Các
công trình sử dụng một cách tiếp cận máy học (Bayesian Naive) cho
phân loại. Các luật kết hợp lớp học được sử dụng để trích xuất
các liên kết giữa các tính năng từ xuất hiện trong
ý kiến của người tiêu dùng xem xét và tính năng sản phẩm cho một
sản phẩm tiêu dùng đặc biệt.
Một tập hợp các ý kiến trước câu phân loại được sử dụng như
dữ liệu huấn luyện để phát triển các luật kết hợp lớp. Mỗi
câu được gắn nhãn với một hoặc nhiều tính năng sản phẩm, fj, hoặc
không có tính năng sản phẩm, không có. Các e-biện pháp được sử dụng làm thước đo
để đánh giá, và tuyên bố hiệu suất lên đến 70%. Trong
bài báo, những câu xét được chia thành các lớp khác nhau
theo các luật kết hợp. Việc phân loại các
văn bản ngoan cố được thực hiện bằng cách sử dụng cả hai luật kết hợp lớp
và phân loại Bayes ngây thơ. Sau đó các thí nghiệm
được thực hiện đã chứng minh rằng các luật kết hợp lớp thực hiện tốt hơn so với
các phân loại Bayes ngây thơ truyền thống. Trong [7], các tác giả
trình bày một cách tiếp cận để khai thác ý kiến mà dựa trên
các kỹ thuật xử lý ngôn ngữ tự nhiên. Công việc này được
thực hiện bằng các từ vựng tình cảm và một mô hình
cơ sở dữ liệu. Hai thuật toán lựa chọn tính năng thảo luận trong
tác phẩm này được dựa trên mô hình hỗn hợp và khả năng
tỷ lệ. Họ đề xuất một mô hình tâm lý dựa trên phân tích cho
các công việc phân loại tình cảm.
Trong [8], một nghiên cứu chuyên sâu của mối quan hệ phụ thuộc giữa các
từ của một câu được thảo luận. Trong công việc của họ,
phụ thuộc được phân loại là tầm ngắn và tầm xa
phụ thuộc. Họ sử dụng một phương pháp tiếp cận phân nhóm sau khi
phân tích cú pháp được thực hiện. Trong bài báo của [9] một mô hình kết hợp của
phân tích tâm lý được thực hiện. Xem xét tất cả các cấp độ
phân tích như mức độ cụm từ, câu và mức độ tài liệu
có lợi thế riêng của họ. Tuy nhiên, một mô hình kết hợp
bao gồm cả ba có thể đạt được hiệu suất tốt hơn.
Một mô hình kết hợp dựa trên cụm từ và mức án
phân tích và mô tả về việc thực hiện các
mức độ khác nhau của phân tích được trình bày. Đối với các phraselevel
phân tích tâm lý, một mẫu được sử dụng. Mới được
định nghĩa là mẫu template Left-Trung-Right. Các
điều kiện Random Fields được sử dụng để trích xuất các tình cảm
từ. Các mô hình Maximum Entropy được sử dụng trong
phân tích tâm lý câu cấp. Các mô hình kết hợp
với sự kết hợp các tính năng cụ thể thực hiện một chút
tốt hơn so với các mô hình cấp truyền thống duy nhất. Một
bài báo trong đó nghiên cứu việc khai thác các ý kiến trên mạng ở
miền phim là [10]. Trong bài báo của họ đưa ra một
đề nghị của một mô hình được gọi là S-PLSA (Sentiment Probabilistic
Latent Semantic Analysis). Đây là một mô hình sinh sản cho
phân tích tình cảm mà không một hiểu sâu sắc hơn về những
tình cảm trong blog.
Các mô hình S-PLSA được sử dụng để tổng kết tình cảm
thông qua đánh giá. Từ mô hình S-PLSA, họ
phát triển Arsa (model Sentiment-Aware tự hồi quy),
một mô hình để dự đoán hiệu suất bán hàng dựa trên các
thông tin tình cảm và bán hàng qua các sản phẩm của
hiệu suất. Họ đã xem xét vai trò của đánh giá
chất lượng trong dự đoán hiệu suất bán hàng. Mô hình dự báo
đánh giá chất lượng của một đánh giá. Các yếu tố chất lượng sau đó được
kết hợp vào một mô hình khác được gọi ARSQA
(tự hồi Sentiment và chất lượng mô hình Aware). Hai
mô hình, Arsa và ARSQA mô hình được thiết kế cho
dự đoán doanh số bán sản phẩm. Những mô hình này phản ánh ảnh hưởng của
tình cảm, và hoạt động bán hàng trong quá khứ về doanh số bán hàng trong tương lai
thực hiện. Vấn đề phân tích tâm lý là cố gắng để được
giải quyết bằng cách sử dụng một phương pháp tiếp cận nhóm trong [11]. Bài viết này cũng
thảo luận về các ứng dụng của phương pháp trọng số TF-IDF, bỏ phiếu
cơ chế nhập khẩu và điểm hạn và tuyên bố hầu như
kết quả ổn định. Một phân tích Sentiment cấp tính năng được
thảo luận trong [12]. Dưới đây công việc đã được tập trung vào
đánh giá sản phẩm của Trung Quốc.
Các quá trình lựa chọn tính năng dựa trên một apriori
thuật toán. Các quy tắc khai thác mỏ liên Apriori được sử dụng để
trích xuất các tính năng sản phẩm ứng cử viên. Sau đó, các đơn đặt hàng của
một số từ tính năng sản phẩm ứng cử viên được điều chỉnh. Cuối cùng,
thông tin lẫn nhau (PMI) phương pháp điểm-khôn ngoan được sử dụng để
lọc từ tính năng để có được những sản phẩm có ý nghĩa
từ tính năng. Công việc rất đơn giản và không tối đa
sự hài lòng. Nhưng các tính năng khai thác được thực hiện trong công việc này là
mentionable. Một cách tiếp cận rất phân biệt với quan điểm
khai thác khoáng sản được đưa ra trong [13]. Mô hình này dựa trên các danh từ
và trạng từ, tính từ, danh từ (AAN) kết hợp trong
phân tích tâm lý.
Các AAN dựa kỹ thuật phân tích tâm lý triển khai
phân tích ngôn ngữ của phó từ chỉ mức độ, phạm vi riêng biệt
tính từ và danh từ trừu tượng. Một tập hợp các tiên đề chung (dựa
trên phân loại phó từ chỉ mức độ thành năm loại,
phân loại tính từ thành mười tên miền cụ thể,
phân loại danh từ trừu tượng trong hai loại) cho ý kiến
phân tích cũng được xác định. Cách thức mà các tính từ và
trạng từ được tìm thấy và ghi bàn là thú vị. Nguyên phân và
các thuật toán AAN nhị phân cũng được đề cập trong tác phẩm.
Một cách tiếp cận mới là một sự gần gũi tình cảm dựa trên
phân tích [14].
Ý tưởng này được dựa trên những phát hiện về các cách thức mà
con người bày tỏ suy nghĩ của họ. Khi một người bắt đầu viết
tích cực về một chủ đề hoặc chủ đề mà họ cứ tiếp tục
xu hướng tích cực trong một khoảng thời gian. Sau lời inflexion
như "tuy nhiên" được sử dụng và sau đó bắt đầu viết trong âm
nghĩa về chủ đề. Trong một đoạn mọi người thường không
liên tục viết một tích cực và tiêu cực một từ
lại với nhau. Điển hình là các phân đoạn của một văn bản viết (egparagraphs hoặc câu) chụp một khái niệm hay xu hướng của
suy nghĩ trong một thời gian ngắn. Xu hướng này có thể
dao động khi di chuyển dọc theo tài liệu bằng văn bản. Các
khoảng cách trung bình giữa tích cực định hướng (hoặc negativeoriented)
từ dự kiến sẽ được nhỏ cho các phân đoạn mang
dương (âm) tình cảm. Do đó, trung bình
khoảng cách giữa (âm định hướng) tích cực theo định hướng
từ này là tương đối lớn cho phân khúc mang âm
(tích cực) tình cảm. Đây là nguyên tắc mà trên đó các
mô hình được phát triển. Ba gần trụ sở khác nhau
các tính năng, phân phối gần, thông tin lẫn nhau
giữa các loại khoảng cách, và mô hình gần gũi được sử dụng
để phân tích tình cảm.
Support Vector Machine Classifier được thực hiện sử dụng trong [15].
Cách tiếp cận này nhấn mạnh việc sử dụng của một loạt các đa dạng
các nguồn thông tin , và SVMs cung cấp các công cụ lý tưởng để
mang lại những nguồn với nhau. Các phương pháp được sử dụng để gán
giá trị cho các từ và cụm từ được lựa chọn, và mang lại cho họ
với nhau để tạo ra một mô hình cho việc phân loại văn bản. Trong
bài báo này, Định hướng tình cảm của một cụm từ được
xác định dựa trên điểm khôn ngoan lẫn nhau của cụm từ
thông tin (PMI) với những từ như tuyệt vời và người nghèo.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: