4. Sentiment classification techniq

4. Sentiment classification techniques
Sentiment Classification techniques can be roughly divided
into machine learning approach, lexicon based approach and
hybrid approach [69]. The Machine Learning Approach (ML)
applies the famous ML algorithms and uses linguistic features.
The Lexicon-based Approach relies on a sentiment lexicon, a
collection of known and precompiled sentiment terms. It is
divided into dictionary-based approach and corpus-based
approach which use statistical or semantic methods to find sentiment
polarity. The hybrid Approach combines both
approaches and is very common with sentiment lexicons
playing a key role in the majority of methods. The various
approaches and the most popular algorithms of SC are
illustrated in Fig. 2 as mentioned before.
The text classification methods using ML approach can be
roughly divided into supervised and unsupervised learning
methods. The supervised methods make use of a large number
of labeled training documents. The unsupervised methods are
used when it is difficult to find these labeled training
documents.
The lexicon-based approach depends on finding the opinion
lexicon which is used to analyze the text. There are two methods
in this approach. The dictionary-based approach which
depends on finding opinion seed words, and then searches
the dictionary of their synonyms and antonyms. The corpusbased
approach begins with a seed list of opinion words, and
then finds other opinion words in a large corpus to help in finding
opinion words with context specific orientations. This
could be done by using statistical or semantic methods. There
is a brief explanation of both approaches’ algorithms and
related articles in the next subsections.
4.1. Machine learning approach
Machine learning approach relies on the famous ML
algorithms to solve the SA as a regular text classification
problem that makes use of syntactic and/or linguistic features.
Text Classification Problem Definition: We have a set of
training records D = {X1, X2, ..., Xn} where each record is labeled to a class. The classification model is related to the
features in the underlying record to one of the class labels.
Then for a given instance of unknown class, the model is used
to predict a class label for it. The hard classification problem is
when only one label is assigned to an instance. The soft classi-
fication problem is when a probabilistic value of labels is
assigned to an instance.
4.1.1. Supervised learning
The supervised learning methods depend on the existence of
labeled training documents. There are many kinds of
supervised classifiers in literature. In the next subsections, we
present in brief details some of the most frequently used
classifiers in SA.
4.1.1.1. Probabilistic classifiers. Probabilistic classifiers use
mixture models for classification. The mixture model assumes
that each class is a component of the mixture. Each mixture
component is a generative model that provides the probability
of sampling a particular term for that component. These kinds
of classifiers are also called generative classifiers. Three of the
most famous probabilistic classifiers are discussed in the next
subsections.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

4. tình cảm phân loại kỹ thuậtTình cảm phân loại kỹ thuật có thể được tạm chiavào máy học tập phương pháp tiếp cận, lexicon dựa trên phương pháp tiếp cận vàcách tiếp cận Hybrid [69]. Máy học phương pháp tiếp cận (ML)áp dụng các thuật toán ML nổi tiếng và sử dụng các tính năng ngôn ngữ.Lexicon dựa trên phương pháp tiếp cận dựa vào một lexicon tình cảm, mộtbộ sưu tập của tình cảm được biết đến và tạo điều kiện. Nó làchia thành cách tiếp cận dựa trên từ điển và corpus dựa trênphương pháp tiếp cận, sử dụng phương pháp thống kê hoặc ngữ nghĩa để tìm tình cảmphân cực. Kết hợp phương pháp tiếp cận kết hợp cả haiphương pháp tiếp cận và rất phổ biến với tình cảm lexiconschơi một vai trò quan trọng trong phần phương pháp. Khác nhauphương pháp tiếp cận và các thuật toán phổ biến nhất của SCminh họa trong hình 2 như đã đề cập trước khi.Các phương pháp phân loại văn bản bằng cách sử dụng phương pháp tiếp cận ML có thểtạm chia thành giám sát và không có giám sát học tậpphương pháp. Các phương pháp giám sát thực hiện sử dụng một số lớntài liệu đào tạo có nhãn. Các phương pháp không có giám sátđược sử dụng khi nó là khó khăn để tìm thấy các có nhãn đào tạotài liệu.Lexicon dựa trên phương pháp tiếp cận phụ thuộc vào việc tìm kiếm ý kiếnLexicon được sử dụng để phân tích văn bản. Có hai phương pháptrong cách tiếp cận này. Từ điển, dựa trên phương pháp tiếp cận màphụ thuộc vào việc tìm kiếm ý kiến hạt giống từ, và sau đó tìm kiếmtừ điển các từ đồng nghĩa của họ và các thành ngữ. Corpusbasedcách tiếp cận bắt đầu với một danh sách hạt giống của ý kiến từ, vàsau đó tìm thấy từ quan điểm khác trong một corpus lớn để giúp đỡ trong việc tìm kiếmý kiến từ với bối cảnh cụ thể định hướng. Điều nàycó thể được thực hiện bằng cách sử dụng phương pháp thống kê hoặc ngữ nghĩa. Cómột lời giải thích ngắn gọn của thuật toán cả hai phương pháp tiếp cận vàBài viết liên quan trong các phần phụ kế tiếp.4.1. cách tiếp cận học tập máyCách tiếp cận học tập máy dựa vào ML nổi tiếngCác thuật toán để giải quyết SA là một phân loại văn bản thường xuyênvấn đề mà làm cho việc sử dụng tính năng cú pháp và/hoặc ngôn ngữ.Văn bản phân loại vấn đề định nghĩa: Chúng tôi có một tập hợp cácđào tạo hồ sơ D = {X 1, X 2,..., Xn} nơi mỗi bản ghi được dán nhãn để một lớp học. Các mô hình phân loại liên quan đến cáctính năng trong hồ sơ cơ bản để một trong các nhãn lớp.Sau đó cho một trường hợp nhất định của lớp không rõ, các mô hình được sử dụngđể dự đoán một lớp nhãn cho nó. Vấn đề khó phân loại làkhi chỉ có một nhãn được gán cho một thể hiện. Mềm cơ-fication vấn đề là khi một giá trị xác suất của nhãn làđược gán cho một thể hiện.4.1.1. Giám sát học tậpCác phương pháp giám sát học tập phụ thuộc vào sự tồn tại củadán nhãn tài liệu đào tạo. Có rất nhiều loại củaGiám sát máy phân loại trong văn học. Trong phần phụ kế tiếp, chúng tôigiới thiệu tóm tắt chi tiết một số trong những thường xuyên sử dụngMáy phân loại trong SA.4.1.1.1. xác suất máy phân loại nhất. Máy phân loại xác suất sử dụnghỗn hợp các mô hình cho phân loại. Giả định các mô hình hỗn hợprằng mỗi lớp là một thành phần của hỗn hợp. Hỗn hợp mỗithành phần là một mô hình thể sinh mà cung cấp khả năngLấy mẫu một cụm từ cụ thể cho các thành phần đó. Các loạicủa máy phân loại cũng được gọi là máy phân loại thể sinh. Ba trong số cácMáy phân loại xác suất nổi tiếng nhất được thảo luận trong kế tiếpphần phụ.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

4. Niềm tin kỹ thuật phân loại
Sentiment kỹ thuật phân loại có thể được tạm chia
thành cách tiếp cận máy học, từ vựng dựa trên cách tiếp cận và
phương pháp lai [69]. Phương pháp học máy (ML)
áp dụng các thuật toán ML nổi tiếng và sử dụng các tính năng ngôn ngữ.
Cách tiếp cận của Lexicon dựa trên dựa trên một từ vựng tình cảm, một
bộ sưu tập từ ngữ tình cảm biết và biên dịch sẵn. Nó được
chia thành phương pháp tiếp cận dựa trên từ điển và thể dựa trên
cách tiếp cận đó sử dụng phương pháp thống kê hoặc ngữ nghĩa để tìm thấy tình cảm
cực. Phương pháp lai kết hợp cả hai
phương pháp tiếp cận và rất phổ biến với lexicons tình cảm
đóng vai trò quan trọng trong phần lớn các phương pháp. Các loại
phương pháp tiếp cận và các thuật toán phổ biến nhất của SC được
minh họa trong hình. 2 như đã đề cập trước đây.
Các phương pháp phân loại văn bản bằng cách sử dụng phương pháp tiếp cận ML có thể được
tạm chia thành học giám sát và không giám sát
các phương pháp. Các phương pháp giám sát sử dụng một số lượng lớn
các tài liệu đào tạo nhãn. Các phương pháp không giám sát được
sử dụng khi nó là khó khăn để tìm thấy những đào tạo nhãn
văn bản.
Cách tiếp cận từ vựng dựa trên phụ thuộc vào việc tìm kiếm các ý kiến
từ vựng được sử dụng để phân tích các văn bản. Có hai phương pháp
trong cách tiếp cận này. Các phương pháp tiếp cận dựa trên từ điển mà
phụ thuộc vào việc tìm kiếm các từ hạt giống quan điểm, và sau đó tìm kiếm
các từ điển từ đồng nghĩa và trái nghĩa của họ. Các corpusbased
phương pháp bắt đầu với một danh sách hạt giống của từ quan điểm, và
sau đó tìm thấy những từ quan điểm khác trong một ngữ liệu lớn để giúp đỡ trong việc tìm kiếm
những từ quan điểm định hướng cụ thể bối cảnh. Điều này
có thể được thực hiện bằng cách sử dụng phương pháp thống kê hoặc ngữ nghĩa. Có
một lời giải thích ngắn gọn về thuật toán và cả phương pháp tiếp cận '
bài viết liên quan trong các phần phụ bên cạnh.
4.1. Tiếp cận máy học tập
cách tiếp cận máy học tập dựa trên ML nổi tiếng
các thuật toán để giải quyết các SA như một phân loại văn bản thông thường
vấn đề mà làm cho sử dụng các tính năng cú pháp và / hoặc ngôn ngữ.
Tiêu Vấn đề phân loại Định nghĩa: Chúng tôi có một bộ
hồ sơ đào tạo D = {X1, X2, ..., Xn} trong đó mỗi bản ghi được dán nhãn một lớp học. Các mô hình phân loại có liên quan đến các
tính năng trong hồ sơ cơ bản để một trong những nhãn lớp.
Sau đó, cho một ví dụ cho các lớp không rõ, các mô hình được sử dụng
để dự đoán một nhãn lớp cho nó. Vấn đề phân loại cứng là
khi chỉ có một nhãn được gán cho một ví dụ. Các soft classi-
vấn đề fication là khi một giá trị xác suất của các nhãn được
gán cho một ví dụ.
4.1.1. Giám sát học tập
Các phương pháp học có giám sát phụ thuộc vào sự tồn tại của
các tài liệu đào tạo nhãn. Có rất nhiều loại
phân loại được giám sát trong văn học. Trong các phần tiếp theo, chúng tôi
trình bày chi tiết ngắn gọn một số trong những thường xuyên nhất được sử dụng
trong phân loại SA.
4.1.1.1. Phân loại theo xác suất. Phân loại theo xác suất sử dụng
mô hình hỗn hợp phân loại. Các mô hình hỗn hợp giả định
rằng mỗi lớp là một thành phần của hỗn hợp. Mỗi hỗn hợp
thành phần là một mô hình có thể sinh sản mà cung cấp khả năng
lấy mẫu một thuật ngữ cụ thể cho các thành phần đó. Những loại
của phân loại cũng được gọi là phân loại sinh sản. Ba trong số các
phân loại xác suất nổi tiếng nhất được thảo luận trong các tiếp theo
tiểu mục.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.