2. MethodologyThe fifty-four articles presented in this survey are sum dịch - 2. MethodologyThe fifty-four articles presented in this survey are sum Việt làm thế nào để nói

2. MethodologyThe fifty-four articl

2. Methodology
The fifty-four articles presented in this survey are summarized
in Table 1. Table 1 contains the articles reference [4–7] and
[12–61]. The objectives of the articles are illustrated in the third
column. They are divided into six categories which are (SA,
ED, SC, FS, TL and BR). The BR category can be classified
to lexica, Corpora or dictionaries. The authors categorized
the articles that solve the Sentiment classification problem as
SC. Other articles that solve a general Sentiment Analysis
problem are categorized as SA. The articles that give contribution
in the feature selection phase are categorized as FS. Then
the authors categorized the articles that represent the SA
related fields like Emotion Detection (ED), Building Resource
(BR) and Transfer Learning (TL).
The fourth column specifies whether the article is domainoriented
by means of Yes/No answers (Y or N). Domain-oriented
means that domain-specific data are used in the SA process.
The fifth column shows the algorithms used, and specifies
their categories as shown in Fig. 2. Some articles use different
algorithms other than the SC techniques which are presented
in Section 4. This applies, for example, to the work presented
by Steinberger [43]. In this case, the algorithm name only is
written. The sixth column specifies whether the article uses
SA techniques for general Analysis of Text (G) or solves the
problem of binary classification (Positive/Negative). The
seventh column illustrates the scope of the data used for evaluating
the article’s algorithms. The data could be reviews, news
articles, web pages, micro-blogs and others. The eighth column
specifies the benchmark data set or the well-known data source
used if available; as some articles do not give that information.
This could help the reader if he is interested in a certain scope
of data. The last column specifies if any other languages other
than English are analyzed in the article.
The survey methodology is as follows: brief explanation to
the famous FS and SC algorithms representing some related
fields to SA are discussed. Then the contribution of these
articles to these algorithms is presented illustrating how they
use these algorithms to solve special problems in SA. The main
target of this survey is to present a unique categorization for
these SA related articles.
3. Feature selection in sentiment classification
Sentiment Analysis task is considered a sentiment classification
problem. The first step in the SC problem is to extract and
select text features. Some of the current features are [62]:
Terms presence and frequency: These features are individual
words or word n-grams and their frequency counts. It either
gives the words binary weighting (zero if the word appears,
or one if otherwise) or uses term frequency weights to indicate
the relative importance of features [63].
Parts of speech (POS): finding adjectives, as they are important
indicators of opinions.
Opinion words and phrases: these are words commonly used
to express opinions including good or bad, like or hate. On the
other hand, some phrases express opinions without using opinion
words. For example: cost me an arm and a leg.
Negations: the appearance of negative words may change
the opinion orientation like not good is equivalent to bad.
3.1. Feature selection methods
Feature Selection methods can be divided into lexicon-based
methods that need human annotation, and statistical methods
which are automatic methods that are more frequently used.
Lexicon-based approaches usually begin with a small set of
‘seed’ words. Then they bootstrap this set through synonym
detection or on-line resources to obtain a larger lexicon. This
proved to have many difficulties as reported by Whitelaw
et al. [64]. Statistical approaches, on the other hand, are fully
automatic.
The feature selection techniques treat the documents either
as group of words (Bag of Words (BOWs)), or as a string
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
2. phương phápNăm mươi bốn bài trình bày trong khảo sát này được tóm tắttrong bảng 1. Bảng 1 chứa tài liệu tham khảo bài viết [4-7] và[12-61]. Mục tiêu của các bài viết được minh hoạ trong thứ bacột. Họ được chia thành sáu loại có (SA,ED, SC, FS, TL và BR). Thể loại BR có thể được phân loạilexica, Corpora hoặc từ điển. Các tác giả phân loạiCác bài viết mà giải quyết vấn đề phân loại tình cảm nhưSC. Các bài viết mà giải quyết một phân tích tình cảm chungvấn đề được phân loại là SA. Các bài viết cung cấp cho sự đóng góptrong giai đoạn lựa chọn tính năng được phân loại là FS. Sau đóCác tác giả phân loại các bài viết đại diện cho SAliên quan đến lĩnh vực như cảm xúc phát hiện (ED), xây dựng tài nguyên(BR) và chuyển giao học tập (TL).Cột thứ tư chỉ định cho dù các bài viết là domainorientedbởi means của Yes/No câu trả lời (Y hoặc N). Tên miền theo định hướngcó nghĩa là rằng dữ liệu đặc trưng cho tên miền được sử dụng trong quá trình SA.Cột thứ năm cho thấy các thuật toán được sử dụng, và xác địnhCác chuyên mục như minh hoạ trong hình 2. Một số bài viết sử dụng khác nhauCác thuật toán khác hơn so với các kỹ thuật SC được trình bàytrong phần 4. Điều này áp dụng, ví dụ, để công việc trình bàybởi Steinberger [43]. Trong trường hợp này, tên thuật toán chỉ làviết lưu. Cột thứ sáu chỉ định cho dù sử dụng bài viếtSA kỹ thuật cho tổng hợp phân tích của văn bản (G) hoặc giải quyết cácvấn đề của phân loại nhị phân (tích cực/tiêu cực). CácThứ bảy cột minh hoạ phạm vi của các dữ liệu được sử dụng để đánh giáCác bài viết của thuật toán. Dữ liệu có thể là đánh giá, tin tứcBài viết, trang web, vi-blog và những người khác. Cột thứ támchỉ định tập hợp dữ liệu tiêu chuẩn hoặc các nguồn dữ liệu nổi tiếngđược sử dụng nếu có; như một số điều không đưa ra thông tin đó.Điều này có thể giúp người đọc nếu anh ta quan tâm trong một phạm vi nhất địnhdữ liệu. Cột cuối cùng chỉ định nếu bất kỳ ngôn ngữ khác khácngoài tiếng Anh được phân tích trong bài viết.Các phương pháp khảo sát là như sau: giới thiệu tóm tắt lời giải thíchCác nổi tiếng FS và SC thuật toán đại diện cho một số liên quantrường SA được thảo luận. Sau đó là sự đóng góp của nhữngCác bài viết để các thuật toán này được trình bày minh họa làm thế nào họsử dụng các thuật toán này để giải quyết các vấn đề đặc biệt tại SA. Chínhmục tiêu của cuộc khảo sát này là để trình bày một loại duy nhất choSA bài viết liên quan.3. tính năng lựa chọn trong phân loại tình cảmTình cảm phân tích công việc được coi là một phân loại tình cảmvấn đề. Bước đầu tiên trong vấn đề SC là để trích xuất vàchọn tính năng văn bản. Một số các tính năng hiện tại là [62]:Điều khoản hiện diện và tần số: các tính năng được cá nhântừ hoặc từ n-gam và số lần tần số của họ. Nó hoặc làcung cấp cho các từ nhị phân nặng (0 nếu từ xuất hiện,hoặc nếu một nếu không) hoặc sử dụng hạn tần số trọng lượng cho biếttầm quan trọng tương đối của tính năng [63].Phần của bài phát biểu (POS): việc tìm kiếm các tính từ, như họ là quan trọngchỉ số ý kiến.Ý kiến từ và cụm từ: đây là những từ thường được sử dụngđể bày tỏ ý kiến trong đó tốt hay xấu, như hay ghét. Trên cácmặt khác, một số cụm từ bày tỏ ý kiến mà không sử dụng ý kiếntừ. Ví dụ: chi phí cho tôi một cánh tay và chân một.Negations: sự xuất hiện của tiêu cực từ có thể thay đổiđịnh hướng ý kiến như thế không tốt là tương đương với xấu.3.1. tính năng lựa chọn phương phápTính năng lựa chọn phương pháp có thể được chia thành dựa trên lexiconphương pháp cần chú thích của con người, và phương pháp thống kêđó là phương pháp tự động được sử dụng thường xuyên hơn.Lexicon dựa trên phương pháp tiếp cận thường bắt đầu với một tập hợp nhỏ cáctừ 'hạt giống'. Sau đó họ bootstrap này tập hợp thông qua đồng nghĩaphát hiện và các nguồn lực trực tuyến để có được một lexicon lớn hơn. Điều nàytỏ ra có nhiều khó khăn, theo báo cáo của Whitelawet al. [64]. Thống kê các phương pháp tiếp cận, mặt khác, là hoàn toàntự động.Các tính năng lựa chọn kỹ thuật điều trị các tài liệu hoặcnhư là nhóm từ (túi của từ (cung)), hoặc như là một chuỗi
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
2. Phương pháp
Các năm mươi bốn bài báo trình bày trong cuộc khảo sát này được tóm tắt
trong Bảng 1. Bảng 1 chứa các bài báo tham khảo [4-7] và
[12-61]. Mục tiêu của bài viết này được minh họa trong ba
cột. Họ được chia thành sáu loại đó là (SA,
ED, SC, FS, TL và BR). Các thể loại BR có thể được phân loại
để lexica, Corpora hay từ điển. Các tác giả phân loại
các bài viết mà giải quyết vấn đề phân loại Sentiment như
SC. Các sản phẩm khác để giải quyết những Sentiment Analysis nói chung
vấn đề được phân loại như SA. Các bài báo đưa ra những đóng góp
trong giai đoạn lựa chọn tính năng được phân loại như FS. Sau đó,
các tác giả đã phân loại các bài viết mà đại diện cho SA
lĩnh vực liên quan như Emotion Detection (ED), xây dựng tài nguyên
(BR) và Chuyển Learning (TL).
Cột thứ tư chỉ định cho dù bài báo được domainoriented
bằng Yes / No câu trả lời (hoặc Y N). Domain-định hướng
có nghĩa là dữ liệu tên miền cụ thể được sử dụng trong quá trình SA.
Cột thứ năm cho thấy các thuật toán được sử dụng, và quy định cụ thể
danh mục của họ như thể hiện trong hình. 2. Một số bài báo khác nhau sử dụng
các thuật toán khác hơn so với các kỹ thuật SC được trình bày
trong phần 4. Điều này áp dụng, ví dụ, để công việc được trình bày
bởi Steinberger [43]. Trong trường hợp này, tên thuật toán chỉ được
viết ra. Cột thứ sáu chỉ định cho dù bài báo sử dụng
SA kỹ thuật cho Phân tích chung của Text (G) hoặc giải quyết các
vấn đề phân loại nhị phân (dương / âm). Các
cột thứ bảy minh họa phạm vi của dữ liệu được sử dụng để đánh giá
các thuật toán của bài viết. Các dữ liệu có thể được đánh giá, tin tức
bài viết, trang web, vi-blog và những người khác. Cột thứ tám
xác định tập dữ liệu chuẩn hoặc nguồn dữ liệu nổi tiếng
được sử dụng nếu có; như một số bài báo không cung cấp thông tin.
Điều này có thể giúp người đọc nếu ông là quan tâm đến một phạm vi nhất định
của dữ liệu. Cột cuối cùng xác định nếu bất kỳ ngôn ngữ nào khác
ngoài tiếng Anh được phân tích trong bài viết.
Các phương pháp điều tra như sau: giải thích ngắn gọn để
các FS nổi tiếng và các thuật toán SC đại diện cho một số liên quan đến
các lĩnh vực để SA được thảo luận. Sau đó, sự đóng góp của các
bài viết để các thuật toán được trình bày minh họa cách thức họ
sử dụng các thuật toán để giải quyết các vấn đề đặc biệt trong SA. Các chính
mục tiêu của cuộc khảo sát này là trình bày một loại duy nhất cho
các bài viết liên quan đến SA.
3. Lựa chọn tính năng phân loại tình cảm
Sentiment nhiệm vụ phân tích được coi là một phân loại tình cảm
vấn đề. Bước đầu tiên trong vấn đề SC là để trích xuất và
chọn tính năng văn bản. Một số các tính năng hiện tại là [62]:
Điều khoản và tần số xuất hiện: Các tính năng này là cá nhân
từ hoặc từ n-gram và đếm tần số của họ. Nó sẽ
mang lại cho các từ trọng nhị phân (zero nếu từ đó xuất hiện,
hoặc nếu một cách khác) hoặc sử dụng trọng số tần số hạn để chỉ ra
tầm quan trọng tương đối của các tính năng [63].
Các bộ phận của lời nói (POS): tìm các tính từ, vì họ là quan trọng
chỉ số ý kiến.
Ý kiến từ và cụm từ: đây là những từ thường được sử dụng
để thể hiện ý kiến đó có tốt hay xấu, như hay ghét. Trên
Mặt khác, một số cụm từ diễn đạt ý kiến mà không cần sử dụng ý kiến
từ. Ví dụ: chi phí cho tôi một cánh tay và một chân.
phủ định: sự xuất hiện của từ ngữ tiêu cực có thể thay đổi
các định hướng dư luận không tốt như là tương đương với xấu.
3.1. Phương pháp lựa chọn tính năng
Tính năng phương pháp lựa chọn có thể được chia thành từ vựng dựa trên
các phương pháp đó cần chú thích của con người, và phương pháp thống kê
là phương pháp tự động được sử dụng thường xuyên hơn.
Lexicon cách tiếp cận dựa trên thường bắt đầu với một tập hợp nhỏ của
'hạt giống' từ. Sau đó, họ bootstrap tập này thông qua từ đồng nghĩa
hoặc phát hiện trên mạng các nguồn lực để có được một từ vựng lớn hơn. Điều này
chứng tỏ có rất nhiều khó khăn như báo cáo của Whitelaw
et al. [64]. Phương pháp thống kê, mặt khác, phải hoàn toàn
tự động.
Các kỹ thuật lựa chọn tính năng xử lý văn bản, hoặc
là nhóm từ (Bag of Words (BOW)), hoặc như là một chuỗi
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: