v2 is used in many applications; on

v2 is used in many applications; one of them is the contextual
advertising as presented by Fan and Chang [27]. They
discovered bloggers’ immediate personal interests in order to
improve online contextual advertising. They worked on real
ads and actual blog pages from ebay.com, wikipedia.com
and epinions.com. They used SVM (illustrated with details in
the next section) for classification and v2 for FS. Their results
showed that their method could effectively identify those ads
that are positively-correlated with a blogger’s personal
interests.
Hagenau and Liebmann [5] used feedback features by
employing market feedback as part of their feature selection
process regarding stock market data. Then, they used them
with v2 and Bi-Normal Separation (BNS). They showed that
a robust feature selection allows lifting classification accuracies
significantly when combined with complex feature types. Their
approach allows selecting semantically relevant features and
reduces the problem of over-fitting when applying a machine
learning approach. They used SVM as a classifier. Their results
showed that the combination of advanced feature extraction
methods and their feedback-based feature selection increases
classification accuracy and allows improved sentiment analytics.
This is because their approach allows reducing the number
of less-explanatory features, i.e. noise, and limits negative
effects of over-fitting when applying machine learning
approaches to classify text messages.
3.1.3. Latent Semantic Indexing (LSI)
Feature selection methods attempt to reduce the dimensionality
of the data by picking from the original set of attributes.
Feature transformation methods create a smaller set of features
as a function of the original set of features. LSI is
one of the famous feature transformation methods [66]. LSI
method transforms the text space to a new axis system which
is a linear combination of the original word features. Principal
Component Analysis techniques (PCA) are used to
achieve this goal [67]. It determines the axis-system which
retains the greatest level of information about the variations
in the underlying attribute values. The main disadvantage of
LSI is that it is an unsupervised technique which is blind to
the underlying class-distribution. Therefore, the features
found by LSI are not necessarily the directions along which
the class-distribution of the underlying documents can be best
separated [62].
There are other statistical approaches which could be used
in FS like Hidden Markov Model (HMM) and Latent
Dirichlet Allocation (LDA). They were used by Duric and
Song [33] to separate the entities in a review document from
the subjective expressions that describe those entities in terms
of polarities. This was their proposed new feature selection
schemes. LDA are generative models that allow documents
to be explained by unobserved (latent) topics. HMM-LDA
is a topic model that simultaneously models topics and syntactic
structures in a collection of documents [68]. The feature
selection schemes proposed by Duric and Song [33] achieved
competitive results for document polarity classification specially
when using only the syntactic classes and reducing
the overlaps with the semantic words in their final feature
sets. They worked on movie reviews and used Maximum
Entropy (ME) classifier (illustrated with details in the next
section).
3.2. Challenging tasks in FS
A very challenging task in extracting features is irony detection.
The objective of this task is to identify irony reviews. This
work was proposed by Reyes and Rosso [48]. They aimed to
define a feature model in order to represent part of the subjective
knowledge which underlies such reviews and attempts to
describe salient characteristics of irony. They have established
a model to represent verbal irony in terms of six categories of
features: n-grams, POS-grams, funny profiling, positive/negative
profiling, affective profiling, and pleasantness profiling.
They built a freely available data set with ironic reviews from
news articles, satiric articles and customer reviews, collected
from amazon.com. They were posted on the basis of an online
viral effect, i.e. contents that trigger a chain reaction in people.
They used NB, SVM, and DT for classification purpose (illustrated
with details in the next section). Their results with the
three classifiers are satisfactory, both in terms of accuracy, as
well as precision, recall, and F-measure.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

v2 được sử dụng trong nhiều ứng dụng; một trong số họ là các theo ngữ cảnhquảng cáo như trình bày của fan hâm mộ và Chang [27]. Họkhám phá blog ngay lập tức lợi ích cá nhân đểcải thiện quảng cáo theo ngữ cảnh trực tuyến. Họ làm việc trên bấtquảng cáo và các blog thực tế trang từ ebay.com, wikipedia.comvà epinions.com. Họ sử dụng SVM (minh họa với các chi tiết trongphần tiếp theo) cho phân loại và v2 cho FS. Kết quả của họcho thấy rằng phương pháp của họ có hiệu quả có thể xác định những quảng cáođó là tích cực tương quan với một blogger cá nhânlợi ích.Hagenau và Liebmann tính năng thông tin phản hồi [5] được sử dụng bởisử dụng thông tin phản hồi thị trường như là một phần của họ lựa chọn tính năngxử lý liên quan đến dữ liệu thị trường chứng khoán. Sau đó, họ sử dụng chúngvới v2 và Bi-bình thường tách (BNS). Họ đã chỉ ra rằngmột lựa chọn các tính năng mạnh mẽ cho phép nâng phân loại phàmđáng kể khi kết hợp với các loại tính năng phức tạp. Của họphương pháp tiếp cận cho phép lựa chọn tính năng ngữ nghĩa có liên quan vàlàm giảm vấn đề của over-phù hợp khi áp dụng một máycách tiếp cận học tập. Họ sử dụng SVM là một loại. Kết quả của họđã chỉ ra rằng sự kết hợp của khai thác tính năng nâng caophương pháp và của họ dựa trên thông tin phản hồi tính năng lựa chọn tăngphân loại độ chính xác và cho phép cải thiện tình cảm analytics.Điều này là bởi vì phương pháp tiếp cận của họ cho phép giảm sốtính năng giải thích ít, tức là tiếng ồn, và giới hạn tiêu cựcảnh hưởng của phù hợp hơn khi áp dụng máy họcphương pháp tiếp cận để phân loại các tin nhắn văn bản.3.1.3. latent Semantic Indexing (LSI)Tính năng lựa chọn phương pháp nỗ lực để giảm chiềudữ liệu của chọn từ các thiết lập ban đầu của thuộc tính.Tính năng chuyển đổi phương pháp tạo ra một tập hợp nhỏ các tính năngnhư là một chức năng của các thiết lập ban đầu của tính năng. LSI làmột trong những phương pháp chuyển đổi tính năng nổi tiếng [66]. LSIphương pháp biến đổi không gian văn bản để một hệ thống trục mới màlà một tổ hợp tuyến tính của các tính năng từ bản gốc. ChínhKỹ thuật phân tích thành phần (PCA) được sử dụng đểđạt được mục tiêu này [67]. Nó sẽ xác định hệ trục màvẫn giữ mức độ lớn nhất của các thông tin về các biến thểtrong các giá trị thuộc tính cơ bản. Những bất lợi chính củaLSI là rằng nó là một kỹ thuật không có giám sát là mù đểlớp cơ bản-phân phối. Do đó, các tính năngtìm thấy bởi LSI là không nhất thiết phải là các hướng dẫn dọc theo đólớp phân phối các tài liệu cơ bản có thể là tốt nhấttách ra [62].Có là các phương pháp tiếp cận mà có thể được sử dụng thống kêở FS như mô hình Markov ẩn (HMM) và ẩnDirichlet các phân bổ (cấp LDA Cải). Chúng được sử dụng bởi Duric vàBài hát [33] để tách các thực thể trong một tài liệu xem xét từnhững biểu hiện chủ quan mô tả những thực thể trong điều khoảnsố cực. Đây là lựa chọn tính năng mới được đề xuất của họchương trình. Cấp LDA Cải có thể sinh các mô hình cho phép tài liệuđể được giải thích bởi các chủ đề (tiềm ẩn) hạt. HMM CẤP LDA CẢIlà một mô hình chủ đề đồng thời mô hình chủ đề và cú phápcấu trúc trong một tập hợp các tài liệu [68]. Các tính nănglựa chọn chương trình được đề xuất bởi Duric và bài hát [33] đạt đượckết quả cạnh tranh cho tài liệu cực phân loại đặc biệtkhi sử dụng chỉ có các lớp học cú pháp và giảmchồng chéo với các từ ngữ nghĩa trong của tính năng cuối cùngbộ. Họ làm việc trên phim đánh giá và sử dụng tối đaLoại dữ liệu ngẫu nhiên (ME) (minh họa với các chi tiết trong kế tiếpphần).3.2. thách thức nhiệm vụ trong FSMột công việc rất khó khăn trong chiết xuất tính năng là irony phát hiện.Mục tiêu của nhiệm vụ này là xác định đánh giá trớ trêu. Điều nàycông việc được đề xuất bởi Reyes và Rosso [48]. Họ nhằm mục đích đểxác định một mô hình tính năng để đại diện cho một phần của các chủ quankiến thức nền tảng đánh giá như vậy và cố gắngMô tả các đặc điểm nổi bật của irony. Họ đã thành lậpmột mô hình đại diện cho lời nói trớ trêu trong điều khoản của các thể loại sáu củatính năng: hài hước n-gam, POS-gam, Hồ sơ, tích cực/tiêu cựcHồ sơ, Hồ sơ trầm và pleasantness profiling.Họ xây dựng một tập hợp dữ liệu sẵn sàng tự do với mỉa mai đánh giá từtin tức bài viết, kiểu bài viết và bình luận, thu thậptừ amazon.com. Họ đã được đăng trên cơ sở một trực tuyếnvirus có hiệu lực, tức là các nội dung kích hoạt một phản ứng dây chuyền trong người.Họ sử dụng NB, SVM và DT cho mục đích phân loại (minh họavới các chi tiết trong phần tiếp theo). Kết quả của họ với cácMáy phân loại ba là thỏa đáng, cả hai tại về tính chính xác, nhưcũng như độ chính xác, thu hồi, và F-biện pháp.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

v2 được sử dụng trong nhiều ứng dụng; một trong số đó là các ngữ cảnh
quảng cáo được trình bày bởi Fan và Chang [27]. Họ
phát hiện ra lợi ích cá nhân ngay lập tức các blogger 'để
cải thiện quảng cáo theo ngữ cảnh trực tuyến. Họ đã làm việc trên thực tế
các quảng cáo và các trang blog thực tế từ ebay.com, wikipedia.com
và epinions.com. Họ đã sử dụng SVM (minh họa với các chi tiết trong
các phần tiếp theo) để phân loại và v2 cho FS. Kết quả của họ
cho thấy rằng phương pháp của họ có hiệu quả có thể xác định những quảng cáo
được tích cực tương quan với cá nhân của một blogger
lợi.
Hagenau và Liebmann [5] sử dụng các tính năng phản hồi bằng cách
sử dụng thông tin phản hồi của thị trường như là một phần của tính năng lựa chọn của họ
liên quan đến quá trình dữ liệu thị trường chứng khoán. Sau đó, họ sử dụng chúng
với v2 và Bi-Normal Separation (BNS). Họ cho thấy
một lựa chọn tính năng mạnh mẽ cho phép nâng độ chính xác phân loại
một cách đáng kể khi kết hợp với các loại tính năng phức tạp. Họ
tiếp cận cho phép lựa chọn các tính năng ngữ nghĩa có liên quan và
làm giảm các vấn đề của quá phù hợp khi áp dụng một máy
phương pháp học tập. Họ đã sử dụng SVM như một bộ phân loại. Kết quả của họ
cho thấy rằng sự kết hợp của tính năng khai thác tiên tiến
phương pháp và lựa chọn tính năng phản hồi của họ dựa trên tăng
độ chính xác phân loại và cho phép cải thiện phân tích tâm lý.
Điều này là bởi vì cách tiếp cận của họ cho phép giảm số lượng
các tính năng ít hơn giải thích, ví dụ như tiếng ồn, và giới hạn tiêu cực
ảnh hưởng của over-fitting khi xin học máy
phương pháp tiếp cận để phân loại các tin nhắn văn bản.
3.1.3. Semantic Indexing (LSI) Latent
phương pháp lựa chọn Feature cố gắng giảm số chiều
của dữ liệu bằng cách chọn từ phần thiết lập ban đầu của các thuộc tính.
Tính năng chuyển đổi phương pháp tạo ra một tập hợp nhỏ các tính năng
như một chức năng của các thiết lập ban đầu của các tính năng. LSI là
một trong những phương pháp chuyển đổi tính năng nổi tiếng [66]. LSI
phương pháp biến đổi không gian văn bản cho một hệ thống trục mới mà
là một sự kết hợp tuyến tính của các tính năng từ bản gốc. Hiệu trưởng
các kỹ thuật phân tích thành phần (PCA) được sử dụng để
đạt được mục tiêu này [67]. Nó quyết định trục hệ thống mà
vẫn giữ được mức độ lớn nhất của thông tin về các biến thể
trong các giá trị thuộc tính cơ bản. Nhược điểm chính của
LSI là nó là một kỹ thuật không có giám sát nước mù quáng,
đẳng cấp phân phối cơ bản. Vì vậy, các tính năng
được tìm thấy bởi LSI là không nhất thiết phải là hướng dọc mà
đẳng cấp phân phối các tài liệu cơ bản có thể được tốt nhất
tách ra [62].
Có phương pháp thống kê khác mà có thể được sử dụng
trong FS như Hidden Markov Model (HMM) và tiềm ẩn
Phân bổ Dirichlet (LDA). Chúng được sử dụng bởi Duric và
Sông [33] để tách các thực thể trong một tài liệu xem xét từ
những biểu hiện chủ quan mà mô tả những thực thể trong các điều khoản
của phân cực. Đây là lựa chọn tính năng mới được đề nghị của
đề án. LDA là các mô hình sinh sản cho phép các tài liệu
được giải thích là do không quan sát được (tiềm ẩn) các chủ đề. HMM-LDA
là một mô hình chủ đề mà đồng thời mô hình chủ đề và cú pháp
cấu trúc trong một bộ sưu tập các tài liệu [68]. Các tính năng
chương trình lựa chọn của Duric và Song [33] đề xuất đạt
kết quả cạnh tranh cho các tài liệu phân cực đặc biệt
khi chỉ sử dụng các lớp học ngữ pháp và làm giảm
sự chồng chéo với những từ ngữ nghĩa trong tính năng cuối cùng của
bộ. Họ đã làm việc trên đánh giá bộ phim và được sử dụng tối đa
Entropy (ME) phân loại (minh họa với các chi tiết trong kế
phần).
3.2. Nhiệm vụ đầy thử thách trong FS
Một nhiệm vụ rất khó khăn trong các tính năng giải nén là phát hiện sự mỉa mai.
Mục đích của việc này là để xác định các ý kiến mỉa mai. Điều này
làm việc đã được đề xuất bởi Reyes và Rosso [48]. Họ nhằm
xác định một mô hình tính năng để đại diện cho một phần của chủ
kiến thức làm nền tảng cho các ý kiến đó và cố gắng để
mô tả đặc điểm nổi bật của sự mỉa mai. Họ đã thành lập
một mô hình đại diện cho lời nói mỉa mai về sáu loại
tính năng: n-gram, POS-gram, funny profiling, tích cực / tiêu cực
. profiling, profiling tình cảm, và sự thú vị profiling
Họ xây dựng một dữ liệu có sẵn miễn phí thiết lập với ý mỉa mai từ
các bài báo, bài báo châm biếm và đánh giá của khách, thu thập
từ amazon.com. Họ đã được đăng tải trên cơ sở của một trực tuyến
hiệu ứng lan truyền, nội dung tức là kích hoạt một phản ứng dây chuyền trong người.
Họ sử dụng NB, SVM, và DT cho mục đích phân loại (minh họa
với các chi tiết trong phần tiếp theo). Kết quả của họ với
ba phân loại là đạt yêu cầu, cả về tính chính xác, như
cũng như độ chính xác, thu hồi, và F-measure.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.