4.1.3. Máy phân loại MetaTrong nhiều trường hợp, các nhà nghiên cứu sử dụng một loại hoặc nhiều cơ-fiers để kiểm tra công việc của họ. Một trong những bài viết này là các công việc được đề xuấtbởi Lane và Clarke [46]. Họ trình bày một MLcách tiếp cận để giải quyết vấn đề của việc tìm tài liệu thực hiệntích cực hay tiêu cực favorability trong phương tiện truyền thông phân tích. Cácsự mất cân bằng trong sự phân bố của tích cực và tiêu cực mẫu,những thay đổi trong các tài liệu qua thời gian, và có hiệu quả đào tạo vàđánh giá thủ tục cho các mô hình là những thách thức họphải đối mặt để đạt được mục tiêu của họ. Họ làm việc trên ba bộ dữ liệu được tạo ra bởi một công ty phân tích phương tiện truyền thông. Họ phân loại tài liệutheo hai cách: phát hiện sự hiện diện của favorability, vàđánh giá tiêu cực vs favorability tích cực. Họ đã sử dụng nămCác loại khác nhau của các tính năng để tạo ra các bộ dữ liệu từ các nguyênvăn bản. Họ kiểm tra máy phân loại nhiều để tìm tốt nhất(SVM, K, gần nhất với hàng xóm, NB, BN, DT, một người học quy tắc vàkhác). Họ đã chỉ ra rằng cân bằng phân phối lớp trongđào tạo dữ liệu có thể mang lại lợi ích trong việc cải thiện hiệu suất,nhưng NB có thể bị ảnh hưởng bất lợi.Áp dụng thuật toán ML trên streaming các dữ liệu từ Twitterđược điều tra bởi Rui và lưu [56]. Trong công việc của họ, họ đãđiều tra hay không và làm thế nào twitter miệng (WOM)ảnh hưởng đến bán hàng phim bởi ước tính một mô hình dữ liệu bảng năng động.Họ sử dụng NB và SVM cho mục đích phân loại. Của họđóng góp chính phân loại các tweets đưa vào xem xétCác đặc tính độc đáo của tweets. Họ phân biệtgiữa ý kiến trước khi người tiêu dùng (những người đã khôngmua các sản phẩm được nêu ra) và ý kiến người tiêu dùng (những ngườimua các sản phẩm). Họ làm việc trên bộ phim điểm chuẩnđánh giá và dữ liệu twitter. Họ đã thu thập Twitter WOMdữ liệu bằng cách sử dụng Twitter API và phim bán hàng dữ liệu từ BoxOfficeMojo.com.Kết quả của họ gợi ý rằng ảnh hưởng củaWOM trên bán sản phẩm từ người sử dụng Twitter với những người theo nhiều hơnlà lớn hơn đáng kể hơn từ người dùng Twitter với ítnhững người theo. Họ thấy rằng có hiệu lực trước khi tiêu thụWOM trên phim bán hàng là lớn hơn mà sau tiêu thụWOM.Một bài viết so sánh Máy phân loại nhiều sau khi áp dụng mộtthống kê mô hình Markov dựa trên loại. Điều này là để nắm bắtphụ thuộc giữa các từ và cung cấp một vốn từ vựngmà nâng cao hiệu suất tiên đoán của một số phổ biếnMáy phân loại. Điều này đã được trình bày bởi Bai [15] những người đã trình bàymột thuật toán dự đoán hai giai đoạn. Trong giai đoạn đầu tiên, ông cơ-Fier học có điều kiện phụ thuộc trong số các từ vàmã hóa chúng vào một Markov chăn đạo diễn Acyclic đồ thịĐối với tình cảm biến. Trong giai đoạn thứ hai, ông đã sử dụng một metaheuristicchiến lược để tinh chỉnh thuật toán của họ để mang lại một caođường xác nhận tính chính xác. Ông đã làm việc trên hai bộ sưu tập củaOnline phim đánh giá từ IMDB và ba bộ sưu tập củatin tức trực tuyến sau đó so sánh các thuật toán của mình với SVM, NB,TÔI và những người khác. Ông minh họa rằng phương pháp của ông đã có thểxác định một parsimonious thiết lập tính năng tiên đoán và thu đượctốt hơn dự đoán kết quả về định hướng tình cảm, so sánhphương pháp khác. Kết quả của mình đề nghị rằng tình cảmđược chụp bởi có điều kiện phụ thuộc giữa các từ là tốtnhư bằng từ khóa hoặc các từ tần số cao. Sự phức tạp củaMô hình của ông là tuyến tính trong số mẫu.Giám sát và không có giám sát phương pháp tiếp cận có thể được kết hợpvới nhau. Điều này được thực hiện bởi Valdivia và Ca´mara [54]. Họđề nghị sử dụng meta-máy phân loại để phát triển mộtCác hệ thống phân loại phân cực. Họ làm việc trên một corpus Tây Ban Nhaphim đánh giá cùng với corpus song song dịchsang tiếng Anh (MCE). Trước tiên, họ tạo ra hai mô hình cá nhânsử dụng các corpora hai sau đó áp dụng máy họcthuật toán (SVM, NB, C4.5 và khác). Thứ hai, họ tích hợpSentiWordNet tình cảm corpus vào các văn thể tiếng Anhtạo ra một mô hình không có giám sát mới bằng cách sử dụng ngữ nghĩa định hướngcách tiếp cận. Thứ ba, họ kết hợp ba hệ thống bằng cách sử dụng mộtMeta-loại. Kết quả của họ tốt hơn các kết quả của việc sử dụngcá nhân corpus và cho thấy rằng cách tiếp cận của họ có thểđược coi là một chiến lược tốt cho sự phân cực phân loại khisong song corpora có sẵn.Máy phân loại ML được sử dụng bởi Walker và Anand [44] để phân loạilập trường. Lập trường được định nghĩa là một vị trí tổng thể được tổ chức bởi mộtngười đối với một đối tượng, ý tưởng hoặc vị trí [84]. Lập trường là tương tự nhưđể một quan điểm hay quan điểm, nó có thể được coi là xác địnhphía '''' mà một người nói là ngày, ví dụ như cho hay chống lạiCác quyết định chính trị. Walker và Anand [44] đã phân loạilập trường rằng người giữ và áp dụng điều này vào cuộc tranh luận chính trị.Họ sử dụng 104 hai mặt cuộc tranh luận từ convinceme.net cho14 khác nhau tranh luận các chủ đề và cố gắng để xác định lập trường hoặcThái độ của các diễn giả. Mục tiêu chính của họ là để xác địnhsự đóng góp tiềm năng để cuộc tranh luận bên phân loại hiệu suấttính năng theo ngữ cảnh đối thoại. Có hiệu lực chính chobối cảnh là khi so sánh kết quả của họ với không có bối cảnh đểnhững người có bối cảnh, nơi chỉ có 5 chủ đề tính năng cặp Hiển thị mộtgiảm từ để không bối cảnh bối cảnh. Họ sử dụng SVM, NBvà một quy tắc dựa trên loại cho mục đích phân loại. Họđạt được phân loại cuộc tranh luận-side phàm, một cho mỗi chủ đềcơ sở, so với đường cơ sở unigram khi sử dụng tình cảm,chủ quan, phụ thuộc và dialogic tính năng.
đang được dịch, vui lòng đợi..
