1. giới thiệuTình cảm phân tích (SA) hoặc ý kiến khai thác mỏ (OM) là các tính toánnghiên cứu về ý kiến, Thái độ và cảm xúc của người dânĐối với một thực thể. Các tổ chức có thể đại diện cho cá nhân, sự kiệnhoặc các chủ đề. Các chủ đề có nhiều khả năng được bao phủ bởigiá của khách. Hai biểu thức SA hoặc OM được hoán đổi cho nhau.Họ thể hiện một ý nghĩa lẫn nhau. Tuy nhiên, một số nhà nghiên cứunói rằng OM và SA có hơi khác nhau khái niệm [1].Quan điểm khai thác chất chiết xuất từ và phân tích các ý kiến của nhân dân vềmột thực thể trong khi tình cảm phân tích xác định tình cảmthể hiện trong một văn bản, sau đó phân tích nó. Vì vậy, mục tiêu củaSA là để tìm ý kiến, xác định tình cảm họ thể hiện,và sau đó phân loại phân cực của họ như minh hoạ trong hình 1.Phân tích tình cảm có thể được coi là một quá trình phân loạinhư minh họa trong hình 1. Có ba phân loại chínhmức độ trong SA: cấp tài liệu, câu cấp và khía cạnh cấpSA. Cấp tài liệu SA nhằm mục đích phân loại một tài liệu ý kiếnnhư thể hiện một ý kiến tích cực hay tiêu cực hoặc tình cảm. Nóxem xét tài liệu toàn bộ một đơn vị thông tin cơ bản(nói về một chủ đề). Cấp câu SA nhằm mục đích phân loạitình cảm, thể hiện trong mỗi câu. Bước đầu tiên làxác định câu là chủ quan hay mục tiêu. Nếu cáccâu là chủ quan, câu cấp SA sẽ xác địnhcho dù câu thể hiện ý kiến tích cực hay tiêu cực.Wilson et al. [2] đã chỉ ra rằng biểu hiện tình cảm là không nhất thiết phải chủ quan trong tự nhiên. Tuy nhiên, không cóCác khác biệt cơ bản giữa các tài liệu và câu cấpphân loại bởi vì câu là các tài liệu chỉ ngắn [3].Phân loại văn bản ở cấp tài liệu hoặc ở cấp độ câukhông cung cấp các chi tiết cần thiết cần thiết các ý kiến trên tất cảCác khía cạnh của các thực thể đó là cần thiết trong nhiều ứng dụng,để có được những chi tiết này; chúng ta cần phải đi đến cấp độ khía cạnh.Khía cạnh cấp SA nhằm mục đích phân loại tình cảm quan đếnCác khía cạnh cụ thể của tổ chức. Bước đầu tiên là để xác định cácthực thể và các khía cạnh. Các chủ sở hữu ý kiến có thể cung cấp cho khác nhauCác ý kiến cho các khía cạnh khác nhau của thực thể giống nhau như thế nàycâu '' chất lượng giọng nói của điện thoại này là không tốt, nhưng cáctuổi thọ pin là dài ''. Khảo sát này bóng lần đầu tiên hai loại củaSA.Các tập dữ liệu được sử dụng trong SA là một vấn đề quan trọng trong lĩnh vực này.Các nguồn chính của dữ liệu từ đánh giá sản phẩm. Đâyđánh giá là quan trọng cho chủ sở hữu doanh nghiệp vì họ có thể mấtquyết định kinh doanh theo kết quả phân tích của người dùngý kiến về sản phẩm của họ. Nguồn đánh giá là chủ yếu làXem lại các trang web. SA không chỉ áp dụng trên sản phẩm đánh giá nhưng có thểcũng được áp dụng trên thị trường chứng khoán [4,5], tin bài, [6] hoặccuộc tranh luận chính trị [7]. Trong cuộc tranh luận chính trị ví dụ, chúng tôi có thểTìm ra ý kiến của người trên một ứng cử viên cuộc bầu cử nhất định hoặcĐảng chính trị. Kết quả bầu cử cũng có thể được dự đoán từBài viết chính trị. Các trang web mạng xã hội và vi viết blogCác trang web được coi là một nguồn thông tin rất tốt bởi vìmọi người chia sẻ và thảo luận về ý kiến của mình về một chủ đề nhất địnhmột cách tự do. Họ cũng được sử dụng như là nguồn dữ liệu trong quá trình SA.Có rất nhiều ứng dụng và các cải tiến trên SAthuật toán mà đã được đề xuất trong vài năm qua. Khảo sát nàynhằm mục đích cung cấp cho một cái nhìn sâu hơn về những cải tiến và đểTổng kết và phân loại một số bài viết trình bày trong lĩnh vực nàytheo các kỹ thuật khác nhau của SA. Các tác giả đã thu thậpnăm mươi bốn bài báo mà trình bày quan trọng cải tiếntrường SA gần đây. Những bài viết này bao gồm một phạm vinhiều lĩnh vực SA. Tất cả họ đã được xuất bản trong vài cuốinăm. Chúng được phân loại theo mục tiêu của bài viếtminh họa các thuật toán và dữ liệu được sử dụng trong công việc của họ.Theo hình 1, các tác giả đã thảo luận về các tính năngLựa chọn (FS) kỹ thuật chi tiết cùng với của họ liên quanBài viết đề cập đến một số tài liệu tham khảo có nguồn gốc. Tình cảmKỹ thuật phân loại (SC), như minh hoạ trong hình 2, làthảo luận với các chi tiết minh hoạ bài viết liên quan vàcó nguồn gốc tài liệu tham khảo là tốt.Khảo sát này có thể hữu ích cho nhà nghiên cứu comer mới ở đâylĩnh vực như là nó bao gồm các nổi tiếng nhất SA kỹ thuật và ứng dụngtrong một nghiên cứu giấy. Điều này khảo sát duy nhất cung cấp cho mộtphân loại tinh chế để các kỹ thuật khác nhau của SA làkhông tìm thấy trong các cuộc điều tra. Nó cũng bàn về lĩnh vực có liên quan mớiở SA mà đã thu hút các nhà nghiên cứu gần đây và của họ tương ứngBài viết. Các lĩnh vực này bao gồm các cảm xúc phát hiện(ED), xây dựng tài nguyên (BR) và chuyển giao học tập (TL).Cảm xúc phát hiện mục tiêu để giải nén và phân tích những cảm xúc, trong khinhững cảm xúc có thể được rõ ràng hoặc tiềm ẩn trong các câu.Chuyển giao học tập hoặc phân loại tên miền chéo là có liên quanvới phân tích các dữ liệu từ một tên miền và sau đó sử dụng cáckết quả trong một mục tiêu tên miền. Xây dựng nguồn lực nhằm mục đích tạo ralexica, corpora trong ý kiến mà biểu hiện được chú thíchtheo phân cực của họ, và đôi khi từ điển. Trong điều nàygiấy, các tác giả cho một cái nhìn gần gũi hơn trên các lĩnh vực này.Có rất nhiều số điều trình bày hàng nămtrong các lĩnh vực SA. Số lượng các bài viết đang gia tăng thông quanăm. Điều này tạo ra một nhu cầu để có giấy tờ khảo sát tóm tắtxu hướng nghiên cứu gần đây và hướng dẫn của SA. Người đọccó thể tìm thấy một số phức tạp và chi tiết khảo sát bao gồm[1,3,8-11]. Những cuộc điều tra đã thảo luận vấn đề của SAtừ ứng dụng điểm trên không từ các kỹ thuật SAquan điểm trên.Hai cuộc điều tra dài và chi tiết đã được trình bày bởi Pang vàLee [8] và lưu [3]. Họ tập trung vào các ứng dụng và những thách thứcở SA. Họ đề cập đến các kỹ thuật được sử dụng để giải quyếtmỗi vấn đề ở SA. Cambria và thoi dai ngay nay et al. [9], Feldman[10] và Montoyo và Martı´nez-Barco [11] đã đưa ra ngắn hạnkhảo sát ý kiến minh họa các xu hướng mới trong SA. Tsytsarau vàPalpanas [1] đã trình bày một cuộc khảo sát mà thảo luận chínhCác chủ đề của SA chi tiết. Cho mỗi chủ đề họ có minh họa của nóđịnh nghĩa, vấn đề và phát triển và phân loại cácBài viết với sự giúp đỡ của các bảng biểu và đồ thị. Phân tích của cácbài trình bày trong khảo sát này là tương tự như những gì đã được đưa rabởi [1], nhưng với một quan điểm và phân loại khác nhauCác bài viết.Sự đóng góp của cuộc khảo sát này là quan trọng vì nhiều lý do.Trước tiên, cuộc khảo sát này cung cấp các phân loại phức tạp củamột số lớn các bài viết gần đây theo các kỹ thuậtđược sử dụng. Góc này có thể giúp các nhà nghiên cứu những người quen thuộcvới một số kỹ thuật để sử dụng chúng trong trường SA và chọncác kỹ thuật thích hợp cho một ứng dụng nhất định. Thứ hai,các kỹ thuật khác nhau của SA được phân loại với các chi tiết ngắn gọnCác thuật toán và tài liệu tham khảo có nguồn gốc của họ. Điều này có thểgiúp comers mới vào trường SA có tầm nhìn toàn cảnhtrên toàn bộ lĩnh vực. Thứ ba, các bộ dữ liệu có tiêu chuẩnđược thảo luận và phân loại theo sử dụng của họ trong một sốứng dụng. Cuối cùng, các cuộc khảo sát được tăng cường bằng việc thảo luận cáccác lĩnh vực liên quan đến SA bao gồm các cảm xúc phát hiện, xây dựngtài nguyên và chuyển giao học tập.Giấy này được tổ chức như sau: phần 2 bao gồm cáckhảo sát phương pháp và một bản tóm tắt của các bài viết. Phần 3bóng FS kỹ thuật và các bài viết có liên quan, vàPhần 4 thảo luận về các kỹ thuật khác nhau của SC và tương ứngBài viết. Trong phần 5, các lĩnh vực liên quan đến SA vàBài viết tương ứng của họ được trình bày. Phần 6 trình bàyCác kết quả và thảo luận, và cuối cùng kết luận vàcác xu hướng trong tương lai trong nghiên cứu được giải quyết trong phần 7
đang được dịch, vui lòng đợi..
