4. tình cảm phân loại kỹ thuậtTình cảm phân loại kỹ thuật có thể được tạm chiavào máy học tập phương pháp tiếp cận, lexicon dựa trên phương pháp tiếp cận vàcách tiếp cận Hybrid [69]. Máy học phương pháp tiếp cận (ML)áp dụng các thuật toán ML nổi tiếng và sử dụng các tính năng ngôn ngữ.Lexicon dựa trên phương pháp tiếp cận dựa vào một lexicon tình cảm, mộtbộ sưu tập của tình cảm được biết đến và tạo điều kiện. Nó làchia thành cách tiếp cận dựa trên từ điển và corpus dựa trênphương pháp tiếp cận, sử dụng phương pháp thống kê hoặc ngữ nghĩa để tìm tình cảmphân cực. Kết hợp phương pháp tiếp cận kết hợp cả haiphương pháp tiếp cận và rất phổ biến với tình cảm lexiconschơi một vai trò quan trọng trong phần phương pháp. Khác nhauphương pháp tiếp cận và các thuật toán phổ biến nhất của SCminh họa trong hình 2 như đã đề cập trước khi.Các phương pháp phân loại văn bản bằng cách sử dụng phương pháp tiếp cận ML có thểtạm chia thành giám sát và không có giám sát học tậpphương pháp. Các phương pháp giám sát thực hiện sử dụng một số lớntài liệu đào tạo có nhãn. Các phương pháp không có giám sátđược sử dụng khi nó là khó khăn để tìm thấy các có nhãn đào tạotài liệu.Lexicon dựa trên phương pháp tiếp cận phụ thuộc vào việc tìm kiếm ý kiếnLexicon được sử dụng để phân tích văn bản. Có hai phương pháptrong cách tiếp cận này. Từ điển, dựa trên phương pháp tiếp cận màphụ thuộc vào việc tìm kiếm ý kiến hạt giống từ, và sau đó tìm kiếmtừ điển các từ đồng nghĩa của họ và các thành ngữ. Corpusbasedcách tiếp cận bắt đầu với một danh sách hạt giống của ý kiến từ, vàsau đó tìm thấy từ quan điểm khác trong một corpus lớn để giúp đỡ trong việc tìm kiếmý kiến từ với bối cảnh cụ thể định hướng. Điều nàycó thể được thực hiện bằng cách sử dụng phương pháp thống kê hoặc ngữ nghĩa. Cómột lời giải thích ngắn gọn của thuật toán cả hai phương pháp tiếp cận vàBài viết liên quan trong các phần phụ kế tiếp.4.1. cách tiếp cận học tập máyCách tiếp cận học tập máy dựa vào ML nổi tiếngCác thuật toán để giải quyết SA là một phân loại văn bản thường xuyênvấn đề mà làm cho việc sử dụng tính năng cú pháp và/hoặc ngôn ngữ.Văn bản phân loại vấn đề định nghĩa: Chúng tôi có một tập hợp cácđào tạo hồ sơ D = {X 1, X 2,..., Xn} nơi mỗi bản ghi được dán nhãn để một lớp học. Các mô hình phân loại liên quan đến cáctính năng trong hồ sơ cơ bản để một trong các nhãn lớp.Sau đó cho một trường hợp nhất định của lớp không rõ, các mô hình được sử dụngđể dự đoán một lớp nhãn cho nó. Vấn đề khó phân loại làkhi chỉ có một nhãn được gán cho một thể hiện. Mềm cơ-fication vấn đề là khi một giá trị xác suất của nhãn làđược gán cho một thể hiện.4.1.1. Giám sát học tậpCác phương pháp giám sát học tập phụ thuộc vào sự tồn tại củadán nhãn tài liệu đào tạo. Có rất nhiều loại củaGiám sát máy phân loại trong văn học. Trong phần phụ kế tiếp, chúng tôigiới thiệu tóm tắt chi tiết một số trong những thường xuyên sử dụngMáy phân loại trong SA.4.1.1.1. xác suất máy phân loại nhất. Máy phân loại xác suất sử dụnghỗn hợp các mô hình cho phân loại. Giả định các mô hình hỗn hợprằng mỗi lớp là một thành phần của hỗn hợp. Hỗn hợp mỗithành phần là một mô hình thể sinh mà cung cấp khả năngLấy mẫu một cụm từ cụ thể cho các thành phần đó. Các loạicủa máy phân loại cũng được gọi là máy phân loại thể sinh. Ba trong số cácMáy phân loại xác suất nổi tiếng nhất được thảo luận trong kế tiếpphần phụ.
đang được dịch, vui lòng đợi..
