Vì từ khoá mình có thể đạt được một thu hồi cao, chúng có thể được sử dụng để lọc ra những câu đó sẽ không phải là câu so sánh. Chúng tôi chỉ cần để cải thiện độ chính xác trên các câu còn lại. Nó cũng đã được quan sát trong (Jindal và Liu, 2006a) rằng câu so sánh có liên quan đến từ khóa mô hình mạnh mẽ so sánh, mà không phải là đáng ngạc nhiên. Những mô hình này có thể được sử dụng như là các tính năng trong học tập. Để khám phá
các mô hình, lớp học quy tắc tuần tự (CSR) khai thác được sử dụng trong (Jindal và Liu, 2006a). Khai thác lớp quy tắc tuần tự là một dạng đặc biệt của tuần tự khai thác mô hình (Liu, 2006 và 2011). Mỗi ví dụ đào tạo là một cặp (si, yi), nơi si là một chuỗi và yi là một nhãn lớp, tức là, yi {so sánh, noncomparison}. Các chuỗi được tạo ra từ một câu. Sử dụng các dữ liệu huấn luyện, CSR có thể được tạo ra.
Đối với xây dựng mô hình phân loại, bên trái mô hình chuỗi bên của các quy tắc CSR với xác suất có điều kiện cao đã được sử dụng như là các tính năng. Naïve Bayes đã được sử dụng để xây dựng mô hình. In (Yang và Ko, 2011), cùng một vấn đề đã được nghiên cứu nhưng trong bối cảnh của ngôn ngữ Hàn Quốc. Các thuật toán học được sử dụng là học chuyển đổi dựa trên, trong đó sản xuất quy định.
đang được dịch, vui lòng đợi..
