Cú pháp hạn chế yêu cầu các cụm từ liên quan để phù hợp với mô hình thẻ POS Hiển thị trong hình 1. Giới hạn các mô hình quan hệ cụm từ là một cụm động từ đơn giản (ví dụ, phát minh), một cụm động từ theo sau ngay lập tức bởi một giới từ hoặc hạt (ví dụ: nằm ở), hoặc một cụm động từ theo sau là một cụm danh từ đơn giản và kết thúc bằng một giới từ hoặc hạt (ví dụ, có khối lượng nguyên tử của). Nếu có nhiều trận đấu có thể trong một câu cho một động từ đơn, trận đấu dài nhất có thể được chọn.Cuối cùng, nếu mô hình phù hợp với nhiều chuỗi liền kề, chúng tôi hợp nhất chúng vào một cụm từ duy nhất quan hệ (ví dụ, muốn mở rộng). Sàng lọc này cho phép các mô hình để dễ dàng xử lý các cụm từ mối quan hệ có chứa động từ nhiều. Một hệ quả của mô hình này là các cụm từ liên quan phải có một khoảng tiếp giáp của các từ trong câu.Trong khi mô hình cú pháp này xác định cụm từ liên quan với độ chính xác cao, đến mức độ nào không nó giới hạn thu hồi? Để trả lời này, chúng tôi phân tích ngô và Hàn của tập 300 Web câu, tự xác định tất cả động từ, dựa trên mối quan hệ giữa danh từ cụm từ cặp. Kết quả là một tập hợp các cụm từ liên quan 327.Cho mỗi cụm từ liên quan, chúng tôi đã kiểm tra cho dù nó đáp ứng REVERB cú pháp hạn chế. Chúng tôi thấy rằng 85% của các cụm từ liên quan đáp ứng những hạn chế. 15% còn lại, chúng tôi xác định một số trường hợp phổ biến mà các khó khăn đã vi phạm, được tóm tắt trong bảng 3. Nhiều người trong số những trường hợp liên quan đến tầm xa quan hệ phụ thuộc giữa các từ trong câu. Như chúng tôi hiển thị trong phần 4, cố gắng để trang trải những trường hợp khó khăn hơn bằng cách sử dụng một phân tích cú pháp phụ thuộc có thể thực sự làm giảm thu hồi cũng như độ chính xác.
đang được dịch, vui lòng đợi..