2.2 xử lý văn bản Ở phía bên xử lý văn bản, chúng tôi lần đầu tiên gửi các Các câu hỏi trực tiếp đến công cụ tìm kiếm để thu hẹp xuống hồ bơi tài liệu với n đầu tiên, nói 200, tài liệu xử lý IE. Hiện nay, Điều này bao gồm tokenization, tính năng gắn thẻ POS và NE gắn thẻ. Kế hoạch tương lai bao gồm nhiều cấp độ phân tích cú pháp cũng như; đây yêu cầu để hỗ trợ cho CE và GE khai thác. Cần lưu ý rằng tất cả Các hoạt động này là rất mạnh mẽ và nhanh chóng, tính năng cần thiết cho các văn bản khối lượng lớn đánh chỉ mục. Phân tích được thực hiện thông qua cascaded finite state transducer grammars.
đang được dịch, vui lòng đợi..
