"WDT → WP" lỗi gắn thẻ chỉ được quan sát thấy
trong các câu hỏi và cũng giảm mạnh.
Ví dụ, trong câu "gì độc tính
được liên kết với cytarabine?", "Cái gì" làm việc
như một determiner (WDT) mà mất "nhiễm độc" ,
trong khi các tagger GENIA thường đã diễn này "gì" như một
đại từ (WP) làm cho một cụm từ của chính nó. Điều này sẽ
là do các dữ liệu huấn luyện cho các tagger GENIA
sẽ chứa 682 WP "cái gì" và chỉ có 27 WDT
"cái gì". WP "gì" không có thể làm cho một cụm danh từ
bằng cách lấy một danh từ tiếp theo, và sau đó có thể phân tích
phân tích cú pháp sẽ bị hỏng ("determiner / đại từ" trong
Bảng 5). Bằng cách thích ứng các tagger, "WDT" tag đã được trao cho "gì", và bộ phân tích một cách chính xác được thực hiện một
cụm từ "độc tính gì".
đang được dịch, vui lòng đợi..
