Việc thực hiện gắn thẻ cũng bị suy yếu do các chú thích khác nhau của nhiều từ thông dụng. Ví
dụ, trong PTB, hơn 99,9% của token 'để' được gắn nhãn là TO, nhưng trong PCHE từ này cũng có thể được dán nhãn là IN, phân biệt các điểm đánh dấu infinitive từ giới từ. Những từ "tất cả", "bất kỳ" và "mỗi" được chú thích như định lượng trong PCHE; thẻ này được ánh xạ tới JJ, nhưng những lời cụ thể được đánh nhãn như DT trong PTB. Một Remapping đơn giản từ Q tới DT dẫn đến sự gia tăng độ chính xác cơ bản 0,78%; có thể là thay đổi khác với các ánh xạ tag của Moon và Baldridge (2007) có thể mang lại những cải tiến hơn nữa, nhưng một cách tiếp cận có hệ thống hơn sẽ là bên ngoài giới hạn của sự thích nghi miền không có giám sát.
đang được dịch, vui lòng đợi..
