Dữ liệu huấn luyện của bộ phân tích GENIA gồm
của WSJ Penn Treebank và GENIA Corpus.
Miễn là chúng ta tìm kiếm với phương pháp chiết xuất của chúng tôi
tại mục 4.3, WSJ và GENIA Corpus dường như
tương ứng chứa 115 và 0 mệnh lệnh, và 432 và bảy câu hỏi . Không giống như các tagger POS,
phân tích cú pháp có thể chuyển tải câu toàn cầu nhiều
công trình xây dựng từ các câu này.
đang được dịch, vui lòng đợi..