Như hầu hết các câu truy vấn là một trong hai mệnh lệnh
hoặc nghi vấn, có những thành phần vô hơn
so với GENIA Corpus. Trong GTREC
truy vấn Treebank, 184/196 (93,9%) câu chứa
một hoặc nhiều phần cấu rỗng, trong khi ở GENIA,
12.222 / 18.541 (65,9%) câu đã làm. Chúng tôi dự kiến sẽ
có những câu hơn với nhiều vô
thành phần trong GTREC so với GENIA, do
tần số của câu nghi vấn bị động, nhưng
ngược lại số lượng các câu có chứa
nhiều hơn một thành phần null là 65 (33,1%) trong
GTREC, và 6367 (34,5%) trong GENIA. Đây có thể là
do tần số của mệnh đề quan hệ trong GENIA.
đang được dịch, vui lòng đợi..
