Như đã mô tả ở trên, nhiệm vụ của chúng tôi là phân loại để xác định như thế nào tiểu luận sinh viên liên quan đến các văn bản gốc. Dữ liệu đào tạo của chúng tôi cho các phương pháp khác nhau là tập hợp các bài tiểu luận sinh viên đề cập ở trên đã được mã hóa bởi các nhà phân tích của con người. Chúng tôi đã làm việc với 459 bài tiểu luận sinh viên thu thập được trong năm 2008 và 2009, bao gồm tổng cộng 4076 câu.
đang được dịch, vui lòng đợi..