Chúng tôi sử dụng d LSA từ http://lsa.colorado.edu với không gian "Tổng đọc lên đến đại học năm 1 (300 yếu tố)" để tính toán sự giống nhau cô sin giữa mỗi câu sinh viên và mỗi câu trong ba nguồn tài liệu mà các sinh viên đọc. Nếu cô sin là lớn hơn một ngưỡng, chúng tôi chỉ định mã TM có liên quan để sinh viên câu. Như với các chú thích coder, điều này cho phép nhiều TM mã cho mỗi học sinh câu. Bởi vì ngưỡng phải được empirically có nguồn gốc, chúng tôi sử dụng một loạt các cô sin ngưỡng (0,4, 0.5, 0,55, 0.6, 0,65, 0.7, 0,75 và 0,8). Các kết quả được hiển thị trong bảng 2. Thương mại-off giữa thu hồi và độ chính xác có thể được nhìn thấy rõ ràng trên các giá trị ngưỡng khác nhau. Kết quả tốt nhất, bằng cách sử dụng F1 đó cung cấp cho thu hồi và độ chính xác tương đương trọng lượng, đã đạt được với một ngưỡng cô sin của 0,70.
đang được dịch, vui lòng đợi..
