Chúng tôi thấy rằng LinkCount và NumExclams có ảnh hưởng lớn nhất trên tổng thể
quyết định phân loại, trong khi NumImages và AvgSentLen đóng một vai trò khá nhỏ.
Trong khi tầm quan trọng tính năng tổng thể có ý nghĩa trực giác, thật ngạc nhiên là
NumImages về cơ bản là bỏ qua. Thông thường, câu trả lời có chứa hình ảnh luôn được
đánh giá cao. Trong thực tế, tuy nhiên, câu trả lời rất hiếm khi có hình ảnh. Vì vậy, mặc dù trong
chính nó là một tính năng rất mạnh mẽ, nó là quá thưa thớt là còn có giá trị. Chúng ta có thể
dễ dàng thả tính năng này và giữ lại hiệu suất phân loại tương tự.
đang được dịch, vui lòng đợi..