Nhưng tuy nhiên, điều này có nghĩa là rằng chúng tôi có thể phân loại khoảng bốn trong số mười saicâu trả lời. Ít chúng tôi đang hướng đi đúng hướng. Thêm tính năng dẫn đến cao hơnđộ chính xác, mà dẫn chúng ta để thêm nhiều tính năng hơn. Vì vậy, cho chúng tôi mở rộng cáctính năng các không gian với hơn tính năng:AvgSentLen: Tính năng này các biện pháp số từ trong một câu, Trung bình.Có lẽ đó là một mô hình đặc biệt tốt bài viết không quá tải của người đọcnão với rất dài câu.AvgWordLen: Tính năng này là tương tự như AvgSentLen; nó các biện pháp trung bìnhsố ký tự trong những lời của một bài đăng.NumAllCaps: Tính năng này các biện pháp số từ được viết bằngHoa, vốn được xem là một phong cách xấu.NumExclams: Tính năng này các biện pháp số lượng dấu chấm than.Biểu đồ sau đây Hiển thị các bản phân phối giá trị trung bình câu và từđộ dài cũng như số lượng chữ hoa từ và dấu chấm than:
đang được dịch, vui lòng đợi..
