Nghiên cứu này tập trung vào hai tính năng chính của việc phân loạiquá trình. Phân tích các gia đình thuật toán phân loại khác nhau,phân loại, thuộc cùng loại được gộp nhómvới nhau. Ví dụ, tất cả hỗ trợ Vector máy (SVM) (Cortes &Vapnik, năm 1995; Mountrakis, Im, và Ogole, năm 2011) bao gồm các phiên bản củaSVM thể loại. Này tập hợp các kỹ thuật tạo đủ mẫuKích thước của các bài viết đại diện cho các gia đình loại trong khi bảo quản cáckhác biệt lớn của thuật toán. Thứ hai thành phần chính của cácphân tích là đánh giá về các thủ tục được sử dụng để tăng cường cácdữ liệu đầu vào cho các thuật toán phân loại. Đầu vào dữ liệu nâng caothể loại bao gồm những điều sau đây:
đang được dịch, vui lòng đợi..