Clustering cho phép người dùng để làm cho nhóm của dữ liệu để xác định các mô hình từ các dữ liệu. Cụm có lợi thế của nó khi tập hợp dữ liệu được định nghĩa và một mô hình chung cần phải được xác định từ dữ liệu. Bạn có thể tạo một số cụ thể của nhóm, tùy thuộc vào nhu cầu kinh doanh của bạn. Một xác định lợi ích của cụm trên phân loại là mỗi thuộc tính trong thiết lập dữ liệu sẽ được sử dụng để phân tích dữ liệu. (Nếu bạn nhớ từ các phương pháp phân loại, chỉ là một tập hợp con của các thuộc tính được sử dụng trong các mô hình.) Một bất lợi chính của việc sử dụng cụm là người dùng được yêu cầu phải biết trước thời hạn bao nhiêu nhóm ông muốn tạo ra. Cho người dùng mà không có bất kỳ kiến thức thực tế của dữ liệu của mình, điều này có thể được khó khăn. Bạn nên tạo ra ba nhóm? Năm nhóm? Nhóm Mười? Nó có thể mất một vài bước thử và sai để xác định số nhóm để tạo ra, lý tưởng.Tuy nhiên, cho người dùng trung bình, cụm có thể là phương pháp khai thác dữ liệu hữu ích nhất bạn có thể sử dụng. Nó một cách nhanh chóng có thể mất của bạn thiết lập toàn bộ dữ liệu và biến nó thành nhóm, từ đó bạn có thể nhanh chóng làm cho một số kết luận. Toán học đằng sau các phương pháp là hơi phức tạp và tham gia, đó là lý do tại sao chúng tôi tận dụng đầy đủ của WEKA.
đang được dịch, vui lòng đợi..