Giới thiệu
Các clustering dữ liệu được xác định là một trong những vấn đề chính trong khai thác dữ liệu.
phổ biến và các biến thể khác nhau liên quan đến vấn đề phân nhóm [1], đã
cho ra đời một số phương pháp giải quyết. Những phương pháp này có thể sử dụng cả hai
nguyên tắc Heuristic hoặc toán học. Trong bài báo này, chúng tôi quan tâm bằng các phương pháp phân nhóm có sử dụng bản đồ topo. Những phương pháp này có lợi thế
để đề nghị cả hai công cụ trực quan và phân nhóm không có giám sát của các loại khác nhau
của dữ liệu (liên tục và nhị phân). Mô hình cơ bản của Kohonen đề xuất, được chỉ
được sử dụng cho dữ liệu liên tục. Mở rộng và tái công của mô hình Kohonen đã
được đề xuất trong các tài liệu [2, 3]. Trong quá trình học tập bản đồ topo, tiêu chí chất lượng là rất khó khăn để xác định; Họ xoay quanh việc giải thích
các vụ sáp nhập khác nhau hoặc cụm thu được. Trong bài báo này, chúng tôi nghiên cứu các thuật toán phân cụm tự động của bản đồ topo. Chúng ta tìm thấy trong văn học nhiều
phương pháp để cụm bản đồ tự organizinge, tất cả các phân nhóm sử dụng phân cấp hoặc
K-trung bình kết hợp với một chỉ số chất lượng để tìm phân vùng tốt [4]. Do đó, chúng tôi
giới thiệu một biện pháp tương tự mới dành riêng cho bản đồ topo kết hợp với
thuật toán phân cụm phân cấp sẽ được áp dụng cho các vector ám.
Trong bài báo này chúng tôi giới thiệu một phương pháp phân cấp mới có tên AntTree định nghĩa
bởi [5] được lấy cảm hứng từ kiến thực sự và họ khả năng kết nối tự
xây dựng cấu trúc phức tạp.
đang được dịch, vui lòng đợi..
