. Thời gian gần đây đã thấy sự tăng trưởng bùng nổ trong sự sẵn có
của các loại dữ liệu khác nhau. Nó đã dẫn đến một cơ hội chưa từng có
để phát triển các kỹ thuật hướng dữ liệu tự động của chiết xuất hữu ích
kiến thức. Khai thác dữ liệu, một bước quan trọng trong quá trình này của tri thức
phát hiện, bao gồm các phương pháp khám phá thú vị, không tầm thường, và
mô hình ẩn hữu ích trong các dữ liệu [SAD + 93, CHY96]. Các lĩnh vực dữ liệu
khai thác xây dựng dựa trên ý tưởng từ các lĩnh vực khác nhau như học máy,
nhận dạng mẫu, thống kê, hệ thống cơ sở dữ liệu, và dữ liệu trực quan.
Tuy nhiên, các kỹ thuật được phát triển trong các lĩnh vực truyền thống thường không thích hợp
do một số đặc điểm độc đáo của ngày hôm nay của các bộ dữ liệu , chẳng hạn như
kích thước của chúng rất lớn, cao-chiều, và không đồng nhất. Có một
điều cần thiết để phát triển các thuật toán song song hiệu quả khai thác dữ liệu khác nhau
kỹ thuật. Tuy nhiên, thiết kế thuật toán như vậy là thách thức, và các
trọng tâm chính của bài báo là một mô tả về công thức song song của
hai thuật toán khai thác dữ liệu quan trọng: phát hiện luật kết hợp,
và cảm ứng của cây quyết định để phân loại. Chúng tôi cũng thảo luận vắn tắt
một ứng dụng khai thác dữ liệu để phân tích các bộ dữ liệu lớn thu thập
bằng cách quan sát trái đất vệ tinh mà cần phải được xử lý để hiểu rõ hơn về
những thay đổi quy mô toàn cầu trong quá trình sinh quyển và các mẫu.
đang được dịch, vui lòng đợi..