Giấy -Đây trình bày tổng quan về các thuật toán song song cho hai trong số các thường
các kỹ thuật khai thác dữ liệu được sử dụng:. Phân loại và các hiệp hội
ngày -Để, các công thức song song của nhiều cảm ứng cây quyết định và ÆÂng
thuật toán phát hiện quy luật ciation được hợp lý được hiểu rõ. Tương đối ít
công việc đã được thực hiện trên các thuật toán song song cho các kỹ thuật khai thác dữ liệu khác
như phân nhóm, các thuật toán phân loại dựa trên nguyên tắc, phát hiện sai lệch, và
hồi quy.
Giấy -Đây bày
một ứng dụng có thể, ví dụ, tập hợp dữ liệu lớn được thu thập bởi Trái đất quan sát vệ tinh
mà cần phải được xử lý để hiểu rõ hơn về những thay đổi quy mô toàn cầu trong sinh quyển
quy trình và mô hình.
-Các kỹ thuật chính
những thách thức trong việc khai thác các dữ liệu bộ bao gồm:
+ (i) lượng cao, đa chiều và
không đồng nhất;
+ (ii) các khía cạnh không-thời gian của dữ liệu;
+ (iii) có thể bị sai lệch
phân lớp;
+ (iv) tính chất phân bố của dữ liệu;
+ (v) sự phức tạp
trong việc chuyển đổi dữ liệu thô thu thập vào các tính năng cao cấp.
-High dữ liệu hiệu suất
khai thác là điều cần thiết để phân tích các dữ liệu ngày càng tăng và cung cấp cho các nhà phân tích với auto
công cụ giao phối để tạo điều kiện một số bước cần thiết cho thế hệ giả thuyết
và đánh giá.
đang được dịch, vui lòng đợi..