Khai thác dữ liệu là một quá trình phân tích thiết kế để khám phá dữ liệu (thường là lượng dữ liệu lớn - điển hình là kinh doanh hoặc thị trường liên quan - còn được gọi là "dữ liệu lớn") trong việc tìm kiếm các mô hình phù hợp và / hoặc các mối quan hệ có hệ thống giữa các biến, và sau đó để xác nhận những phát hiện bằng cách áp dụng các mô hình để phát hiện các tập con dữ liệu mới. Mục tiêu cuối cùng của khai thác dữ liệu là dự đoán - và khai thác dữ liệu tiên đoán là loại phổ biến nhất của khai thác dữ liệu và một trong đó có các ứng dụng kinh doanh trực tiếp nhất. Quá trình khai thác dữ liệu bao gồm ba giai đoạn: (1) thăm dò ban đầu, (2) xây dựng mô hình hay mô hình xác định với xác nhận / xác minh, và (3) triển khai (ví dụ, các ứng dụng của mô hình dữ liệu mới để tạo ra dự đoán).
đang được dịch, vui lòng đợi..
