Một khi dữ liệu được khai thác là identitied, nó nên được làm sạch. Clearning dữ liệu giải phóng nó từ duplicta thông tin và dữ liệu sai. Tiếp theo, các dữ liệu cần được lưu giữ trong một định dạng thống nhất trong các danh mục có liên quan hoặc lĩnh vực. Khai thác các công cụ có thể làm việc với tất cả các loại lưu trữ dữ liệu, từ kho lưu trữ lớn dữ liệu cơ sở dữ liệu máy tính để bàn nhỏ hơn để tập tin phẳng. Kho dữ liệu và marts dữ liệu là phương pháp lí có liên quan đến lưu trữ lớn gắn kết các dữ liệu trong một cách mà làm cho nó dễ dàng truy cập khi cần thiết.
đang được dịch, vui lòng đợi..