Hãy nhớ rằng có rất nhiều chồng chéo giữa các dữ liệu lớn tiền xử lý tác vụ. Ba đầu tiên của những chiến lược đã được thảo luận trước đó trong chương này.Làm mịn là một dạng dữ liệu sạch và đã được đề cập trong phần 3.2.2. Phần 3.2.3 về quá trình làm sạch dữ liệu cũng thảo luận về công cụ ETL, nơi người dùng xác định biến đổi để khắc phục mâu thuẫn của dữ liệu. Tập hợp và xây dựng thuộc tính đã được thảo luận ở phần 3,4 trên dữ liệu giảm. Trong phần này, chúng tôi, do đó, tập trung vào ba chiến lược sau.
đang được dịch, vui lòng đợi..