Giai đoạn trong Data Warehousing
Ba giai đoạn có liên quan đến việc chuyển dữ liệu từ cơ sở dữ liệu giao dịch để một kho dữ liệu:
khai thác, chuyển đổi, và tải (ETL). Hình 7.12 mô tả quá trình này.
Trong theextractionphase, các nhà xây dựng tạo ra các tập tin cơ sở dữ liệu từ giao dịch và lưu chúng
trên máy chủ chứa các kho dữ liệu. Trong thetransformationphase, các chuyên gia "làm sạch" các
dữ liệu và sửa đổi nó thành một hình thức cho phép chèn vào kho dữ liệu. Ví dụ, họ
xác định xem liệu các dữ liệu chứa bất kỳ lỗi chính tả và sửa chữa chúng. Họ đảm bảo rằng tất cả các dữ liệu
phù hợp. Ví dụ, Pennsylvania có thể được ký hiệu là Pa., PA, Penna, hoặc Pennsylvania.
Chỉ có một hình thức sẽ được sử dụng trong một kho dữ liệu. Những người xây dựng đảm bảo rằng tất cả các địa chỉ theo
các hình thức tương tự, với các chữ hoa hay chữ thường kiên định và xác định các lĩnh vực thống nhất
(ví dụ như một lĩnh vực cho toàn bộ địa chỉ đường phố và một lĩnh vực riêng biệt cho các mã zip). Tất cả các dữ liệu mà
diễn tả cùng một loại với số lượng được "sạch" để sử dụng các đơn vị đo.
đang được dịch, vui lòng đợi..
