Các nhà kho bao gồm dữ liệu DenormalizedVì kích thước khổng lồ của một kho dữ liệu, như vậy không hiệu quả có thể tàn phá. Tham gia một ba chiều giữa các bảng trong một nhà kho dữ liệu lớn có thể mất một thời gian chạy quá lâu để hoàn thành và có thể không cần thiết. Trong mô hình nhà kho dữ liệu, các mối quan hệ giữa các thuộc tính không thay đổi. Bởi vì các dữ liệu lịch sử tĩnh trong tự nhiên, không có gì là đã đạt được bằng cách xây dựng bảng bình thường với các năng động liên kết.Cho ví dụ, trong một hệ thống cơ sở dữ liệu hoạt động, sản phẩm X có thể là một yếu tố của làm việc trong tiến trình (WIP) trong vùng A này tháng và một phần của vùng B WIP tháng tiếp theo. Trong một mô hình dữ liệu bình thường đúng cách, nó sẽ là không chính xác để bao gồm các vùng A WIP data như là một phần của một bảng thứ tự bán hàng ghi lại một đơn đặt hàng cho các sản phẩm X. Chỉ số lượng hàng sản phẩm sẽ được bao gồm trong bảng thứ tự bán hàng như một chìa khóa nước ngoài liên kết nó vào bảng sản phẩm. Quan hệ lý thuyết sẽ kêu gọi tham gia (liên kết) giữa doanh số bán hàng để bàn và sản phẩm bảng để xác định tình trạng sản xuất (ví dụ, vùng mà sản phẩm này hiện tại) và các thuộc tính khác của sản phẩm. Từ một quan điểm hoạt động, tuân theo quan hệ lý thuyết là quan trọng vì những thay đổi liên quan như các sản phẩm di chuyển qua các phòng ban khác nhau theo thời gian. Quan hệ lý thuyết không áp dụng cho dữ liệu kho bãi hệ thống vì mối quan hệ bán hàng/sản phẩm là ổn định.Bất cứ nơi nào có thể, do đó, chuẩn hoá bảng liên quan đến các sự kiện đã chọn có thể được hợp nhất vào các bảng denormalized. Con số 11.6 minh họa làm thế nào bán hàng thứ tự dữ liệu được giảm đến một bảng thứ tự bán hàng denormalized duy nhất để lưu trữ trong một hệ thống nhà kho dữ liệu.Trích xuất dữ liệu từ cơ sở dữ liệu hoạt động Khai thác dữ liệu là quá trình thu thập dữ liệu từ cơ sở dữ liệu hoạt động, tập tin phẳng, lưu trữ, và các nguồn dữ liệu bên ngoài. Cơ sở dữ liệu hoạt động thông thường cần phải ra khỏi Dịch vụ khi khai thác dữ liệu xảy ra để tránh dữ liệu inconstancies. Bởi vì kích thước lớn của họ và sự cần thiết cho một chuyển nhanh chóng để giảm thiểu downtime, ít hoặc không có chuyển đổi dữ liệu xảy ra vào thời điểm này. Một kỹ thuật được gọi là nắm bắt dữ liệu thay đổi có thể làm giảm đáng kể các
đang được dịch, vui lòng đợi..