Phần lớn các bộ sưu tập dữ liệu trong doanh nghiệp được sử dụng cho các giao dịch hàng ngày và các hoạt động:
hồ sơ của khách hàng và mua hàng của họ và thông tin về nhân viên, bệnh nhân, và các bên khác
để theo dõi, thu thập, thanh toán, kinh doanh khác hoặc các mục đích hợp pháp. Các giao dịch không
ở lại lâu các cơ sở dữ liệu; thường chỉ có một vài ngày hoặc vài tuần. Tuy nhiên, nhiều tổ chức đã
tìm thấy rằng nếu họ tích lũy dữ liệu giao dịch, họ có thể sử dụng nó cho các quyết định quản lý quan trọng,
như: nghiên cứu xu hướng thị trường hoặc theo dõi xuống gian lận. Tổ chức và lưu trữ dữ liệu cho như
mục đích được gọi là kho dữ liệu.
ADATA warehouseis một lớn, thường quan hệ, cơ sở dữ liệu hỗ trợ quản lý
ra quyết định. Các kho dữ liệu là lớn bởi vì nó có chứa dữ liệu, hoặc tóm tắt các dữ liệu,
từ hàng triệu giao dịch trong nhiều năm và / hoặc từ các giao dịch quốc gia hay toàn cầu chứ không phải
là từ một thời gian ngắn hoặc một khu vực duy nhất. Nó có thể duy trì hồ sơ các giao dịch cá nhân
hoặc tóm tắt các giao dịch trong thời gian định trước, chẳng hạn như hàng giờ, hàng ngày, hàng tuần hoặc. Các
mục đích của kho dữ liệu là để cho các nhà quản lý các báo cáo hoặc phân tích một lượng lớn các
dữ liệu lưu trữ và đưa ra quyết định. Chuyên gia dữ liệu kho phải làm quen với các loại
phân tích kinh doanh sẽ được thực hiện với các dữ liệu. Họ cũng phải thiết kế các kho dữ liệu
bảng là đủ linh hoạt để sửa đổi trong những năm tới, khi các hoạt động kinh doanh thay đổi
hoặc khi thông tin khác nhau phải được trích xuất.
Kho dữ liệu không thay thế cơ sở dữ liệu giao dịch, được cập nhật với hàng ngày
các giao dịch như bán hàng, hóa đơn, biên lai thu tiền, và trả về. Thay vào đó, dữ liệu giao dịch được sao chép
vào kho dữ liệu, đó là một kho lưu trữ dữ liệu riêng biệt. Lưu trữ lớn này chứa giá trị
thông tin cho các tổ chức có thể không được rõ ràng trong số lượng nhỏ dữ liệu
thường được lưu trữ trong cơ sở dữ liệu giao dịch. Ví dụ, một công ty bảo hiểm có thể giữ
bảng hàng tháng bán hàng chính sách; sau đó nó có thể thấy xu hướng trong các loại chính sách khách hàng thích ở
chung hoặc theo nhóm tuổi. Xu hướng như vậy là có ý nghĩa chỉ khi chúng được thu thập từ dữ liệu thu thập được
qua nhiều năm. Dữ liệu từ cơ sở dữ liệu giao dịch được bổ sung vào kho dữ liệu ở cuối
mỗi ngày làm việc, tuần, hoặc tháng, hoặc nó có thể được thêm tự động ngay sau khi một giao dịch
được ghi lại trong một cơ sở dữ liệu giao dịch. Trong khi một cơ sở dữ liệu giao dịch có chứa dữ liệu hiện tại,
mà được xử lý sau một thời gian, dữ liệu trong kho dữ liệu được tích lũy và có thể
phản ánh nhiều năm hoạt động kinh doanh.
Các tổ chức thường lập kho dữ liệu của họ như là một bộ sưu tập ofdata siêu thị, nhỏ hơn
bộ sưu tập dữ liệu mà tập trung vào một chủ đề hoặc bộ phận cụ thể. Nếu siêu thị dữ liệu cần phải được sử dụng như một kho dữ liệu lớn, các công cụ phần mềm đặc biệt có thể thống nhất siêu thị dữ liệu và làm cho họ xuất hiện như là một kho dữ liệu lớn.
đang được dịch, vui lòng đợi..