Dữ liệu kho hàng là những hệ thống dữ liệu chuyên sâu được sử dụng cho các nhiệm vụ phân tích trong các doanh nghiệp như phân tích doanh thu / lợi nhuận thống kê, số liệu thống kê liên quan chi phí / lợi ích, sở thích của khách hàng thống kê. Thời hạn sử dụng cho những công việc này là "on-line phân tích xử lý" (OLAP) để phân biệt với các hệ thống dữ liệu chuyên sâu hoạt động, mà thuật ngữ "on-line xử lý giao dịch" (OLTP) đã trở nên phổ biến. Vì vậy, bất cứ khi nào chúng ta đang phải đối mặt với thiết kế kho dữ liệu, điều này bao gồm việc thiết kế một hệ thống OLAP.
Ý tưởng về một kho dữ liệu [In96, Ki96] là để trích xuất dữ liệu từ cơ sở dữ liệu hoạt động và
lưu trữ chúng một cách riêng biệt. Các biện minh cho phương pháp này là OLAP chủ yếu đề với
dữ liệu đặc, do đó không phụ thuộc vào các bản cập nhật mới nhất của giao dịch. Hơn nữa, OLAP chỉ cần đọc truy cập vào các dữ liệu, vì vậy việc tách các dữ liệu cho OLAP từ OLTP cho phép thời gian quản lý giao dịch được miễn chế.
Vì vậy, vấn đề đầu tiên trong thiết kế kho dữ liệu là để tích hợp điểm từ nguồn khác nhau
cơ sở dữ liệu . Quan điểm này của thiết kế kho dữ liệu như là một vấn đề quan điểm hội nhập đã được đẩy mạnh trong [Wi95] và [KM99]. Mặt khác, nó đã được quan sát thấy rằng cấu trúc của dữ liệu cần thiết cho OLAP, tức là cấu trúc của lược đồ kho dữ liệu, bằng cách nào đó đơn giản hơn so với cấu trúc của cơ sở dữ liệu hoạt động. Điều này đã dẫn đến các khái niệm cơ sở dữ liệu đa chiều, trong đó "sự kiện" cần thiết cho OLAP như số lượng bán hàng, giá cả. được tách ra từ "chiều" như thời gian, địa điểm, sản phẩm, các thông số ví dụ tiêu biểu cho các sự kiện. Về hình thức, chúng ta vẫn có được các mối quan hệ, trong đó các kích thước hình thành một chìa khóa, nhưng các lược đồ đa chiều (quan hệ) cơ sở dữ liệu thường 254 có hình thức sao hoặc bông tuyết lược đồ [In96]. Các công việc trong [GL96] trình bày một mô hình chính thức cho cơ sở dữ liệu đa chiều.
Ý tưởng chính của kho dữ liệu bao hàm một sự tách biệt của đầu vào từ cơ sở dữ liệu hoạt động và đầu ra để xem có chứa các dữ liệu cho các nhiệm vụ OLAP cụ thể. Trong các tài liệu kho dữ liệu các quan điểm này thường được gọi là "siêu thị dữ liệu". Các công việc trong [LST99] trình bày một
quan điểm khác về thiết kế kho dữ liệu nhấn mạnh không chỉ là đầu vào, nhưng cũng có đầu ra,
tức là các siêu thị dữ liệu và OLAP. Để làm được điều này, mỗi mart dữ liệu cùng với các chức năng OLAP làm việc trên nó định nghĩa một cái gọi là "đối tượng đối thoại". Sau ý tưởng này là đáng ngạc nhiên rằng rất nhiều công việc được đưa vào thiết kế của kho dữ liệu, trong khi nhấn mạnh lớn nên được về chức năng OLAP được dựa trên quan điểm trong kho.
Điều này thúc đẩy chúng ta có một cái nhìn gần hơn vào hệ thống năng động, không chỉ là dữ liệu tĩnh
cấu trúc.
hơn nữa, như là đối thoại đối tượng trên một dẫn kho dữ liệu để xem qua một lần xem, nó có thể được hỏi, cho dù nó có ý nghĩa để có một cách tiếp cận toàn diện để thiết kế kho dữ liệu hoặc cho dù đó có thể là tốt hơn để thay thế các kho dữ liệu của một tập hợp các quan điểm vật hoá trên cơ sở dữ liệu hoạt động. Quan điểm này cũng được cơ bản các công việc trong [TS98, Th99]. Trong [MSZ05] một cách tiếp cận để thiết kế kho dữ liệu đã được trình bày mà đề cập rõ đến những ý tưởng cơ bản của đầu vào tách từ cơ sở dữ liệu hoạt động từ đầu ra để hệ thống OLAP. Việc nhấn mạnh vào việc phân phối các kho dữ liệu. Trong bài báo này ở đây chúng tôi thảo luận về sự tinh tế từng bước từ các kiến trúc 3-tier, nhằm đạt được một bộ hoàn chỉnh các quy tắc để sàng lọc. Chúng tôi tạm phân loại các quy tắc thành hai nhóm: những người phản ánh nhu cầu ứng dụng bổ sung và những người tổ chức lại và cải thiện một đặc điểm kỹ thuật mà không cần thêm các yêu cầu mới. Đối với nhóm đầu tiên chúng ta phải nhận kỹ thuật để xem hội nhập, tổ chức lại cấu trúc dữ liệu theo một mô hình kho dữ liệu chính thức [GL96], kỹ thuật thiết kế phân phối [MSZ05], và các kỹ thuật thao tác hạn chế. Đối với nhóm thứ hai kỹ thuật cho việc giới thiệu thể hóa
quan điểm [TS98 và quy tắc tinh hoạt động nhiều hơn tiêu chuẩn đã được xem xét.
Cách tiếp cận này có liên quan đến một phương pháp chính thức để thiết kế các kho dữ liệu và OLAP
hệ thống sử dụng các phương pháp của State Machines Tóm tắt (ASMs, [ BS03, Bo03]). ¨ cách tiếp cận chính thức này đã được trình bày trong [ZS04, ZM04b, SZ05]. Một thức hóa các quy tắc kết hợp tinh tế ý tưởng từ [Bo03] ¨ đã được giới thiệu trong [ZM04a]. Chúng tôi trình bày các kiến trúc 3-tier trong phần 2. Chúng tôi thảo luận về sự tinh tế từng bước tại mục 3, với ví dụ cho thấy cách các quy tắc cần được áp dụng, tức là chúng tôi cung cấp những hướng dẫn thiết thực cho các phương pháp sàng lọc. Chúng tôi kết thúc với một bản tóm tắt ngắn.
đang được dịch, vui lòng đợi..