7.2 một phác thảo của các thủ tục chuẩn bị dữ liệuNăm tháng dữ liệu giao dịch được lấy cho nhu cầu của các ứng dụng khai thác mỏkế hoạch (value‐based phân khúc, RFM di động phân khúc, mô hình cross‐selling) bao gồm5 tháng đầu năm 2012. Các dữ liệu ban đầu, như chúng ta sẽ thấy ở các đoạn văn tiếp theo, bao gồmnhiều dòng cho mỗi đơn đặt hàng giao dịch, ghi lại các chi tiết cụ thể của mỗi giao dịch: giao dịchngày, hoá đơn số, id của cửa hàng, hình thức thanh toán, số tiền và mục mã. Tuy nhiên, customer‐cấp dữ liệu được yêu cầu cho tất cả các ứng dụng khai thác mỏ. Do đó, thông qua dữ liệu mở rộngchuẩn bị, chi tiết nguyên thông tin đã được chuyển đổi và tổng hợp để tóm tắtthói quen mua hàng của mỗi thẻ, cung cấp cho khách hàng "chữ ký," một cái nhìn thống nhấtCác khách hàng. Sử dụng các khía cạnh tóm tắt ở cấp độ khách hàng bao gồm:● Các tần số và recency mua hàng● Tổng số tiền chi tiêu● tương đối số tiền chi tiêu cho mỗi nhóm sản phẩm● Kích thước giỏ (trung bình chi tiêu số tiền cho mỗi giao dịch)● phương thức thanh toán ưa thích● ưu tiên thời gian (ngày/lần) mua hàng● ưu tiên lưu trữ● các nhiệm kỳ của từng khách hàngBảng 7.1 trình bày dữ liệu ban đầu cho hai chủ thẻ hư cấu (thẻ ID C1, C2) vàba mua giao dịch (hoá đơn INV1, INV2, INV3). Mỗi hồ sơ giao dịch (line)chứa thông tin về, trong số những thứ khác, hóa đơn số, ngày và thời giangiao dịch, mã sản phẩm đã mua, và số tiền thanh toán.Các thủ tục chuẩn bị dữ liệu được trình bày chi tiết trong các đoạn văn tiếp theo. Chính mìnhCác bước được nêu dưới đây.
đang được dịch, vui lòng đợi..
