Hãy xem xét một ví dụ từ một câu chuyện New York Times từ năm 2004:
Bão Frances đang trên đường, chuồi qua vùng biển Caribbean, đe dọa một hit trực tiếp trên bờ biển Đại Tây Dương của Florida. Cư dân thực hiện cho vùng đất cao hơn, nhưng ở xa, ở ích tonville, Ark., Giám đốc điều hành tại Wal-Mart Stores quyết định rằng tình hình cung cấp một cơ hội tuyệt vời cho một trong những vũ khí dựa trên dữ liệu mới nhất của họ ... công nghệ tiên đoán. Một trước tuần đổ bộ của cơn bão, Linda M. Dillman, giám đốc thông tin của Wal-Mart, ép nhân viên của mình để đến với dự báo dựa trên những gì đã xảy ra khi cơn bão Charley đánh vài tuần trước đó. Được hỗ trợ bởi hàng nghìn tỷ byte 'giá trị của lịch sử mua sắm được lưu trữ trong kho dữ liệu của Wal-Mart, cô cảm thấy rằng công ty có thể' bắt đầu dự đoán những gì sẽ xảy ra, thay vì chờ đợi cho nó xảy ra, 'như cô đặt nó. (Hays, 2004) xem xét tại sao dự đoán dựa trên dữ liệu có thể có ích trong trường hợp này. Nó có thể là hữu ích để dự đoán rằng những người trong đường đi của cơn bão sẽ mua nước đóng chai hơn. Có thể, nhưng thời điểm này có vẻ như một chút rõ ràng, và tại sao chúng ta cần phải khoa học dữ liệu để khám phá nó? Nó có thể là hữu ích để dự kiến số lượng gia tăng doanh thu do các cơn bão, để đảm bảo rằng cửa hàng Wal-Marts được thả đúng. Có lẽ khai thác dữ liệu có thể tiết lộ rằng một DVD đặc biệt được bán ra trong những cơn bão path-nhưng có lẽ nó được bán ra trong tuần đó tại Wal-Marts trên khắp đất nước, không chỉ là nơi hạ cánh bão sắp xảy ra. Các dự đoán có thể được phần nào hữu ích, nhưng có lẽ là tổng quát hơn bà Dillman đã có ý định.
đang được dịch, vui lòng đợi..
