Đánh giá
Mục đích của giai đoạn đánh giá để đánh giá kết quả khai thác dữ liệu một cách chặt chẽ và
để đạt được sự tự tin rằng họ có giá trị và đáng tin cậy trước khi chuyển. Nếu chúng ta nhìn cứng
đủ tại bất kỳ dữ liệu, chúng tôi sẽ tìm thấy các mẫu, nhưng họ có thể không tồn tại xem xét kỹ lưỡng.
Chúng tôi muốn có sự tự tin rằng các mô hình và các mẫu được chiết xuất từ các dữ liệu
được quy tắc đúng sự thật và không chỉ phong cách riêng hay bất thường mẫu. Có thể
triển khai kết quả ngay lập tức sau khi khai thác dữ liệu nhưng điều này là không lưu ý; nó thường là xa
dễ dàng hơn, rẻ hơn, nhanh hơn và an toàn hơn để thử nghiệm một mô hình đầu tiên trong phòng thí nghiệm kiểm soát.
Quan trọng không kém, giai đoạn đánh giá cũng phục vụ để giúp đảm bảo rằng các mô hình đáp ứng
các mục tiêu kinh doanh ban đầu. Nhớ lại rằng mục tiêu chính của khoa học dữ liệu cho doanh nghiệp là
để hỗ trợ việc ra quyết định, và chúng ta bắt đầu quá trình này bằng cách tập trung vào việc kinh doanh
vấn đề chúng ta muốn giải quyết. Thông thường, một giải pháp khai thác dữ liệu chỉ là một phần của
giải pháp lớn hơn, và nó cần phải được đánh giá như vậy. Hơn nữa, ngay cả khi một mô hình qua
các bài kiểm tra đánh giá nghiêm ngặt "trong phòng thí nghiệm," có thể cần cân nhắc bên ngoài mà làm cho nó
không thực tế. Ví dụ, một lỗ hổng phổ biến với các giải pháp phát hiện (chẳng hạn như phát hiện gian lận,
phát hiện thư rác, và giám sát xâm nhập) là họ sản xuất ra quá nhiều sai
báo động. Một mô hình có thể rất chính xác (> 99%) theo tiêu chuẩn của phòng thí nghiệm, nhưng đánh giá
trong bối cảnh kinh doanh thực tế có thể cho thấy rằng nó vẫn sản sinh ra quá nhiều sai
báo động có tính khả thi về mặt kinh tế. (Bao nhiêu nó sẽ có chi phí để cung cấp cho các nhân viên để đối phó
với tất cả những cảnh báo sai? Điều gì sẽ là chi phí không hài lòng của khách hàng?)
đang được dịch, vui lòng đợi..