khai thác dữ liệu cho phép phát hiện các kiến thức tiềm năng hữu ích và chưa biết. Cho dù những kiến thức phát hiện ra là mới, hữu ích hoặc thú vị, là rất chủ quan và phụ thuộc vào ứng dụng và người sử dụng. Chắc chắn rằng việc khai thác dữ liệu có thể tạo ra, hoặc khám phá, một số lượng rất lớn các mẫu hoặc các quy tắc. Trong một số trường hợp số lượng các quy tắc có thể đạt đến hàng triệu. Một thậm chí có thể nghĩ ra một giai đoạn meta-khai thác mỏ để khai thác các kết quả khai thác dữ liệu quá khổ. Để giảm số lượng các mẫu hoặc các quy tắc phát hiện ra rằng có một xác suất cao là không thú vị, người ta phải đặt một phép đo trên mẫu. Tuy nhiên, điều này đặt ra vấn đề của sự hoàn chỉnh. Người dùng sẽ muốn khám phá tất cả các quy tắc hoặc mô hình, nhưng chỉ có những người rất thú vị. Việc đo một khám phá sự thú vị là, thường được gọi là lý thú, có thể dựa vào các yếu tố khách quan định lượng như giá trị của mẫu khi thử nghiệm trên dữ liệu mới với một số mức độ chắc chắn, hoặc trên một số miêu tả chủ quan như dễ hiểu của các mô hình, mới lạ của các mô hình, hoặc hữu dụng.
đang được dịch, vui lòng đợi..
