Trong chúng tôi tổng quan ngắn gọn về các phương pháp khai thác dữ liệu, chúng tôi cố gắng đặc biệt để truyền đạt ý niệmHầu hết (nếu không phải tất cả) các phương pháp có thể được xemnhư tiện ích mở rộng hoặc lai của một vài nguyên tắc và kỹ thuật cơ bản. Chúng tôi lần đầu tiên thảo luận về các phương pháp chính của khai thác dữ liệu và sau đó hiển thịCác phương pháp khai thác dữ liệu có thể được xemnhư là bao gồm của ba chính thuật toánthành phần: (1) mô hình đại diện, (2)Mô hình đánh giá, và (3) tìm kiếm. Trong các cuộc thảo luận của KDD và phương pháp khai thác dữ liệu,chúng tôi sử dụng một ví dụ đơn giản để làm cho một số cáckhái niệm cụ thể hơn. Hình 2 cho thấy một tập đơn giản hai chiều nhân tạo dữ liệu bao gồm 23 trường hợp. Mỗi điểm trên biểu đồ đại diện cho một người đã được đưa ra một khoản cho vaybởi một ngân hàng cụ thể ở một số thời gian trong quá khứ.Trục ngang đại diện cho thu nhập củangười; trục dọc đại diện cho tổng số nợ cá nhân của người (thế chấp, xeCác khoản thanh toán, và như vậy). Các dữ liệu đãXếp hạng thành hai lớp học: (1) các x đại diện cho người sử dụng có cài đặt sẵn trên của họcho vay và (2) các o's đại diện cho người cócho vay trong tình trạng tốt với các ngân hàng. Do đó,Điều này thiết lập dữ liệu nhân tạo đơn giản có thể đại diện cho mộtlịch sử các tập hợp dữ liệu có thể chứa hữu íchkiến thức từ điểm nhìn của cácNgân hàng làm cho các khoản cho vay. Lưu ý rằng trong thực tếỨng dụng KDD, có rất nhiều thông thườngThêm kích thước (như một số hàng trăm) và nhiều dữ liệu hơn chỉ (nhiềuhàng ngàn hoặc thậm chí hàng triệu).Bài viếtMÙA THU NĂM 1996 43
đang được dịch, vui lòng đợi..
