đổ tội, trong đó khoảng từ đơn giản (ví dụ, thay thế các giá trị thiếu bằng số không, bởi với mức trung bình hàng, hoặc bằng trung bình hàng) đến (phương pháp ví dụ, chuỗi Markov Monte Carlo [MCMC]) phức tạp hơn nhiều cơ chế đổ tội. Một phương pháp khác được phát triển bởi Pelckmans et al. (2005) đã không nỗ lực xây dựng lại giá trị bị mất, mà là đánh giá tác động của các missingness trên ra-đi. Ở đây, các tác giả kết hợp sự không chắc chắn do missingness vào một chức năng rủi ro thích hợp. Công việc của Pantanowitz và Marwala (2009) đã đưa ra một so sánh toàn diện các mô hình đa dạng sử dụng cho dữ liệu bị mất imputa-tion. Sử dụng một tập dữ liệu tỷ lệ hiện nhiễm HIV được lựa chọn, dữ liệu đổ tội được thực hiện thông qua năm phương pháp: Rừng ngẫu nhiên, mạng nơron autoassociative với các thuật toán di truyền, thần kinh autoassociative cấu hình mờ, và hai giống lai rừng ngẫu nhiên và thần kinh dựa trên mạng. Kết quả cho thấy rừng ngẫu nhiên là cao hơn nhiều so trong imputing thiếu dữ liệu cho các dữ liệu được thiết lập về độ chính xác và trong điều kiện thời gian tính toán. Cuối cùng, có rất nhiều loại thiếu các phương pháp xử lý dữ liệu có sẵn cho các loại dữ liệu khác nhau gặp phải (ví dụ, phân loại, liên tục, rời rạc), không có một phương pháp được phổ phù hợp cho tất cả các ứng dụng.
đang được dịch, vui lòng đợi..
![](//viimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)