Hiệu suất kém của MI cũng là thông tin. Thiên vị cho Phường tần số thấp điều khoản được biết (phần 2), nhưng hay không này suy yếu lý thuyết sẽ gây ra signi không thể tính chính xác mất trong phân loại văn bản đã không được empirically kiểm tra. Thí nghiệm của chúng tôi theo địa chỉ vấn đề này bằng cách sử dụng một cross-phương pháp so sánh và xác nhận một cross-loại. Ngoài thiên vị này, MI dường như có một vấn đề nghiêm trọng hơn ở độ nhạy cảm với xác suất ước lượng lỗi. Có nghĩa là, thứ hai thuật ngữ trong công thức tôi (t; c) = đăng nhập Pr (t j c) đăng nhập quan hệ công chúng (t) làm cho các điểm cực kỳ nhạy cảm với dự toán lỗi khi P r (t) là gần bằng không.
đang được dịch, vui lòng đợi..
