kết hợp. Nhiều Rejects với sự phân biệt như vậy sẽ có nhiều thông tin hơn một single "nhập nhằng từ chối". Trong số tất cả các cuộc điều tra, nguyên tắc Bayes được áp dụng một lần nữa cho hướng dẫn thiết kế của họ về phân loại.
Trong khi nguyên tắc suy luận Bayes được áp dụng rộng rãi trong phân loại, một nguyên tắc dựa trên các khái niệm hình trong- lẫn nhau là rất hiếm khi được áp dụng để thiết kế các phân loại. Thông tin lẫn nhau là một trong những định nghĩa quan trọng trong lý thuyết entropy [38]. Entropy được coi là một biện pháp của sự không chắc chắn trong các biến ngẫu nhiên, và thông tin lẫn nhau mô tả các entropy tương đối giữa hai biến ngẫu nhiên [9]. Nếu phân loại tìm cách tối đa hóa entropy tương đối cho mục tiêu học tập của mình, chúng tôi giới thiệu họ đến "phân loại lẫn nhau thông tin". Dường như Quinlan [5] là một trong những sớm nhất để áp dụng các khái niệm về thông tin lẫn nhau (nhưng gọi là "tăng hình trong-" trong thuật toán ID3 nổi tiếng của ông) trong việc xây dựng cây quyết định. KVA lseth [6] và Wickens [7] giới thiệu định nghĩa về thông tin lẫn nhau bình thường (NMI) để đánh giá một bảng dự phòng, trong đó đặt xuống nền tảng về mối quan hệ giữa một ma trận nhầm lẫn và thông tin lẫn nhau. Là người tiên phong trong việc sử dụng một tiêu chí dựa trên thông tin để đánh giá phân loại, Kononenko và Bratko [41] đề xuất thuật ngữ "thông tin số" đó là tương đương với định nghĩa về thông tin lẫn nhau. Một nhóm nghiên cứu Trường do Principe [8] đề xuất một khuôn khổ chung, gọi là "Thông tin lý thuyết học tập (ITL)", cho thiết kế máy học tập vari độc hại, trong đó họ cho rằng thông tin lẫn nhau, hoặc các thông tin khác tiêu chuẩn lý thuyết, có thể được thiết lập như là một hàm mục tiêu trong học tập phân loại. Mackay [[9], trang 533] một lần cho thấy ví dụ bằng số cho một số ma trận nhầm lẫn nào, và ông đề nghị để áp dụng chung thông tin cho các cấp các ví dụ phân loại. Wang và Hu [10] có nguồn gốc quan hệ tuyến tính giữa các thông tin lẫn nhau và các biện pháp thực hiện thông thường, chẳng hạn như độ chính xác, độ chính xác, thu hồi và biện pháp F1 để phân loại nhị phân. Trong [11], một công thức chung cho thông tin lẫn nhau bình thường hóa được thành lập đối với các ma trận nhầm lẫn cho các loại lớp multiple- với / bằng mà không có một tùy chọn từ chối, và vantages quảng cáo- và hạn chế của phân loại lẫn nhau, thông tin đã được thảo luận. Tuy nhiên, không có điều tra có hệ thống được báo cáo cho một so sánh giữa lý thuyết phân loại Bayes và phân loại lẫn nhau, thông tin trong các tài liệu.
Công trình này tập trung vào việc khám phá sự khác biệt giữa lý thuyết phân loại Bayes và lẫn nhau thông tin Fiers classi- các phân loại cho các thiết lập có / không có một từ chối tùy chọn. Đặc biệt, báo cáo này xuất phát từ nhiều và conse- xuyên kéo dài đến công việc của Chow bằng cách phân biệt các loại lỗi và từ chối các loại. Để đạt được dễ kiểm soát phân tích mà không làm mất tính tổng quát, một chiến lược của việc áp dụng đơn giản
nhưng giả định có ý nghĩa nhất đối với vấn đề phân loại Người ta có thể tranh luận rằng các giả định trên là vô cùng hạn chế cung cấp tổng quát thực tế trong việc giải quyết các vấn đề thế giới thực. Trong thực tế, sức mạnh của phân loại Bayes không ở lại trong các giải pháp chính xác của họ cho các vấn đề lý thuyết, nhưng xuất hiện từ nguyên tắc suy luận chung của họ trong việc hướng dẫn các ứng dụng thực tế, ngay cả trong những sự xấp xỉ cực vào học thuyết. Chúng tôi hoàn toàn nhận ra rằng giả định về kiến thức đầy đủ về sự phân bố xác suất liên quan có thể là không bao giờ là trường hợp trong các vấn đề thế giới thực [31] [33]. Các giải pháp hình thức closed- của phân loại Bayes về phân loại nhị phân trong [3] [4] đã chứng minh hướng dẫn thiết kế hữu ích mà có thể áp dụng cho nhiều lớp học [22]. Tác giả tin rằng việc phân tích dựa trên các giả định trên sẽ cung cấp đầy đủ thông tin cho việc phát hiện sự khác biệt giữa lý thuyết phân loại Bayes và lẫn nhau thông tin Fiers classi-, trong khi đơn giản hóa dự định sẽ có lợi cho độc giả để đạt được một tốt hơn, hoặc sâu hơn, hiểu biết với những lợi thế và hạn chế của từng loại phân loại. Những đóng góp của tác phẩm này có hai mặt. Đầu tiên, các công thức ical analyt- cho phân loại Bayes và phân loại lẫn nhau, thông tin có nguồn gốc bao gồm các trường hợp chung với tinctions dis- giữa các loại lỗi và từ chối các loại cho các chi phí học tập nhạy cảm hơn trong phân loại. Thứ hai, so sánh được tiến hành giữa hai loại phân loại để tiết lộ một điểm tương đồng và khác biệt của họ. Nỗ lực cụ thể được thực hiện trên một phân tích chính thức của tham số dư với các điều khoản chi phí cho phân loại Bayes khi từ chối tùy chọn được áp dụng. Phần II trình bày một quy tắc chung của quyết định phân loại Bayes có hoặc không có một tùy chọn từ chối. Phần III cung cấp các công thức cơ bản để phân loại lẫn nhau thông tin. Mục IV, khối tigates những điểm tương đồng và khác biệt giữa hai loại phân loại, và ví dụ bằng số được đưa ra để hi
đang được dịch, vui lòng đợi..