BẢNG VII
RE SU LT SOFEXAMPLE 4 ON LHQ Tôi VA RI AT IFORM DI STRI BU tions E LHQ Quyết định Tr về Ri E1, E2 E Rej1, Rej2 Rej NI 1/3 <Tr <2/3 f (x ∈ Ri) = y1 0.0, 0,125 0,125 0, 0 0 0,549 2/3 ≤ Tr ≤ 1 f (x ∈ Ri) = y2 0,250, 0,250 0 0, 0 0 0,311 0 ≤ ≤ Tr 1/3 f (x ∈ Ri) = y3 0, 0 0 0,250, 0,125 0,375 0,656 cực kỳ bộ dữ liệu đẳng cấp imba, có thể mô tả một giải thích lý thuyết tại sao con người có nhiều quan ngại về tính chính xác của các lớp học hiếm hoi trong phân loại ". ràng buộc thấp hơn (LB) bởi Fano [48] và các ràng buộc trên ( UB) của Kovalevskij [49] trong các hình thức của APPE NDIX A LB: E ≥ H (T) - I (T, Y) - H (E) = log (m - 1) H (T | Y) - H ( E), log (m - 1) BẰNG CHỨNG VỀ CÁC QUẶNG M 1 Chứng minh: Các quy tắc quyết định phân loại Bayes cho 2 2 (B1) H (T) I (T, Y) H (TY) UB: E ≤ =, (B2) "không từ chối" trường hợp được biết đến trong [4]. Sau đó, chỉ có 2 2 quy tắc cho các "bác bỏ" trường hợp được nghiên cứu trong các bằng chứng hiện nay. Xét eq. (6a) đầu tiên từ (5a), một mô hình x được quyết định bởi một phân loại Bayes được Y1 nếu rủi ro (y1 | x) <nguy cơ (y2 | x) và trong đó m là tổng số các lớp học trong T, H (E ) là Shannon entropy nhị phân, và H (T | Y) được gọi là điều kiện entropy có thể bắt nguồn từ một mối quan hệ nói chung [4]: nguy cơ (y1 | x) <nguy cơ (y3 | x). Thay eqs. (1) và (2) vào những phương trình bất bình đẳng sẽ dẫn đến: I (T, Y) = I (Y, T) = H (T) - H (T | Y) = H (Y) - H (Y | T). p (x | t1) p (t1) λ21 - λ22 (B3) Đối với phân loại nhị phân (m = 2), ràng buộc một Fano chặt chẽ hơn của Quyết định y1 nếu> p (x | t) p (t) λ - λ 2 2 12 11 (A1) trong [50] [51] được thông qua. Dựa trên rationals của Bayesian và p (x | t1) p (t1)> p (x | t2) p (t2) λ21 - λ23. Λ13 - λ11 lỗi, chúng tôi đề nghị các giới hạn trên và dưới chặt chẽ hơn trong các hình thức: Tương tự như vậy, một người có thể có được p (x | t1) p (t1) λ21 - λ22 M ODIF IED LB: H (E) ≥ H (T | Y), và 0 ≤ E, (B4) H (T | Y) Quyết định y2 nếu p (x | t) p (t) ≤ λ - λ M ODIF UB IED: E ≤ min (p (t1), p (t2),). (B5) 2 2 12 11 (A2) 2 và p (x | t1) p (t1) ≤ λ23 - λ22, Fig. 5 cho thấy các giới hạn trong phân loại nhị phân, mà là p (x | t2) p (t2) λ12 - λ13 khác nhau từ "I (T, Y) so với E" lô trong [51]. Bởi vì sự và eq. (6c) tương ứng. Eq. (A1) mô tả rằng một đơn trên ràng buộc trong vòng hai ranh giới sẽ điều khiển một mô hình x là y1. Tương tự như vậy, eq. (A2) mô tả một ràng buộc thấp hơn cho một mô hình x là y2. Từ những hạn chế (3), người ta không thể xác định ranh giới sẽ được ràng buộc trên hoặc thấp hơn bị ràng buộc. Tuy nhiên, người ta có thể xác định họ từ hai gợi ý sau đây trong phân loại: A. Eq. (6c) mô tả một ranh giới thấp hơn duy nhất và một ranh giới trên duy nhất cho một mẫu x là y3. B. Các ràng buộc trên trong (A1) và các ràng buộc thấp hơn trong (A2) nên được trùng với một trong những ranh giới (6c) tương ứng sao cho những vùng phân loại từ R1 đến R3 sẽ bao gồm một miền hoàn chỉnh của mẫu x (xem hình. 1c -d). Các gợi ý trên cho thấy những hạn chế mới đối với λij như trong eq. (6d). Bất kỳ vi phạm các ràng buộc sẽ giới thiệu một khu vực phân loại mới R4, đó là không đúng đối với các nền phân loại hiện nay. Những hạn chế của các ngưỡng để từ chối (6đ) có thể được bắt nguồn trực tiếp từ (6c) và (6d). APPE NDIX B ER chặt BOUNDS BE Tween Condit ional ENT ROPY VÀ BAYE Sian LỖI TẠI Binary CL ASSIFICAT ion Trong nghiên cứu về mối quan hệ giữa lẫn nhau thông tin (I) và lỗi Bayesian (E), hai nghiên cứu quan trọng được báo cáo về các mối quan hệ tương đương [11]: max I (T, Y) = min H (T | Y), (B6) các lô đất cho H (T | Y) là thích hợp hơn, mà không yêu cầu các thông tin của H (T). Một là có thể vẽ đường cong giới hạn thấp hơn lại từ (B4), nhưng không thể hiển thị hình thức rõ ràng của nó đối với E. Tính năng chứa trên bề mặt của các giới hạn kèm theo gợi ý hai thuộc tính quan trọng về các mối quan hệ. Việc đầu tiên là do những sự xấp xỉ trong Mục từ các giới hạn [48] [49]. Thứ hai đại diện cho một tài sản nội tại của không có "một-to-một" mối quan hệ giữa thông tin lẫn nhau và độ chính xác trong phân loại [10]. Các tam giác và hình tròn trong hình. 5 đại diện cho các cặp dữ liệu trong bảng V từ phân loại Bayes và cùng phân loại hình trong-, tương ứng. Họ chứng minh rõ các hình thức cụ thể ở các vị trí của họ trong các cặp cùng. Các vị trí vòng tròn hoặc là trùng hoặc "lên và / hoặc trái" với đối tác của mình. Những hình thức này được cho là do các hướng khác nhau của lực đối với hai loại phân loại. Một là cho "min E" và một cho "min H (T | Y)". Phát hiện quan trọng là obs
đang được dịch, vui lòng đợi..