5.2 TÍNH GIẢ THUYẾT CHÍNH XÁC
Khi đánh giá một giả thuyết đã học chúng ta thường quan tâm nhiều nhất trong việc dự đoán
chính xác mà nó sẽ phân loại các trường hợp tương lai. Đồng thời, chúng tôi
muốn biết các lỗi có thể xảy ra trong dự toán chính xác này (tức là cái lỗi
thanh để kết hợp với ước tính này).
Trong suốt chương này chúng ta xem xét sau thiết cho việc học tập
vấn đề. Có một số không gian của trường có thể X (ví dụ, các thiết lập của tất cả mọi người)
qua đó các chức năng mục tiêu khác nhau có thể được xác định (ví dụ, những người có kế hoạch
mua ván trượt mới trong năm nay). Chúng tôi cho rằng trường hợp khác nhau trong X có thể gặp với frequencies.A khác nhau cách thuận tiện để mô hình này là giả định
có một số khả năng biết phân phối D định nghĩa xác suất
gặp phải mỗi trường hợp trong X (ví dụ., 23 có thể gán một xác suất cao hơn để gặp những người 19 tuổi so với những người 109 tuổi). Thông báo 23 nói gì
về việc liệu x là một ví dụ tích cực hay tiêu cực; nó chỉ detennines xác suất x sẽ gặp phải. Các nhiệm vụ học tập là để tìm hiểu những khái niệm mục tiêu
hoặc mục tiêu hàm f bằng cách xem xét một H không gian giả thuyết có thể. Đào tạo
ví dụ của hàm mục tiêu f được cung cấp cho người học của một huấn luyện viên người
rút mỗi trường một cách độc lập, theo sự phân bố D, và những người sau đó
sẽ chuyển tiếp các ví dụ x cùng với giá trị mục tiêu f đúng của nó (x) cho người học.
Để minh họa , xem xét học hàm đích "những người có kế hoạch mua ván trượt mới trong năm nay," cho một mẫu dữ liệu đã thu bằng cách khảo sát
người khi họ đến một khu nghỉ mát trượt tuyết. Trong trường hợp này, không gian dụ X là không gian
của tất cả mọi người, những người có thể được mô tả bởi các thuộc tính như tuổi tác, nghề nghiệp của họ,
bao nhiêu lần họ skied năm ngoái, vv Sự phân bố D quy định cụ thể cho từng
người x xác suất mà x chí thể gặp phải như người kế tiếp đến tại
các khu nghỉ mát trượt tuyết. Các chức năng mục tiêu f: X + {O, 1) phân loại từng người theo
hay không, họ có kế hoạch mua ván trượt trong năm nay.
Trong bối cảnh tổng quát này, chúng tôi quan tâm đến hai câu hỏi sau đây:
1. Cho một h giả thuyết và một mẫu dữ liệu có chứa n ví dụ vẽ tại
ngẫu nhiên theo sự phân bố D, ước tính tốt nhất của những gì là
chính xác của h trên trường hợp tương lai rút ra từ cùng một phân phối?
2. Các lỗi có thể xảy ra trong dự toán chính xác này là gì?
đang được dịch, vui lòng đợi..
