CHƯƠNGĐÁNH GIÁGIẢ THUYẾTEmpirically đánh giá tính chính xác của giả thuyết là cơ bản để máy học. Chương này giới thiệu một giới thiệu về các phương pháp thống kê cho các ước tính chính xác của giả thuyết, tập trung vào ba câu hỏi. Đầu tiên, được quan sát chính xácmột giả thuyết trên một mẫu dữ liệu giới hạn, tốt như thế nào này hiện ước tính độ chính xác hơn bổ sung ví dụ? Thứ hai, được đưa ra một giả thuyết rằng nhanh hơn so vớikhác hơn một số mẫu dữ liệu, có thể xảy ra như thế nào là nó rằng giả thuyết này là thêmchính xác nói chung? Thứ ba, khi dữ liệu được giới hạn trong những gì là cách tốt nhất để sử dụng nàydữ liệu cho cả hai tìm hiểu một giả thuyết và ước tính độ chính xác? Vì hạn chế mẫudữ liệu có thể xuyên tạc phân phối tổng hợp dữ liệu, ước tính chính xác đúng sự thậttừ mẫu như vậy có thể gây hiểu nhầm. Phương pháp thống kê, cùng với các giả định về các bản phân phối cơ bản của dữ liệu, cho phép một ràng buộc sự khác biệtgiữa các quan sát độ chính xác trong các mẫu dữ liệu sẵn có và tính chính xác đúng sự thậtqua sự phân bố toàn bộ dữ liệu.5.1 ĐỘNG LỰCTrong nhiều trường hợp, nó là quan trọng để đánh giá hiệu suất của các học giả thuyếtcàng chính xác càng tốt. Một lý do là đơn giản để hiểu cho dù sử dụng cácgiả thuyết. Ví dụ, khi học hỏi từ một giới hạn kích thước cơ sở dữ liệu chỉ rahiệu quả của điều trị y tế khác nhau, quan trọng là phải hiểu làchính xác càng tốt tính chính xác của giả thuyết đã học được. Lý do thứ hai làđánh giá các giả thuyết là một thành phần không thể thiếu của nhiều phương pháp học tập.Ví dụ, ở sau khi cắt tỉa cành cây quyết định để tránh overfitting, chúng ta phải đánh giáCác tác động có thể cắt tỉa bước về tính chính xác của kết quả cây quyết định.Vì vậy nó là quan trọng để hiểu những sai sót khả năng vốn có trong dự toán cácđộ chính xác của sự cây pruned và unpruned.Ước tính chính xác của một giả thuyết là tương đối đơn giản khidữ liệu rất phong phú. Tuy nhiên, khi chúng ta phải tìm hiểu một giả thuyết và ước tính của nóđộ chính xác tương lai được đưa ra chỉ là một tập hợp giới hạn các dữ liệu, những khó khăn chính hai phát sinh:Thiên vị trong các ước tính. Đầu tiên, quan sát độ chính xác của giả thuyết họcqua các ví dụ huấn luyện thường là một ước tính người nghèo của độ chính xác hơnVí dụ trong tương lai. Bởi vì các giả thuyết học được bắt nguồn từ nhữngVí dụ, họ thường sẽ cung cấp một ước tính lạc quan kiến củagiả thuyết các chính xác hơn ví dụ trong tương lai. Điều này đặc biệt là khả năng khingười học sẽ xem xét một không gian giả thuyết rất phong phú, cho phép nó để overfit cácCác ví dụ huấn luyện. Để có được một xấp xỉ không thiên vị của chính xác trong tương lai, chúng tôithường kiểm tra giả thuyết trên một số thiết lập thử nghiệm ví dụ chọn độc lập với các ví dụ huấn luyện và các giả thuyết.một phương sai trong các ước tính. Thứ hai, ngay cả khi giả thuyết chính xác được đo trên một tập các ví dụ kiểm tra độc lập với việc đào tạo không thiên vịVí dụ, độ chính xác đo có thể vẫn còn khác nhau từ sự thật chính xác, tùy thuộc vào các trang điểm của các thiết lập cụ thể của kiểm tra ví dụ. Nhỏ hơnCác thiết lập thử nghiệm ví dụ, các lớn hơn dự kiến phương sai.Chương này thảo luận về các phương pháp để đánh giá các học giả thuyết, phương phápđể so sánh độ chính xác của hai giả thuyết và phương pháp để so sánh cácđộ chính xác của thuật toán học hai khi chỉ giới hạn dữ liệu có sẵn. NhiềuTrung tâm thảo luận về các nguyên tắc cơ bản từ các số liệu thống kê và lý thuyết mẫu,mặc dù các chương giả định không có nền tảng đặc biệt trong số liệu thống kê trên part of thengười đọc. Các tài liệu trên thống kê thử nghiệm giả thuyết là rất lớn. Chương nàycung cấp một tổng quan giới thiệu chỉ tập trung vào những vấn đề đặt trực tiếpliên quan đến học tập, đánh giá và so sánh các giả thuyết.5.2 ƯỚC HYPOTHESIS CHÍNH XÁCKhi đánh giá một giả thuyết học chúng ta quan tâm thường xuyên nhất ở ước tínhđộ chính xác mà nó sẽ phân loại các trường hợp trong tương lai. Cùng lúc đó, chúng tôimuốn biết các lỗi có thể xảy ra trong này ước tính độ chính xác (tức là, những gì lỗithanh liên kết với các ước tính này).Trong chương này, chúng tôi xem xét các thiết lập sau đây cho học tậpvấn đề. Một số không gian có thể có trường hợp X (ví dụ, các thiết lập của tất cả mọi người)qua đó có thể được định nghĩa chức năng mục tiêu khác nhau (ví dụ, những người có kế hoạchmua ván trượt mới năm nay). Chúng tôi giả định rằng các trường hợp khác nhau trong X có thể gặp phải với tần số khác nhau. Một cách thuận tiện để mô hình này là giả địnhđó là một số không biết xác suất phân phối D xác định xác suấtgặp phải mỗi trường hợp X
đang được dịch, vui lòng đợi..
