Các con số trước cho thấy làm thế nào bạn chia một lần duy nhất đào tạo thành subfolds.Chúng ta cần phải lặp lại nó cho tất cả các nếp gấp khác. Trong trường hợp này, chúng tôi đang tìm kiếm5 bên ngoài folds và nếp gấp bên trong năm, nhưng không có lý do để sử dụng cùng một sốcủa bên ngoài và bên trong nếp gấp; bạn có thể sử dụng bất kỳ số điện thoại bạn muốn miễn là bạn giữhọ riêng biệt.Điều này dẫn đến nhiều tính toán, nhưng nó là cần thiết để làm việc một cách chính xác.Vấn đề là nếu bạn sử dụng một phần dữ liệu để thực hiện bất kỳ quyết định về của bạnMô hình (bao gồm cả những tham số để thiết lập), bạn đã ô nhiễm và bạn có thểkhông còn sử dụng nó để kiểm tra khả năng tổng quát của mô hình của bạn. Đây là một tinh tếđiểm và nó có thể không rõ ràng ngay lập tức. Trong thực tế, nó vẫn là trường hợp mà nhiều ngườingười sử dụng của máy học có được điều này sai và đánh giá cao như thế nào hệ thống của họlàm bởi vì họ không thực hiện đường xác nhận một cách chính xác!May mắn thay, scikit-tìm hiểu làm cho nó rất dễ dàng để làm đúng: có các lớp họctên là LassoCV, RidgeCV, và ElasticNetCV, tất cả đều đóng gói một crossvalidationkiểm tra các tham số bên trong. Mã là 100 phần trăm như trước đómột, ngoại trừ rằng chúng tôi không cần phải chỉ định bất kỳ giá trị cho kiến trúc alpha
đang được dịch, vui lòng đợi..
