Chúng tôi tìm hiểu việc sử dụng các phương pháp tập hợp kiểm chứng để ước tính tỷ lệ lỗi thử nghiệm mà kết quả từ fi fitting mô hình tuyến tính khác nhau trên các thiết lập tự động dữ liệu. Trước khi chúng ta bắt đầu, chúng tôi sử dụng các set.seed () chức năng để thiết lập một hạt giống cho
hạt giống
số ngẫu nhiên R, sao cho người đọc về cuốn sách này sẽ được chính xác kết quả tương tự như những hình dưới đây. Nó thường là một ý tưởng tốt để thiết lập một hạt giống ngẫu nhiên khi thực hiện một phân tích như cross-validation có chứa một yếu tố ngẫu nhiên, do đó, các kết quả thu được có thể được sao chép một cách chính xác tại một thời gian sau đó. Chúng ta bắt đầu bằng cách sử dụng các mẫu () chức năng để phân chia các bộ quan sát
mẫu ()
thành hai nửa, bằng cách chọn một tập hợp con ngẫu nhiên của 196 quan sát ra của 392 quan sát ban đầu. Chúng tôi coi những quan sát như tập huấn luyện.
đang được dịch, vui lòng đợi..