Bây giờ chúng ta sẽ thực hiện qua xác nhận trên một tập dữ liệu mô phỏng.
(A) Tạo ra một dữ liệu mô phỏng thiết lập như sau:
> set.seed (1)> y = rnorm (100)> x = rnorm (100)> y = x- 2 * x ^ 2 + rnorm (100)
Trong tập dữ liệu này, là những gì n và là những gì p? Viết ra những mô hình được sử dụng để tạo ra các dữ liệu dưới dạng phương trình.
(B) Tạo phân tán của X so với Y. Bình luận về những gì bạn fi thứ.
(C) Thiết lập một hạt giống ngẫu nhiên, và sau đó tính toán các lỗi LOOCV mà kết quả từ fi fitting trong bốn mẫu sử dụng phương nhỏ nhất:
5.4 Bài tập 201
i. Y = β0 + β1X +? ii. Y = β0 + β1X + β2X2 +? iii. Y = β0 + β1X + β2X2 + β3X3 +? iv. Y = β0 + β1X + β2X2 + β3X3 + β4X4 +?. Lưu ý bạn có thể fi nd nó hữu ích để sử dụng data.frame () để tạo ra một tập hợp dữ liệu duy nhất chứa cả X và Y. (d) Lặp lại (c) sử dụng một hạt giống ngẫu nhiên, và báo cáo kết quả của bạn. Là kết quả của bạn giống như những gì bạn có trong (c)? Tại sao? (e) nào trong các mô hình trong (c) đã có những lỗi LOOCV nhỏ nhất? Đây có phải là những gì bạn mong đợi? Giải thich câu trả lơi của bạn.
đang được dịch, vui lòng đợi..
