Tuyến tính hồi quy [sửa]
Bài chi tiết: Hồi quy tuyến tính
Xem hồi quy tuyến tính đơn giản cho một dẫn xuất của các công thức và một ví dụ số
Trong hồi quy tuyến tính, các đặc điểm kỹ thuật mô hình này là các biến phụ thuộc, y_i là một sự kết hợp tuyến tính của các tham số (nhưng không nhất thiết phải tuyến tính trong các biến độc lập). Ví dụ, trong hồi quy tuyến tính đơn giản để mô hình hóa n điểm dữ liệu có là một biến độc lập: x_i, và hai tham số, beta_0 và beta_1: đường thẳng: y_i = beta_0 + beta_1 x_i + varepsilon_i, quad i = 1 , dots, n .! Trong hồi quy tuyến tính đa, có một số biến độc lập hay các chức năng của các biến độc lập. Thêm một thuật ngữ trong xi2 để hồi quy trước cho: parabol: y_i = beta_0 + beta_1 x_i + beta_2 x_i ^ 2+ varepsilon_i, i = 1, dots, n .! Đây vẫn là hồi quy tuyến tính; mặc dù các biểu thức ở bên tay phải là bậc hai trong x_i biến độc lập, nó là tuyến tính trong các tham số beta_0, beta_1 và beta_2. Trong cả hai trường hợp, varepsilon_i là một thuật ngữ lỗi và chỉ số i chỉ là một quan sát cụ thể. Quay trở lại sự chú ý của chúng tôi để các trường hợp đường thẳng: Cho một mẫu ngẫu nhiên từ dân số, chúng tôi ước tính các thông số về dân số và có được các mô hình hồi quy tuyến tính mẫu: widehat {y_i} = widehat { beta} _0 + widehat { beta} _1 x_i. Các dư, e_i = y_i - widehat {y} _i, là sự khác biệt giữa giá trị của biến phụ thuộc được dự đoán bởi mô hình, widehat {} y_i, và giá trị đích thực của biến phụ thuộc, y_i. Một phương pháp ước lượng là bình phương nhỏ nhất. Phương pháp này có được ước lượng tham số đó giảm thiểu tổng số dư bình phương, SSE, [20] [21] cũng đôi khi được ký hiệu RSS: SSE = sum_ {i = 1} ^ n e_i ^ 2. , Giảm thiểu chức năng này kết quả trong một tập hợp các phương trình bình thường, một tập hợp các phương trình tuyến tính đồng thời trong các thông số, mà được giải quyết để mang lại các ước lượng tham số, widehat { beta} _0, widehat { beta} _1. Minh họa của hồi quy tuyến tính trên một tập dữ liệu. Trong trường hợp hồi quy đơn giản, công thức cho các ô vuông ước tính ít nhất là widehat { beta_1} = frac { sum (x_i- bar {x}) (y_i- bar { y})} { sum (x_i- bar {x}) ^ 2} text {và} hat { beta_0} = bar {y} - widehat { beta_1} bar {x} nơi thanh {x} là giá trị trung bình (trung bình) của các giá trị x và bar {y} là giá trị trung bình của các giá trị y. Theo các giả định rằng các lỗi hạn quần thể có một phương sai không đổi, ước tính phương sai mà được cho bởi: hat { sigma} ^ 2_ varepsilon = frac {SSE} {n-2}. , Điều này được gọi là sai số bình phương trung bình (MSE) của hồi quy. Các mẫu số là cỡ mẫu giảm số lượng các thông số mô hình ước tính từ cùng một dữ liệu, (np) cho p biến hồi quy hay (np-1) nếu một đánh chặn được sử dụng. [22] Trong trường hợp này, p = 1 nên mẫu số là n-2. Các sai số chuẩn của các ước lượng tham số được đưa ra bởi hat sigma _ { beta_0} = hat sigma _ { varepsilon} sqrt { frac {1} {n} + frac { bar { x} ^ 2} { sum (x_i- bar x) ^ 2}} hat sigma _ { beta_1} = hat sigma _ { varepsilon} sqrt { frac {1} { sum (x_i- bar x) ^ 2}}. Theo các giả định thêm rằng các lỗi hạn phân bố dân số bình thường, các nhà nghiên cứu có thể sử dụng các sai số chuẩn ước tính để tạo ra khoảng tin cậy và tiến hành kiểm tra giả thuyết về các tham số dân.
đang được dịch, vui lòng đợi..
