Nội dung
1 Giới thiệu 1
1.1 Các mối quan hệ 1
1.2 Các mối quan hệ xác định: một vấn đề cụ thể 2
1.3 Mô hình 5
1.4 Least squares 7
1.5 Một ví dụ và một trường hợp đặc biệt 10
1.6 Khi là Least squares một phương pháp tốt? 11
1.7 Một Measure of Fit cho Simple Regression 13
1.8 Mean và phương sai của 6o và bi 14
1.9 Khoảng tin cậy và các xét nghiệm 17
1.10 Dự đoán 18
Phụ lục Chương 1 20
23 Vấn đề
2 Nhiều Regression 28
2.1 Giới thiệu 28
2.2 Regression Model trong Matrix Notation 28
2.3 Least squares Ước tính 30
2.4 Các ví dụ 31
2.5 Gauss-Markov Điều kiện 35
2.6 Mean và phương sai của các ước lượng Dưới Điều kiện GM. . 35
2.7 Ước lượng a2 37
2.8 Các biện pháp của Fit 39
2.9 Gauss-Markov lý 41
2.10 Mô hình Centered 42
2.11 tâm và Scaling 44
2.12 'Least squares Constrained 44
Phụ lục 2 của Chương 46
Vấn đề 49
3 xét nghiệm và khu vực niềm tin 60
3.1 Giới thiệu 60
3.2 Giả thuyết tuyến tính 60
li
3.3 'Khả năng Ratio thử nghiệm 62
3.4 'phân phối của Test Thống kê 64
3.5 Hai trường hợp đặc biệt 65
3.6 Các ví dụ 66
3.7 So sánh các phương trình hồi quy 67
3.8 Khoảng tin cậy và khu vực 71
3.8.1 CI cho Nguyện vọng của một giá trị dự đoán. ... 71
3.8.2 CI cho một quan sát tương lai 71
3.8.3 'Region Niềm tin cho Regression Parameters ... 72
3.8.4 'của CI cho tuyến tính kết hợp của hệ số ... 73
74 Vấn đề
4 biến Chỉ thị 83
4.1 Giới thiệu 83
4.2 Một ứng dụng đơn giản 83
4.3 Biến Polychotomous 84
4.4 Các biến liên tục và Chỉ thị 88
4.5 Tấm Đường hồi quy 89
4.6 Các chỉ số như biến phụ thuộc 92
vấn đề 95
5 Các chuẩn tắc Assumption 100
5.1 Giới thiệu 100
5.2 Kiểm tra các chuẩn tắc 101
5.2.1 Xác suất Plots 101
5.2.2 Các xét nghiệm cho chuẩn tắc 105
5.3 Gọi Lý thuyết mẫu lớn. . • 106
5.4 'Bootstrapping 107
5.5 'tiệm cận Theory 108
110 Vấn đề
bất bình đẳng 6 Variances 111
6.1 Giới thiệu Ill
6.2 Phát hiện các biến ngẫu Ill
6.2.1 thử nghiệm chính 114
6.3 Phương sai Ổn định Transformations 115
6.4 Trọng số 118
Vấn đề 128
7 'lỗi tương quan 132
7.1 Giới thiệu 132
7.2 Generalized Least Squares: Case Khi f! Được biết đến là .... 133
7.3 Dự kiến Generalized Least Squares 134
7.3.1 Lỗi toán chênh lệch không bình đẳng và Unknown 134
7.4 lỗi Nested 136
7.5 Sự tăng trưởng Đường cong hình 138
7.6 tiếp Serial Correlation 140
7.6.1 Các Durbin-Watson thử nghiệm 142
7.7 Sự tương quan không gian 143
7.7 0,1 Thử nghiệm cho không gian tương quan 143
7.7.2 Ước lượng các thông số 144
Vấn đề 146
8 Outliers và quan sát ảnh hưởng 154
8.1 Giới thiệu 154
8.2 Đòn bẩy 155
8.2.1 'Đòn bẩy như Mô tả xa xôi 156
8.3 Dư 156
8.4 Phát hiện Outliers và điểm đó Đỗ Không Thuộc các
mẫu 157
8.5 Quan sát ảnh hưởng 158
8.5.1 Các biện pháp khác của ảnh hưởng 160
8.6 Các ví dụ 161
Phụ lục Chương 8 173
176 Vấn đề
9 Transformations 180
9.1 Giới thiệu 180
9.1.1 Một Lời Cảnh báo quan trọng của 180
9.2 Một số Common Transformations 181
9.2. 1 đa thức Regression 181
9.2.2 Splines 182
9.2.3 Các mô hình nhân giống 182
9.2.4 Mô hình Logit cho Proportions 186
9.3 Quyết định về Need for Transformations 188
9.3.1 Kiểm tra Plots dư 189
9.3.2 Sử dụng điều khoản bổ sung 190
9.3.3 Sử dụng Lặp lại phép đo 192
9.3.4 Daniel và Gỗ Near-Neighbor Approach 194 "
9.3.5 Phương pháp khác Dựa trên gần Neighbors 195
9.4 Lựa chọn biến đổi 197
9.4.1 Phương pháp đồ họa: Một biến độc lập .... 197
9.4.2 Phương pháp đồ họa : Nhiều biến độc lập. . 200
9.4.3 Phương pháp phân tích: việc chuyển các Response. . . 204
9.4.4 Phương pháp phân tích: Việc chuyển đổi các dự báo. . . 209
9.4.5 Simultaneous điện biến đổi cho các dự báo
và ứng phó 209
Phụ lục chương 9 211
213 Các vấn đề
đa cộng 10 218
10.1 Giới thiệu 218
10.2 đa cộng tuyến và nó ảnh hưởng 218
10,3 Phát hiện đa cộng 222
10.3.1 Dung sai và phương sai yếu tố lạm phát 222
10.3.2 trị riêng và điều kiện số 223
10.3.3 Variance Components 224
10.4 Các ví dụ 225
231 Vấn đề
11 Lựa chọn Variable 233
11.1 Giới thiệu 233
11.2 Một số ảnh hưởng của biến Thả 234
11.2.1 Hiệu ứng về Ước tính của 0j 235
11.2.2 'Effect trên Estimation của Lỗi Variance 236
11.2.3 "Ảnh hưởng về Hiệp phương sai của các ước lượng Matrix ...... 236
11.2.4 'Effect trên Giá trị dự đoán: Cp Mallows' 237
11.3 Các thủ tục lựa chọn Variable 238
11.3.1 Tìm kiếm Trong Tất cả phân nhóm có thể có 239
11.3.2 Thủ tục từng bước 240
11.3.3 Stagewise và thay đổi thủ tục Stagewise .... 243
11.4 Các ví dụ 243
251 Vấn đề
12 'Biased Estimation 253
12.1 Giới thiệu 253
12.2 Principal Component Regression 253
12.2.1 Bias và phương sai của các ước lượng 255
12,3 Ridge Regression 256
12.3.1 Physical Giải thích từ Ridge Regression 257
12.3.2 Bias và phương sai của các ước lượng 258
12,4 ngót Ước tính 261
263 Vấn đề
Một ma trận 267
A. l Phép cộng và phép nhân 267
A. 2 Các Transpose của một Matrix 268
A. 3 Null và Identity Matrices 268
A. 4 Vectors 269
A. 5 Rank của một Matrix 270
A. 6 Dấu vết của một Matrix 271
A. 7 phân Matrices 271
A. 8 yếu tố quyết định 272
A. 9 ngược 273
A. 10 Roots đặc trưng và Vectors 276
A. 11 idempotent Matrices 277
A. 12 Generalized Inverse 278
A. 13 Quadratic Forms 279
A. 14 Vector Spaces 280
282 Vấn đề
biến B ngẫu nhiên và ngẫu nhiên Vectors 284
B. l biến ngẫu nhiên 284
B. 1.1 Độc lập biến ngẫu nhiên 284
B. 1.2 Tương quan biến ngẫu nhiên 285
B. Thống kê l.3 mẫu 285
B. 1.4 Tuyến tính Kết hợp của các biến ngẫu nhiên 285
B. 2 Random Vectors 286
B. 3. Phân phối đa biến bình thường 288
B. 4 Chi-Square Distributions 290
B. 5 F và t Distributions 292
B. 6 Jacobian của biến đổi 293
B. 7 Nhiều Correlation 295
Vấn đề 297
C Nonlinear Least squares 298
C. l Gauss-Newton Loại Algorithms 299
C. 1.1 Các Gauss-Newton Procedure 299
C. l.2 Bước giảm một nửa 300
C. l.3 Giá trị bắt đầu và Derivatives 301
C. 1.4 Marquardt Procedure 302
C. 2 Một số khác Algorithms 302
C. 2.1 dốc Descent Phương pháp 303
C. 2.2 Quasi-Newton Algorithms 303
C. 2.3 Simplex Method 305
C. 2.4 Trọng • • 305
C. 3 cạm bẫy 306
C.4 Bias, Regions Niềm tin và biện pháp của Fit 308
C.5 Ví dụ 310
316 Vấn đề
Tables 319
Tài liệu tham khảo 327
Index 336
Author Index 345 Chương 1 Giới thiệu 1.1 Các mối quan hệ nhận thức của các mối quan hệ là nền tảng của nền văn minh. By dưới đứng như thế nào hiện tượng nhất định phụ thuộc vào người khác chúng ta học để dự đoán những hậu quả của các hành động của chúng tôi và để thao tác môi trường của chúng tôi. Hầu hết RELA-mối mà chúng ta biết được dựa trên những quan sát thực nghiệm. Mặc dù một số mối quan hệ được mặc nhiên công nhận trên cơ sở lý thuyết, thường là các lý thuyết mình đã được ban đầu được lấy từ những quan sát thực nghiệm. Và ngay cả những mối quan hệ thường cần phải được kiểm tra bằng thực nghiệm. Một số mối quan hệ tương đối dễ dàng để khám phá hoặc xác minh. Đây là mệnh là đặc đúng khi cơ hội đóng ít hoặc không có vai trò trong đó. Nhưng khi cơ hội không đóng một vai trò, nhiệm vụ phát hiện các mối quan hệ thường đòi hỏi phải phân tích khá thận trọng của dữ liệu. Cuốn sách này được dành cho việc nghiên cứu phân tích các dữ liệu nhằm phát hiện bao một hoặc nhiều biến (gọi là biến độc lập, biến dự báo hoặc biến hồi quy) ảnh hưởng đến các biến số khác (gọi là biến phụ thuộc hay biến phản ứng). Phân tích như vậy được gọi là hồi quy. Danh mục này có phần chưa may mắn vì nó có ít để làm với đi ngược trở lại, như re¬gression từ ngụ ý. Tên đến từ sớm (1885) ứng dụng của Sir Francis Galton, mà bị xử lý với các mối quan hệ về chiều cao của cha mẹ và chiều cao của con cái. Ông đã cho thấy rằng cha mẹ cao bất thường ('cao hơn tầm thường', khi ông đặt nó) có con người là ngắn hơn so với chính mình, và cha mẹ là "ngắn hơn so với tầm thường 'có con cao hơn bản thân họ. Điều này dẫn đến lý thuyết của ông về "hồi quy đối với tầm thường 'và cuối cùng dẫn đến việc sử dụng nó với các nghiên cứu khác liên quan đến các mối quan hệ. Sự lựa chọn này của từ này là gấp đôi bất hạnh, vì nó có thể có xu hướng ngày hồi quy từ công việc của Galton. Trên thực tế, hồi quy là lớn tuổi hơn nhiều đó. Toán học thế kỉ Eigh¬teenth Pháp (đặc biệt là Laplace) và những người khác (đặc biệt là Boscovich, năm 1757) rõ ràng đã làm những gì chúng ta gọi là hồi quy (Stigler, 1975, 1984) và nếu ai sẵn sàng để yêu cầu bồi thường thử nghiệm hai mẫu như một subcase của hồi quy (như chúng ta làm trong Chương 4), lịch sử của nó có từ thời Kinh Thánh. 1.2 Các mối quan hệ xác định: một vấn đề cụ thể Ví dụ 1.1 Chúng ta biết rằng những chiếc xe có nhiều hơn trên một con đường chậm hơn tốc độ của dòng chảy giao thông trở nên. Một sự hiểu biết khá chính xác của điều này là quan trọng đối với các kế hoạch vận chuyển từ việc giảm thời gian đi lại thường xuyên là mục đích chính đằng sau tăng phương tiện giao thông vận tải. Exhibit 1.1 hiển thị dữ liệu về mật độ trong xe mỗi dặm và tốc độ tương ứng trong dặm một giờ. Mật độ Tốc độ (Speed) 1/2 Mật độ Tốc độ (Speed) 1/2 20,4 38,8 6,229 29,5 31,8 5,639 27,4 31,5 5,612 30,8 31,6 5,621 106,2 10,6 3,256 26,5 34,0 5,831 80,4 16,1 4,012 35,7 28,9 5,376 141,3 7,7 30,0 28,8 2,775 5,367 2,881 130,9 8,3 106,2 10,5 3.240 121,7 8,5 97,0 12,3 2,915 3,507 3,332 106,5 11,1 90,1 13,2 3,633 2,933 130,5 8,6 106,7 11,4 3,376 101,1 3,332 11,1 99,3 11,2 3,347 123,9 9,8 107,2 10,3 3,130 3,209 144,2 7,8 109,1 11,4 2,793 3,376 LỤC 1.1: Số liệu về mật độ của xe và tốc độ trung bình SOURCE: Huber (1957). Sao chép với sự cho phép từ Vận tải Re¬search Ban, Hội đồng Nghiên cứu Quốc gia, Washington, DC Kể từ tắc nghẽn ảnh hưởng đến tốc độ (và không phải là cách khác xung quanh) chúng ta quan tâm trong việc xác định ảnh hưởng của mật độ vào tốc độ. Vì lý do đó không cần phải quan tâm đến chúng tôi tại thời điểm này (nhưng sẽ được thảo luận trong chương 6), chúng ta sẽ thiết lập các biến phụ thuộc là căn bậc hai của tốc độ. Exhibit 1.2 cho thấy một cốt truyện (hoặc một biểu đồ phân tán như đôi khi được gọi là) với biến indepen¬dent (mật độ) trên trục ngang và biến phụ thuộc (căn bậc hai của tốc độ) vào vertic
đang được dịch, vui lòng đợi..