2Suy luận thống kê II: Ước tính khoảng thời gian, thử nghiệm giả thuyết, và dân số so sánhScientific quyết định nên được dựa trên âm thanh phân tích và chính xác thông tin-mation. Chương này cung cấp các lý thuyết và giải thích của confidence khoảng, thử nghiệm giả thuyết, và so sánh dân là thống kê xây dựng (công cụ) được sử dụng để hỏi và trả lời các câu hỏi về các hiện tượng giao thông đang được nghiên cứu. Mặc dù của tiện ích rất lớn, confidence khoảng thường bị bỏ qua trong giao thông vận tải thực tế và giả thuyết thử nghiệm và so sánh popu-lation thường xuyên được lạm dụng và misinterpreted. Công nghệ-niques thảo luận trong chương này có thể được sử dụng để xây dựng, kiểm tra, và đưa ra quyết định thông báo liên quan đến một số lớn các giả thuyết. Những câu hỏi như sau phục vụ như là ví dụ. Tai nạn xảy ra tại một ngã tư đặc biệt có hỗ trợ quan điểm cho rằng nó là vị trí nguy hiểm? Làm traffic - làm dịu các biện pháp giảm tốc độ traffic? Thông tin hướng dẫn lộ trình thực hiện thông qua một hệ thống đăng thông báo thay đổi thành công chuyển động cơ-ists từ các khu vực tắc nghẽn? Đã bãi bỏ quy định của thị trường vận tải máy tăng thị phần cho kinh doanh du lịch? Không thay đổi các đơn vị điều hành trợ cấp để hệ thống quá cảnh thay đổi hiệu suất hoạt động của họ? Để giải quyết những và tương tự như các loại câu hỏi, các nhà nghiên cứu giao thông vận tải và các chuyên gia có thể áp dụng các kỹ thuật trình bày trong chương này.2.1 Confidence khoảngTrong thực tế, thống kê các tính từ mẫu chẳng hạn như bộ mẫu- tuổi X, s2 phương sai, độ lệch chuẩn s, và những người khác xem xét trong các trước chương được sử dụng để ước tính tham số dân. Ví dụ, mẫu là X được sử dụng như một công cụ ước tính có nghĩa là dân Qx, mẫu phương sai s2 là một ước tính của phương sai dân W2, và như vậyngày. Thu hồi từ phần 1.6 mong muốn hoặc "tốt" estimators đáp ứng 4 thuộc tính quan trọng: unbiasedness, efficiency, nhất quán và sufficiency. Tuy nhiên, bất kể các thuộc tính một ước tính satisfies, ước tính sẽ khác nhau trên mẫu và có ít nhất một số xác suất nó sẽ khác nhau từ các tham số dân, nó có nghĩa là để ước tính. Không giống như các estimators điểm được nhận xét trong chương trước, tập trung ở đây là trên ước tính khoảng thời gian. Ước tính khoảng thời gian cho phép suy luận được rút ra về dân bằng cách cung cấp một khoảng thời gian, một hạ và thượng ranh giới, trong đó một tham số không biết sẽ nói dối với một prespecified cấp của confi-dence. Logic đằng sau một ước tính khoảng thời gian là một khoảng thời gian được tính toán bằng cách sử dụng dữ liệu mẫu có chứa các tham số dân thực sự với một số mức độ confidence (tỷ lệ dài hạn của thời gian khoảng thời gian thật sự dân tham số nằm trong khoảng thời gian). Khoảng thời gian được gọi là confi-dence khoảng (CIs) và có thể được xây dựng cho một loạt các mức độ confidence. Giá trị thấp hơn được gọi là confidence thấp giới hạn (LCL) và giá trị trên giới hạn trên confidence (UCL). Các rộng hơn một khoảng thời gian confidence, confident thêm các nhà nghiên cứu là rằng nó có chứa các tham số dân (nói chung confidence là tương đối cao). Ngược lại, một khoảng thời gian tương đối hẹp confidence là ít có khả năng chứa dân param-eter (tổng confidence là tương đối thấp).Tất cả các phương pháp tham số trình bày trong vòng bốn phần này chương làm cho specific giả định về phân bố xác suất của mẫu estimators, hoặc làm cho các giả định về bản chất của các quần thể lấy mẫu. Đặc biệt, các giả định của một dân số khoảng bình thường phân phối (và mẫu) thường được thực hiện. Như vậy, nó là imper-Anh có những giả định, hoặc yêu cầu, kiểm tra trước khi áp dụng-ing những phương pháp. Khi các giả định không được đáp ứng, sau đó các phương pháp thống kê nonparametric cung cấp trong phần 2,5 là thích hợp hơn.2.1.1 Confidence khoảng thời gian nhất với nổi tiếng σ2Định lý giới hạn Trung tâm (CLT) cho thấy rằng bất cứ khi nào một sufficiently lớn mẫu ngẫu nhiên được rút ra từ bất kỳ dân với có nghĩa là Q và độ lệch chuẩn W, có nghĩa là mẫu X là khoảng bình thường phân phối với có nghĩa là Q và độ lệch chuẩn W / n. Nó có thể dễ dàng verified rằng này tiêu chuẩn bình thường biến ngẫu nhiên Z có một proba 0,95-bility là giữa phạm vi giá trị [–1.96, 1,96] (xem bảng C.1 ởPhụ lục C). Một tuyên bố xác suất liên quan đến Z được cho là (2,1)Với một số thao tác cơ bản của đại số tuyên bố xác suất của Equa-tion 2.1 có thể được ghi trong một hình thức khác nhau, nhưng tương đương: (2,2) Phương trình 2.2 cho thấy rằng, với một số lớn các khoảng tính từ khác nhau mẫu ngẫu nhiên rút ra từ dân số, tỷ lệ giá trị của X cho khoảng thời gian (X 1.96W n, X 1.96W n) chụp Q là 0,95. Khoảng thời gian này được gọi là công cụ ước tính khoảng confidence của 95% của Q. Aký hiệu lối tắt cho khoảng thời gian này là X s 1,96 Wn . (2,3) Rõ ràng, khác hơn so với 95% các xác suất có thể được sử dụng. Ví dụ, 90%confidence khoảng thời gian làX s 1.645 W.nNói chung, bất kỳ mức độ confidence có thể được sử dụng trong ước tính confidence khoảng thời gian. Khoảng thời gian confidence là 1 E, và ZE 2 là giá trị của Z như vậy rằng diện tích trong mỗi của đuôi theo tiêu chuẩn đường cong bình thường là E 2. Sử dụng ký hiệu này, công cụ ước tính khoảng confidence q có thể được viết dưới dạng WX s ZE 2 n . (2,4) Bởi vì mức độ confidence là tỷ lệ nghịch với nguy cơ confidence khoảng thời gian không bao gồm giá trị thực của Q, nó thường khoảng giữa 0,90 0,99, reflecting 10% và 1% mức độ nguy cơ không bao gồm các tham số thực dân, tương ứng.Ví dụ 2.1Một khoảng thời gian confidence 95% là mong muốn cho tốc độ xe cộ có nghĩa là trên những con đường Indiana (xem ví dụ 1.1 cho biết thêm chi tiết). Trước tiên, giả định của bình thường được kiểm tra; Nếu giả định này là satisfied chúng tôi có thể tiến hành phân tích. Kích thước mẫu là n = 1296, và có nghĩa là mẫu là X = 58.86. Giả sử một lịch sử lâu dài của các nghiên cứu trước khi có hiển thị độ lệch chuẩn popu-lation như W = 5,5. Sử dụng phương trình 2.4, khoảng confidence có thể thu được: X s 1,96 Wn ! 58.86 s 1,96 5.5 1296 ! 58.86 s 0,30!? 58.56, 59 .16A. Kết quả chỉ ra rằng 95% confidence khoảng thời gian cho các tham số không rõ dân Q bao gồm thấp hơn và giới hạn trên của 58,56 và59.16. điều này cho thấy rằng các tham số đúng và không rõ dân sẽ nằm một nơi nào đó trong khoảng thời gian này khoảng 95 lần ra khỏi 100, Trung bình. Khoảng confidence là khá "chặt chẽ," có nghĩa là phạm vi của các giá trị có thể là tương đối nhỏ. Đây là kết quả của giả thấp tiêu chuẩn độ lệch (hoặc các biến đổi trong dữ liệu) dân số kiểm tra.Khoảng 90% confidence, bằng cách sử dụng cùng một tiêu chuẩn độ lệch, là [58,60,59.11], và khoảng thời gian confidence 99% là [58.46, 59.25]. Như confidencekhoảng thời gian trở nên rộng lớn hơn, đó là lớn hơn và lớn hơn confidence mà cáckhoảng thời gian có chứa các tham số dân không biết sự thật.2.1.2 Confidence khoảng thời gian nhất có nghĩa là với phương sai không rõTrong phần trước, một thủ tục đã được thảo luận để xây dựng confi-dence khoảng xung quanh bình dân bình thường khi phương sai của dân số được biết đến. Trong phần lớn các tình huống thực tế lấy mẫu, Tuy nhiên, phương sai dân hiếm khi được biết đến và thay vào đó được ước tính từ dữ liệu. Khi phương sai dân chưa được biết và dân thường được phân phối, (1-E) 100% confidence khoảng thời gian cho Q được cho bởiX s t s, (2,5)E 2 n nơi s là bậc hai của phương sai ước tính (s2), tE 2 là giá trị của việc phân phối t với n 1 bậc tự do (cho một cuộc thảo luận của tphân phối, xem phụ lục A).Ví dụ 2.2Tiếp tục với các ví dụ trước đó, một khoảng thời gian confidence 95% cho tốc độ trung bình trên những con đường Indiana được tính, giả định rằng phương sai dân không được biết đến, và thay vào đó một dân số ước tính thu được từ các dữ liệu có giá trị tương tự như trước khi. Kích thước mẫu là n = 1296, và mẫu có nghĩa là X = 58.86. Sử dụng phương trình 2.3, khoảng confidence có thể thu được như là X s t s! 58.86 s 1,96 4,41!? 58.61, 59 .10A. E 2 n 1296 Điều thú vị, kiểm tra xác suất kết hợp với phân phối t(xem bảng C.2 trong phụ lục C) cho thấy rằng sự phân bố t hội tụ để phân phối bình thường tiêu chuẩn như n pg. Mặc dù phân phối t là phân phối chính xác để sử dụng bất cứ khi nào phương sai dân là Liên Hiệp Quốc được biết đến khi kích thước mẫu là sufficiently lớn bình thường tiêu chuẩn distri-bution có thể được sử dụng như là một xấp xỉ đầy đủ để phân phối t.2.1.3 Confidence khoảng thời gian cho một tỷ lệ dân sốĐôi khi, quan tâm đến Trung tâm trên một biến chất lượng (danh nghĩa quy mô), thay vì một định lượng biến (khoảng thời gian hoặc tỷ lệ quy mô). Có thể có quan tâm đến tần suất tương đối của một số đặc trưng trong một dân số chẳng hạn như, cho kỳ thi-ple, tỷ lệ người ở dân quá cảnh người. Trong đó trường hợp, ước tính tỷ lệ dân số, p, ước tính có là pˆ has an approximate normal distribution provided that n is sufficiently large (np u 5 and nq u 5 , where q ! 1 p ). The mean of the sampling distribution pˆ is the population proportion p and the standard deviation is pq n . A large sample 1 E 100% confidence interval for the population propor- tion, p is given bypˆ s Z pq , (2.6)E 2 n where the estimated sample proportion, pˆ , is equal to the number of “suc- cesses” in the sample divided by the sample size, n, and qˆ ! 1 pˆ . Example 2.3
đang được dịch, vui lòng đợi..
