Revista Colombiana de EstadísticaJunio 2010, volumen 33, no. 1, pp. 63 a 88Sự tự tin và khoảng tin cậy cho cácSự khác biệt của hai tỷ lệIntervalos de confianza y de credibilidad para la diferencia de dosproporcionesHANWEN ZHANG1, một, HUGO ÀNDRÉS GưTIÉRREZ ROJAS1'b,EDILBERTO CEPEDA CUERYO2'01CENTRO DE INVESTIGACIONES y EsTUDios ESTADÍSTICOS (CIEES), FAOƯLTAD DEĐIỀU, ĐẠI HỌC SANTO TOMÁS, BOGOTÁ, COLOMBIA2DEPARTAMENTO DE ESTADÍSTICA, FACULTAD DE CIENCIAS, UNIVERSIDAD NACIONAL DECOLOMBIA, BOGOTÁ, COLOMBIATóm tắtBài viết này trình bày một frequentist so sánh hiệu suất của khoảng thời gian con-fidence và độ tin cậy cho sự khác biệt của hai tỷ lệ từ hai mẫu độc lập. So sánh tiến hành xem xét ba frequentist tiêu chuẩn. Nó được tìm thấy rằng khoảng thời gian với tốt nhất perfor-mance, về phạm vi bảo hiểm xác suất, Bayesians; trong điều kiện độ dài dự kiến và phương sai của chiều dài, khoảng Newcombe cho thấy hiệu suất tốt nhất. Như là một lưu ý cuối cùng, nó đã được tìm thấy khoảng thời gian truyền thống như Wald và điều chỉnh Wald có một hiệu suất kém.Từ khóa: khoảng tin cậy, khoảng tin cậy, sự khác biệt của hai tỷ lệ...ResumenEste artículo presenta una comparación del comportamiento de interva los de confianza frecuentistas y de credibilidad bayesianos para la diferencia de dos proporciones provenientes de muestras aleatorias independientes. La comparación se lleva cabo considerando tres criterios frecuentistas con los cuales se concluyó que el mejor comportamiento, en términos de la proba bilidad de cobertura, lo tienen los intervalos bayesianos, y en términos de la longitud esperada y varianza de la longitud el mejor comportamiento está dado por el intervalo frecuentista de Newcombe. Como resultado de esta trong vestigación se encontró que los intervalos frecuentistas más populares como Wald y Wald tienen ajustado un comportamiento deficiente.Palabras clave: intervalos de confianza, intervalos de credibilidad, diferen-cia de dos proporciones.aDocente investigadora. E-mail: hanwenzhang@usantotomas.edu.co bDirector. E-mail: hugogutierrez@usantotomas.edu.co cProfesor asociado. E-mail: ecepedac@unal.edu.co1. nềnMột vấn đề phổ biến trong số liệu thống kê thực tế là estimatig sự khác biệt của hai tỷ lệ bằng phương pháp ước lượng khoảng thời gian. Chủ đề này là đặc biệt quan trọng trong các thử nghiệm lâm sàng mà nó là cần thiết để điều tra tỷ lệ chữa của hai loại thuốc hoặc phương pháp điều trị. Lý thuyết nền tảng của nghiên cứu này là như sau: giả sử rằng Xi,..., Xni và Yi,..., Yn2 là độc lập hai mẫu như vậy mà Xị ~ Bernoulli(Pi) và Yj ~ Bernoulli(p2), với i = 1,..., ni và j = 1,..., n2. Nó là cần thiết để xây dựng một khoảng thời gian conhdence hoặc một khoảng tin cậy cho sự khác biệt về tỷ lệ pi-P2.Các phương pháp phổ biến nhất cho ước tính Pi-P2 bằng phương pháp frequentist confi-dence khoảng thời gian là khoảng thời gian Wald, được trình bày trong hầu hết các sách giáo khoa giới thiệu statis-tật máy dù có hiệu suất kém. Nhiều modihcations đã được thực hiện để khoảng Wald để cải thiện nó. Một trong số họ là điều chỉnh khoảng thời gian Wald thu được bằng cách mở rộng khoảng Wald để tăng khả năng bảo hiểm. Cải tiến này là có ý nghĩa đặc biệt là khi kích thước mẫu là nhỏ. Khoảng thời gian quan trọng khác là điểm khoảng thời gian (Wilson 1927), thu được bằng inverting thống kê điểm bài kiểm tra. Khoảng thời gian này lần đầu tiên có thể được cho một tỷ lệ, và sau đó đã được mở rộng để đối phó với sự khác biệt của hai tỷ lệ. Tuy nhiên, trong trường hợp đó, khoảng thời gian thiếu một hình thức đóng cửa (Pan 2002) và phải được tính toán bằng số xấp xỉ. Agresti & Caffo (2000) phân tích các điểm khoảng, và nguồn gốc các phương pháp thêm-4: thêm 2 thành công và thất bại 2 để quan sát mẫu. Một số lượng đáng kể của tác giả đồng ý rằng phương pháp Agresti và Caffo có một hiệu suất rất tốt (Pan 2002, Correa và Sierra 2003, Agresti et al. 2008). Một khoảng thời gian thu được bằng cách thay đổi phương pháp điểm là khoảng thời gian Newcombe (Newcombe 1998a, 1998b), và nó dường như có một hiệu suất tương tự như Agresti và Caffo khoảng thời gian (Correa & Sierra năm 2003).Trong phương pháp tiếp cận Bayes, phạm Gia & Turkkan (1993) được sử dụng chức năng Appell hypergeo-số liệu và nguồn gốc phân phối sau của pi-p2 khi beta priors được sử dụng cho mỗi phần. Được phân phối chính xác sau, một khoảng tin cậy Bayes chính xác cho Pi-P2 có thể được tìm thấy. Tuy nhiên, các compu - thủ tục tational là hơi tẻ nhạt, vì vậy phương pháp tính toán mới như các Markov chuỗi Monte Carlo (MCMC), có thể được sử dụng để làm cho nó dễ dàng hơn để đánh giá các phân phối sau cho Pi-P2, Agresti & Min (2005) lập luận.Trong văn học, nhiều so sánh giữa conhdence khoảng thời gian đã được thực hiện (Newcombe 1998a, Newcombe 1998b, Agresti & Caffo 2000, Pan 2002, Correa và Sierra năm 2003). Mục đích của nghiên cứu này là để đưa vào tài khoản tin cậy Bayes khoảng thời gian cùng với frequentist con
đang được dịch, vui lòng đợi..