11.4.3.2 thư phân tíchĐiều này sử dụng rộng rãi công cụ, mà cho phép kiểu trực quan của một bảng phòng hờ, có thể được dùng như một tổng quát của hậu môn-thành phần chính ysis (PCA) cho tự và danh nghĩa dữ liệu. CA sẽ xác định một dự của các dữ liệu vào kích thước vuông góc như vậy mà họ tuần tự đại diện cho càng nhiều của các biến thể trong dữ liệu càng tốt. Trong khi có nhiều kết quả và các biện pháp chính trong CA, thường, chúng tôi chủ yếu nhìn plot (2D) lần đầu tiên hai thành phần; Nếu các biến thể giải thích là không đủ, chúng tôi có thể xem xét thêm kích thước như là tốt. Giải thích bản đồ CA là giống như biplots (Gabriel 1971), một ứng dụng phổ biến trong đó là một (tuyến tính hoặc giai đoạn 4) ưu tiên lập bản đồ. Thông tin chi tiết về CA vượt ra ngoài phạm vi của chúng tôi; độc giả quan tâm gọi sách giáo khoa Greenacre (2007).CA cổ điển dựa trên cái gọi là χ2-khoảng cách. Trong xem xét tai-lier phê bình của các ứng dụng của số liệu này cho dữ liệu phong phú loài, Legendre và Gallagher (2001) lưu ý rằng χ2 khoảng cách sẽ được nhiều hơn nữa bị ảnh hưởng bởi sự bao gồm của một số loài rất hiếm hơn bởi loài rất phong phú. Chứ không phải là loại bỏ các loài quý hiếm trước khi tiến hành CA, họ đề xuất bằng cách sử dụng khoảng cách Hellinger cái gọi là (Hellinger năm 1909) là một thay thế. Popper et al. (2011) được thực hiện tương tự như quan sát về sự bao gồm các điều khoản CATA hiếm khi được chọn vào CA: khoảng cách giữa các sản phẩm trong cốt truyện CA cuối cùng phụ thuộc vào những gì các sản phẩm khác được bao gồm trong các phân tích, và hiếm khi kiểm tra các thuộc tính tổng thể sẽ có một tác động cao quá đáng trên các kết quả cuối cùng. Họ áp dụng CA sử dụng khoảng cách Hellinger CATA dữ liệu để khắc phục những vấn đề này. Williams et al. (2011) lưu ý rằng CA là tốt nhất sử dụng khi có được năm hoặc nhiều hơn các sản phẩm đánh giá, chẳng hạn như trong một bài đánh giá thể loại.Có thể tiến hành CA trong R bằng cách sử dụng gói khác nhau. Ca trọn gói (Nenadic và Greenacre 2007) được dành chủ yếu để CA, trong khi trình bày (Beaton et al. 2013), với sản lượng đồ họa được tạo ra với prettyGraphs (Beaton năm 2013), cung cấp CA cũng như chức năng cho các phương pháp đa biến. Xa như chúng tôi là nhận thức, trình bày là các gói phần mềm R duy nhất hiện nay có một thực hiện trực tiếp cho CA sử dụng khoảng cách Hellinger. Các gói phần mềm FactoMineR (Husson et al. 2013) cũng cung cấp các phương pháp đa biến, bao gồm CA.Chúng tôi cung cấp một số mã với những ví dụ trong phần 11.5 của chương này. Cần lưu ý rằng các số liệu tiêu chuẩn từ nhiều người trong số những gói này không nhất thiết phải duy trì tỷ lệ khía cạnh cốt truyện, có nghĩa là những nhân vật tiêu chuẩn từ nhiều người trong số những gói không tôn trọng các khoảng cách thực tế của sản phẩm; thay vào đó, các biến thể giải thích cần phải được đưa vào tài khoản cho việc giải thích; chúng tôi khuyên bạn nên chỉnh sao cho khoảng cách trực quan có tỷ lệ thuận với sự khác biệt giữa các sản phẩm.
đang được dịch, vui lòng đợi..
