Bước 3. Chuẩn bị và nạp dữ liệu.
Để thực hiện phù hợp với số xu hướng, bạn sẽ
cần một bộ dữ liệu bao gồm các trường hợp trong các hàng và
các biến trong cột. Bạn sẽ cần một nhóm các
biến và một hoặc kết hợp nhiều biến. Các
biến nhóm là biến mà xác định đó
nhóm một trường hợp thuộc về (ví dụ, điều trị hoặc điều khiển).
Các biến phù hợp là những người mà bạn muốn
cố gắng để cân bằng các nhóm trên. Ví dụ, trong các
bộ dữ liệu Falbe (2014), biến stw là nhóm
biến. Nó xác định xem một trường hợp cụ thể (một
trường) đã được chỉ định là một trường học để xem ©
trường (1) hay không (0). Các biến tot khác (trường
kích thước), min (tỷ lệ sinh viên dân tộc thiểu số trong
trường), và dis (tỷ lệ sinh viên nhận được miễn phí
ăn trưa và giảm) là các biến phù hợp. Các
số liệu chúng tôi sử dụng ở đây có thể được tải về từ
Randolph (2014a). Trong bộ dữ liệu của riêng bạn, hãy chắc chắn
rằng không có dữ liệu bị mất hoặc R có thể không có khả năng để
thực hiện các phân tích.
Mặc dù có chức năng nhập khẩu Excel,
SPSS, hoặc các định dạng dữ liệu khác vào R, chúng tôi đã tìm thấy nó là
thuận tiện nhất để tiết kiệm nó như là một tập tin .csv trước khi cố gắng để
nạp dữ liệu vào R. Khi bạn lưu các tập tin trong Excel,
bạn sẽ có tùy chọn để lưu nó như một tập tin .csv. Khi bạn
lưu các tập tin, lưu ý vị trí của nó.
Tiếp theo, bạn sẽ cần phải thay thế các vị trí tập tin
giữa các dấu ngoặc trong dòng đầu tiên của mã R trong
Hình 1 có vị trí tập tin riêng của bạn. Lưu ý rằng trong những
dòng đầu tiên, dấu gạch chéo chứ không phải là dấu chéo ngược được
sử dụng để xác định vị trí tập tin. Ví dụ dưới đây là một
vị trí tập tin trong Windows, nơi mà dữ liệu được đặt trong
một tập tin gọi là newyork.csv trong thư mục có tên r trên
ổ C. Các dòng mã đầu tiên đọc dữ liệu từ của bạn
máy tính và đặt lại tên cho nó mydata. Dòng thứ hai
làm cho những dữ liệu có sẵn trong phiên R hiện tại.
Dòng thứ ba của mã bên dưới in các biến
tên và mười trường hợp đầu tiên trong tập dữ liệu. Chúng tôi làm điều này
chỉ để kiểm tra các tập dữ liệu và hiểu những gì từng
cột đại diện.
Mydata <- read.csv ( "C: /r/newyork.csv")
đính kèm (mydata)
mydata [1:10,]
Hình 1. Mã ví dụ để nhập một tập dữ liệu.
Hình 2 cho thấy kết quả của việc chạy mã trong
Hình 1. Nó cho thấy mười trường hợp đầu tiên trong tập dữ liệu và
các biến thể được bao gồm trong các cột. Nó cho thấy
rằng các cột từ trái sang phải là số trường hợp
(một số id duy nhất cho mỗi trường), trường học (tên
của mỗi trường), tot (tổng số học sinh trong các
trường học), min (tỷ lệ thiểu số học sinh trong
trường), dis (số lượng sinh viên nhận được miễn phí hoặc
đang được dịch, vui lòng đợi..
