Step 3. Prepare and load the data.

Step 3. Prepare and load the data.
To perform propensity score matching, you will
need a data set that consists of cases in rows and
variables in columns. You will need a grouping
variable and one or more matching variables. The
grouping variable is the variable that specifies which
group a case belongs to (e.g., treatment or control).
The matching variables are the ones that you want to
attempt to equalize the groups on. For example, in the
Falbe (2014) data set, the stw variable is the grouping
variable. It specifies whether a particular case (a
school) has been designated as a Schools to Watch ©
school (1) or not (0). The other variables tot (school
size), min (percentage of minority students in the
school), and dis (percentage of students receiving free
and reduced lunch) are the matching variables. The
dataset we used here can be downloaded from
Randolph (2014a). In your own datasets, make sure
that there are no missing data or R may not be able to
perform the analysis.
Although there are functions to import Excel,
SPSS, or other data formats into R, we have found it is
most convenient to save it as a .csv file before trying to
load the data into R. When you save the file in Excel,
you will have the option to save it as a .csv file. As you
save the file, note its location.
Next, you will need to replace the file location
between the parentheses in the first line of R code in
Figure 1 with your own file location. Note that in the
first line, forward slashes rather than backslashes are
used to specify the file location. The example below is a
file location in Windows, where the data are located in
a file called newyork.csv in folder called r on the
C drive. The first line of code reads the data from your
computer and renames it mydata. The second line
makes those data available in the current R session.
The third line of the code below prints the variable
names and the first ten cases in the data set. We do this
just to check the data set and understand what each
column represents.
mydata

Step 3. Prepare and load the data. 
To perform propensity score matching, you will 
need a data set that consists of cases in rows and 
variables in columns. You will need a grouping 
variable and one or more matching variables. The 
grouping variable is the variable that specifies which 
group a case belongs to (e.g., treatment or control). 
The matching variables are the ones that you want to 
attempt to equalize the groups on. For example, in the 
Falbe (2014) data set, the stw variable is the grouping 
variable. It specifies whether a particular case (a 
school) has been designated as a Schools to Watch © 
school (1) or not (0). The other variables tot (school 
size), min (percentage of minority students in the 
school), and dis (percentage of students receiving free 
and reduced lunch) are the matching variables. The 
dataset we used here can be downloaded from 
Randolph (2014a). In your own datasets, make sure 
that there are no missing data or R may not be able to 
perform the analysis. 
Although there are functions to import Excel, 
SPSS, or other data formats into R, we have found it is 
most convenient to save it as a .csv file before trying to 
load the data into R. When you save the file in Excel, 
you will have the option to save it as a .csv file. As you 
save the file, note its location. 
Next, you will need to replace the file location 
between the parentheses in the first line of R code in 
Figure 1 with your own file location. Note that in the 
first line, forward slashes rather than backslashes are 
used to specify the file location. The example below is a 
file location in Windows, where the data are located in 
a file called newyork.csv in folder called r on the 
C drive. The first line of code reads the data from your 
computer and renames it mydata. The second line 
makes those data available in the current R session. 
The third line of the code below prints the variable 
names and the first ten cases in the data set. We do this 
just to check the data set and understand what each 
column represents. 
mydata

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Bước 3. Chuẩn bị và tải dữ liệu. Để thực hiện phù hợp với xu hướng được điểm, bạn sẽ cần một tập hợp dữ liệu bao gồm các trường hợp hàng và biến trong cột. Bạn sẽ cần một nhóm thay đổi và một hoặc nhiều kết hợp các biến. Các Nhóm biến là biến xác định đó Nhóm thuộc về một trường hợp (ví dụ: điều trị hoặc kiểm soát). Kết hợp các biến là những người mà bạn muốn cố gắng để cân bằng các nhóm trên. Ví dụ, trong các Falbe (2014) tập hợp dữ liệu, biến stw là các nhóm biến. Nó xác định liệu một trường hợp cụ thể (a trường học) đã được xác định là một trường học để xem © trường học (1) hay không (0). Các biến khác tot (trường học Kích thước), min (tỷ lệ học sinh dân tộc thiểu số ở các trường học), và dis (tỷ lệ học sinh nhận được miễn phí và giảm bữa ăn trưa) biến phù hợp. Các Các bộ dữ liệu chúng tôi sử dụng ở đây có thể được tải về từ Randolph (2014a). Ở datasets của riêng bạn, hãy chắc chắn rằng rằng không có mất dữ liệu hoặc R có thể không có khả năng thực hiện các phân tích. Mặc dù có những chức năng nhập khẩu Excel, SPSS hoặc dữ liệu định dạng vào R, chúng tôi đã tìm thấy nó thuận tiện nhất để lưu nó dưới dạng tệp .csv trước khi cố gắng tải dữ liệu vào R. Khi bạn lưu các tập tin trong Excel, bạn sẽ có tùy chọn để lưu nó dưới dạng tệp .csv. Như bạn lưu các tập tin, lưu ý vị trí của nó. Tiếp theo, bạn sẽ cần phải thay thế vị trí tệp giữa dấu ngoặc đơn trong dòng đầu tiên của R mã trong Hình 1 với vị trí tập tin riêng của bạn. Lưu ý rằng trong các dòng đầu tiên, chuyển tiếp slashes chứ không phải những dấu xồ nguợc được sử dụng để xác định vị trí tệp. Ví dụ dưới đây là một vị trí tệp trong Windows, nơi mà các dữ liệu nằm trong một tập tin gọi là newyork.csv trong thư mục được gọi là r trên các Ổ đĩa C. Dòng đầu tiên của mã đọc dữ liệu từ của bạn máy tính và đổi tên nó mydata. Dòng thứ hai làm cho những dữ liệu có sẵn trong R phiên hiện tại. Dòng thứ ba của mã dưới đây in biến tên gọi và các trường hợp đầu tiên mười trong tập dữ liệu. Chúng tôi làm điều này chỉ để kiểm tra dữ liệu thiết lập và hiểu những gì mỗi cột đại diện cho. mydata <-read.csv ("C:/r/newyork.csv") attach(mydata) mydata [1:10] Hình 1. Mã các ví dụ để nhập vào một tập hợp dữ liệu. Hình 2 cho thấy các kết quả của chạy các mã Hình 1. Nó cho thấy trường hợp đầu tiên mười trong tập dữ liệu và biến những gì được bao gồm trong các cột. Nó cho thấy Các cột từ trái sang phải là một số trường hợp (một số lượng id duy nhất cho mỗi trường), trường (tên của mỗi trường học), tot (tổng số sinh viên trong các trường học), min (tỷ lệ học sinh dân tộc thiểu số ở các trường học), dis (số lượng học sinh nhận được miễn phí hoặc

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Bước 3. Chuẩn bị và nạp dữ liệu.
Để thực hiện phù hợp với số xu hướng, bạn sẽ
cần một bộ dữ liệu bao gồm các trường hợp trong các hàng và
các biến trong cột. Bạn sẽ cần một nhóm các
biến và một hoặc kết hợp nhiều biến. Các
biến nhóm là biến mà xác định đó
nhóm một trường hợp thuộc về (ví dụ, điều trị hoặc điều khiển).
Các biến phù hợp là những người mà bạn muốn
cố gắng để cân bằng các nhóm trên. Ví dụ, trong các
bộ dữ liệu Falbe (2014), biến stw là nhóm
biến. Nó xác định xem một trường hợp cụ thể (một
trường) đã được chỉ định là một trường học để xem ©
trường (1) hay không (0). Các biến tot khác (trường
kích thước), min (tỷ lệ sinh viên dân tộc thiểu số trong
trường), và dis (tỷ lệ sinh viên nhận được miễn phí
ăn trưa và giảm) là các biến phù hợp. Các
số liệu chúng tôi sử dụng ở đây có thể được tải về từ
Randolph (2014a). Trong bộ dữ liệu của riêng bạn, hãy chắc chắn
rằng không có dữ liệu bị mất hoặc R có thể không có khả năng để
thực hiện các phân tích.
Mặc dù có chức năng nhập khẩu Excel,
SPSS, hoặc các định dạng dữ liệu khác vào R, chúng tôi đã tìm thấy nó là
thuận tiện nhất để tiết kiệm nó như là một tập tin .csv trước khi cố gắng để
nạp dữ liệu vào R. Khi bạn lưu các tập tin trong Excel,
bạn sẽ có tùy chọn để lưu nó như một tập tin .csv. Khi bạn
lưu các tập tin, lưu ý vị trí của nó.
Tiếp theo, bạn sẽ cần phải thay thế các vị trí tập tin
giữa các dấu ngoặc trong dòng đầu tiên của mã R trong
Hình 1 có vị trí tập tin riêng của bạn. Lưu ý rằng trong những
dòng đầu tiên, dấu gạch chéo chứ không phải là dấu chéo ngược được
sử dụng để xác định vị trí tập tin. Ví dụ dưới đây là một
vị trí tập tin trong Windows, nơi mà dữ liệu được đặt trong
một tập tin gọi là newyork.csv trong thư mục có tên r trên
ổ C. Các dòng mã đầu tiên đọc dữ liệu từ của bạn
máy tính và đặt lại tên cho nó mydata. Dòng thứ hai
làm cho những dữ liệu có sẵn trong phiên R hiện tại.
Dòng thứ ba của mã bên dưới in các biến
tên và mười trường hợp đầu tiên trong tập dữ liệu. Chúng tôi làm điều này
chỉ để kiểm tra các tập dữ liệu và hiểu những gì từng
cột đại diện.
Mydata <- read.csv ( "C: /r/newyork.csv")
đính kèm (mydata)
mydata [1:10,]
Hình 1. Mã ví dụ để nhập một tập dữ liệu.
Hình 2 cho thấy kết quả của việc chạy mã trong
Hình 1. Nó cho thấy mười trường hợp đầu tiên trong tập dữ liệu và
các biến thể được bao gồm trong các cột. Nó cho thấy
rằng các cột từ trái sang phải là số trường hợp
(một số id duy nhất cho mỗi trường), trường học (tên
của mỗi trường), tot (tổng số học sinh trong các
trường học), min (tỷ lệ thiểu số học sinh trong
trường), dis (số lượng sinh viên nhận được miễn phí hoặc

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.