3 thí nghiệm
Phần này trình bày các thí nghiệm về chuẩn
FB15K giới thiệu trong (Bordes et al., 2013)
và gia đình, một phiên bản hơi mở rộng của các
cơ sở dữ liệu nhân tạo được mô tả trong (Garc'ıa-Duran et
'al., 2014). Bảng 1 đưa ra thống kê của họ.
3.1 nghiệm giao thức
dữ liệu FB15K là một tập hợp con của Freebase, rất
cơ sở dữ liệu lớn các sự kiện chung chung thu thập hơn
1,2 tỷ gấp ba và 80 triệu đơn vị. Lấy cảm hứng
bởi (Hinton, 1986), Gia đình là một cơ sở dữ liệu
chứa gấp ba bày tỏ mối quan hệ gia đình
(anh họ của, có tổ tiên, lập gia đình, mẹ của,
liên quan đến, em ruột của người, chú của) giữa các thành viên
của 5 gia đình cùng 6 thế hệ. Bộ dữ liệu này
là nhân tạo và mỗi gia đình được tổ chức trong một lớp
cấu trúc cây trong đó mỗi lớp đề cập đến một thế hệ.
Các gia đình được kết nối giữa chúng bằng cách
liên kết hôn nhân giữa hai thành viên, ngẫu nhiên
được lấy mẫu từ cùng một lớp của các gia đình khác nhau.
Điều thú vị về số liệu này, có là rõ ràng
mối quan hệ thành phần như chú của ≈
em ruột của + mẹ của cha, mẹ của ≈ kết hôn với
+ mẹ, trong số những người khác.
Thiết so sánh chính của chúng tôi là Transe vì vậy chúng tôi
theo các thiết lập thí nghiệm tương tự như trong (Bordes
et al., 2013), sử dụng số liệu bảng xếp hạng để đánh giá.
Đối với mỗi bài kiểm tra ba chúng tôi thay thế người đứng đầu
của mỗi thực thể trong lần lượt, và sau đó tính
số điểm của mỗi của các ứng cử viên và sắp xếp
chúng. Kể từ khi ứng cử viên tích cực khác (tức là thực thể
tạo thành bộ ba true) có thể được xếp hạng cao hơn so với
một mục tiêu, chúng tôi lọc ra tất cả các ứng cử viên tích cực
hiện tại hoặc là đào tạo, xác nhận và
kiểm tra bộ, ngoại trừ một trong những mục tiêu, từ các bảng xếp hạng
và sau đó chúng tôi giữ cấp bậc của các thực thể mục tiêu. Các
thủ tục tương tự được lặp đi lặp lại nhưng loại bỏ các đuôi
thay vì đầu. Các cấp bậc bình lọc (có nghĩa là
thứ hạng trong phần còn lại) là trung bình của các cấp bậc, và
Hits lọc @ 10 (H @ 10 trong phần còn lại) là tỷ lệ
của các đơn vị mục tiêu trong 10 dự đoán hàng đầu.
Các kích thước nhúng được thiết lập để 20 cho
gia đình và 100 cho FB15K. Đào tạo được thực hiện
bởi stochastic gradient descent, dừng lại
sau khi cho 500 kỷ nguyên. Trên FB15K, chúng tôi sử dụng các
embeddings của Transe để khởi tạo RTRANSE,
và chúng tôi thiết lập một tỷ lệ học tập của 0.001 để tinh chỉnh
RTRANSE. Trên FAMILY, cả hai thuật toán đã được khởi tạo
ngẫu nhiên và được sử dụng một tỷ lệ học của 0,01.
Việc xếp hạng trung bình đã được sử dụng như một tiêu chuẩn xác nhận,
và các giá trị của γ, λ, α và μ được chọn tương ứng
trong số {0.25, 0.5, 1}, { 1e
-4, 1e -5, 0}, {0,1, 0,05, 0,1, 0,01, 0,005} và {1e -4, 1e -5, 0}.
đang được dịch, vui lòng đợi..
