Đối với mỗi Türker, chúng tôi đánh giá điểm F1 trung bình của mình vào những lời nói vàng và loại bỏ các chú thích bằng turkers với số điểm F1 dưới 0,5. Chúng tôi sau đó so sánh hai chú thích cho mỗi lời nói và nhãn lựa chọn đồng ý của cả hai turkers. Trong trường hợp tranh chấp, chúng ta chọn nhãn bởi Türker với F1 cao nhất được giao. Điều này mang lại tổng cộng 9.971 lời phát biểu được chú thích (510K thẻ). Hiệp định liên Annotator giữa turkers tính toán sử dụng κ Cohen [22] là .72.5
đang được dịch, vui lòng đợi..
