Làm nổi bật thế hệ chúng tôi tạo ra điểm nổi bật cho một thử nghiệm của 600 tài liệu. Chúng tôi tạo ra và570 giải quyết một ILP cho mỗi tài liệu. Câu được đầu tiên tokenized để tách từ và dấu chấm câu, sau đó phân tích cú pháp để có được các cụm từ và phụ thuộc như mô tả trong phần 4 bằng cách sử dụng phân tích cú pháp Stanford (Klein và Manning, 2003). Đối với mỗi cụm từ, tính năng đã được chiết xuất và nhô điểm tính từ trọng lượng tính năng xác định thông qua đào tạo SVM. Khoảng cách từ SVM hyperplane đại diện cho các điểm số nhô. Các mô hình ILP (xem phương trình (1)) là parametrized như sau: số điểm nổi bật NS, tối đa là 4, giới hạn tổng thể về chiều dài LT là 75 thẻ, chiều dài của mỗi điểm nổi bật là trong phạm vi của thẻ [8,28], và các thiết lập bảo hiểm chủ đề T bên top 5 tf.idf từ. Các tham số được chọn để nắm bắt các thuộc tính được thấy trong đa số tập huấn luyện; họ cũng được thoải mái, đủ đểcho phép một giải pháp khả thi của các mô hình ILP (với khó khăn) cho tất cả các tài liệu trong các thiết lập thử nghiệm. Để giải quyết các mô hình ILP chúng tôi sử dụng phần mềm ZIB tối ưu hóa mật (Achterberg, 2007; Koch, năm 2004; Wunderling, 1996). Các giải pháp đã được chuyển thành điểm nổi bật bởi ghép các nút lá được lựa chọn theo thứ tự. Những vấn đề ILP chúng tôi tạo ra có trung bình 290 biến nhị phân và 380 hạn chế. Có nghĩa là giải quyết thời gian là 0,03 giây
đang được dịch, vui lòng đợi..