Thế hệ Highlight Chúng tôi tạo điểm nhấn cho một tập kiểm tra 600 văn bản. Chúng tôi tạo ra và
570 giải quyết một ILP cho mỗi tài liệu. Câu đầu tiên đã được tokenized đến lời nói và dấu chấm câu riêng biệt, sau đó phân tích cú pháp để có được cụm từ và phụ thuộc như được mô tả trong phần 4 bằng cách sử dụng phân tích cú pháp Stanford (Klein và Manning, 2003). Đối với mỗi cụm từ, các tính năng được trích xuất và điểm nổi bật tính toán từ các trọng số tính năng xác định thông qua đào tạo SVM. Khoảng cách từ các siêu phẳng SVM đại diện cho số điểm nổi bật. Các mô hình ILP (xem phương trình (1)) được parametrized như sau: số lượng tối đa những điểm nổi bật NS là 4, giới hạn chiều dài tổng thể dài hạn là 75 thẻ, độ dài của mỗi nổi bật là trong khoảng [8,28] tokens và phạm vi bảo hiểm chủ đề thiết lập T chứa 5 từ tf.idf đầu. Những thông số đã được lựa chọn để chụp các tài sản nhìn thấy trong đa số các tập huấn luyện; họ cũng đã được nới lỏng, đủ để
cho phép một giải pháp khả thi của mô hình ILP (với những hạn chế cứng) cho tất cả các tài liệu trong tập kiểm tra. Để giải quyết các mô hình ILP chúng tôi sử dụng các phần mềm ZIB Optimization Suite (Achterberg, 2007; Koch, 2004; Wunderling, 1996). Giải pháp đã được chuyển đổi thành điểm nổi bật bằng cách kết hợp các nút lá được chọn theo thứ tự. Các vấn đề ILP chúng tôi tạo ra có trung bình 290 biến nhị phân và 380 constraints.The có nghĩa là giải quyết được thời gian 0,03 giây
đang được dịch, vui lòng đợi..
