Summarization Để kiểm tra tính tổng quát
của mô hình của chúng tôi và so sánh với trước đây
làm việc, chúng tôi cũng đánh giá hệ thống của chúng tôi về một vanilla
nhiệm vụ tổng kết. Cụ thể, chúng tôi sử dụng các
mô hình tương tự (được đào tạo trên corpus CNN) để tạo ra
bản tóm tắt cho các corpus2
ĐỨC-2002. Chúng tôi
báo cáo kết quả trên toàn bộ số liệu và trên một tập hợp con
chứa 140 tài liệu. Đây là cùng một phân vùng
được sử dụng bởi Martins và Smith (2009) để đánh giá
ILP model.3 họ
Đường cơ sở Chúng tôi so sánh đầu ra của mô hình của chúng tôi
để hai đường cơ sở. Người đầu tiên chỉ đơn giản là lựa chọn
các "hàng đầu" ba câu từ mỗi tài liệu
(không có bất kỳ nén). Các cơ sở thứ hai
là sản phẩm của một mô hình dựa trên câu ILP, tương tự
cho chính chúng ta, nhưng đơn giản hơn. Mô hình này được đưa ra
trong (2). Các biến quyết định nhị phân x ∈ {0,1}
| S |
doanh nghiệp đại diện cho câu, và fi
số điểm nổi bật
cho mỗi câu. Mục tiêu lại là tối đa hóa
tổng số điểm, nhưng bây giờ chỉ tuân
tf.idf bảo hiểm (2b) và một giới hạn về số lượng các điểm nổi bật (2c) mà chúng tôi đặt lên 3. Không có
chiều dài câu hay grammaticality hạn chế, như
có không nén câu
đang được dịch, vui lòng đợi..