Chúng tôi báo cáo kết quả về công tác thế hệ nổi bật
trong hình 3 với ROUGE-1 và ROUGE-L (lỗi
thanh chỉ ra các khoảng tin cậy 95%). Trong
cả hai biện pháp, các cơ sở câu ILP có
hồi tốt nhất, trong khi mô hình cụm từ ILP có
độ chính xác tốt nhất (có sự khác biệt ý nghĩa thống kê).
F-score là cao hơn cho các cụm từ dựa trên
hệ thống nhưng không đáng kể. Điều này có thể là do
thực tế là các đầu ra còn các
mô hình dựa trên câu làm cho nhiệm vụ thu hồi dễ dàng hơn.
Độ dài trung bình nổi bật được thể hiện trong Bảng 3,
và tỷ lệ nén mà họ đại diện. Chúng tôi
mô hình cụm đạt được nén cao nhất
giá, trong khi mô hình câu dựa trên xu hướng
chọn câu dài ngay cả khi so sánh với các
cơ sở dẫn. Mô hình câu ILP nhanh hơn so với
các cơ sở dẫn đầu với sự tôn trọng gọi lại nhưng
không chính xác hoặc F-score. Các cụm từ ILP đạt được
một F-score tốt hơn đáng kể trên đường cơ sở dẫn
với cả ROUGE-1 và ROUGE-L.
đang được dịch, vui lòng đợi..
