Công việc của riêng của chúng tôi là gần gũi nhất với Martins và Smith (2009). Chúng tôi cũng phát triển một nén ILP dựa trên
và tổng kết mô hình, tuy nhiên, một số khác biệt quan trọng thiết lập phương pháp tiếp cận của chúng tôi xa nhau. Thứ nhất,
lựa chọn nội dung được thực hiện tại các cụm từ chứ không phải là câu. Thứ hai, sự kết hợp của cụm từ và sự phụ thuộc thông tin vào một cấu trúc dữ liệu duy nhất là mới, và quan trọng trong việc cho phép chúng tôi bày tỏ grammaticality như những hạn chế trên toàn
phụ thuộc cụm từ, chứ không phải dùng đến một mô hình lan-ngôn. Cuối cùng, mô hình của chúng tôi là nhỏ gọn hơn, có các tham số ít, và không đòi hỏi hai quy trình đào tạo. Cách tiếp cận của chúng tôi mang một số điểm tương đồng với hệ tiêu đề (Dorr et al, 2003;.. Banko et al, 2000), mặc dù chúng tôi ra vài câu chứ không phải là duy nhất. Mô hình Headlinegeneration thường trích xuất từ cá nhân từ một tài liệu để sản xuất một bản tóm tắt rất ngắn, trong khi chúng tôi trích cụm từ và đảm bảo rằng chúng được kết hợp vào câu ngữ pháp
thông qua ILP constraints.Svore chúng tôi et al. (2007) là người đầu tiên để làm nổi bật
những nhiệm vụ thế hệ nổi bật mà chúng tôi áp dụng như là một thử nghiệm đánh giá cho mô hình của chúng tôi. Tuy nhiên cách tiếp cận của họ là một trong những đơn thuần khai khoáng. Sử dụng một thuật toán dựa trên các mạng thần kinh và các nguồn lực của bên thứ ba (ví dụ, các bản ghi truy vấn thông tin và Wikipedia mục) họ xếp hạng các câu và chọn ba cái chấm điểm cao nhất là câu chuyện nổi bật. Ngược lại, chúng tôi nhằm mục đích để tạo ra chứ không phải chiết xuất nổi bật.
Như là một bước đầu tiên, chúng tôi tập trung vào việc xóa tài liệu không liên quan, nhưng các thao tác phức tạp hơn viết lại khác (ví dụ, Cohn và Lapata 2009) có thể được đưa
vào khuôn khổ của chúng tôi
đang được dịch, vui lòng đợi..