Mà không có một thỏa thuận tuyệt vời của ngôn ngữ phân tích, nócó thể tạo ra tóm lược cho một loạt cáctài liệu. Thật không may, chất chiết xuất từ thườngCác tài liệu của chất lượng thấp, dễ đọc và văn bảnvà chứa nhiều thông tin dự phòng. Điều này làđánh dấu trái ngược với viết tay tóm lượcmà thường kết hợp một số mẩu thông tintừ tài liệu gốc (Jing, 2002) vàtriển lãm nhiều hoạt động viết lại chẳng hạn như thay thế,Thêm vào, xóa, hoặc reorderings.Câu nén thường được coi là mộthứa hẹn bước đầu tiên hướng tới tăng một sốCác vấn đề liên quan đến khai khoáng tổng hợp.Nhiệm vụ thường được biểu thị dưới dạng mộtCác vấn đề xóa từ. Nó liên quan đến việc tạo ra một đoạn ngắnCác tóm tắt ngữ pháp của một câu duy nhất, bằng cách loại bỏyếu tố mà được coi là không liên quan,trong khi giữ lại các thông tin quan trọng nhất(Hiệp sĩ và Marcu, 2002). Interfacing extractiveTổng hợp với một mô-đun nén câucó thể cải thiện conciseness của việc tạo raTóm lược và làm cho họ nhiều thông tin hơn(Jing, năm 2000; Lin, 2003; Zajic et al., 2007).Mặc dù phần lớn các công việc trên câu nénvà tổng hợp (xem Clarke và Lapata2008 và Mani năm 2001 cho overviews) chỉ là một số ítphương pháp tiếp cận nỗ lực để làm cả hai trong một mô hình chung(Daume III và Marcu, 2002; Daum ´ e III, 2006; ´Lin, 2003; Martins và Smith, 2009). Một lý doĐối với điều này có thể là hiệu suất của câuHệ thống nén mà rơi ngắn của đạt đượcgrammaticality các cấp độ của con người ra. Ví dụ,Clarke và Lapata (2008) đánh giá rất nhiềuHệ thống nhà nước-of-the-nghệ thuật nén trên khác nhautên miền và hiển thị mà máy tạo ranén luôn coi là tồi tệ hơnso với các tiêu chuẩn vàng của con người. Một lý do làmục tiêu tổng hợp chính nó. Nếu mục tiêu của chúng tôi làđể tóm tắt tin tức bài viết, sau đó chúng tôi có thể tốt hơntắt chọn n câu đầu tiên của tài liệu.Này "dẫn" đường cơ sở có thể err trên mặt củaverbosity nhưng ít sẽ được về ngữ pháp, và nóthực sự đã chứng minh vô cùng khó khăn để tốt hơnbằng phương pháp phức tạp hơn (Nenkova, 2005).
đang được dịch, vui lòng đợi..
