Tóm tắtTrong bài này chúng tôi trình bày một nội dung chungMô hình lựa chọn và nénĐối với đơn-tài liệu tổng hợp. CácMô hình hoạt động trong một đại diện dựa trên cụm từnguồn tài liệu màchúng tôi có được bằng việc sáp nhập các thông tin từPCFG phân tích cây và đồ thị phụ thuộc.Bằng cách sử dụng một số nguyên tuyến tính lập trình xây dựng,Các mô hình học để chọn vàkết hợp cụm từ tùy thuộc vào chiều dài, phạm vi bảo hiểmvà ngữ pháp hạn chế. Chúng tôi đánh giácách tiếp cận vào công việc tạo ra"câu chuyện nổi bật"-một số lượng nhỏcâu ngắn, khép cho phépcác độc giả để nhanh chóng thu thập thông tin vềcâu chuyện tin tức. Hiển thị kết quả thử nghiệmCác mô hình của sản lượng là tương đương vớiviết lưu con người nổi bật trong điều khoản của cả haigrammaticality và nội dung.1 giới thiệuTổng hợp là quá trình ngưng tụ mộtnguồn gốc văn bản vào một phiên bản ngắn hơn trong khi bảo quảnnội dung thông tin của nó. Con người tóm tắt vàomột cơ sở hàng ngày và dễ dàng, nhưng sản xuất caochất lượng tóm tắt tự động vẫn là một thách thức.Khó khăn nằm chủ yếu trong thiên nhiêncủa công việc mà rất phức tạp, phải đáp ứng nhiềunhững hạn chế (ví dụ, độ dài tóm tắt, informativeness,tính mạch lạc, grammaticality) và cuối cùngđòi hỏi sự hiểu biết văn bản rộng phạm vi bảo hiểm. Kể từsau đó là vượt ra ngoài khả năng của hiện tại NLPcông nghệ, hầu hết làm việc ngày hôm nay tập trung vào extractiveTổng hợp, nơi một bản tóm tắt được tạo ra chỉ đơn giản làbằng cách xác định và sau đó ghépthe most important sentences in a document.
đang được dịch, vui lòng đợi..