Chúng tôi trình bày ba hệ thống cho bề mặt thế hệ ngôn ngữ tự nhiên mà có thể đào tạo được từ corpora chú thích. Hai hệ thống đầu tiên, được gọi là NLG1 và NLG2, đòi hỏi một ngữ đánh dấu chỉ với tên miền thuộc tính ngữ nghĩa cụ thể, trong khi hệ thống cuối cùng, gọi là NLG3, đòi hỏi một ngữ đánh dấu với cả hai thuộc tính ngữ nghĩa và thông tin phụ thuộc cú pháp. Tất cả các hệ thống cố gắng để tạo ra một cụm từ ngôn ngữ tự nhiên ngữ pháp từ một đại diện ngữ nghĩa tên miền cụ thể. NLG1 phục vụ một hệ thống cơ bản và sử dụng tần số cụm từ để tạo ra cả một cụm từ trong một bước, trong khi NLG2 và NLG3 sử dụng mô hình entropy xác suất tối đa để tạo ra các cá nhân mỗi từ trong các cụm từ. Các hệ thống NLG2 và NLG3 tìm hiểu để xác định cả hai lựa chọn từ và trật tự từ trong các cụm từ. Chúng tôi trình bày thí nghiệm mà chúng ta tạo ra cụm từ để mô tả các chuyến bay trong lĩnh vực du lịch hàng không
đang được dịch, vui lòng đợi..