Chúng tôi trình bày ba hệ thống cho các bề mặt tự nhiên ngữ
hệ ngôn đó là khả năng huấn luyện từ chú thích
corpora. Hai hệ thống đầu tiên, được gọi là NLG1 và
NLG2, đòi hỏi một ngữ đánh dấu chỉ với, lĩnh vực
thuộc tính ngữ nghĩa cụ thể, trong khi hệ thống cuối cùng,
gọi là NLG3, đòi hỏi một ngữ đánh dấu với cả hai
thuộc tính ngữ nghĩa và cú pháp phụ thuộc tin
thông. Tất cả các hệ thống cố gắng để sản xuất một grammat-
cụm từ ngôn ngữ tự nhiên ical từ một tên miền cụ thể
đại diện ngữ nghĩa. NLG1 phục vụ một cơ sở
hệ thống và sử dụng tần số cụm từ để tạo ra một
toàn bộ cụm từ trong một bước, trong khi NLG2 và NLG3
sử dụng mô hình entropy xác suất tối đa để indi-
vidually tạo ra mỗi từ trong các cụm từ. Các thống
tems NLG2 và NLG3 tìm hiểu để xác định cả hai
lựa chọn từ và trật tự từ trong các cụm từ. Chúng tôi
trình bày thí nghiệm mà chúng ta tạo ra cụm từ để
mô tả các chuyến bay trong lĩnh vực du lịch hàng không.
đang được dịch, vui lòng đợi..
