In order to train and evaluate the

In order to train and evaluate the model presented
in the following sections we created a corpus
of document-highlight pairs (approximately
9,000) which we downloaded from the CNN.com
website.1 The articles were randomly sampled
from the years 2007–2009 and covered a wide
range of topics such as business, crime, health,
politics, showbiz, etc. The majority were news
articles, but the set also contained a mixture of
editorials, commentary, interviews and reviews.
Some overview statistics of the corpus are shown
in Table 2. Overall, we observe a high degree of
compression both at the document and sentence
level. The highlights summary tends to be ten
times shorter than the corresponding article. Furthermore,
individual highlights have almost half
the length of document sentences.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Để đào tạo và đánh giá các mô hình trình bàytrong các phần sau chúng tôi tạo ra một corpuscủa tài liệu nổi bật cặp (khoảng9.000) mà chúng tôi tải về từ CNN.comWebsite.1 các bài viết đã được lấy mẫu ngẫu nhiêntừ năm 2007-2009 và bao phủ rộngphạm vi của các chủ đề như kinh doanh, tội phạm, y tế,chính trị, showbiz, vv. Phần lớn đã là tin tứcBài viết, nhưng các thiết lập cũng chứa một hỗn hợp củabài xã luận, bình luận, phỏng vấn và đánh giá.Một số số liệu thống kê tổng quan của các văn thể được hiển thịtrong bảng 2. Nói chung, chúng tôi quan sát một mức độ cao củanén cả ở các tài liệu và câucấp độ. Tóm tắt điểm nổi bật có xu hướng là mườilần ngắn hơn so với bài viết tương ứng. Hơn nữa,điểm nổi bật cá nhân có gần một nửachiều dài của tài liệu câu.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Để đào tạo và đánh giá các mô hình được trình bày
trong các phần sau chúng tôi tạo ra một corpus
của cặp tài liệu-highlight (khoảng
9.000) mà chúng ta tải về từ CNN.com
website.1 Các bài báo đã được lấy mẫu ngẫu nhiên
từ năm 2007-2009 và được bảo hiểm một rộng
phạm vi của các chủ đề như kinh doanh, tội phạm, y tế,
chính trị, showbiz, vv Phần lớn là tin tức
bài viết, nhưng các thiết lập cũng chứa một hỗn hợp của
các bài xã luận, bình luận, phỏng vấn và đánh giá.
Một số thống kê tổng quan về corpus được thể hiện
trong Bảng 2. Nhìn chung, chúng ta quan sát một mức độ cao của
nén cả các tài liệu và câu
mực. Các điểm nổi bật tóm tắt xu hướng được mười
ngắn hơn lần so với các điều luật tương ứng. Hơn nữa,
điểm nổi bật riêng có gần một nửa
chiều dài của câu văn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.