Without a great deal of linguistic

Without a great deal of linguistic analysis, it
is possible to create summaries for a wide range
of documents. Unfortunately, extracts are often
documents of low readability and text quality
and contain much redundant information. This is
in marked contrast with hand-written summaries
which often combine several pieces of information
from the original document (Jing, 2002) and
exhibit many rewrite operations such as substitutions,
insertions, deletions, or reorderings.
Sentence compression is often regarded as a
promising first step towards ameliorating some of
the problems associated with extractive summarization.
The task is commonly expressed as a
word deletion problem. It involves creating a short
grammatical summary of a single sentence, by removing
elements that are considered extraneous,
while retaining the most important information
(Knight and Marcu, 2002). Interfacing extractive
summarization with a sentence compression module
could improve the conciseness of the generated
summaries and render them more informative
(Jing, 2000; Lin, 2003; Zajic et al., 2007).
Despite the bulk of work on sentence compression
and summarization (see Clarke and Lapata
2008 and Mani 2001 for overviews) only a handful
of approaches attempt to do both in a joint model
(Daume III and Marcu, 2002; Daum ´ e III, 2006; ´
Lin, 2003; Martins and Smith, 2009). One reason
for this might be the performance of sentence
compression systems which falls short of attaining
grammaticality levels of human output. For example,
Clarke and Lapata (2008) evaluate a range
of state-of-the-art compression systems across different
domains and show that machine generated
compressions are consistently perceived as worse
than the human gold standard. Another reason is
the summarization objective itself. If our goal is
to summarize news articles, then we may be better
off selecting the first n sentences of the document.
This “lead” baseline may err on the side of
verbosity but at least will be grammatical, and it
has indeed proved extremely hard to outperform
by more sophisticated methods (Nenkova, 2005).

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Mà không có một thỏa thuận tuyệt vời của ngôn ngữ phân tích, nócó thể tạo ra tóm lược cho một loạt cáctài liệu. Thật không may, chất chiết xuất từ thườngCác tài liệu của chất lượng thấp, dễ đọc và văn bảnvà chứa nhiều thông tin dự phòng. Điều này làđánh dấu trái ngược với viết tay tóm lượcmà thường kết hợp một số mẩu thông tintừ tài liệu gốc (Jing, 2002) vàtriển lãm nhiều hoạt động viết lại chẳng hạn như thay thế,Thêm vào, xóa, hoặc reorderings.Câu nén thường được coi là mộthứa hẹn bước đầu tiên hướng tới tăng một sốCác vấn đề liên quan đến khai khoáng tổng hợp.Nhiệm vụ thường được biểu thị dưới dạng mộtCác vấn đề xóa từ. Nó liên quan đến việc tạo ra một đoạn ngắnCác tóm tắt ngữ pháp của một câu duy nhất, bằng cách loại bỏyếu tố mà được coi là không liên quan,trong khi giữ lại các thông tin quan trọng nhất(Hiệp sĩ và Marcu, 2002). Interfacing extractiveTổng hợp với một mô-đun nén câucó thể cải thiện conciseness của việc tạo raTóm lược và làm cho họ nhiều thông tin hơn(Jing, năm 2000; Lin, 2003; Zajic et al., 2007).Mặc dù phần lớn các công việc trên câu nénvà tổng hợp (xem Clarke và Lapata2008 và Mani năm 2001 cho overviews) chỉ là một số ítphương pháp tiếp cận nỗ lực để làm cả hai trong một mô hình chung(Daume III và Marcu, 2002; Daum ´ e III, 2006; ´Lin, 2003; Martins và Smith, 2009). Một lý doĐối với điều này có thể là hiệu suất của câuHệ thống nén mà rơi ngắn của đạt đượcgrammaticality các cấp độ của con người ra. Ví dụ,Clarke và Lapata (2008) đánh giá rất nhiềuHệ thống nhà nước-of-the-nghệ thuật nén trên khác nhautên miền và hiển thị mà máy tạo ranén luôn coi là tồi tệ hơnso với các tiêu chuẩn vàng của con người. Một lý do làmục tiêu tổng hợp chính nó. Nếu mục tiêu của chúng tôi làđể tóm tắt tin tức bài viết, sau đó chúng tôi có thể tốt hơntắt chọn n câu đầu tiên của tài liệu.Này "dẫn" đường cơ sở có thể err trên mặt củaverbosity nhưng ít sẽ được về ngữ pháp, và nóthực sự đã chứng minh vô cùng khó khăn để tốt hơnbằng phương pháp phức tạp hơn (Nenkova, 2005).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Nếu không có một thỏa thuận tuyệt vời của phân tích ngôn ngữ, nó
có thể tạo ra bản tóm tắt cho một phạm vi rộng
các văn bản. Thật không may, chiết xuất thường
văn bản dễ đọc thấp và chất lượng văn bản
và chứa nhiều thông tin không cần thiết. Điều này là
trái ngược với bản tóm tắt viết tay
mà thường kết hợp một số thông tin
từ các tài liệu gốc (Jing, 2002) và
triển lãm nhiều hoạt động viết lại như thay thế,
chèn thêm, xóa, hoặc reorderings.
Nén Sentence thường được coi là một
hứa hẹn bước đầu tiên hướng tới việc cải thiện một số
vấn đề liên quan tổng kết khai thác.
Các nhiệm vụ thường được thể hiện như một
vấn đề xóa từ. Nó liên quan đến việc tạo ra một đoạn ngắn
tóm tắt ngữ pháp của một câu duy nhất, bằng cách loại bỏ
các yếu tố đó được coi là không liên quan,
trong khi giữ lại các thông tin quan trọng nhất
(Knight và Marcu, 2002). Interfacing khai thác
tổng hợp với một mô-đun nén câu
có thể cải thiện sự súc tích của tạo
tóm tắt và làm cho chúng nhiều thông tin hơn
(Jing, 2000; Lin, 2003;. Zajic et al, 2007).
Mặc dù phần lớn các công việc về câu nén
và tổng kết (xem Clarke và Lapata
2008 và Mani năm 2001 cho tổng quan) chỉ một số ít
các phương pháp cố gắng làm cả hai trong một mô hình doanh
(Daume III và Marcu, 2002; Daum 'e III, năm 2006;'
Lin, 2003; Martins và Smith, 2009). Một lý do
cho điều này có thể thực hiện các câu
hệ thống nén mà rơi ngắn đạt
mức grammaticality sản lượng của con người. Ví dụ,
Clarke và Lapata (2008) đánh giá hàng loạt
các nhà nước-of-the-nghệ thuật các hệ thống nén khác nhau trên
các lĩnh vực và cho thấy rằng máy tạo ra các
lần ép luôn được coi là tồi tệ hơn
so với tiêu chuẩn vàng của con người. Một lý do khác là
mục tiêu tổng kết chính nó. Nếu mục tiêu của chúng tôi là
để tóm tắt các bài báo, sau đó chúng ta có thể được tốt hơn
off chọn n câu đầu tiên của tài liệu.
Điều này "dẫn" đường cơ sở có thể sai lầm về phía của
rườm rà nhưng ít nhất sẽ có ngữ pháp, và nó
đã thực sự tỏ ra cực kỳ khó khăn để làm tốt hơn
bằng nhiều phương pháp tinh vi (Nenkova, 2005).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.