Identifying document pairs that are mutual translations of one another in large multilingual document collections is an important processing step in harvesting parallel bilingual data from web crawls.
Xác định các cặp tài liệu đang dịch lẫn nhau của nhau trong các bộ sưu tập lớn các tài liệu đa ngôn ngữ là một bước quan trọng xử lý trong thu hoạch song song song ngữ dữ liệu từ các trang web thu thập.
Xác định các cặp tài liệu có bản dịch chung với nhau trong bộ sưu tập tài liệu đa ngôn ngữ lớn là một bước xử lý quan trọng trong việc thu hoạch dữ liệu song ngữ song song từ trườn web.