Xác định các cặp tài liệu đang dịch lẫn nhau của nhau trong các bộ sưu tập lớn các tài liệu đa ngôn ngữ là một bước quan trọng xử lý trong thu hoạch song song song ngữ dữ liệu từ các trang web thu thập. Tác vụ chia sẻ trên sắp xếp tài liệu song ngữ tại hội nghị đầu tiên về máy dịch thuật (WMT16) cung cấp một khuôn khổ chung để điều tra và so sánh các phương pháp tiếp cận để giải quyết vấn đề này:
đang được dịch, vui lòng đợi..