Thống kê dịch máy Công nghệ máy thống kê dịch sử dụng mô hình dịch thống kê mà các tham số xuất phát từ sự phân tích của corpora đơn ngữ và song ngữ. Xây dựng mô hình dịch thống kê là một quá trình nhanh chóng, nhưng công nghệ này dựa chủ yếu vào corpora đa ngôn ngữ hiện có. Một tối thiểu là 2 triệu chữ cho một tên miền cụ thể và thậm chí nhiều hơn cho ngôn ngữ chung là bắt buộc. Về mặt lý thuyết có thể đạt tới ngưỡng chất lượng nhưng hầu hết các công ty không có số lượng lớn như vậy của corpora đa ngôn ngữ hiện có để xây dựng các mô hình dịch cần thiết. Ngoài ra, dịch máy thống kê là CPU chuyên sâu và đòi hỏi một cấu hình phần cứng rộng rãi để chạy mô hình dịch cho mức hiệu suất trung bình.
đang được dịch, vui lòng đợi..
