Mô hình ngôn ngữ lớn đã được chứng minh là hoàn toàn có lợi cho một loạt các nhiệm vụ nhận dạng giọng nói tự động trong Google. Chúng tôi tóm tắt kết quả trên Voice Search và một số tác vụ sao chép bài phát biểu YouTube để làm nổi bật tác động mà người ta có thể mong đợi từ tăng cả số lượng dữ liệu đào tạo, và kích thước của các mô hình ngôn ngữ ước lượng từ dữ liệu đó. Tùy thuộc vào công việc, sẵn sàng và số lượng dữ liệu đào tạo sử dụng, kích thước mô hình ngôn ngữ và số lượng công việc và chăm sóc đưa vào lồng ghép trong các bước lưới rescoring chúng ta quan sát giảm tỷ lệ lỗi từ giữa 6% và 10% tương đối, cho các hệ thống trên loạt các điểm hoạt động giữa 17% và
52% tỷ lệ lỗi từ.
đang được dịch, vui lòng đợi..
