Mô hình ngôn ngữ lớn đã được chứng minh khá lợi cho một loạt các bài phát biểu tự động công nhận nhiệm vụ trong Google. Chúng tôi tóm tắt các kết quả tìm kiếm thoại và một vài YouTube nói sao chép nhiệm vụ để làm nổi bật những tác động mà người ta có thể mong đợi từ tăng cả hai số lượng dữ liệu đào tạo, và kích thước của các mô hình ngôn ngữ ước tính từ các dữ liệu đó. Tùy thuộc vào nhiệm vụ, tính khả dụng và lượng dữ liệu đào tạo sử dụng, ngôn ngữ mô hình kích thước và số lượng công việc và chăm sóc đưa vào tích hợp chúng trong lưới rescoring bước chúng tôi quan sát giảm tỷ lệ lỗi từ giữa 6% và 10% tương đối, cho các hệ thống trên một loạt các hoạt động điểm giữa 17% và52% từ tỷ lệ lỗi.
đang được dịch, vui lòng đợi..
