Một khi chúng ta đã giải quyết một hệ thống ban đầu, chúng tôi bắt đầu thu thập dữ liệu cho việc đào tạo
và thử nghiệm. Đối với ghi nhãn chúng ta có hai lựa chọn: giám sát ghi nhãn, nơi
chúng tôi phải trả transcribers con người để viết những gì được nghe thấy trong lời phát biểu, và
ghi nhãn không có giám sát mà chúng tôi dựa vào các số liệu tin cậy từ recognizer
và các bộ phận khác của hệ thống cùng với những hành động của người sử dụng
để lựa chọn lời phát biểu mà chúng tôi nghĩ rằng kết quả công nhận là có khả năng là
chính xác. Chúng tôi bắt đầu với việc học có giám sát, tích cực chuyển dữ liệu
cho đào tạo, và sau đó di chuyển về phía học không giám sát như giao thông
tăng lên.
đang được dịch, vui lòng đợi..