Sung. 1. Các khối xây dựng chính của một hệ thống loa diarization điển hình. Hầu hết các hệ thống đều có
các thành phần để thực hiện phát hiện lời nói, speaker- hay âm dựa trên phân khúc và
loa clustering, trong đó có thể bao gồm các thành phần để phát hiện giới tính và loa
nhận dạng.
đang được dịch, vui lòng đợi..