Mục đích của diễn giả phân nhóm trong các hệ thống loa diarization là để kết hợp hoặc cụm
lại với nhau các phân đoạn từ loa cùng. Lý tưởng nhất, phân cụm này tạo một cụm
cho mỗi loa, với tất cả các phân khúc từ một người nói được đưa ra trong một cụm duy nhất. Các
cách tiếp cận chủ đạo được sử dụng trong các hệ thống được gọi là diarization agglomerative hierarchical
clustering (Theodoridis & Koutroumbas, 2003); nó bao gồm các bước sau đây (Tranter &
Reynolds, 2006):
đang được dịch, vui lòng đợi..