2. Biện pháp Similarity: tính khoảng cách từng đôi giữa mỗi cụm;
3. Sáp nhập bước:
a. sáp nhập các cụm gần nhau nhất;
b. cập nhật các khoảng cách của các cụm còn lại để các cluster mới;
4. Dừng tiêu chí:. Lặp bước 3 cho đến khi một số tiêu chí dừng lại được gặp
các vấn đề chính liên quan đến việc tiếp cận loa-clustering trên bao gồm việc lựa chọn một
biện pháp tương tự thích hợp, cơ quan đại diện thích hợp của các dữ liệu cụm và tìm kiếm một
điều kiện dừng thích hợp. Các dữ liệu âm thanh được sử dụng cho các cụm loa được nói chung
đại diện bởi các tính năng âm thanh gồm: hoặc mel tần số hệ số Cepstral
(MFCCs) hoặc hệ số tuyến tính dự đoán điểm tri giác (PLPCs), (Picone, 1993). Các cụm
dữ liệu được đại diện bởi các tính năng này sau đó thường mô phỏng theo các phân phối Gaussian, và
các biện pháp tương tự kết quả được tính như các chức năng khả năng từ những mô hình (Moh et al, 2000;. Reynolds & Torres-Carrasquillo, 2004;. Sinha et al, 2005). Nhất
cách tiếp cận phổ biến là đại diện cho các cụm bởi đơn đầy đủ-hiệp phương sai Gaussian
phân phối, trong khi đối với sự giống nhau đo một tiêu chí thông tin Bayes được sử dụng
(Chen & Gopalakrishnan, 1999). Đối với hiệu suất tốt của phân nhóm, các dừng
tiêu chí cũng cần phải được lựa chọn đúng. Một điều kiện dừng thích hợp nên kết thúc các
quá trình hợp nhất vào thời điểm mà các dữ liệu âm thanh từ mỗi loa được tập trung chủ yếu
trong một cluster, và nói chung nó được đặt theo một biện pháp tương tự và cụm mô hình
được sử dụng trong quá trình hợp nhất của loa clustering.
đang được dịch, vui lòng đợi..