Hình 5. Cấu hình và các tính năng hình học của môi Để loại bỏ tình cảm của người nói khác nhau, tất cả các tính năng hình ảnh đều được chuẩn hoá bằng trừ các tính năng hình ban đầu khung tương ứng. Để mô tả các tính năng hình ảnh năng động, chúng tôi trích xuất hệ delta và gia tốc của thị giác cơ bản tính năng. Cùng lúc đó, các tính năng trực quan được chiết xuất tại 25Hz, kể từ khi các tính năng âm thanh được chế biến tại 100Hz, và các tính năng visual linearly interpolated để làm cho họ xảy ra tại tỷ lệ khung hình giống như các tính năng âm thanh. Hoàn toàn, các kích thước 60 môi hình học tính năng thu được.
đang được dịch, vui lòng đợi..