Mục đích của công việc luận án này là để điều tra các thuật toán nhận dạng tiếng nói. Các tác giả
lập trình và mô phỏng các hệ thống được thiết kế cho các thuật toán nhận dạng tiếng nói trong
MATLAB. Có hai hệ thống được thiết kế trong luận án này. Một là dựa vào hình dạng
thông tin của các âm mưu tương quan chéo. Một trong những khác là sử dụng Wiener Filter để
thực hiện nhận dạng giọng nói. Các mô phỏng các hệ thống lập trình trong MATLAB được
thực hiện bằng cách sử dụng microphone để ghi lại những lời nói. Sau khi chạy
chương trình trong MATLAB, MATLAB sẽ yêu cầu người dùng ghi lại những lời ba lần. Việc đầu tiên
từ ghi và thứ hai là những từ khác nhau sẽ được sử dụng như là các tín hiệu tham chiếu trong
các hệ thống thiết kế. Từ ghi nhận thứ ba là cùng một từ như là một trong những lần đầu tiên hai
chữ ghi lại. Sau khi ghi âm từ, các từ sẽ trở thành thông tin của các tín hiệu đó
sẽ được lấy mẫu và lưu trữ trong MATLAB. Sau đó, MATLAB sẽ có thể cung cấp cho các phán quyết
rằng các từ đó được ghi lại ở lần thứ ba so với hai từ tham chiếu đầu tiên
theo các thuật toán lập trình trong MATLAB. Các tác giả mời những người khác nhau
từ các nước khác nhau để thử nghiệm các hệ thống thiết kế. Các kết quả mô phỏng cho cả hai
hệ thống được thiết kế cho thấy rằng hệ thống được thiết kế cả hai làm việc tốt khi hai tham chiếu đầu tiên
ghi âm và ghi hình lần thứ ba được ghi nhận từ cùng một người. Nhưng thiết kế
các hệ thống đều có những khuyết điểm khi hai ghi tham chiếu đầu tiên và lần thứ ba
ghi âm được ghi nhận từ những người khác nhau. Tuy nhiên, nếu môi trường thử nghiệm là yên tĩnh
đủ và loa là cùng một người cho ba ghi thời gian, công
suất của các phát biểu công nhận là phương pháp tiếp cận đến 100%. Như vậy, hệ thống được thiết kế để
thực sự làm việc tốt cho nhận dạng giọng nói basical.
Từ khóa: thuật toán, nhận dạng tiếng nói, MATLAB, ghi âm, Cross-tương quan,
Wiener Filter, chương trình, mô phỏng.
I
đang được dịch, vui lòng đợi..
