Chương 22 đã cho chúng tôi một mô hình hợp lý của ngôn ngữ: chúng tôi sử dụng CFGs và DCGs để mô tả một chuỗi như là một thành viên hoặc một nonmember của một ngôn ngữ. Trong phần này, chúng tôi sẽ giới thiệu một số mô hình xác suất. Xác suất các mô hình có một số lợi thế. Họ có thể thuận tiện được đào tạo từ dữ liệu: học tập là chỉ là một vấn đề tính xuất hiện (với một số khoản phụ cấp đối với các lỗi của dựa vào một kích thước mẫu nhỏ). Ngoài ra, họ là mạnh mẽ hơn (vì họ có thể chấp nhận bất kỳ chuỗi, mặc dù với một xác suất thấp), họ phản ánh một thực tế là không phải 100% người sử dụng đồng ý mà câu là thực sự là một phần của một ngôn ngữ, và họ có thể được sử dụng để định hướng: xác suất có thể được sử dụng để lựa chọn các giải thích có khả năng nhất.Một mẫu xác suất ngôn ngữ định nghĩa một phân bố xác suất hơn một bộ dây (có thể là vô hạn). Ví dụ các mô hình mà chúng tôi đã nhìn thấy những mô hình ngôn ngữ bigram và trigram được sử dụng trong bài phát biểu công nhận (phần 15.6). Một mô hình unigram gán một xác suất P(w) cho mỗi từ trong lexicon. Mô hình giả định rằng từ được lựa chọn một cách độc lập, do đó, xác suất của một chuỗi là chỉ là sản phẩm của xác suất của nó từ, được đưa ra bởi ni P(wi). Theo trình tự 20-word đã được tạo ra ngẫu nhiên từ một mô hình unigram trong những từ ngữ trong cuốn sách này
đang được dịch, vui lòng đợi..