Bây giờ chúng tôi muốn chia para thành câu. Lần đầu tiên chúng ta cần phải nhập câu tokenizationchức năng, và sau đó chúng tôi có thể gọi nó với các đoạn văn như là đối sốsent_tokenize sử dụng một thể hiện của PunktSentenceTokenizer từ nltk.Mô-đun tokenize.Punkt. Trường hợp này đã được huấn luyện ngày và hoạt động tốt chonhiều ngôn ngữ châu Âu. Vì vậy, nó biết những gì các dấu chấm câu và ký tự đánh dấu sự kết thúc của mộtcâu và bắt đầu một câu mới.
đang được dịch, vui lòng đợi..