sent_tokenize sử dụng một thể hiện của PunktSentenceTokenizer từ nltk.Mô-đun tokenize.Punkt. Trường hợp này đã được huấn luyện ngày và hoạt động tốt chonhiều ngôn ngữ châu Âu. Vì vậy, nó biết những gì các dấu chấm câu và ký tự đánh dấu sự kết thúc của mộtcâu và bắt đầu một câu mới.
đang được dịch, vui lòng đợi..
