• Lặp đi lặp lại dấu chấm câu bình thường.
Trong bước đầu tiên của tiền xử lý, chúng tôi phát hiện lặp đi lặp lại các dấu hiệu chấm (".", "!"
Và "?"). Nhiều dấu chấm câu liên tiếp
có dấu hiệu được thay thế với các nhãn "nhiều pha", cho các điểm dừng đầy đủ, "multiexclamation"
trong trường hợp các dấu chấm than và "multiquestion" cho những dấu hỏi và không gian
trước và sau.
đang được dịch, vui lòng đợi..