• Lặp đi lặp lại bình thường hóa dấu chấm câu.Trong bước đầu tiên của các tiền xử lý, chúng tôi phát hiện lặp lại của dấu chấm câu dấu hiệu (".","!"và "?"). Nhiều dấu chấm câu liên tiếpdấu hiệu được thay thế bằng các nhãn "multistop", cho fullstops, "multiexclamation"trong trường hợp của "multiquestion" cho các dấu chấm hỏi và không gian và dấu chấm thantrước và sau khi.
đang được dịch, vui lòng đợi..
