Bước đầu tiên là xác định các thiết lập đầy đủ ký tự được sử dụng, và chuẩn bị một văn bản hoặc tập tin từ bộ vi xử lý có chứa một tập hợp các ví dụ. Những điểm quan trọng nhất cần nhớ khi tạo một tập tin được đào tạo:
• Hãy chắc chắn rằng có một số lượng tối thiểu của mẫu của mỗi nhân vật. 10 là tốt, nhưng 5 là OK cho các nhân vật hiếm.
• Nên có nhiều mẫu của các nhân vật thường xuyên hơn - ít nhất là 20.
• Đừng làm cho sai lầm của nhóm tất cả các phi chữ cái với nhau. Làm cho văn bản thực tế hơn. Ví dụ, The quick brown fox jumps over the lazy dog. 0123456789! @ # $% ^ & (),. {} <> /? là khủng khiếp. Tốt hơn nhiều là The (nhanh) nâu {} fox nhảy! trên $ 3,456.78# 90 con chó và vịt / ngỗng, như 12,5% của E-mail từ aspammer@website.com là thư rác? Điều này cho phép mã phát hiện textline một cơ hội tốt hơn để nhận được các số liệu cơ sở hợp lý cho các ký tự đặc biệt
đang được dịch, vui lòng đợi..
