Kết hợp biểu tượng hoặc dấu chữ, giống như những người được tìm thấy trong Devanagari hoặc văn tự Ấn Độ, mà cần phải được kết hợp với các chính, nhân vật cơ bản có thể được xác định bởi người sử dụng trong một tập tin văn bản UTF-8, đặc biệt là dữ liệu / combiningsymbols.txt, được đọc bởi tạo TIFF / Hộp chức năng. Thiết lập này cung cấp cho người sử dụng sự linh hoạt trong việc xác định kết hợp biểu tượng / dấu cho các kịch bản ngôn ngữ của họ.
Đối với đào tạo tự động, hãy chắc chắn để xây dựng tất cả các file thực thi Tesseract cần thiết nếu cần thiết; Thực thi Windows đã được đi kèm với các chương trình. Đặt tất cả các tập tin dữ liệu đào tạo nguồn cần thiết, bắt đầu bằng một mã ngôn ngữ thích hợp, trong một thư mục chỉ định; mẫu kiểm tra thư mục cho các ví dụ. Quá trình đào tạo cũng có thể được tự động sử dụng train.ps1, một kịch bản Windows PowerShell.
đang được dịch, vui lòng đợi..
