Bạn sẽ cần phải cung cấp các tập tin TIFF/hộp như đầu vào để trình biên tập. Các hình ảnh được sử dụng trong việc đào tạo cần 300 DPI và 1 bpp (bit / pixel) đen & màu trắng hoặc 8 bpp màu xám không nén TIFF định dạng; tập tin hộp, mã hóa ở định dạng UTF-8, được tạo ra bởi Tesseract thực thi với các tùy chọn dòng lệnh thích hợp (xem Tesseract đào tạo Wiki). Hoặc cả hai đều có thể được tạo ra bằng cách sử dụng các máy phát điện TIFF/hộp được xây dựng trong.Lưu ý rằng hệ thống phối hợp được sử dụng trong các tập tin hộp có (0,0) tại phía dưới bên trái; trên máy tính đồ họa động, Tuy nhiên, (0,0) được định nghĩa là trên bên trái. jTessBoxEditor sử dụng và hiển thị trong tọa độ thiết bị đồ họa. Các tập tin hộp chỉnh sửa vẫn được đọc và viết bằng định dạng thích hợp. Các máy phát điện sản xuất, cho một nhất định UTF-8 văn bản tập tin đầu vào, một cặp TIFF/hộp của tập tin phù hợp với đào tạo với Tesseract. Hình ảnh được tạo ra là, tùy thuộc vào chế độ chống răng cưa được kích hoạt, một màu xám nhị phân hoặc 8-bpp, không nén TIFF nhiều trang với độ phân giải 300 DPI. Tiếng ồn (tùy chọn) có thể được thêm vào hình ảnh, mà có thể dẫn đến dữ liệu trainned tốt hơn. Theo dõi thư, hoặc khoảng cách giữa các ký tự, có thể được điều chỉnh để loại bỏ các giáp ranh hộp chồng chéo vấn đề. Lưu ý rằng một số hộp có thể là hơi khác nhau (bởi 1 hoặc 2 điểm ảnh) từ những người nào có được tạo ra bởi Tesseract chính nó; Tuy nhiên, các tập tin tạo ra hộp có thể được sử dụng để xác nhận một tạo bởi Tesseract với việc sử dụng một Unicode tương thích tập tin so sánh công cụ, chẳng hạn như WinMerge.
đang được dịch, vui lòng đợi..
