Các thuật toán tìm đường là một trong số ít các phần của
Tesseract mà trước đây đã được xuất bản [3]. Các thuật toán tìm đường được thiết kế để trang bị nghiêng có thể được công nhận mà không cần phải de-nghiêng,
do đó tiết kiệm giảm chất lượng hình ảnh. Các bộ phận quan trọng của quá trình này là blob lọc và xây dựng đường dây.
Giả sử rằng phân tích bố trí trang đã cung cấp các vùng văn bản của một văn bản kích thước xấp xỉ thống nhất, một bộ lọc cao percentile đơn giản loại bỏ thả mũ và các nhân vật cảm động theo chiều dọc. Chiều cao trung bình xấp xỉ kích thước văn bản trong khu vực, do đó, nó là an toàn để lọc ra các đốm màu mà là nhỏ hơn so với một số phần nhỏ của
chiều cao trung bình, là rất có thể chấm câu, dấu phụ và tiếng ồn.
đang được dịch, vui lòng đợi..
