Baseline Lắp
Khi dòng văn bản đã được tìm thấy, các đường cơ sở được trang bị chính xác hơn bằng cách sử dụng một spline bậc hai. Đây là một đầu tiên cho một hệ thống OCR, và kích hoạt Tesseract để xử lý các trang với đường cơ sở cong [5], mà là một tạo tác thường thấy trong quét, và không chỉ ở bindings cuốn sách.
Các đường cơ sở được trang bị bằng cách phân vùng các đốm màu thành các nhóm với một cách hợp lý chuyển liên tục cho các cơ sở thẳng ban đầu. Một spline bậc hai được
trang bị cho các phân vùng đông dân nhất, (giả định là các cơ sở) bằng một phương tối thiểu phù hợp. Spline bậc hai có lợi thế mà tính toán này là hợp lý ổn định, nhưng nhược điểm là không liên tục có thể phát sinh khi nhiều đoạn spline được yêu cầu. Một spline khối truyền thống hơn [6] có thể làm việc tốt hơn.
đang được dịch, vui lòng đợi..
