Phần mềm OCR thường "trước quá trình" hình ảnh để cải thiện cơ hội nhận thành công. Các kỹ thuật gồm: [14] De nghiêng - Nếu tài liệu không được sắp xếp đúng khi quét, nó có thể cần được nghiêng một vài độ chiều kim đồng hồ hoặc ngược chiều kim đồng để làm cho dòng văn bản ngang hay dọc. Despeckle - loại bỏ tích cực và tiêu cực điểm, cạnh mịn Binarisation - Chuyển đổi hình ảnh từ màu hoặc tông màu xám sang màu đen và trắng (gọi là một "hình ảnh nhị phân" vì có hai màu). Nhiệm vụ của binarisation được thực hiện như là một cách đơn giản để tách các văn bản (hoặc bất kỳ thành phần hình ảnh mong muốn khác) từ nền. [15] Nhiệm vụ của binarisation chính nó là cần thiết vì hầu hết các thuật toán nhận dạng thương mại chỉ làm việc trên ảnh nhị phân vì nó chứng minh được đơn giản để làm như vậy [16] Ngoài ra, hiệu quả của những ảnh hưởng bước binarisation đến một mức độ đáng kể chất lượng của giai đoạn nhận dạng ký tự và các quyết định cẩn thận được thực hiện trong sự lựa chọn của binarisation dụng cho một loại hình ảnh đầu vào cho trước. vì chất lượng của các phương pháp binarisation dụng để có được kết quả nhị phân phụ thuộc vào loại hình ảnh đầu vào (tài liệu quét, văn bản hình ảnh cảnh, tài liệu suy thoái lịch sử vv.) [17] [18]. loại bỏ Line - Dọn dẹp không glyph hộp và đường dây phân tích Layout hay "quy hoạch" - Xác định các cột, đoạn văn, chú thích, vv khối như khác biệt. Đặc biệt quan trọng trong bố trí nhiều cột và bảng. Line và từ phát hiện - Thiết lập cơ sở cho các từ và nhân vật hình dạng, tách từ nếu cần thiết. Công nhận Script - Trong các tài liệu đa ngôn ngữ, các kịch bản có thể thay đổi ở cấp độ của các từ và do đó, xác định các kịch bản là cần thiết, trước khi quyền OCR có thể được viện dẫn để xử lý các kịch bản cụ thể [19]. cô lập nhân vật hoặc "phân khúc" - Đối với OCR cho mỗi ký tự, nhiều nhân vật được kết nối do các hiện vật hình ảnh phải được tách; nhân vật duy nhất được chia thành nhiều phần do hiện vật phải được kết nối. Đồng hóa tỉ lệ và quy mô [20] Phân đoạn của phông chữ cố định sân được thực hiện tương đối đơn giản bằng cách sắp xếp các hình ảnh vào một lưới điện đồng bộ dựa vào nơi đường lưới dọc sẽ ít nhất là thường giao khu vực màu đen. Đối với phông chữ theo tỷ lệ, kỹ thuật tinh vi hơn là cần thiết bởi vì khoảng trắng giữa các chữ đôi khi có thể được lớn hơn giữa các từ, và các đường thẳng đứng có thể cắt nhau hơn một ký tự. [21]
đang được dịch, vui lòng đợi..
