OCR software often

OCR software often "pre-processes"

OCR software often "pre-processes" images to improve the chances of successful recognition. Techniques include:[14]

De-skew – If the document was not aligned properly when scanned, it may need to be tilted a few degrees clockwise or counterclockwise in order to make lines of text perfectly horizontal or vertical.
Despeckle – remove positive and negative spots, smoothing edges
Binarisation – Convert an image from color or greyscale to black-and-white (called a "binary image" because there are two colours). The task of binarisation is performed as a simple way of separating the text (or any other desired image component) from the background.[15] The task of binarisation itself is necessary since most commercial recognition algorithms work only on binary images since it proves to be simpler to do so.[16] In addition, the effectiveness of the binarisation step influences to a significant extent the quality of the character recognition stage and the careful decisions are made in the choice of the binarisation employed for a given input image type; since the quality of the binarisation method employed to obtain the binary result depends on the type of the input image (scanned document, scene text image, historical degraded document etc.).[17][18]
Line removal – Cleans up non-glyph boxes and lines
Layout analysis or "zoning" – Identifies columns, paragraphs, captions, etc. as distinct blocks. Especially important in multi-column layouts and tables.
Line and word detection – Establishes baseline for word and character shapes, separates words if necessary.
Script recognition – In multilingual documents, the script may change at the level of the words and hence, identification of the script is necessary, before the right OCR can be invoked to handle the specific script.[19]
Character isolation or "segmentation" – For per-character OCR, multiple characters that are connected due to image artifacts must be separated; single characters that are broken into multiple pieces due to artifacts must be connected.
Normalise aspect ratio and scale[20]
Segmentation of fixed-pitch fonts is accomplished relatively simply by aligning the image to a uniform grid based on where vertical grid lines will least often intersect black areas. For proportional fonts, more sophisticated techniques are needed because whitespace between letters can sometimes be greater than that between words, and vertical lines can intersect more than one character.[21]
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Phần mềm OCR thường "trước quá trình" hình ảnh để cải thiện cơ hội thành công nhận. Kỹ thuật bao gồm: [14]De-nghiêng-nếu các tài liệu được liên kết không đúng khi quét, nó có thể cần phải nghiêng một vài độ ngược chiều kim đồng hồ hoặc để làm cho dòng văn bản hoàn toàn ngang hoặc dọc.Despeckle-hủy bỏ những điểm tích cực và tiêu cực, làm mịn cạnhBinarisation-chuyển đổi một hình ảnh màu sắc hoặc thang độ xám trắng đen (gọi là một "hình ảnh nhị phân" vì có hai màu sắc). Nhiệm vụ của binarisation được thực hiện như là một cách đơn giản để tách các văn bản (hoặc bất kỳ thành phần nào khác của hình ảnh mong muốn) từ nền. [15] nhiệm vụ binarisation chính nó là cần thiết kể từ khi thương mại đặt nhận dạng thuật toán làm việc chỉ trên hình ảnh nhị phân vì nó chứng tỏ là đơn giản để làm như vậy. [16] Ngoài ra, hiệu quả của các bước binarisation ảnh hưởng đến một mức độ đáng kể chất lượng của giai đoạn nhận dạng ký tự thông thường và các quyết định cẩn thận lựa chọn binarisation làm việc cho một loại hình ảnh nhập vào nhất định; kể từ khi chất lượng của các phương pháp binarisation làm việc để có được kết quả nhị phân phụ thuộc vào loại hình ảnh nhập vào (tài liệu được quét, cảnh văn bản hình ảnh, tài liệu lịch sử bị suy thoái vv). [17] [18]Loại bỏ dòng-Cleans-glyph hộp và dòngBố trí phân tích hoặc "quy hoạch"-Identifies cột, đoạn, chú thích, vv như các khối riêng biệt. Đặc biệt quan trọng trong việc bố trí nhiều cột và các bảng.Phát hiện dòng chữ-Establishes baseline cho word và nhân vật hình dạng, tách từ nếu cần thiết.Kịch bản công nhận-trong tài liệu đa ngôn ngữ, các kịch bản có thể thay đổi ở cấp độ của các từ và do đó, việc xác định các kịch bản là cần thiết, trước khi quyền OCR có thể được kích hoạt để xử lý kịch bản cụ thể. [19]Nhân vật bị cô lập hoặc "phân đoạn" – cho mỗi ký tự OCR, nhiều nhân vật được kết nối do hiện vật hình ảnh phải được tách; nhân vật duy nhất được chia thành nhiều mảnh do hiện vật phải được kết nối.Normalise tỉ lệ và quy mô [20]Phân khúc của phông chữ cố định được thực hiện tương đối đơn giản bằng việc xếp thẳng các hình ảnh với một mạng lưới thống nhất dựa trên nơi đường lưới dọc sẽ ít nhất là thường xuyên giao nhau màu đen các khu vực. Cho tỉ lệ fonts, kỹ thuật phức tạp hơn là cần thiết vì các khoảng trắng giữa các chữ đôi khi có thể lớn hơn giữa các từ, và đường thẳng đứng có thể cắt nhau nhiều hơn một nhân vật. [21]
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Phần mềm OCR thường "trước quá trình" hình ảnh để cải thiện cơ hội nhận thành công. Các kỹ thuật gồm: [14] De nghiêng - Nếu tài liệu không được sắp xếp đúng khi quét, nó có thể cần được nghiêng một vài độ chiều kim đồng hồ hoặc ngược chiều kim đồng để làm cho dòng văn bản ngang hay dọc. Despeckle - loại bỏ tích cực và tiêu cực điểm, cạnh mịn Binarisation - Chuyển đổi hình ảnh từ màu hoặc tông màu xám sang màu đen và trắng (gọi là một "hình ảnh nhị phân" vì có hai màu). Nhiệm vụ của binarisation được thực hiện như là một cách đơn giản để tách các văn bản (hoặc bất kỳ thành phần hình ảnh mong muốn khác) từ nền. [15] Nhiệm vụ của binarisation chính nó là cần thiết vì hầu hết các thuật toán nhận dạng thương mại chỉ làm việc trên ảnh nhị phân vì nó chứng minh được đơn giản để làm như vậy [16] Ngoài ra, hiệu quả của những ảnh hưởng bước binarisation đến một mức độ đáng kể chất lượng của giai đoạn nhận dạng ký tự và các quyết định cẩn thận được thực hiện trong sự lựa chọn của binarisation dụng cho một loại hình ảnh đầu vào cho trước. vì chất lượng của các phương pháp binarisation dụng để có được kết quả nhị phân phụ thuộc vào loại hình ảnh đầu vào (tài liệu quét, văn bản hình ảnh cảnh, tài liệu suy thoái lịch sử vv.) [17] [18]. loại bỏ Line - Dọn dẹp không glyph hộp và đường dây phân tích Layout hay "quy hoạch" - Xác định các cột, đoạn văn, chú thích, vv khối như khác biệt. Đặc biệt quan trọng trong bố trí nhiều cột và bảng. Line và từ phát hiện - Thiết lập cơ sở cho các từ và nhân vật hình dạng, tách từ nếu cần thiết. Công nhận Script - Trong các tài liệu đa ngôn ngữ, các kịch bản có thể thay đổi ở cấp độ của các từ và do đó, xác định các kịch bản là cần thiết, trước khi quyền OCR có thể được viện dẫn để xử lý các kịch bản cụ thể [19]. cô lập nhân vật hoặc "phân khúc" - Đối với OCR cho mỗi ký tự, nhiều nhân vật được kết nối do các hiện vật hình ảnh phải được tách; nhân vật duy nhất được chia thành nhiều phần do hiện vật phải được kết nối. Đồng hóa tỉ lệ và quy mô [20] Phân đoạn của phông chữ cố định sân được thực hiện tương đối đơn giản bằng cách sắp xếp các hình ảnh vào một lưới điện đồng bộ dựa vào nơi đường lưới dọc sẽ ít nhất là thường giao khu vực màu đen. Đối với phông chữ theo tỷ lệ, kỹ thuật tinh vi hơn là cần thiết bởi vì khoảng trắng giữa các chữ đôi khi có thể được lớn hơn giữa các từ, và các đường thẳng đứng có thể cắt nhau hơn một ký tự. [21]










đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: