Background and LimitationsTesseract

Background and Limitations

Tesseract was originally designed to recognize English text only. Efforts have been made to modify the engine and its training system to make them able to deal with other languages and UTF-8 characters. Tesseract 3.0 can handle any Unicode characters (coded with UTF-8), but there are limits as to the range of languages that it will be successful with, so please take this section into account before building up your hopes that it will work well on your particular language!

Tesseract 3.01 added top-to-bottom languages, and Tesseract 3.02 added Hebrew (right-to-left). Tesseract currently handles scripts like Arabic with an auxiliary engine called cube (included in Tesseract 3.0+)

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Nền và hạn chếTesseract ban đầu được thiết kế để nhận ra văn bản tiếng Anh chỉ. Những nỗ lực đã được thực hiện để thay đổi động cơ và các hệ thống đào tạo của mình để làm cho họ có thể để đối phó với các ngôn ngữ khác và các ký tự UTF-8. Tesseract 3.0 có thể xử lý bất kỳ ký tự Unicode (mã hoá với UTF-8), nhưng không có giới hạn về phạm vi của các ngôn ngữ mà nó sẽ được thành công với, vì vậy hãy dành phần này vào tài khoản trước khi xây dựng của bạn với hy vọng rằng nó sẽ làm việc tốt trên ngôn ngữ cụ thể của bạn! Tesseract 3,01 đưa trên dưới cùng ngôn ngữ, và Tesseract 3,02 tiếng Do Thái (phải sang trái). Tesseract hiện đang xử lý kịch bản như tiếng ả Rập với một động cơ phụ trợ được gọi là các khối lập phương (bao gồm trong Tesseract 3.0 +)

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Bối cảnh và giới hạn Tesseract ban đầu được thiết kế để nhận ra chỉ có bản tiếng Anh. Những nỗ lực đã được thực hiện để sửa đổi các động cơ và hệ thống đào tạo của mình để làm cho họ có khả năng để đối phó với các ngôn ngữ khác và UTF-8 ký tự. Tesseract 3.0 có thể xử lý bất kỳ ký tự Unicode (mã hóa với UTF-8), nhưng cũng có những giới hạn cho nhiều ngôn ngữ mà nó sẽ thành công, vì vậy hãy dành phần này vào tài khoản trước khi xây dựng lên những hy vọng của bạn mà nó sẽ làm việc tốt trên ngôn ngữ cụ thể của bạn! Tesseract 3.01 thêm ngôn ngữ top-to-bottom, và Tesseract 3.02 thêm Hebrew (từ phải sang trái). Tesseract hiện xử lý kịch bản như tiếng Ả Rập với một động cơ phụ trợ được gọi là khối lập phương (bao gồm trong Tesseract 3.0+)

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.