Có hai loại cơ bản cốt lõi thuật toán OCR, trong đó có thể tạo ra một danh sách xếp hạng các nhân vật ứng cử viên [18]. Matrix hợp liên quan đến việc so sánh một hình ảnh vào một glyph được lưu trữ trên một cơ sở pixel-by-pixel; nó còn được gọi là "mô hình kết hợp", "mô hình công nhận", hoặc "hình ảnh tương quan". [19] Điều này dựa trên các glyph đầu vào được phân lập một cách chính xác từ phần còn lại của hình ảnh, và trên các glyph lưu trữ được trong một phông chữ tương tự và tại cùng một tỷ lệ. Kỹ thuật này làm việc tốt nhất với các văn bản được đánh máy và không làm việc tốt khi phông chữ mới được gặp. Đây là kỹ thuật OCR vật lý dựa trên tế bào quang sớm thực hiện, chứ không phải trực tiếp.
đang được dịch, vui lòng đợi..