2.2. hình lọcVới việc khai thác cạnh nâng cao MSER, chúng tôi có được một nhị phânhình ảnh, nơi tiền cảnh CCs được coi là ứng cử viên thư.Như trong phần lớn các hệ thống phát hiện văn bản nhà nước-of-the-nghệ thuật, chúng tôi thực hiện một bộkiểm tra hình học đơn giản và linh hoạt trên mỗi CCs để lọc rađối tượng không phải là văn bản. Trước hết, rất lớn và rất nhỏ các đối tượngbị từ chối. Sau đó, kể từ khi hầu hết các chữ cái có tỷ lệ khía cạnh gần gũi với 1,chúng tôi từ chối CCs với tỷ lệ khía cạnh rất lớn và rất nhỏ. Một ngưỡng bảo thủ vào tỷ lệ khía cạnh được chọn để đảm bảo rằngmột số chữ cái thuôn dài chẳng hạn như 'tôi' và 'l' không được bỏ đi. Cuối cùng,chúng tôi loại bỏ các đối tượng có chứa một số lớn các lỗ, bởi vìCCs với nhiều lỗ có khả năng là ứng cử viên thư.
đang được dịch, vui lòng đợi..
