Vision based approaches has always been forming a basis to be used as primary communication method thatallows impaired hearing people to communicate with others in their daily life. It is the fundamental communicationbridge among the hearing deficient person. Any vision based system or technique involving sign language with handgestures alone does not yield effective results and hence use of facial gestures have received wide spread acceptance.Among the various types of facial gestures, eye-brow and lip motion are primary ingredients in such a system asthese parts generally undergo various stresses and expansion during any expression and hence are the most commonly used facial features. The upper and bottom part of the face conveys messages and descriptors in thelanguage. Grammatical importance is always sought after in these facial movements. The field of vision basedsystem is very vast and the problems faced by recognition system are immense. Further, the system being related tohuman computer interaction (HCI), it possesses great importance in making such communication real time andeffective. Our system mainly focuses on certain designs which are intended to remove some of the deficiencies andlimitation observed in any such recognition based system. It focuses on formulation of certain approaches andengaging some of the parameters that are quite extensively used in such recognition systems. Facial expressions arehầu như bị bỏ qua bởi vì họ khác nhau phức tạp, giải thích của các nhân vật và unevenness củasự hiểu biết. Để giảm bớt những thiếu sót thường gặp của hệ thống như vậy, chúng tôi đã nghĩ ra phương pháp nhất định để vượt quaĐiều này và làm cho hệ thống drap để điều kiện khác nhau. Hệ thống chúng tôi kết hợp cũng sẽ đưa vào tài khoảnsự kết hợp đáng kể và không hiệu quả của tất cả các tính năng của nó trong các hệ thống thời gian thực, do đó làm cho nó trải qua một sốthay đổi và đi ra với hiệu quả sản lượng quả. Dựa trên bất kỳ mặt công nhận hệ thống tích hợp đáng kểvới một bàn tay tầm nhìn dựa trên hệ thống nhận dạng có thể chứng minh là có lợi cho người điếc và câm. Hiệu quảcủa hệ thống như vậy sẽ được đo trong điều kiện befitting và chính xác kết quả cung cấp cho người dùng. Chúng ta thường có xu hướngkết hợp các bước sau đây 3 chính cơ bản trong hệ thống bao gồm việc mua lại, phát hiện vàcông nhận mẫu đáng kể. Cho mục đích này, chúng tôi sử dụng thuật toán Viola Jones tiếp theo kỹ thuật Adaboosttốt hơn thresholding. Cuối cùng để có được kết quả mong muốn, chúng tôi tạo ra histograms của tất cả các đồ thị theo định hướng như vậy như là đểLấy kỳ thích hợp để có được kết quả tốt hơn trong thời gian đào tạo và theo dõi. Giống như các tính năng hoặc chiết xuấtCác thành phần sau đó gần như phù hợp và được sử dụng cho đốm lỗi hoặc thực tế đúng được phát hiện để mang lại cho các bộ phậnra kết quả chính xác và chính xác.Thus we propose such a machine vision based system that takes video feeds from camera. For our work, we areusing a USB Webcam linked into Matlab via the webcam support package to access live video. Video input is takeninto the designed system at a speed of 10 frames per second (FPS) and five consecutive frames are considered asbelonging to one syllable. Thus the system functions on basis of the assumption that a person speaking will speaktwo syllables per second. Frames from that video are extracted for the purpose of preprocessing to make it suitablefor the classification and recognition process. The first step is to detect the face region for the purpose of extractingdesired portion of the image. This is achieved by using object detector of computer vision toolbox in Matlab. Herewe have worked on recognizing syllables taking into account only the lip movement. Five consecutive frames areconsidered to build the features for one particular syllable. The bounding box of the lip is determined to crop theregion from the original image for recognition.Fig. 1 & Fig. 2
đang được dịch, vui lòng đợi..
