underactuated 2 UTM, Khoa Khoa học Máy tính và Hệ thống thông tin, Trường Đại học Teknologi Malaysia, 81.310 UTM Skudai, Johor Darul Takzim, Malaysia Việc sử dụng các cử chỉ như là phương tiện để truyền đạt thông tin là một phần quan trọng của thông tin liên lạc của con người. Việc công nhận tự động cử chỉ làm phong phú thêm sự tương tác của con người-máy tính bằng cách cung cấp một phương pháp tự nhiên và trực quan dữ liệu đầu vào. Hệ thống tự động để giúp đỡ những người có thính giác bị suy giảm gần đây đã là một trong những lĩnh vực nghiên cứu. Trong ngôn ngữ ký hiệu, cử chỉ tay là một trong những phương pháp điển hình của giao tiếp phi ngôn ngữ cho con người và chúng tôi tự nhiên sử dụng những cử chỉ khác nhau để bày tỏ ý định của chúng ta trong cuộc sống hàng ngày. Nghiên cứu đã được thực hiện để cấu trúc một sự hiểu biết ban đầu và xác định các bước tiếp theo của sự phát triển chức năng. Phát hiện tay là một bước cơ bản trong nhiều ứng dụng thực tế như nhận dạng cử chỉ, giám sát video, và giao diện máy tính đa phương thức và như vậy. Đối với sự linh hoạt và tính năng thường hay ful, tầm nhìn kỹ thuật đã được đề xuất dựa trên thu thập dữ liệu cử chỉ. Bài viết này sẽ trình bày quá trình nghiên cứu và kết quả nghiên cứu về kỹ thuật và các thuật toán để phát hiện tay vì nó sẽ được sử dụng như một đặt trong- cho quá trình nhận dạng cử chỉ. Từ khóa nhận dạng ngôn ngữ ký hiệu; phát hiện tay; dựa trên tầm nhìn 1. Giới thiệu Khả năng phát hiện một bàn tay không bị người trong một chuỗi video tự nhiên có ứng dụng trong ngôn ngữ ký hiệu, công nhận và tương tác máy tính của con người. Có hai cách để thu thập dữ liệu cử chỉ công nhận. Thiết bị đo lường dựa trên cử chỉ mà MEAs- biện tay với các thiết bị như găng tay dữ liệu có thể lưu trữ các vị trí chính xác của các cử chỉ tay như vị trí của nó được đo trực tiếp. Thứ hai là kỹ thuật dựa trên tầm nhìn, có thể bao gồm cả khuôn mặt và bàn tay người ký tên trong đó người ký tên không cần phải đeo găng tay dữ liệu thiết bị. Tất cả công việc xử lý được giải quyết bằng cách sử dụng các kỹ thuật thị giác máy tính mà là linh hoạt hơn và hữu ích hơn so với phương pháp trước. Kể từ ngôn ngữ ký hiệu được gesticulated trôi chảy và tương tác như tiếng nói khác, một dấu hiệu ngôn ngữ nhận dạng phải có thể nhận ra các từ vựng dấu hiệu liên tục trong thời gian thực . Chúng tôi đang cố gắng xây dựng một hệ thống như vậy cho các ngôn ngữ ký hiệu tiếng Bahasa Melayu hoặc tiếng Bahasa Malaysia Isyarat (BIM). Một định nghĩa cơ bản, cử chỉ thường được hiểu là bàn tay và cơ thể chuyển động mà có thể vượt qua hình trong- từ một đến khác. Vì chúng tôi là quan tâm đến cử chỉ tay và do đó thuật ngữ "cử chỉ" là al-cách gọi các cử chỉ tay trong bài báo này. Các điểm chính sẽ được mô tả trong các phần sau. Mục 2 và 3 sẽ xem xét một số công trình có liên quan đã được thực hiện trong khu vực cụ thể, công nhận ngôn ngữ ký hiệu và phát hiện tay. Sau đó, giai đoạn thuê cur- của chúng tôi phát triển, kỹ thuật phát hiện bàn tay của chúng tôi sẽ được giải thích và cũng có phát hiện đã được chiết xuất từ phân khúc tay. Giai đoạn phát triển hiện nay hệ thống của chúng tôi và phương hướng trong tương lai cũng sẽ được thảo luận. 2. Công trình liên quan * Tác giả: thư điện tử: noorsaliza@uniten.edu.my, Điện thoại: + 603-89212020 © FORMATEX năm 2006 968 bước phát triển mới trong giáo dục Công nghệ hỗ trợ (2006) Những nỗ lực trên máy tính dựa trên tầm nhìn nhận ngôn ngữ ký hiệu đã bắt đầu được công bố chỉ gần đây với tài liệu liên quan từ cách đây vài năm. Hầu hết các nỗ lực để phát hiện tay từ video ra các hạn chế về môi trường. Đối với ví dụ, màu da đáng ngạc nhiên là thống nhất [1, 2], vì vậy phát hiện tay màu dựa trên có thể [3]. Tuy nhiên, điều này tự nó không phải là phương thức đáng tin cậy. Tay phải được phân biệt với các đối tượng da màu khác và đây là những trường hợp điều kiện ánh sáng đầy đủ, chẳng hạn như ánh sáng hoặc màu xám cấp hình ảnh màu. Thông tin lưu động là một phương thức có thể lấp đầy khoảng cách này theo một số điều kiện [4], nhưng ví dụ cho máy ảnh đứng yên không phương pháp này ngày càng trở nên khó khăn và ít đáng tin cậy. Thông tin thống kê về các vị trí tay là hiệu quả khi được sử dụng như là một xác suất trước [5], nhưng nó đòi hỏi đào tạo ứng dụng cụ thể. Eng-Jon Ong và Bowden [1] trình bày một cuốn tiểu thuyết, phương pháp không giám sát để đào tạo một máy dò hiệu quả và mạnh mẽ mà áp dụng các không chỉ phát hiện sự hiện diện của bàn tay con người bên trong và hình ảnh, nhưng phân loại các hình bàn tay. Phương pháp của họ là để phát hiện vị trí của bàn tay sử dụng một thác tăng của phân loại để phát hiện hình dạng một mình trong hình ảnh màu xám quy mô. Một cơ sở dữ liệu hình ảnh bàn tay được nhóm vào bộ tay tương tự như tìm kiếm bằng cách sử dụng thuật toán phân nhóm k-mediod rằng việc sử dụng một thước đo khoảng cách dựa trên bối cảnh hình thành. Một cây dò tay tăng sau đó được thành lập, bao gồm hai lớp, lớp trên cùng để phát hiện tay nói chung, trong khi các chi nhánh ở lớp thứ hai chuyên về phân loại các bộ hình dạng bàn tay do các phương pháp phân nhóm không được giám sát. Kiểm tra phát hiện có một cơ sở dữ liệu vô hình của 2509 hình ảnh đã được 99,8% tỷ lệ thành công và hình dạng phân loại có 97,4% tỷ lệ thành công. Kölsch và Turk đã làm một nghiên cứu về phát hiện tư thế tay xem cụ thể với một phương pháp nhận dạng khốn khổ đề xuất gần đây của Viola và James. Đầu tiên, họ chứng minh sự phù hợp của các phương pháp tiếp cận hình ảnh integral- với nhiệm vụ phát hiện sự xuất hiện tay. Sau đó, các biện pháp định tính được trình bày rằng số tiền để một một ưu tiên ước tính của 'năng phát hiện, làm giảm sự cần thiết phải tính toán chuyên sâu đào tạo. Cuối cùng, các thông số của phương pháp phát hiện được tối ưu hóa, đạt được sự cải thiện tốc độ và độ chính xác đáng kể. Họ cho rằng hầu hết xuất hiện lồi với các biến thể màu xám cấp nội bộ thì phù hợp hơn với mục đích phát hiện bằng phương pháp hình chữ nhật tính năng phân loại. Sổ tay Hàn Quốc Bảng chữ cái (KMA) của Jung-Bae Kim, Kwang-Hyun Park và Z.Zenn Biên [3 ], trình bày một hệ thống nhận dạng dựa trên tầm nhìn của Hàn Quốc dẫn bảng chữ cái mà là một tập hợp con của ngôn ngữ ký hiệu của Hàn Quốc. KMA có thể nhận ra bàn tay con người da màu bằng cách thực hiện mờ min-max thuật toán mạng lưới thần kinh sử dụng Matrox Genesis hội đồng quản trị hình ảnh và máy ảnh PULNIX TMC-7 RGB. Feng-Sheng Chen, Chih-Ming Fu, Chung-Lin Huang [4] giới thiệu một bàn tay hệ thống nhận dạng cử chỉ để nhận ra "cử chỉ động 'trong đó một cử chỉ trong thực hiện đơn lẻ trong nền phức tạp bằng cách sử dụng đầu vào video 2D. Hệ thống theo dõi chuyển động tay và phân tích sự thay đổi tay hình dạng và chuyển động trong- hình như là đầu vào cho các hệ thống nhận dạng dựa trên HMM. Họ đi ra với kết quả thực nghiệm của HMM 4 nhà nước đã được chứng minh để tạo ra hiệu suất tốt nhất cho mô hình hóa các cử chỉ. Mỗi trình chiếu hình ảnh đầu vào được trước khi xử lý bằng quá trình khai thác khu vực đường viền tay để biết thông tin và mã hóa và đã được thực hiện bằng cách sử dụng hai phương pháp: (1) thông tin chỉ đường viền và (2) sử dụng thông tin đường viền và chuyển động thông tin bined đồng. Các thông tin thu được chuyển thành trình tự vector và sau đó lượng tử hóa thành những chuỗi biểu tượng cho cả hai quá trình đào tạo và công nhận. Tổng cộng 1200 chuỗi hình ảnh được thu thập cho 20 cử chỉ khác nhau, do đó mỗi loại cử chỉ với 60 chuỗi trung bình, trong giai đoạn đào tạo và 1200 trình tự khác được thu thập cho thử nghiệm. Đối với phương pháp (1), tỉ lệ nhận dạng của việc sử dụng dữ liệu huấn luyện để thử nghiệm là 97%, và tỷ lệ công nhận của việc sử dụng dữ liệu thử nghiệm là 90,5%, trong khi đó đối với phương pháp (2), tỉ lệ nhận dạng của việc sử dụng dữ liệu huấn luyện để thử nghiệm là 98,5% và tỉ lệ nhận dạng của việc sử dụng kiểm tra dữ liệu tăng lên đến 93,5%. 3. Khu vực cầm tay phát hiện phát hiện tay là một bước khởi đầu cho một số ứng dụng bao gồm HCI, giám sát, công nhận cử chỉ, theo dõi bàn tay và sự hiểu biết tương tác của con người-con người. phát hiện tay tồn tại trong giai đoạn sơ bộ trong xử lý hình ảnh. Nghiên cứu của chúng tôi phát hiện ra có một số kỹ thuật phát hiện vùng mặt. © 2006 FORMATEX hiện tại phát triển trong giáo dục Công nghệ hỗ trợ (2006) 969 chung tay phát hiện bao gồm trừ hình ảnh những người ký tên từ hình nền. Việc tìm kiếm khu vực tay sử dụng hình ảnh màu sắc không phải là khó khăn bởi vì bản chất của màu da có giá trị độc đáo của riêng mình và có thể dễ dàng được xử lý. Da mô hình màu sẽ được sử dụng để phát hiện hình ảnh tay tinh khiết từ môi trường phức tạp. Tuy nhiên, vì màu da bị ảnh hưởng bởi độ sáng và bóng tối, HSL mô hình màu hoặc mô hình màu RGB không cung cấp hiệu suất tốt. Để hình ảnh sáng miễn phí, chuẩn RGB đã được áp dụng. Một số sẽ so sánh màu sắc của vùng da chiết xuất với màu da mẫu chiết xuất từ hình ảnh đào tạo. Những hệ thống này không trong điều kiện ánh sáng yếu hoặc màu da họ không được đào tạo cho. Đến nay, các mô hình màu sắc khác nhau đã được đề xuất để phát hiện màu da, ví dụ, không gian màu CbCr được sử dụng trong [8,9], không gian màu RGB được sử dụng trong [10]. HS (Hue, Saturation) không gian màu được sử dụng trong [11], bình thường RGB và HSV (Hue, Saturation, Value) trong [12] và vv Xử lý hình ảnh màu sẽ làm cho quá trình tìm kiếm một giá trị ngưỡng để phát hiện các tay trở nên dễ dàng hơn. Tuy nhiên, đối phó với hình ảnh đầu vào thang màu xám buộc chúng tôi phải tự động hóa các giá trị ngưỡng đầu vào để đo lường sự thông tin trong báo như vậy, trích xuất các vùng tay từ toàn bộ hình ảnh. Ngoài ra, kỹ thuật phát hiện biên sẽ được áp dụng để tách các vùng cánh tay từ vùng tay khi người ký tên mặc ngắn tay áo sơ mi. Đối với cùng một kịch bản, trong [12], vùng bàn tay và cánh tay mỏng để có được những skele
đang được dịch, vui lòng đợi..
