Ngôn ngữ ký hiệu để nhận dạng giọng nói: tay phát hiện công nghệ - niques cho cách tiếp cận dựa trên tầm nhìn
Noor Saliza Mohd Salleh *, 1, Jamilin Jais1, Lucyantie Mazalan1, Roslan Ismail1, Salman Yussof1, Azhana Ahmad1, Adzly Anuar1, Dzulkifli Mohamad2
1 UNITEN, trường cao đẳng công nghệ thông tin, Universiti Tenaga Nasional, Km 7, Jalan Kajang-Puchong, 43009 Kajang, Selangor, Malaysia.
2 UTM, Khoa Khoa học máy tính và hệ thống thông tin, công nghệ Universiti Malaysia, 81310 UTM Skudai, Johor Darul Takzim, Malaysia
sử dụng cử chỉ như là phương tiện để truyền đạt thông tin là một phần quan trọng của thông tin liên lạc của con người. Sự công nhận tự động cử chỉ enriches con người-máy tính tương tác bằng cách cung cấp một phương pháp tự nhiên và trực quan của dữ liệu đầu vào. Các hệ thống tự động để giúp đỡ những người có suy xét xử mới đã là một trong các lĩnh vực chính của nghiên cứu. Trong ngôn ngữ ký hiệu, cử chỉ tay là một trong những phương pháp điển hình của thông tin liên lạc nói cho con người và chúng tôi tự nhiên sử dụng các cử chỉ để thể hiện ý định của chúng tôi trong cuộc sống hàng ngày. Nghiên cứu đã được thực hiện để cấu trúc một sự hiểu biết ban đầu và xác định bước tiếp theo của chức năng phát triển. Tay phát hiện là một bước cơ bản trong nhiều ứng dụng thực tế như cử chỉ công nhận, video giám sát, và giao diện đa phương thức máy và vân vân. Đối với tính linh hoạt và tính năng sử dụng-ful, tầm nhìn dựa trên kỹ thuật đã được đề xuất cho cử chỉ thu thập dữ liệu. Giấy này sẽ trình bày nghiên cứu tiến bộ và phát hiện về kỹ thuật và các thuật toán phát hiện tay vì nó sẽ được sử dụng như là một trong-đặt cho cử chỉ công nhận quá trình.
công nhận ngôn ngữ ký hiệu từ khóa; phát hiện tay; Dựa trên tầm nhìn
1. Giới thiệu
khả năng phát hiện một người unconstrained tay trong một chuỗi video tự nhiên có ứng dụng trong ngôn ngữ ký hiệu, công nhận và con người máy tính tương tác.
có hai cách để thu thập dữ liệu cử chỉ để được công nhận. Thiết bị dựa trên các đo lường mà meas chức tay cử chỉ với các thiết bị như găng tay dữ liệu mà có thể lưu trữ vị trí chính xác của cử chỉ tay như vị trí của nó trực tiếp đo. Thứ hai là kỹ thuật dựa trên tầm nhìn, đó có thể bao gồm cả hai phải đối mặt và bàn tay người ký tên chung trong người ký tên chung mà không cần phải mang dữ liệu găng tay thiết bị. Tất cả xử lý tác vụ được giải quyết bằng cách sử dụng máy tính tầm nhìn kỹ thuật mà có nhiều linh hoạt và hữu ích hơn phương pháp tiếp cận trước.
vì ngôn ngữ ký hiệu gesticulated lưu loát và tương tác như khác ngôn ngữ được nói, một bộ nhận dạng dấu hiệu lan-gauge phải có thể nhận ra dấu hiệu liên tục từ vựng trong thời gian thực. Chúng tôi đang cố gắng để xây dựng một hệ thống cho các ngôn ngữ ký hiệu Bahasa Melayu hoặc Bahasa Isyarat Malaysia (BIM).
một định nghĩa cơ bản, cử chỉ thường được hiểu như là tay và cơ thể phong trào mà có thể vượt qua trong hình thành từ một đến khác. Kể từ khi chúng tôi đang quan tâm trong tay cử chỉ và vì vậy, thuật ngữ 'cử chỉ' là al-cách gọi cử chỉ tay trong giấy này.
những điểm chính sẽ được mô tả trong các phần sau. Phần 2 và 3 sẽ xem xét một số tác phẩm liên quan đã được thực hiện trong khu vực cụ thể, ngôn ngữ ký hiệu nhận dạng và tay phát hiện. Sau đó, chúng tôi phát triển, bệnh hoạn-thuê giai đoạn kỹ thuật phát hiện tay của chúng tôi sẽ được giải thích và cũng có tính năng phát hiện đã được trích ra từ phân khúc tay. Giai đoạn hiện tại của chúng tôi phát triển hệ thống và direc-tion trong tương lai cũng sẽ được thảo luận.
2. Liên quan đến tác phẩm
* Corresponding tác giả: e-mail: noorsaliza@uniten.edu.my, điện thoại: 603-89212020
© FORMATEX 2006
968 phát triển hiện nay trong giáo dục Technology-Assisted (2006)
nỗ lực trên máy dựa trên tầm nhìn ngôn ngữ ký hiệu nhận dạng đã bắt đầu được phát hành chỉ mới với các tài liệu có liên quan từ vài năm trước đây.
đặt nỗ lực để phát hiện tay từ video nơi hạn chế về môi trường. Ví dụ, da màu là đáng ngạc nhiên đồng nhất [1, 2], Vì vậy màu dựa trên tay phát hiện có thể [3]. Tuy nhiên, điều này tự nó không phải là phương thức đáng tin cậy. Tay có thể phân biệt từ các đối tượng khác của da màu và đây là những trường hợp đủ điều kiện ánh sáng, chẳng hạn như ánh sáng màu hoặc xám cấp hình ảnh. Chuyển động dòng chảy thông tin là một phương thức mà có thể lấp đầy khoảng cách này theo một số điều kiện [4], nhưng ví dụ cho phòng không văn phòng phẩm máy ảnh cách tiếp cận này trở nên ngày càng khó khăn và ít đáng tin cậy. Thống kê thông tin về địa điểm tay là có hiệu quả khi sử dụng như một xác suất trước [5], nhưng nó đòi hỏi dành riêng cho ứng dụng đào tạo.
Eng-Jon Ong và Bowden [1] một cuốn tiểu thuyết trình bày. không có giám sát phương pháp tiếp cận để đào tạo một phát hiện hiệu quả và mạnh mẽ mà áp dụng của không chỉ phát hiện sự hiện diện của con người tay trong vòng và hình ảnh nhưng phân loại hình dạng tay. Cách tiếp cận của họ là để phát hiện vị trí của tay sử dụng một thác boosted của máy phân loại để phát hiện các hình dạng một mình trong hình ảnh màu xám quy mô. Cơ sở dữ liệu của tay hình ảnh được tập trung vào bộ tương tự như bàn tay tìm kiếm bằng cách sử dụng các thuật toán kết cụm k-mediod mà sử dụng một khoảng cách số liệu dựa trên hình dạng bối cảnh. Một cây thiết bị dò thúc đẩy mạnh mẽ tay sau đó được thành lập, bao gồm hai lớp, lớp trên cùng chung tay phát hiện, trong khi các chi nhánh trong lớp thứ hai chuyên phân loại bộ hình dạng bàn tay là hệ quả từ các phương pháp kết cụm không có giám sát. Thử nghiệm các máy dò với một cơ sở dữ liệu không nhìn thấy hình ảnh 2509 đã cho 99,8% thành công tỷ lệ và hình dạng loại với tỷ lệ 97,4% thành công.
Kolsch và Turk đã làm một nghiên cứu dành riêng cho xem tay tư thế phát hiện với một phương pháp công nhận abject mới được đề xuất bởi Viola và James. Trước tiên, họ chứng minh sự phù hợp của các phương pháp hình ảnh tích phân với nhiệm vụ phát hiện tay xuất hiện. Sau đó, các biện pháp về chất lượng được trình bày mà số tiền để một tiên nghiệm một ước tính của 'detectability', giảm sự cần thiết cho việc đào tạo chuyên sâu tính toán. Cuối cùng, các tham số của các phương pháp phát hiện được tối ưu hóa, đạt được cải tiến đáng kể tốc độ và độ chính xác. Họ đề nghị đặt lồi xuất hiện với nội bộ xám cấp biến thể tốt hơn phù hợp với mục đích phát hiện với hình chữ nhật tính năng-phân loại phương pháp.
The Hàn Quốc hướng dẫn sử dụng bảng chữ cái (KMA) của Kim Jung-Bae, Kwang-Hyun Park và Z.Zenn biên [3], trình bày một hệ thống nhận dạng dựa trên tầm nhìn của Hàn Quốc hướng dẫn sử dụng bảng chữ cái mà là một tập hợp con của ngôn ngữ ký hiệu Triều tiên. KMA có thể nhận ra bàn tay con người da màu bởi triển khai thực hiện các mạng nơ-ron min-max mờ thuật toán sử dụng Matrox Genesis hình ảnh ban và PULNIX TMC-7 RGB máy ảnh.
phong-Sheng Chen, Chih-Ming Fu, Chung-Lin hoàng [4] giới thiệu một cử chỉ tay công nhận hệ thống để nhận ra 'năng động cử chỉ' trong đó một cử chỉ trong thực hiện đơn lẻ trong nền phức tạp bằng cách sử dụng đầu vào video 2D. Hệ thống theo dõi mặt di chuyển và phân tích các biến thể hình dạng bàn tay và chuyển động trong hình thành như là đầu vào cho hệ thống dựa trên HMM công nhận. Họ đi ra với các thử nghiệm kết quả của 4-bang HMM đã chứng minh để tạo ra hiệu suất tốt nhất cho mô hình các cử chỉ. Mỗi hình ảnh nhập vào chuỗi trước được xử lý bằng tay quá trình khai thác khu vực đường viền thông tin và mã hóa và đã được thực hiện bằng cách sử dụng hai phương pháp: (1) chỉ đường viền thông tin và (2) sử dụng com - bined đường viền thông tin và thông tin chuyển động. Các thông tin được giải nén chuyển đổi sang trình tự véc tơ và sau đó bước vào trình tự biểu tượng cho cả đào tạo và các quy trình công nhận. Hoàn toàn 1200 chuỗi hình ảnh được thu thập cho 20 cử chỉ khác nhau, do đó mỗi loại cử chỉ với 60 trình tự trong trung bình, trong giai đoạn đào tạo và trình tự 1200 khác được thu thập cho thử nghiệm. Đối với phương pháp (1), công nhận tốc độ bằng cách sử dụng dữ liệu đào tạo để thử nghiệm là 97%, và tỷ lệ nhận dạng bằng cách sử dụng dữ liệu thử nghiệm là 90,5%, trong khi đó đối với phương pháp (2), công nhận tốc độ bằng cách sử dụng dữ liệu đào tạo để thử nghiệm là 98,5% và tỷ lệ nhận dạng bằng cách sử dụng dữ liệu thử nghiệm tăng lên đến 93.5%.
3. Tay phát hiện vùng
tay phát hiện là một bước sơ bộ để một số ứng dụng bao gồm HCI, giám sát, cử chỉ công nhận, tay theo dõi và tìm hiểu về con người-con người tương tác.
tay phát hiện tồn tại trong giai đoạn sơ bộ xử lý hình ảnh. Chúng tôi nghiên cứu tìm thấy ra có là một số kỹ thuật phát hiện tay vùng.
© FORMATEX 2006
sự phát triển hiện nay trong giáo dục Technology-Assisted (2006) 969
Nói chung tay phát hiện bao gồm trừ hình ảnh người ký từ hình ảnh nền. Tìm khu vực tay bằng cách sử dụng màu sắc hình ảnh là không khó khăn bởi vì bản chất của màu da có giá trị độc đáo của riêng của nó và có thể dễ dàng được xử lý. Da màu sắc mô hình sẽ được sử dụng để phát hiện tinh khiết tay hình ảnh từ môi trường phức tạp. Tuy nhiên, kể từ khi màu da bị ảnh hưởng bởi độ sáng và bóng tối, HSL màu sắc mô hình hoặc RGB màu sắc mô hình không cho hiệu suất tốt. Hình ảnh miễn phí chói, RGB bình thường đã được áp dụng. Một số sẽ so sánh các màu sắc của các vùng da chiết xuất với mẫu màu da chiết xuất từ đào tạo hình ảnh. Các hệ thống thất bại dưới điều kiện ánh sáng nghèo hoặc cho da màu sắc không đào tạo cho
đến nay, Mô hình màu khác nhau đã được đề xuất cho da màu phát hiện, ví dụ: không gian màu CbCr được sử dụng trong [8,9], không gian màu RGB được sử dụng trong [10]. Không gian màu HS (Huế, bão hòa) được sử dụng trong [11], chuẩn hoá RGB và HSV (Hue, bão hòa, giá trị) trong [12] và vv. Đối phó với màu hình ảnh sẽ làm cho quá trình của việc tìm kiếm một giá trị ngưỡng phát hiện mặt trở thành dễ dàng hơn. Tuy nhiên, đối phó với greyscale hình ảnh nhập vào buộc chúng tôi để tự động hoá nhập ngưỡng giá trị để đo informa tion do đó chiết xuất vùng tay từ hình ảnh toàn bộ.
ngoài ra, cạnh phát hiện kỹ thuật sẽ được áp dụng để tách vùng cánh tay từ vùng tay khi người ký mặc ngắn tay áo áo sơ mi. Cho cùng một kịch bản, trong [12], vùng tay và cánh tay mỏng để có được mặc
đang được dịch, vui lòng đợi..