d 3) dự đoán ý định sử dụng khi họ
tham gia vào các nhiệm vụ đa ứng dụng. Là một phần trong công việc của chúng tôi, chúng tôi thu thập dữ liệu từ điện thoại thông minh
của 14 người đã tham gia vào cuộc sống thực nhiệm vụ đa ứng dụng. Chúng tôi thấy rằng nó là hợp lý
để tập nhóm vào ý định của cấp cao. Dựa trên nội dung hộp thoại, IA có thể
tạo ra cụm từ hữu ích để mô tả ý định. Chúng tôi cũng nhận thấy rằng, với dễ dàng
bối cảnh có sẵn, IAs hiệu quả có thể dự đoán được ý định của người sử dụng trong quá trình trò chuyện,
với độ chính xác ở 58,9%.
1 Giới thiệu
trợ lý thông minh (IAs) trên các thiết bị thông minh có thể trò chuyện với người sử dụng của con người và giúp họ với
nhiệm vụ đơn giản như việc tìm kiếm một nhà hàng hoặc gửi tin nhắn. Nhưng người dùng của con người có thể tương tác
với điện thoại của họ theo những cách phức tạp hơn có thể span nhiều lĩnh vực và các ứng dụng. Lập kế hoạch và
thực hiện các nhiệm vụ đa lĩnh vực đó được quản lý bởi người dùng có nhận thức bối cảnh toàn cầu cho các
nhiệm vụ. Chúng tôi giả định rằng IAs sẽ trở nên có giá trị hơn nếu họ tích cực có thể giúp đỡ về điều này nhiều hơn
mức độ công việc trừu tượng, thay vì xử lý từng lĩnh vực một cách độc lập.
Một ứng dụng sẽ IA, theo định nghĩa, không duy trì sự mong đợi của bất kỳ lĩnh vực theo dõi. Nó là bằng nhau
có khả năng mà người sử dụng sẽ nói về thức ăn hay thời tiết tiếp theo, không phụ thuộc vào ngữ cảnh. Những hậu quả
bao gồm 1) hệ thống có thể không được chuẩn bị đầy đủ vì nó có thể được, nếu nó hiểu được cách người dùng
thực sự cấu trúc nhiệm vụ đó; 2) hệ thống có thể mất cơ hội để cung cấp hỗ trợ kịp thời
để thông suốt hướng dẫn thoại trên các lĩnh vực ("Bạn có muốn gửi hình ảnh này với ai đó?") Hoặc
chia sẻ bối cảnh của sự tương tác đa ứng dụng cho các nhiệm vụ nguyên tố tiếp theo (" Bạn có nghĩa là hình ảnh bạn
vừa chụp? "). Trong bài báo này, chúng tôi giải quyết vấn đề này bằng cách tiến hành một nghiên cứu sử dụng điều tra làm thế nào người dùng
thực hiện các tác vụ đa ứng dụng thông qua ngôn ngữ. Chúng tôi chứng minh rằng hệ thống với sự hiểu biết nông cạn,
chẳng hạn như những gì người dùng nói và các cấu trúc công việc chung, vẫn có thể cải thiện chất lượng tương tác.
Các hệ thống hỗ trợ đa miền tương tác giọng nói đã được nghiên cứu trong quá khứ [11, 16]. Một
hiện thực là một kiến trúc phân tán cho phép các lĩnh vực khác nhau được phát triển độc lập
nhưng hợp tác với nhau để trả lời cho người sử dụng đầu vào [8, 14, 2, 7]. Tuy nhiên, các phương pháp này chờ đợi
cho người dùng để gọi một tên miền bằng một số phương tiện rõ ràng và không cố gắng để khai thác các mối quan hệ
giữa các ứng dụng mà có thể tồn tại trong công việc chung. Chúng tôi quan tâm đến các hệ thống trở thành
nhận thức được những mối quan hệ và có thể chủ động hỗ trợ các hoạt động của người dùng.
1
Hình 1: Multi-ứng dụng chú thích ví dụ; thời gian và địa điểm là màu đỏ; ứng dụng thành phần có màu xanh dương.
Nó đã được chứng minh rằng dựa trên bối cảnh đơn giản như thời gian hoặc địa điểm, điện thoại thông minh dự đoán
nhu cầu của người dùng có thể cải thiện đáng kể hiệu quả của điều hướng các ứng dụng [19, 24]. Tuy nhiên,
sự tương tác ngôn ngữ có thể biết nhiều thông tin, cho phép để được hỗ trợ tốt hơn. Mọi người cũng
làm việc về phát hiện cấu trúc tiềm ẩn cấp cao trong các cuộc trò chuyện [26], với giả định rằng
những phát biểu (từ) trong một hộp thoại được tạo ra bởi một chủ đề tiềm ẩn năng động. Trong công việc của chúng tôi, chúng tôi giả định rằng
chúng ta đã biết các ứng dụng trước đó (đúng cho đại lý cấp hệ điều hành) và các chủ đề tiềm ẩn (tức là cấp cao có ý định như vậy
là "lập kế hoạch một cuộc họp") là tĩnh trong một hộp thoại.
Để điều tra những câu hỏi này, chúng tôi thu thập được một corpus của việc sử dụng điện thoại thông minh thực tế, cùng với văn nói
phiên bản ngôn ngữ của các hoạt động này. Chúng tôi sử dụng những dữ liệu này để xây dựng mô hình hoạt động của người dùng và
cung cấp một đường ống dẫn end-to-end cho IAs phải học để hiểu và nói về các hoạt động như vậy dựa
trên ngôn ngữ được sản xuất bởi người sử dụng. Chúng tôi đánh giá như thế nào IAs có thể dự đoán dòng chảy công việc tiềm năng
xuất phát từ ý định của người sử dụng, bằng cách thích ứng với ngôn ngữ cá nhân của người sử dụng và các mẫu hành vi và
bối cảnh xung quanh.
đang được dịch, vui lòng đợi..
