Chúng tôi mô tả một cách tiếp cận đối tượng và thu hồi cảnh đó tìm kiếm và localizes tất cả các lần xuất hiện của một người sử dụng đối tượng nêu trong một video. Các đối tượng được biểu diễn bởi một tập hợp các quan điểm mô tả khu vực bất biến nên công nhận rằng có thể tiến hành thành công bất chấp những thay đổi trong quan điểm, chiếu sáng và một phần tắc. Tính liên tục thời gian của video trong một shot được sử dụng để theo dõi các khu vực để từ chối các vùng bất ổn và giảm ảnh hưởng của tiếng ồn trong các mô tả. Sự tương tự với hồi văn bản là trong việc thực hiện phù hợp với nơi trên mô tả là tính toán trước (sử dụng vector quantization), và hệ thống tập tin ngược và bảng xếp hạng tài liệu được sử dụng. Kết quả là truy xuất là ngay lập tức, trả lại một danh sách xếp hạng của khung hình / bức ảnh quan trọng trong cách thức của Google. Phương pháp này được minh họa cho phù hợp trong hai bộ phim độ dài đầy đủ.
đang được dịch, vui lòng đợi..