Lấy cảm hứng từ những bước đột phá học sâu trong lĩnh vực hình ảnh [24] nơi tiến bộ nhanh chóng đã được thực hiện trong vài năm qua trong việc học tính năng, khác nhau trước khi được đào tạo mạng chập (ConvNet) mô hình [16] được làm sẵn để trích các tính năng hình ảnh. Những tính năng này là kích hoạt của vài lớp đầy đủ kết nối cuối cùng của mạng mà thực hiện tốt các nhiệm vụ học tập chuyển [47, 48]. Tuy nhiên, hình ảnh dựa trên các tính năng sâu sắc như vậy là không trực tiếp thích hợp cho
video do thiếu mô hình chuyển động (như trong thí nghiệm của chúng tôi trong các phần 4,5,6). Trong bài báo này chúng tôi đề xuất để học tính năng của không-thời gian sử dụng sâu 3D ConvNet.
đang được dịch, vui lòng đợi..