Tất cả các lớp chập được áp dụng với
đệm thích hợp (cả về không gian và thời gian) và sải bước
1, do đó không có sự thay đổi trong thời hạn kích thước từ đầu vào
đến đầu ra của các lớp chập. Tất cả các lớp tổng hợp
được tối đa tổng hợp với kích thước hạt nhân 2? 2? 2 (trừ
các lớp đầu tiên) với sải chân 1 có nghĩa là kích thước của đầu ra
tín hiệu bị giảm bởi một nhân tố của 8 so với các đầu vào
tín hiệu. Các lớp tổng hợp đầu tiên có kích thước hạt nhân 1? 2? 2
với ý định không để hợp nhất các tín hiệu thời gian quá
sớm và cũng để đáp ứng độ dài clip 16 khung hình (ví dụ
, chúng tôi tạm thời có thể bơi với hệ số 2 tối đa 4 lần trước khi
hoàn toàn sụp đổ tín hiệu thời gian). Hai
lớp kết nối đầy đủ có 2048 kết quả đầu ra. Chúng tôi đào tạo các mạng
từ đầu bằng cách sử mini-lô 30 clip, với ban đầu
tỷ lệ học của 0: 003. Tỷ lệ học tập được chia bởi
10 sau mỗi 4 kỷ nguyên. Việc đào tạo được dừng lại sau 16
thời đại.
đang được dịch, vui lòng đợi..
