Tóm tắt-Trong bài báo này, một kỹ thuật huấn luyện mạng nơron có giám sát dựa trên tối ưu hóa ràng buộc được phát triển để bảo tồn kiến thức trước khi một bản đồ đầu vào-đầu ra trong các buổi đào tạo tăng dần lặp đi lặp lại. Các kiến thức trước, được gọi là bộ nhớ dài hạn (LTM), được thể hiện trong các hình thức hạn chế bình đẳng thu được bằng phương tiện của một kỹ thuật đào tạo đại số. Đào tạo gia tăng, trong đó có thể được sử dụng để tìm hiểu những ký ức ngắn hạn mới (STMs) trực tuyến, sau đó được đưa ra như một vấn đề chủ thể giảm thiểu lỗi để hạn chế bình đẳng. Các giải pháp của vấn đề này được đơn giản hóa bằng cách thực hiện một gradient lỗi tiếp giáp mà làm hỏng thay thế trực tiếp và khai thác lan truyền ngược cổ điển. Một ứng dụng mục tiêu là thần kinh chức năng mạng xấp xỉ trong thiết kế nhà phê bình thích nghi. Đối với mục đích minh họa, đào tạo hạn chế được thực hiện để cập nhật một bộ điều khiển chuyến bay phê bình thích ứng, trong khi vẫn giữ kiến thức về đường cơ sở thực hiện thành lập bao gồm các bộ điều khiển được lưu theo lịch cổ điển. Nó được thể hiện cả hai phân tích và bằng con số rằng LTM được bảo quản một cách chính xác trong khi điều khiển được đào tạo liên tục theo thời gian để đồng hóa STMs mới.
Phê bình Index Điều khoản-Adaptive, kiểm soát, thăm dò, chức năng xấp xỉ, đào tạo gia tăng, sự can thiệp, mua lại kiến thức và duy trì, bộ nhớ , học tập trực tuyến, mạng nơron xích ma.
đang được dịch, vui lòng đợi..