Một ứng dụng Mục tiêu của chế đào tạo tiếp cận veloped triển trong bài viết này là thần kinh chức năng mạng xấp xỉ trong thiết kế nhà phê bình thích nghi. Nhà phê bình thích ứng gần đúng tions giải pháp để vấn đề kiểm soát tối ưu phức tạp bằng cách tối ưu hóa xấp xỉ thần kinh của các luật điều khiển và chức năng giá trị lặp đi lặp lại theo thời gian [7]. Lendaris và Neidhoefer viết rằng "nếu một kiến thức tiên nghiệm có sẵn về các vấn đề tên miền mà có thể được dịch thành một thiết kế bắt đầu của bộ điều khiển và / hoặc các nhà phê bình, sau đó nó behooves chúng tôi sử dụng kiến thức này như là một điểm khởi đầu cho các thủ tục ADP" [12]. Một lý do là những thiết kế có thể khai thác kiến thức trước khi thực hiện đầy đủ trong khi hệ thống ADP được học tập trực tuyến. Một lý do khác là nếu thiết kế bắt đầu gần các giải pháp tối ưu, sau đó hệ thống ADP hoạt động trên tinh chỉnh các thiết kế hiện tại thay vì học từ đầu. Ngay cả khi biết trước được thành công nhúng trong bộ điều khiển nhà phê bình thích nghi bắt đầu, nó có thể bị xấu đi hoặc hoàn toàn bị lãng quên sau khi cập nhật tham số thường xuyên trong giai đoạn thăm dò.
Trong phần này, các phương pháp tiếp cận hạn chế-đào tạo là trọng plemented để bảo tồn một nhà phê bình thích nghi bay điều khiển của kiến thức của một tập hợp các thiết kế được lưu theo lịch cổ điển. Các bộ điều khiển mô phỏng, lấy từ [17], được xem xét trong các phần VA và VB. Trong Phần VC, nó cho thấy rằng, sau khi khám phá chế độ, mà là phi tuyến đáng kể, bộ nhớ của thiết kế được lưu theo lịch bị suy thoái đáng kể do sự can thiệp. Cuối cùng, trong phần VD, các phương pháp đào tạo hạn chế được thực hiện, vì vậy ức chế sự can thiệp và bảo quản bộ nhớ chính xác của những thiết kế này ở tất cả các lần. A. Nhận xét về thích ứng Critic bay thiết kế điều khiển Nó được giả định rằng động lực máy bay có thể được chụp bởi một phương trình vi phân phi tuyến
đang được dịch, vui lòng đợi..
