Hình 7. Ba buổi đào tạo hạn chế được minh họa trong thời gian đó e lỗi STM được tối thiểu hoá, và các khó khăn LTM được hài lòng trong rất nhỏTaotl biểu hiện bằng "và". trong khi STMs mới được hình thành. LTM bảo tồn được xác minh bởi so sánh, có nghĩa là lỗi bình phương (MSE) của bộ điều khiển mạng nơ-ron hơn trước và sau khi sự thích ứng. Số kết quả cho thấy rằng lỗi này vẫn còn gần bằng không mọi lúc. Ngoài ra, LTM hiệu quả được minh họa bằng cách kiểm tra hiệu suất của bộ điều khiển mạng nơ-ron trong suốt chuyến bay tăng cấp phong bì (hình 3) sau khi bộ đã xảy ra.Cổ điển dự kiến sẽ đạt được điều khiển (phần V-A1) được sử dụng để tạo thành một gradient-dựa LTM đào tạo thiết lập. Sử dụng các kết quả trong phần IV, thiết lập này có thể được nhúng trong các khó khăn bình đẳng (26)để mà tất cả các biến được xác định trong phần IV và quảng cáo - độ dốc tham gia cung cấp trong định lý 2. Bộ điều khiển mạng nơ-ron (9) có các nút, và được huấn luyện với trước khi thực hiện trực tuyến. Nếu hiệu quả của nó trở thành phụ-tối ưu, điều kiện điều (25) tạo ra một mục tiêu từng thời gian, ngay lập tức được sử dụng bởi 1 thuật toán để cập nhật các trọng lượng của (9).Để bắt đầu thích ứng DHP, chiếc máy bay đạo diễn để thực hiện một lần lượt lớn-góc với 60 tại(145 m/s, 6000 m). Như là trường hợp trong ví dụ được cung cấp trong hình 4, cơ động này cũng vi phạm cả hai giả định của các độ lệch nhỏ và tách năng động. Do đó, một cổ điển bộ điều khiển (23) được thiết kế đặc biệt cho điều kiện chuyến bay như vậy là suboptimal, như có thể được xác nhận bằng cách đánh giá các điều kiện điều (25). Để so sánh, bộ điều khiển mạng nơ-ron được Cập Nhật với một thuật toán RPROP không bị giới hạn [17] và với một thuật toán RPROP hạn chế việc thực hiện các gradient adjoined. Bộ điều khiển hạn chế thích nghi mạng nơ-ron phát hiện tốt hơn thiết kế tuyến tính và bộ điều khiển thích nghi không bị giới hạn, dẫn đến một tổng thể giảm tổng chi phí lên đến 62,5% bởi thời gian cuối cùng 10 s (so với các bộ điều khiển khác). Ngoài ra, đến cuốicủa cơ động, hiệu suất của mạng nơ-ron ràng buộc-thích nghi được tìm thấy là gần tối ưu, như thể hiện bởi chi phí gia tăng.Cùng lúc đó, bằng cách thực hiện các gradient adjoined, bộ điều khiển hạn chế mạng nơ-ron giữ lại bộ nhớ chính xác của bộ đào tạo LTM, như được hiển thị trong bảng I, tóm tắt MSE trên thử nghiệm mẫu thời gian bước trong quá trình thích ứng. Nó có thể được nhìn thấy rằng trong suốt adapta-tion mạng nơ-ron điều khiển được đào tạo với các thuật toán tối ưu hóa hạn chế duy trì một MSE của dữ liệu đầu ra, và một MSE thấp hơn cho các dữ liệu gradient. Bộ điều khiển DHP cùng được đào tạo với một thuật toán RPROP không bị giới hạn đáng kể nặng hơn hiệu suất trên LTM đào tạo thiết lập, tăng MSE đến 24 đơn đặt hàng của các cường độ ngay sau khi bắt đầu sự thích ứng. Blues đào tạo thu được từ buổi đào tạo mẫu được tiến hành với các thuật toán RPROP hạn chế và không bị giới hạn được hiển thị trong Figs. 7 và 8, tương ứng. Mỗi buổi tập mẫu xảy ra vào thời điểm ngay lập tức được nêu trên cốt truyện. Trong những blues đào tạo, STM lỗi, được định nghĩa trong (5), âm mưu đối với kỷ nguyên được sử dụng để giảm thiểu của nó. Taotl LTM cho sản lượng và gradient dữ liệu, được biểu thị bằng và, tương ứng, được tính vào cuối mỗi phiên làm việc đào tạo sử dụng các Hình 8. Ba buổi huấn luyện không bị giới hạn được minh họa trong thời gian đó e lỗi STM được cực tiểu hoá, nhưng các khó khăn LTM không hài lòng, như thể hiện bởi taotl lớn "và".BẢNG IIPHẦN TRĂM THAY ĐỔI TRONG TRỌNG LƯỢNG MẠNG LƯỚI HÀNH ĐỘNG CẬP NHẬT BỞI DHP THÓI QUEN Cập Nhật tham số, và hiển thị trong Figs. 7 và 8. Tương tự như LTM MSE giá trị thu được tại trung gian kỷ nguyên, và trong tất cả các buổi đào tạo khác.Một cách tiếp cận trước đó để trấn áp sự can thiệp mà không có đại diện-resenting dữ liệu LTM đề xuất để giữ trọng lượng LTM con-stant trong một nỗ lực để giữ những kỷ niệm tương ứng [4], [5]. Tuy nhiên, do tính chất phi tuyến của mạng nơ-ron, khi trọng lượng STM được sửa đổi, các giá trị cũ của trọng lượng LTM có thể không còn phù hợp với dữ liệu LTM, hoặc các khó khăn (3). Từ (4), nó là rõ ràng rằng các giá trị đó đáp ứng (3) phụ thuộc vào các giá trị của. Mô phỏng của chúng tôi xác nhận rằng, bằng cách giữ các trọng lượng LTM của mạng nơ-ron điều khiển con-stant trong thích ứng, hiệu quả của nó trên phong bì tăng cấp hủy với gia tăng nhanh chóng của LTM MSE như trọng lượng STM được Cập Nhật để giảm thiểu.Trong cách tiếp cận tối ưu hóa hạn chế của chúng tôi, tất cả trọng lượng được phép thay đổi trong đào tạo gia tăng, nhưng trọng lượng LTM thay đổi để bảo tồn bộ nhớ, trong khi trọng lượng STM thay đổi để acqui
đang được dịch, vui lòng đợi..
