240
Các Hamilton (với t bỏ qua) là
1 2 2 H = 2 {q: r: + ru) + pa: r: + pu
Các chính sách tối ưu, thu được từ aH / au = 0, là
u '* p / 1 '
Áp dụng p {t) = kx {t) từ (14) cung cấp cho
u '* = - {k / r): r: {t)
k là hằng số, phương trình Riccati (27) cho
k 2-2 rak - RQ = 0
có giải pháp là
k = ar ± 1 'J một 2r + q / r
Sự mơ hồ của dấu hiệu được lấy ra bằng cách nhìn nhận thực tế là k> 0
(K là một ma trận đối xứng xác định dương nói chung), và viết
8 ::: v'a 2 r + q / 1 '(> 0), ta có
k = {a + 8) 1 '
Các chính sách tối ưu được
u '* {t) = - (a + 8): r: (t)
x {t) = a: r: (t) + u (t) = - 8: r: (t)
tức là,
u * (t) - (a · 1- 8Jx 0 e -et
: r: '* {t ): r: oe
-Bt
đó cung cấp cho các chính sách trả nợ tối ưu và nợ mà kết quả
giảm ở mức B theo cấp số nhân theo thời gian.
8.3 Tuyến tính theo dõi vấn đề
I.inear theo dõi (LT) bao gồm việc lập ra một cơ chế kiểm soát để
làm cho sản lượng của hệ thống y (t) (hoặc nhà nước: r: (t}) để theo dõi một số
. đầu ra mong muốn hoặc tham chiếu; rtJ (hoặc nhà nước; (t)) A Engineering cổ điển
ví dụ là một tên lửa đánh chặn một số tên lửa được. Kinh tế, một
đang được dịch, vui lòng đợi..
![](//viimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)