TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
————oOo————
NGUYỄN THỊ THANH NGÂN
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI
VỚI HỆ Ô-TÔ-NÔM TUYẾN TÍNH
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán giải tích
HÀ NỘI, 04/2017
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
————oOo————
KHÓA LUẬN TỐT NGHIỆP
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI
VỚI HỆ Ô-TÔ-NÔM TUYẾN TÍNH
Giảng viên hướng dẫn:
TS. TRẦN VĂN BẰNG
Sinh viên thực hiện
: NGUYỄN THỊ THANH NGÂN
Lớp
: K39C
HÀ NỘI, 04/2017
Lời cảm ơn
Để hoàn thành khóa luận tốt nghiệp này, em xin bày tỏ lòng biết ơn chân
thành tới các thầy giáo và cô giáo trong khoa Toán, trường Đại học Sư phạm
Hà Nội 2, đã tận tình giúp đỡ chỉ bảo trong suốt thời gian em theo học tại khoa
và trong thời gian làm khóa luận.
Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo TS. Trần Văn
Bằng, giảng viên Khoa Toán, trường Đại học Sư phạm Hà Nội 2, người trực
tiếp hướng dẫn em, luôn tận tâm chỉ bảo và định hướng cho em trong suốt quá
trình làm khóa luận để em có được kết quả như ngày hôm nay.
Mặc dù đã có rất nhiều cố gắng, song thời gian và kinh nghiệm bản thân còn
nhiều hạn chế nên khóa luận không thể tránh khỏi những thiếu sót rất mong
được sự đóng góp ý kiến của các thầy cô giáo, các bạn sinh viên và bạn đọc.
Em xin chân thành cảm ơn!
Hà Nội, tháng 4 năm 2017
Sinh viên
Nguyễn Thị Thanh Ngân
1
Lời cam đoan
Khóa luận này là kết quả nghiên cứu của bản thân em dưới sự hướng dẫn
tận tình của thầy giáo TS. Trần Văn Bằng.
Trong khi nghiên cứu hoàn thành đề tài nghiên cứu này em đã tham khảo
một số tài liệu đã ghi trong phần tài liệu tham khảo.
Em xin khẳng định kết quả của đề tài "Bài toán điều khiển tối ưu thời
gian đối với hệ ô-tô-nôm tuyến tính" là kết quả của việc nghiên cứu, học
tập và nỗ lực của bản thân, không có sự trùng lặp với kết quả của các đề tài
khác. Nếu sai em xin chịu hoàn toàn trách nhiệm.
Hà Nội, tháng 4 năm 2017
Sinh viên
Nguyễn Thị Thanh Ngân
2
Mục lục
Lời cảm ơn
1
Lời nói đầu
4
Một số kí hiệu
7
1 Kiến thức chuẩn bị
8
1.1
Bài toán điều khiển được . . . . . . . . . . . . . . . . . . . . .
8
1.2
Bài toán điều khiển tối ưu . . . . . . . . . . . . . . . . . . . .
11
1.3
Hệ thời gian ngược . . . . . . . . . . . . . . . . . . . . . . . .
12
1.4
Tính điều khiển được của hệ ô-tô-nôm . . . . . . . . . . . . . .
12
1.5
Phụ lục của Chương ??: Chứng minh của Nguyên lý Bang−Bang. 15
2 Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến
tính
2.1
17
Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến
tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2
Sự tồn tại của điều khiển tối ưu thời gian . . . . . . . . . . . .
21
2.3
Ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . .
48
3
Lời nói đầu
1. Lý do chọn đề tài
Toán học bắt nguồn từ nhu cầu giải quyết các bài toán có nguồn gốc thực
tiễn. Cùng với thời gian, toán học ngày càng phát triển và chia thành hai lĩnh
vực, đó là: Toán học lý thuyết và toán học ứng dụng. Trong lĩnh vực toán học
ứng dụng thường gặp rất nhiều bài toán liên quan đến việc giải quyết bài toán
bằng cách tìm một quy luật điều khiển một hệ cho trước.
Một bài toán điều khiển bao gồm một hàm chi phí đó là một hàm của trạng
thái và các biến điều khiển. Một điều khiển tối ưu là một tập hợp các phương
trình vi phân mô tả đường đi của các biến điều khiển cực tiểu hóa hàm chi phí.
Xuất phát từ nhận thức trên và lòng ham mê môn học với sự hướng dẫn tận
tình của thầy giáo TS. Trần Văn Bằng, em mạnh dạn chọn đề tài "Bài toán
điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính" để thực
hiện khóa luận tốt nghiệp của mình. Nội dung chính của khóa luận là trình
bày một số kết quả về bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm
tuyến tính. Khóa luận được trình bày trong hai chương là:
Chương 1: Kiến thức chuẩn bị
Trong chương này trình bày một số kiến thức cần thiết cho nội dung của
Chương 2, bao gồm bài toán điều khiển được, bài toán điều khiển tối ưu, hệ
thời gian ngược và tính điều khiển được của hệ ô-tô-nôm.
Chương 2: Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến
tính
4
MỤC LỤC
5
Trong chương này trình bày một số kiến thức về bài toán điều khiển tối ưu
thời gian đối với hệ ô-tô-nôm tuyến tính, sự tồn tại của điều khiển tối ưu thời
gian và ứng dụng.
2. Mục đích và nhiệm vụ nghiên cứu
- Tìm hiểu tính điều khiển tối ưu thời gian của hệ ô-tô-nôm tuyến tính.
- Nghiên cứu tính điều khiển tối ưu thời gian hệ ô-tô-nôm tuyến tính;
- Ứng dụng xét tính điều khiển tối ưu thời gian một số hệ ô-tô-nôm tuyến
tính cụ thể.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Bài toán của hệ ô-tô-nôm tuyến tính.
Phạm vi nghiên cứu: Tính điều khiển tối ưu thời gian .
4. Phương pháp nghiên cứu
Tổng hợp kiến thức thu thập được qua những tài liệu liên quan đến đề tài
và sử dụng các phương pháp nghiên cứu của giải tích.
5. Ý nghĩa khoa học và thực tiễn của đề tài
Bài toán điều khiển tối ưu đóng vai trò quan trọng trong sự phát triển của
khoa học và kỹ thuật. Lĩnh vực này hữu hiệu khắp nơi trong thực tiễn như việc
điều khiển động cơ xe lửa, mô hình nền kinh tế, mô hình bể chứa nước,...
6. Đóng góp của đề tài
Xây dựng luận văn thành một tài liệu tổng quan tốt cho sinh viên về đề tài
"Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính".
6
MỤC LỤC
7
Bảng kí hiệu
B(x; α)
Hình cầu mở tâm x bán kính α, {y|y − x| < α}.
C , C [u(·)]
Hàm chi phí.
C (t)
Tập điều khiển được ở thời điểm t.
CBB (t)
Tập điều khiển được ở thời điểm t sử dụng
điều khiển Bang−Bang.
∂S
Biên của tập S.
IntS
Phần trong của tập S.
K(t; x0 )
Tập khả đạt tại thời điểm t.
KBB (t; x0 )
Tập khả đạt tại thời điểm t sử dụng
điều khiển Bang−Bang.
RC
Nón khả đạt.
T (t)
Trạng thái mục tiêu.
Ω
Hình lập phương đơn vị trong Rm .
Um (t0 ; t1 )
Lớp hàm đo được từ [t0 ; t1 ] đến Ω.
Um
t1 >t0
Um (t0 ; t1 )
UP C
Lớp các hàm hằng từng khúc trong Um .
UBB
Lớp của hàm trong Um theo đó |ui (t)| = 1.
x(t; t0 ; x0 ; u(·)) Nghiệm của phương trình vi phân
qua x0 tại thời điểm t0 ứng với điều khiển u(·).
Chương 1
KIẾN THỨC CHUẨN BỊ
1.1
Bài toán điều khiển được
Chúng ta sẽ thảo luận về tính điều khiển được của bài toán điều khiển:
x˙ = f (t; x; u),
u(·) ∈ Um ,
T (t) đã cho
(1.1)
tức là, mô tả những trạng thái ban đầu x(0) = x0 sao cho tồn tại ít nhất một
điều khiển thành công u(·).
Ta định nghĩa tập hợp điều khiển được C =
C (t1 ), trong đó
t1 >0
C (t1 ) = {x0 ∈ Rn |∃u(·) ∈ Um sao cho x(t1 ; x0 ; u(·)) ∈ T (t1 )}
hay đơn giản là tập những trạng thái mà có thể hướng đến mục tiêu ở thời
điểm t1 .
Hai vấn đề lớn về tính điều khiển được đó là:
(a) Miêu tả tập C .
(b) Miêu tả cách C thay đổi nếu chúng ta thay đổi tập điều khiển Um .
Liên quan đến các lớp điều khiển đặc biệt, có ba tập con của Um mà chúng
ta sẽ xét:
(a) UP C [0; t1 ]={u(·) ∈ Um [0; t1 ]|u(·) hằng từng khúc [0; t1 ]} trong đó u(·)
là hằng từng khúc, tức là tồn tại một phân hoạch (phụ thuộc vào u(·))
0 = s0 < s1 < ... < sl = t1 sao cho u(t) là hằng số trên mỗi khoảng
UP C [0; t1 ] bao gồm các điều
[sk−1 ; sk ). Từ quan điểm thực tế, UP C =
t1 >0
khiển dễ sử dụng so với điều khiển thuộc Um nói chung.
8
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
9
(b) Uε [0; t1 ]={u(·) ∈ Um [0; t1 ]|u(·) liên tục tuyệt đối, u(0) = u(t1 ) = 0,
˙
|u(t)| ≤ 1 và |u(t)|
≤ ε hầu khắp nơi trên [0; t1 ]}.
Trong đó ε > 0 cố định, Uε =
Uε [0; t1 ] là lớp các điều khiển trơn
t1 >0
(không thay đổi đột ngột)− chẳng hạn là việc điều khiển một chiếc xe.
(c) UBB [0; t1 ]={u(·) ∈ Um [0; t1 ]||ui (t)| ≡ 1 trên [0; t1 ], i = 1, ..., m} là lớp
điều khiển "bang−bang". Điều khiển từ lớp UBB =
UBB [0; t1 ] sử
t1 >0
dụng năng lượng tối đa cho phép (nhớ rằng u(t) ∈ Ω) tại mọi thời điểm.
Những điều khiển này có thể dễ xây dựng hơn đối với bài toán xe lửa
vì các động cơ chỉ cần hai trạng thái "tắt" và "toàn bộ năng lượng".
Chúng ta không yêu cầu một hàm u(·) ∈ UBB phải liên tục từng khúc,
do đó UBB có thể chứa một số hàm khá phi thực tế. Lớp các điều khiển
bang−bang hằng từng khúc trên [0; t1 ] được ký hiệu là UBBP C [0; t1 ] và
UBBP C =
UBBP C [0; t1 ].
t1 >0
Bây giờ chúng ta sẽ chỉ xét các điều khiển thuộc Um nói chung. Để nghiên
cứu tính điều khiển được đối với một trạng thái ban đầu x0 , ta gọi K(t; x0 ) là
tập khả đạt ở thời điểm t, và RC(x0 ) là nón khả đạt. K(t; x0 ) là tập hợp các
trạng thái trong Rn mà có thể đạt được ở thời điểm t, khởi đầu từ trạng thái
x0 ở thời điểm t0 = 0, trong đó sử dụng tất cả các điều khiển chấp nhận được,
tức là:
K(t; x0 ) = {x(t; x0 ; u(·))|u(·) ∈ Um }
và
RC(x0 ) = {(t; x(t; x0 ; u(·)))|t ≥ 0, u(·) ∈ Um } =
t × K(t; x0 ).
t≥0
Để đơn giản, chúng ta đã lấy t0 = 0 (nếu chúng ta cho phép t0 là tùy ý thì
ta sẽ phải xác định K(t; t0 ; x0 ), RC(t0 ; x0 ) theo cách tương tự). (Hình 1.1) là
phác họa hai tập K(t; x0 ), RC(x0 ) trong trường hợp n = 2. Hai phản hồi phác
họa trong đó cho ta hình dung về biên của RC(x0 ).
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
10
Hình 1.1:
Hình 1.2:
RC(x0 ) trông giống như hình nón và K(t; x0 ) là lát cắt của nón tại thời điểm
t. Các tập hợp K(t; x0 ) trong thực tế là các tập trong không gian (x1 , x2 ), vì
vậy chúng ta nên chiếu chúng trở lại không gian (x1 , x2 ), như được phác họa
trong (Hình 1.2).
Khi đó chúng ta sẽ nhìn thấy trực tiếp sự biến đổi của tập khả đạt theo thời
gian (luôn bắt đầu từ x0 tại t0 = 0).
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
1.2
11
Bài toán điều khiển tối ưu
* Bài toán điều khiển cơ bản thường liên quan tới một hàm chi phí hoặc
một tiêu chí thực hiện. Chúng ta sẽ chỉ giải quyết với hàm chi phí có dạng
t1
f 0 (x[t]; u(t))dt,
C[u(·)] =
x[t] ≡ x(t; x0 ; u(·)),
0
trong đó f 0 là hàm giá trị thực đã cho. Bài toán điều khiển tối ưu là điều khiển
x0 đến mục tiêu, bằng cách dùng điều khiển u(·) từ lớp nào đó làm cho C[u(·)]
nhỏ nhất. Tập các điều khiển thành công là:
∆ = {u(·) ∈ Um |∃t1 ≥ 0 sao cho x(t1 ; x0 , u(·)) ∈ T (t1 )}.
Khi đó điều khiển u∗ (·) ∈ Um là tối ưu nếu nó thành công, tức là u∗ (·) ∈ ∆ và
C(u∗ (·)) ≤ C(u(·)) với mọi u(·) ∈ ∆.
Trong lý thuyết điều khiển tối ưu, có hai vấn đề cơ bản đó là:
(a) Chứng minh sự tồn tại của điều khiển tối ưu.
(b) Tìm (xây dựng) một điều khiển tối ưu, hay là đưa ra một công thức để
điều khiển đến mục tiêu một cách tối ưu.
Trong trường hợp bài toán điều khiển tuyến tính, Nguyên lý cực đại sẽ cho
thấy rằng, dưới một số ràng buộc hợp lý, điều khiển tối ưu là bang−bang và
hằng từng khúc.
*Tiếp theo chúng ta sẽ thảo luận vắn tắt về bài toán điều khiển tối ưu xe
lửa. Phiếm hàm chi phí là
t1
{λ1 + λ2 [q(t)]2 + λ3 |u(t)|}dt,
C[u(·)] =
0
3
λk = 1,
λk
0 với k = 1, 2, 3,
k=1
trong đó u(·) ∈ U1 . Chúng ta biết rằng một trạng thái ban đầu x0 có thể điều
khiển đến 0 ∈ R2 bằng cách sử dụng u(t) ≡ ±1 với một lần chuyển. Tuy nhiên,
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
12
ta biết rằng có thể C[u(·)] còn đạt cực tiểu tại một vài điều khiển thành công
khác thuộc U1 − chẳng hạn, và điều khiển một lần chuyển có thể rất tốn nhiên
liệu. Vấn đề về sự tồn tại và xây dựng các điều khiển tối ưu có thể khá khó
khăn; ngay lúc này chúng ta chỉ phân tích bằng trực giác hai trường hợp đặc
biệt của bài toán điều khiển xe lửa.
1.3
Hệ thời gian ngược
C là một tập điều khiển được, tức là tập tất cả các điểm ban đầu x0 bị điều
khiển đến mục tiêu. Tập C điều khiển được cho cả hai bài toán ô-tô-nôm tổng
quát:
x(t) ∈ Rn ,
x˙ = f (x, u),
u(·) ∈ Um
(NLA)
và bài toán ô-tô-nôm tuyến tính
x˙ = Ax + Bu,
A, B là các ma trận hằng số
(LA)
với mục tiêu T (t) ≡ 0.
Khi đó:
x(t) là nghiệm của (NLA) với x(0) = x0 và x(t1 ) = x1 , nên z(t) = x(t1 − t)
là nghiệm của hệ thời gian ngược:
˜ ),
z˙ = −f (z, u
z(0) = x1 ,
z(t1 ) = x0 ,
˜ (t) = u(t1 − t).
u
(1.2)
Phương trình (1.2) là một phương trình phi tuyến ô-tô-nôm.
1.4
Tính điều khiển được của hệ ô-tô-nôm
* Ta sẽ nghiên cứu vấn đề điều khiển được đối với hệ tuyến tính ô-tô-nôm:
x˙ = Ax + Bu,
A, B là các ma trận hằng số.
Theo công thức biến thiên hằng số (xem phụ lục), cho trước một điều khiển
u(·) ∈ Um nghiệm của (LA) với trạng thái ban đầu x0 tại thời điểm t = 0,
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
13
được cho bởi công thức phản hồi
t
−1
x[t] ≡ x(t; x0 ; u(·)) = X(t)X (0)x0 +
X(t)X−1 (s)B(s)u(s)ds
(1.3)
0
˙
trong đó X(t) là ma trận cơ bản bất kì của phương trình thuần nhất x(t)
=
Ax(t). Đặc biệt, x0 ∈ C (t1 ) (ta đạt mục tiêu T (t) = 0 tại thời điểm t1 ) khi
và chỉ khi có một u(·) ∈ Um sao cho
t1
−1
X(t1 )X (0)x0 +
X(t1 )X−1 (s)B(s)u(s)ds = 0.
(1.4)
0
Từ (1.4) ta thấy rằng, x0 ∈ C (t1 ) khi và chỉ khi có một t1 > 0 và một
u(·) ∈ U [0; t1 ] sao cho:
t1
x0 = −X(0)
X−1 (s)B(s)u(s)ds.
(1.5)
0
* Sau đây ta có các định lý về hệ ô-tô-nôm tuyến tính (LA):
Định lí 1.1. Cho hệ (LA) mô tả như trên, khi đó C là liên thông đường. Hơn
nữa C là mở khi và chỉ khi 0 ∈ Int C .
Định lí 1.2. Cho hệ (LA), tập có thể điều khiển được C ∈ Rn là đối xứng và
lồi.
Định lí 1.3. Cho hệ ô-tô-nôm tuyến tính ( (LA)). Khi đó:
rank M = n ⇔ 0 ∈ Int C (⇔ C mở, theo Định lí 1.1)
Chứng minh. Chứng minh định lý tương đương với việc chứng minh:
0∈
/ Int C ⇔ rank M < n.
Thật vậy, Từ (1.5), với t1 > 0 ta có x0 ∈ C (t1 ) khi và chỉ khi có u(·) ∈ Um
sao cho
t1
x0 = −
e−As Bu(s)ds
(1.6)
0
do X(t) = eAt là ma trận cơ bản của hệ (LA).
Chứng minh phần đảo: Giả sử rank M < n. Khi đó có một vectơ đơn vị
y ∈ Rn , ||y|| = 1, trực giao với mọi vectơ cột của M, tức là 1 × m vectơ dòng
yT Ak B = 0 với k = 0, 1, . . . , (n − 1).
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
14
Nếu P(λ) ≡ det (λI − A) là đa thức đặc trưng của A, thì theo Định lí
Cayley-Hamilton nói rằng "thay thế" ma trận A cho λ thì kết quả trong đa
thức thuộc ma trận không, tức là P(A) = 0. Do đó An có thể được viết như
một tổ hợp tuyến tính của các lũy thừa bậc thấp hơn của nó
An = β1 An−1 + . . . + βn
(*)
và
yT An B = β1 yT An−1 B + β2 yT An−2 B + . . . + βn yT B = 0.
Ta nhân (*) với yT A rồi cho yT An+1 B = 0, và cứ tiếp tục như thế, ta được
yT Ak B = 0 với mọi k = 0, 1, 2, . . . Mà
∞
e
−As
=
k=0
(−1)k Ak k
s
k!
nên yT e−As B = 0. Do (1.6) và C (t1 ) nằm trong siêu phẳng trực giao với
y, ∀t1 > 0 nên với mọi x0 ∈ C (t1 ), yT x0 = 0. Vì C là hợp của các tập C (t1 )
nên nó nằm trong siêu phẳng đó. Nên suy ra 0 ∈
/ Int C .
Chứng minh phần thuận: Giả sử 0 ∈
/ Int C . Khi đó ∀t1 > 0, 0 ∈
/ Int C (t1 )
(vì C (t1 ) ⊂ C ). Mặt khác, với mọi t1 và C (t1 ) lồi sao cho: 0 ∈ C (t1 ) (bằng
cách lấy u(·) ≡ 0) nên với mỗi t1 , tồn tại một siêu phẳng chứa 0 sao cho C (t1 )
nằm về một phía của siêu phẳng này, tức là có một vectơ khác không b(t1 ) sao
cho ∀x0 ∈ C (t1 ), bT x0 ≤ 0. Khi đó
t1
bT e−As Bu(s)ds = −bT x0 ≥ 0, ∀u(·) ∈ Um , ∀x0 ∈ C (t1 ).
(1.7)
0
Từ đó suy ra
bT e−As B ≡ 0 trên [0, t1 ].
(**)
Chọn s = 0 ta có bT B ≡ 0. Vi phân k lần hai vế của (**) rồi lấy s = 0 ta
thu được bT Ak B ≡ 0, k = 0, 1, 2, . . . Do đó b là trực giao với các cột của M.
Chứng tỏ rank M < n.
Định lí 1.4. Với rank M = n. Xét hệ ô-tô-nôm tuyến tính (LA)
x˙ = Ax + Bu.
Nếu Re(λ) < 0 với mọi giá trị riêng λ của A thì C = Rn .
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
15
Định lí 1.5. Xét hệ ô-tô-nôm tuyến tính (LA) và M = [B, AB, . . . , An−1 B].
Khi đó:
C = Rn ⇔ rank M = n và Re(λ) ≤ 0 với mọi giá trị riêng λ của A.
Ví dụ 1.1. (Tính điều khiển được của động cơ xe lửa )
Với động cơ xe lửa, ta có:
0 1
0
0
, B = , M = [B, AB] =
A=
0 0
1
1
1
0
nên rank M = 2 và hệ là hệ riêng (theo nhận xét sau Định lí 1.3). Giá trị
riêng duy nhất của A là λ = 0. Từ Định lí 1.5, C = R2 , tức là đối với động cơ
xe lửa, bất kì trạng thái ban đầu nào cũng có thể được điều khiển đến 0 ∈ R2 .
* Một điều đáng nói là Định lí 1.5 trở nên đơn giản hơn đáng kể trong trường
hợp không có hạn chế đối với điều khiển (u(t) ∈ Rm ).
Định lí 1.6. (Nguyên lí Bang - Bang) Cho hệ (LA), ta có CBB (t1 ) = C (t1 )
với ∀t1 > 0 ; tập này là tập compact, lồi và phụ thuộc liên tục vào t1 .
1.5
Phụ lục của Chương 1: Chứng minh của Nguyên
lý Bang−Bang.
Mệnh đề 1.1. (Tính compact yếu của Um [0; t1 ] trong dãy L2 [0; t1 ]).
Nếu {un (·)}⊂ Um [0; t1 ], (n = 1, 2, ...) thì tồn tại dãy con {unk (·)} và một
u∗ (·) ∈ Um [0; t1 ] sao cho mọi ma trận Y(t) cấp n × m trong L2 [0; t1 ], ta có:
t1
lim
k→∞
t1
Y(t)unk (t)dt =
0
Y(t)u∗ (t)dt.
0
* Từ mệnh đề (1.1) suy ra ánh xạ T: U1 [0; t1 ] → Rn được xác định bởi công
thức:
t1
T (u(·)) =
y(s)u(s)ds,
0
trong đó ma trận B cấp n × 1.
y(s) = e−As B
(1.8)
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
16
Mệnh đề 1.2. Ánh xạ T được định nghĩa ở (1.8) từ tập ánh xạ lồi vào tập
lồi, và tập compact yếu trong L2 [0; 1] lên tập compact trong Rm . (Nói riêng, từ
mệnh đề (1.1) , Q là lồi và compact).
Chương 2
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU
THỜI GIAN ĐỐI VỚI HỆ
Ô-TÔ-NÔM TUYẾN TÍNH
2.1
Bài toán điều khiển tối ưu thời gian đối với hệ
ô-tô-nôm tuyến tính
Sau đây là tóm tắt kết quả của việc nghiên cứu bài toán điều khiển tối ưu
tuyến tính:
˙
x(t)
= Ax(t) + Bu(t),
x(t) ∈ Rn ,
u(t) ∈ Ω ⊂ Rm ,
(LA)
với A, B là các ma trận hằng cấp n × n và n × m, u(·) ∈ Um , mục tiêu
T (t) ≡ 0, và hàm chi phí
t1
C[u(·)] =
1dt = t1 ,
0
trong đó t1 là thời điểm đến mục tiêu 0. Nếu không có điều khiển thành công
nào cho giá trị t1 nhỏ hơn nó thì một điều khiển thành công và phản hồi của
nó là tối ưu−thời gian. Có thể sẽ có nhiều điều khiển tối ưu−thời gian ứng với
một trạng thái ban đầu đã cho.
Trong suốt chương này chúng ta giả thiết rằng:
Không cột nào của B gồm toàn số 0.
17
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
18
Giả thiết này không làm mất tính tổng quát. Vì chẳng hạn nếu cột thứ
nhất của B gồm toàn số 0, thì thành phần thứ nhất u1 (·) của u(·) sẽ không có
ảnh hưởng gì trong (LA). Vì vậy, chúng ta có thể thay thế m−vectơ u(·) bằng
(m − 1)−vectơ [u2 (·), ..., um (·)]T . Nên khi bỏ cột thứ nhất của B trong (LA)
thì bài toán không thay đổi.
Nhiều kết quả của chương này vẫn đúng với hệ tuyến tính tổng quát
˙
x(t)
= A(t)x(t) + B(t)u(t) + c(t),
những mở rộng đó sẽ được tóm tắt trong mục cuối cùng. Chương này tập trung
nghiên cứu bài toán (LA) bởi vì hình học của bài toán này rõ ràng hơn trong
trường hợp bài toán điều khiển tối ưu tổng quát.
Đầu tiên chúng ta chỉ ra những phản hồi chính sẽ được chứng minh trong
chương này.
Để làm được điều này, nhớ rằng Ω là hình lập phương đơn vị trong Rm :
Ω = {v|v ∈ Rm , |v i |
1, i = 1, m}.
K(t, x0 ) là tập khả đạt từ x0 tại thời điểm t :
K(t; x0 ) = {x(t; x0 ; u(·))|u(·) ∈ Um }.
RC =
{t} × K(t; x0 ) là nón khả đạt, và điều khiển bang−bang u(·) luôn
t 0
thỏa mãn |ui {t}| = 1, i = 1, 2, ..., m. Chú ý rằng K(t; x0 ) là tập con của Rn và
RC là tập con của Rn+1 (xem hình 1.1 và 1.2 Chương 1).
K(t; x0 ) và RC có thể được nhúng trong siêu phẳng với số chiều nhỏ nhất
của Rn và Rn+1 . Khi đó Int K, ∂K, v.v., đều được lấy tương đối so với siêu
phẳng tương ứng. Với hệ ô-tô-nôm (LA), trạng thái ban đầu x0 ∈ Rn , giả sử
tồn tại một điều khiển thành công thuộc Um điều khiển x0 đến 0 (không nhất
thiết phải là tối ưu−thời gian). Do đó các mệnh đề sau là đúng:
(a) Có ít nhất một điều khiển tối ưu − thời gian bang−bang trong Um
(không nhất thiết hằng từng khúc).
(b) Phản hồi ứng với điều khiển tối ưu−thời gian nằm trên biên của K(t; x0 )
với ∀t, nghĩa là, nếu x[t] = x(t; x0 ; u(·)) là tối ưu−thời gian thì x[t] ∈ ∂K(t; x0 )
(tương đương (t; x[t]) ∈ ∂RC) với 0 ≤ t ≤ t1 .
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
19
(c) Điều khiển tối ưu−thời gian u(t) thỏa mãn Nguyên lý cực đại: Có vectơ
hằng h = 0 sao cho
hT e−At Bu(t) = sup hT e−At Bv,
0 ≤ t ≤ t1 .
v∈Ω
Tương đương, khi (hT e−At B)i = 0 :
ui (t) = sgn(hT e−At B)i ,
i = 1, 2, ..., m.
(d) Dưới điều kiện chuẩn tắc, điều khiển tối ưu−thời gian là duy nhất,
bang−bang và hằng từng khúc.
(e) Nếu điều kiện chuẩn tắc đúng, thì Mệnh đề đảo của (c) cũng đúng: bất kỳ
điều khiển thành công nào mà thỏa mãn Nguyên lý cực đại đều là tối ưu−thời
gian (do vậy, thay (d), duy nhất, bang−bang, và hằng từng khúc).
Chú ý 2.1. Chúng ta sẽ chứng tỏ rằng số lần chuyển giá trị điều khiển (trong
từng trường hợp cụ thể) phụ thuộc vào các giá trị riêng của A.
Để bắt đầu, chúng ta cần làm một vài quan sát sơ bộ. Nhắc lại Nguyên lý
Bang−Bang (Định lý 1.6 từ Chương 1) phát biểu rằng với bất kỳ hệ ô-tô-nôm
tuyến tính, CBB (t) = C (t) ∀t > 0, trong đó C (t) (CBB (t)) là tập các trạng
thái ban đầu mà tồn tại điều khiển thành công thuộc Um (UBB ) điều khiển
trạng thái đó đến mục tiêu 0. Chú ý rằng chúng ta chọn T (t) ≡ 0 cho tiện
(vì bất kỳ điểm cố định nào trong Rn đều có thể là mục tiêu). Chúng ta khẳng
định rằng Nguyên lý Bang−Bang là tương đương với mệnh đề sau về tập khả
đạt:
Với (LA), K(t; x0 ) = KBB (t; x0 ) ∀t ≥ 0, ∀x0 .
Tức là, các trạng thái có thể đạt từ một điểm x0 cho trước tại một thời
điểm cho trước là như nhau bất kể chúng ta sử dụng điều khiển tổng quát
thuộc Um [0; t], hay điều khiển Bang−Bang.
Điều này suy ra từ ý tưởng thời gian ngược được bàn luận ở Chương 1. Nhắc
lại rằng x(t) nghiệm đúng (LA) với x(0) = x0 nếu và chỉ nếu z(t) = x(t1 − t)
nghiệm đúng hệ thời gian ngược:
z˙ = −Az − Bu;
z(t1 ) = x0 .
(2.1)
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
20
Do vậy hai hệ có cùng các quỹ đạo, chỉ khác nhau về hướng. Hệ thời gian ngược
cũng là hệ tuyến tính và ô-tô-nôm, nên Nguyên lý Bang−Bang khẳng định rằng
CBB (t1 ) = C (t1 ) với (2.1),tức là các trạng thái điều khiển thành công đến x0
bởi (2.1) là như nhau đối với điều khiển bang−bang và điều khiển tổng quát.
Nhưng x1 có thể điều khiển tới x0 bởi (2.1) nếu và chỉ nếu x0 có thể điều khiển
thành công x1 bởi (LA) (Hình 2.1). Do vậy x1 thuộc tập điều khiển thành công
đối với (2.1) nếu và chỉ nếu nó thuộc tập khả đạt đối với (LA). Do đó Nguyên
lý Bang−Bang suy ra rằng KBB (t1 ; x0 ) = K(t1 ; x0 ) đối với (LA).
Hình 2.1:
Chúng ta cũng cần bổ đề kỹ thuật sau, chính là Nguyên lý Bang−Bang
(Định lý 1.6) từ Chương 1.
Bổ đề 2.1. Cho (LA), K(t; x0 ) luôn là tập lồi và compact, nếu x0 = 0 thì nó
đối xứng. Ngoài ra, ánh xạ đa trị
t −→ K(t; x0 ),
0≤t<∞
là liên tục.
Chứng minh. * Công thức phản hồi đối với (LA) là
t
At
eA(t−s) Bu(s)ds = eAt x0 + Q[u].
x(t; x0 ; u(t)) = e x0 +
0
Do đó y ∈ K(t; x0 ) nếu và chỉ nếu y = eAt x0 + Q[u] với một u(·) ∈ Um [0; t].
Với t cố định, tính lồi của K(t; x0 ) (và tính đối xứng của K(t; 0)) nhận được
từ tính chất tuyến tính của Q và tính đối xứng, lồi của Um [0; t].
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
21
* Mệnh đề (1.1) của phụ lục Chương 1 phát biểu rằng Um [0; t] là compact
yếu theo dãy trong L2 [0; t], và Mệnh đề (1.2) của phụ lục Chương 1 chứng tỏ
rằng đối với mỗi t, tập
D(t) =
t
0
−As
e
Bu(s)ds|u(·) ∈ Um [0, t]
là tập compact trong Rn . Tập K(t; x0 ) là tập thu được từ tập này bằng cách
nhân mỗi phần tử với eAt và cộng với vectơ cố định eAt x0 (cả hai phép toán
liên tục), do đó K(t; x0 ) là tập compact trong Rn .
* Cuối cùng chúng ta sẽ chứng minh ánh xạ t → D(t) là liên tục. Với t cố
định và ε > 0, chúng ta phải chứng minh rằng có δ(ε) > 0 sao cho |t∗ − t1 | < δ
thì D(t1 ); D(t∗ ) có tính chất mỗi tập bị chứa trong ε−lân cận của tập còn lại.
Thật vậy, giả sử δ < 1, đặt T = t1 + 1; M = max |e−As B|. Ta sẽ chứng tỏ
[0,T ]
ε
rằng D(t∗ ) chứa trong một ε−lân cận của D(t1 ) với |t∗ − t1 | <
. Giả sử y∗ ∈
M
D(t∗ ) nghĩa là y∗ =
t∗
e−As Bu∗ (s)ds với một u∗ (·) ∈ Um [0, t∗ ]. Mở rộng u∗ (s)
0
t1
lên [0, T ] bằng cách đặt u∗ = 0 trên (t∗ , T ], sau đó đặt y0 =
e−As Bu∗ (s)ds.
0
Rõ ràng y0 ∈ D(t1 ) và |y∗ − y0 | ≤ |
của D(t1 ).
2.2
t1
M ds| < ε. Do đó y∗ thuộc ε−lân cận
t∗
Sự tồn tại của điều khiển tối ưu thời gian
Định lí 2.1. Nếu tồn tại một điều khiển thành công điều khiển x0 đến 0 qua
(LA) thì tồn tại một điều khiển tối ưu−thời gian.
Chứng minh. Giả thiết có một điều khiển thành công nghĩa là 0 ∈ K(t∗ ; x0 )
với một t∗ . Đặt
t1 = inf {t ≥ 0 | 0 ∈ K(t, x0 )}.
Tập này khác rỗng và bị chặn dưới, nên tồn tại cận dưới đúng. Ta sẽ chứng tỏ
rằng 0 ∈ K(t1 ; x0 ), hay có một điều khiển trong Um điều khiển x0 đến 0 trong
thời gian cực tiểu t1 .
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
22
Thật vậy: Giả sử 0 ∈
/ K(t1 ; x0 ). Vì K(t1 ; x0 ) là tập đóng nên có một hình
cầu B(0; ρ) với 0 ∈ Rn sao cho B(0; ρ) ∩ K(t1 ; x0 ) = φ. Vì K(t; x0 ) liên tục
theo t, nên tính chất giao khác rỗng này vẫn đóng khi t gần t1 , nếu chúng ta
có B(0; ρ), nghĩa là có δ > 0 sao cho với t1 ≤ t ≤ t1 + δ :
ρ
B(0; ) ∩ K(t; x0 ) = φ.
2
Chứng tỏ 0 ∈ Rn không khả đạt với t1 ≤ t ≤ t1 + δ, mâu thuẫn với định nghĩa
của t1 .
Suy ra giả sử là sai. Vì vậy 0 ∈ K(t1 ; x0 ).
Hệ quả 2.1. Nếu tồn tại một điều khiển thành công thuộc Um điều khiển
x0 đến 0, thì tồn tại một điều khiển tối ưu−thời gian bang−bang.
Chứng minh. Theo Nguyên lý Bang−Bang, KBB (t, x0 ) = K(t, x0 ) với mọi t ≥
0.
Định nghĩa 2.1. Điều khiển u(·) xác định trên [0, t∗ ] là cực trị nếu phản hồi
tương ứng nằm trên biên của RC, nghĩa là:
x(t; x0 ; u(·)) ∈ ∂K(t, x0 ),
0 ≤ t ≤ t∗ .
(2.2)
Một điều khiển cực trị có thể là thành công hoặc không, và nếu là thành công
thì nó vẫn có thể là tối ưu hoặc không. (Hình 2.2)
Hình 2.2: Đường cong (e) là cực trị; (n) là không cực trị.
CHƯƠNG 2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM
TUYẾN TÍNH
23
Định lí 2.2. Nếu w(·) là điều khiển tối ưu−thời gian đối với (LA), thì w(·)
là cực trị.
Chứng minh. Chứng minh gồm hai phần.
Thứ nhất, chúng ta sẽ chứng minh rằng nếu w(·) là tối ưu, thì tại thời điểm
tới mục tiêu t1 phản hồi sẽ nằm trên ∂K(t1 ; x0 ), tức là nếu w(·) là điều khiển
tối ưu điều khiển x0 đến 0 trong thời gian t1 , nghĩa là:
x[t1 ] ≡ x(t1 ; x0 ; w(·)) = 0,
thì x[t1 ] = 0 ∈ ∂K(t1 ; x0 ).
Thật vậy: Giả sử x[t1 ] = 0 không nằm trên ∂K(t1 ; x0 ). Khi đó có một hình
cầu B(0; ρ) ⊂ K(t1 ; x0 ). Bởi vì K(t1 ; x0 ) là hàm liên tục của t. Nên ta có thể
thay đổi t mà vẫn giữ được bao hàm thức trên nếu chúng ta thu nhỏ hình cầu,
ρ
nghĩa là, có δ > 0 sao cho B(0; ) ⊂ K(t; x0 ) với t1 − δ ≤ t ≤ t1 . Khi đó 0 sẽ
2
đạt được ở thời điểm t1 − δ, mâu thuẫn với tính tối ưu của t1 . Suy ra giả sử là
sai. Do đó: 0 = x[t1 ] ∈ ∂K(t1 ; x0 ).
Thứ hai, chúng ta chứng minh rằng nếu phản hồi nằm trên ∂K(t∗ ; x0 ) ở
thời điểm t∗ bất kỳ, thì (2.2) đúng với 0 ≤ t ≤ t∗ (nói cách khác, phản hồi
không bao giờ chuyển động được từ bên trong của RC ra biên, ∂RC). Giả sử
x∗ ≡ x[t∗ ] ∈ Int K(t∗ ; x0 ) với một 0 < t∗ < t1 , trong đó x[t] là phản hồi đối
với w(·). Ta phải chứng minh rằng x[t] ∈ Int K(t; x0 ) ∀t > t∗ .
˜ ≡ B(x∗ ; δ) ⊂
Thật vậy: Vì x∗ ∈ Int K(t∗ ; x0 ) nên có một hình cầu B
˜ đều khả đạt từ x0 tại thời điểm t∗ ,
˜0 ∈ B
K(t∗ ; x0 ). Do đó mỗi trạng thái x
˜ (·). Chúng ta xét bài toán
bằng cách sử dụng một điều khiển chấp nhận được u
mới.
y˙ = Ay + Bw,
˜ 0;
y(t∗ ) = x
t∗ < t,
˜ 0 = x∗ , ta có y[t] ≡ x[t]. Nghiệm
với điều khiển w(·) cố định. Chú ý rằng với x
của bài toán có thể được viết:
t
˜0 +
y[t] = eA(t−t∗ ) x
eA(t−s) Bw(s)ds = R(t)˜
x0 + c(t).
t∗