Tải bản đầy đủ (.pdf) (70 trang)

Nghiệm viscosity của bài toán điều khiển với thời gian thoát ra

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (518.33 KB, 70 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM
∗∗∗∗∗∗

∗∗∗∗∗∗

LÊ THỊ HƯƠNG

NGHIỆM VISCOSITY CỦA BÀI
TOÁN ĐIỀU KHIỂN VỚI THỜI
GIAN THOÁT RA

LUẬN VĂN THẠC SĨ TOÁN HỌC

Huế, Năm 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM

LÊ THỊ HƯƠNG

NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU
KHIỂN VỚI THỜI GIAN THOÁT RA

Chuyên ngành: TOÁN GIẢI TÍCH
Mã số: 60.46.01.02

LUẬN VĂN THẠC SĨ TOÁN HỌC



NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS.TS. NGUYỄN HOÀNG

Huế, Năm 2016
i


LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu
của riêng tôi, các số liệu và kết quả nghiên
cứu ghi trong Luận văn là trung thực. Tôi
hoàn toàn chịu trách nhiệm trước khoa và nhà
trường về sự cam đoan này.

Lê Thị Hương

ii


LỜI CẢM ƠN

Lời đầu, xin gửi đến PGS.TS Nguyễn Hoàng lời cảm ơn sâu sắc về sự tận
tình giúp đỡ của thầy đối với tôi trong suốt quá trình Thầy giảng dạy tại lớp
Cao học K23 và nhất là trong quá trình tôi hoàn thành Luận văn này.
Tôi cũng xin chân thành cảm ơn tất cả quý thầy, cô khoa Toán của Trường
Đại học Sư phạm Huế đã tận tình giảng dạy và truyền đạt những kiến thức bổ
ích trong suốt khóa học tại Trường Đại học Sư phạm Huế.
Chân thành cảm ơn các Anh, Chị học viên Cao học khóa 23, đặc biệt là các

Anh, Chị chuyên ngành Toán Giải Tích và cũng như tất cả bạn bè của tôi đã
luôn hỗ trợ tôi suốt quá trình tôi học tập.
Cuối cùng tôi xin cảm ơn Bố, Mẹ và toàn thể gia đình tôi, những người đã
động viên tôi rất nhiều và cũng là động lực giúp tôi hoàn thành Luận văn này.
Mặc dù đã cố gắng hết sức nhưng Luận văn sẽ không tránh khỏi những thiếu
sót. Tôi rất mong các thầy cô giáo cùng các bạn đánh giá, góp ý để Luận văn
được hoàn chỉnh hơn.

Lê Thị Hương

iii


Mục lục
Trang phụ bìa

i

Lời cam đoan

ii

Lời cảm ơn

iii

Mục lục

1


Bảng các ký hiệu

2

Mở đầu

3

1 MỘT SỐ KIẾN THỨC CƠ SỞ
1.1 Tập lồi, hàm nửa lồi, hàm nửa lõm. . . . . . . . . . .
1.2 Phương trình vi phân thường . . . . . . . . . . . . .
1.3 Nghiệm viscosity của phương trình Hamilton-Jacobi
1.4 Bài toán điều khiển tối ưu . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.

.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

6
6
9
10
12


2 NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU KHIỂN VỚI
THỜI GIAN THOÁT RA
15
2.1
2.2
2.3
2.4

Bài toán điều khiển tối ưu với thời gian thoát ra . . . . . . . . .
Tính liên tục Lipschitz và tính nửa lõm của hàm giá trị . . . . .
Tính nửa lồi của hàm thời gian tối tiểu T trên hệ điều khiển tuyến
tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Điều kiện tối ưu . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. 15
. 26
. 47
. 52

Kết luận
65
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

1


BẢNG CÁC KÝ HIỆU
Ký hiệu
Rn



Rn×n
C(Ω)
C 1 (Ω)
C 1,1 (Ω)
1,1
Cloc
(Ω)

SCLloc (Ω)
L1 (Ω)
L1loc (Ω)

Ý nghĩa ký hiệu
Không gian vector thực n-chiều.
Miền mở trong không gian Rn .
Tập hợp các ma trận vuông thực cấp n.
Không gian các hàm liên tục trên Ω.
Không gian các hàm khả vi liên tục trên Ω.
Không gian các hàm khả vi liên tục
và có đạo hàm riêng liên tục Lipschitz trên Ω.
Không gian các hàm khả vi liên tục, có đạo hàm
riêng liên tục Lipschiz địa phương trên Ω.
Không gian các hàm nửa lõm
với modun tuyến tính địa phương trên Ω.
Không gian các hàm thực đo được trên Ω
sao cho |f | khả tích theo nghĩa Lebesgue.
Không gian các hàm thực đo được trên Ω

sao cho |f | khả tích địa phương theo nghĩa Lebesgue.

∂K
Biên của tập hợp K.
Lx
Đạo hàm riêng của hàm L theo biến x.
∇u
Gradient của hàm u theo biến x.
Br (x) hoặc B(x, r) Hình cầu mở tâm x bán kính r.
x.y hoặc < x, y >
Tích vô hướng trong Rn .
[x, y]
|x|
||x||∞

Đoạn thẳng nối hai điểm x và y với mọi x, y ∈ Rn .
Chuẩn Euclid trong Rn .
Chuẩn maximum trong Rn .

2


MỞ ĐẦU

Lý thuyết điều khiển tối ưu xuất hiện từ những năm 50 của thế kỷ 20
với một loạt công trình tiêu biểu của các nhà toán học Xô viết đứng đầu là
L.C. P ontryagin về nguyên lý cực đại để tìm điều kiện cần các quá trình tối ưu.
Lý thuyết này được phát triển từ những bài toán tối ưu hóa cổ điển như bài
toán biến phân, bài toán quy hoạch động. Bài toán điều khiển tối ưu là bài toán
tìm các quá trình tối ưu cho các hệ điều khiển mô tả bởi các phương trình toán
học, có thể bắt nguồn từ việc sử dụng nguyên lý cực đại Pontryagin (điều kiện
cần) hoặc bằng cách giải phương trình Hamilton-Jacobi-Bellman (điều kiện đủ).

Ta có thể mô tả bài toán điều khiển tối ưu một cách giải tích như sau. Xét
hệ điều khiển



y (t) = f (t, y(t), u(t)),




t ∈ I = (a, b) ⊆ R,

y(t0 ) = x, y(t) ∈ X = Rn ,





u(t) ∈ U ⊆ Rm ,
trong đó u(t) thuộc một lớp hàm đặc biệt như lớp hàm L1 ([t0 , T ], U ), f (t, y(t), u(t)) :
I × X × U → X là hàm mô tả quá trình chuyển động của trạng thái. Phiếm hàm
mục tiêu được định nghĩa bởi
f 0 (t, y, u)dt,

J(u) =
I

trong đó f 0 (t, y, u) : I × X × U → R là hàm cho trước. Bài toán điều khiển tối
ưu đặt ra là tìm điều khiển chấp nhận được u∗ (t) ∈ U sao cho cùng với quỹ đạo
tương ứng y ∗ (t) của hệ điều khiển, phiếm hàm mục tiêu sẽ đạt cực tiểu tại điều

khiển u∗ (t). Điều khiển u∗ (t) sẽ được gọi là điều khiển tối ưu cho bài toán tối ưu,
cặp (u∗ (t), y ∗ (t)) gọi là quá trình tối ưu của hệ điều khiển. Người ta phân loại
bài toán điều khiển tối ưu theo cấu trúc của hàm mục tiêu. Nếu hàm mục tiêu
có dạng như trên thì ta có bài toán điều khiển tối ưu Lagrange. Nếu hàm mục
tiêu có dạng
J(u) = g(T, y(T )),

trong đó T là thời gian cuối cố định trước của thì ta có bài toán điều khiển tối
ưu Mayer. Còn nếu hàm mục tiêu có dạng
f 0 (t, y, u)dt + g(T, y(T )),

J(u) =
I

3


thì ta có bài toán điều khiển tối ưu Bolza. Lagrange, Bolza, Mayer là tên ba nhà
toán học đã có những nghiên cứu đầu tiên về bài toán tối ưu với các hàm mục
tiêu đó.
Ta định nghĩa hàm giá trị của bài toán điều khiển tối ưu có dạng
V (t, x) = inf{J(u) : u ∈ L1 ([t0 , T ], U )}.

Xét phương trình quy hoạch động sau:


−∂t V (t, x) + H(x, ∇V (t, x)) = 0,

t ∈ I = [0, T ],
∀x ∈ Rn ,



V (T, x) = g(x),

với H(x, .) là hàm Hamilton liên kết với bài toán điều khiển tối ưu tương ứng.
Đối với bài toán Mayer thì H(x, p) = max −p.f (t, x, u), còn đối với bài toán Bolza
u∈U

thì H(x, p) = max[−p.f (t, x, u) − f 0 (t, x, u)]. Các định lý đã được chứng minh cho
u∈U

thấy rằng hàm giá trị V (t, x) là nghiệm viscosity của phương trình quy hoạch
động tương ứng với mỗi bài toán điều khiển tối ưu cho trước. Khái niệm nghiệm
viscosity được M.G. Crandall và P.L. Lions đưa ra vào những năm đầu của thập
kỷ 80, mở ra một hướng nghiên cứu hiệu quả trong việc nghiên cứu phương trình
đạo hàm riêng phi tuyến cấp 1, cấp 2, trong đó có phương trình Hamilton-Jacobi.
Thay vì buộc nghiệm phải thỏa mãn phương trình và khả vi cấp k , các tác giả
chỉ đòi hỏi nghiệm liên tục, thỏa mãn các bất đẳng thức vi phân thông qua hàm
thử đủ trơn hoặc qua khái niệm trên vi phân, dưới vi phân.
Bài toán điều khiển tối ưu với thời gian thoát ra là một dạng của bài toán
điều khiển tối ưu Bolza, trong đó thời gian cuối của hệ là không cố định mà phụ
thuộc vào mục tiêu được cho trước. Một trường hợp đặc biệt của bài toán thời
gian thoát ra là bài toán thời gian tối tiểu với mong muốn là cực tiểu hóa thời
gian cuối để quá trình tối ưu đạt mục tiêu cho trước.
Xuất phát từ những kiến thức tìm hiểu được, chúng tôi chọn đề tài:
"Nghiệm viscosity của bài toán điều khiển với thời gian thoát ra" để
nghiên cứu với hy vọng có thể hiểu sâu hơn một số kết quả trong lý thuyết của
phương trình đạo hàm riêng.
Luận văn chia làm hai chương. Trong chương 1, chúng tôi trình bày một
số kiến thức cơ bản của giải tích làm nền tảng cho các chứng minh ở chương

sau. Trong chương 2, chúng tôi trình bày các kết quả của bài toán điều khiển
tối ưu với thời gian thoát ra có cấu trúc như sau. Mục 2.1 chúng tôi giới thiệu
về bài toán thời gian thoát ra và một số kết quả về sự tồn tại của điều khiển
4


tối ưu. Mục 2.2 chúng tôi xem xét hàm giá trị tương ứng của bài toán, chỉ ra
rằng hàm giá trị là liên tục Lipschitz địa phương và là hàm nửa lõm với modun
tuyến tính. Mục 2.3 chúng tôi nghiên cứu một vài kết quả của hàm thời gian
tối tiểu trên hệ tuyến tính. Và cuối cùng, mục 2.4 nghiên cứu điều kiện tối ưu
của bài toán thời gian thoát ra, các kết quả của nguyên lý cực đại Pontryagin
trong trường hợp của mục tiêu trơn và dưới những giả thiết thích hợp, chúng
tôi chỉ ra rằng quỹ đạo tối ưu là nghiệm của hệ Hamilton liên kết và tương ứng
một-một với reachable gradients của hàm giá trị.
Mặc dù đã có nhiều cố gắng, song trong quá trình nghiên cứu và trình
bày khó tránh khỏi các sai sót, mong quý độc giả góp ý thêm để Luận văn được
hoàn thiện hơn.

5


CHƯƠNG 1

MỘT SỐ KIẾN THỨC CƠ SỞ

Chương này có mục đích trình bày một số kiến thức về giải tích được sử dụng
ở chương sau, các nội dung được trích ra từ các tài liệu [2], [4], [6].

1.1


Tập lồi, hàm nửa lồi, hàm nửa lõm.

Định nghĩa 1.1.1. Cho A ⊂ Rn ,
(i) Tập A được gọi là tập lồi nếu với mọi x1 , x2 ∈ A thì [x1 , x2 ] ⊂ A. Nói cách
khác, A lồi nếu với mọi x1 , x2 ∈ A và λ ∈ [0, 1] ta có λx + (1 − λ)y ∈ A.
(ii) Bao lồi của một tập A, ký hiệu coA, là giao của tất cả các tập lồi chứa A.
coA là một tập lồi và là tập lồi bé nhất chứa A.
(iii) Tập A được gọi là nón nếu với mọi điểm a ∈ A và λ > 0 ta có λa ∈ A. Nếu
hơn nữa, A là tập lồi thì nó sẽ được gọi là nón lồi.
(iv) Bao nón của một tập A, ký hiệu conA = {λa| λ > 0; a ∈ A} là giao của tất
cả các nón chứa A và là nón bé nhất chứa A.
(v) Hàm f : A → R, với A là tập lồi, f được gọi là hàm lồi nếu
λf (x) + (1 − λ)f (y) ≥ f (λx + (1 − λ)y),

∀x, y ∈ A, λ ∈ [0, 1].

Ta nói rằng hàm f lồi chặt nếu bất đẳng thức ở trên là chặt với mọi λ ∈ (0, 1).
Hàm f được gọi là hàm lõm nếu −f là hàm lồi.
Định nghĩa 1.1.2. (i) Cho A ⊂ Rn , hàm u : A → R được gọi là nửa lõm
nếu tồn tại một hàm nửa liên tục trên không giảm ω : R+ → R+ sao cho

6


lim ω(ρ) = 0 và

ρ→0+

λu(x) + (1 − λ)u(y) − u(λx + (1 − λ)y) ≤ λ(1 − λ)|x − y|ω(|x − y|),


với mọi cặp x, y ∈ A sao cho [x, y] ⊂ A và với mọi λ ∈ [0, 1], ω được gọi là
mô-đun nửa lõm của u trên A.
(ii) Cho hàm nửa lõm u : A → R với mô-đun nữa lõm ω , nếu ω(h) =

C
2h

với

C ≥ 0 thì hàm nửa lõm với mô-đun này được gọi là hàm nửa lõm với mô-đun

tuyến tính, nghĩa là, tồn tại C ≥ 0 sao cho
λu(x) + (1 − λ)u(y) − u(λx + (1 − λ)y) ≤ C

λ(1 − λ)
|x − y|2 ,
2

với mọi x, y ∈ A sao cho [x, y] ⊂ A với mọi λ ∈ [0, 1], C được gọi là hằng số
nửa lõm của u trên A.
Hàm u được gọi là nửa lồi (nửa lồi với mô-đun tuyến tính) trên A nếu −u là
nửa lõm (nửa lõm với mô-đun tuyến tính). Ký hiệu SC(A) là không gian của tất
cả các hàm nửa lõm trên A và SCL(A) là không gian của các hàm nửa lõm với
mô-đun tuyến tính trên A.
Mệnh đề 1.1.3. Cho u : A → R với A ⊂ Rn là tập lồi mở, và cho C ≥ 0, khi đó
các tính chất sau là tương đương:
(i) u là nửa lõm với mô-đun tuyến tính trên A với hằng số nửa lõm C ,
(ii) u thỏa mãn
u(x + h) + u(x − h) − 2u(x) ≤ C|h|2 ,


với mọi x, h ∈ Rn sao cho [x − h, x + h] ⊂ A.
(iii) Hàm x → u(x) − C2 |x|2 là lõm trên A.
Định nghĩa 1.1.4. Tập A ⊂ Rn được gọi là thỏa mãn điều kiện hình cầu trong
với r > 0 nếu A là hợp của các hình cầu đóng bán kính r, tức là, với mọi x ∈ A
tồn tại y sao cho x ∈ Br (y) ⊂ A.
Mệnh đề 1.1.5. Cho A ⊂ Rn là tập đóng, A = ∅, A = Rn . Khi đó hàm khoảng
cách dA (x) = min |y − x|, ∀x ∈ Rn thỏa mãn các tính chất sau đây:
y∈A

(i) d2A ∈ SCL(Rn ) với hằng số nửa lõm 2.

7


(ii) dA ∈ SCLloc (Rn \ A). Chính xác hơn, cho tập S (không cần thiết là compact)
sao cho dist(S, A) > 0, dA là nửa lõm trên S với hằng số nửa lõm bằng
dist(S, A)−1 .
(iii) Nếu A thỏa mãn điều kiện hình cầu trong với r > 0 thì dA ∈ SCL(Rn \ A)
với hằng số nửa lõm là r−1 .
(iv) dA không nửa lõm địa phương trên toàn bộ không gian Rn .
Định nghĩa 1.1.6. Cho V ⊂ Rn là tập lồi. Nếu v ∈ V thì nón pháp tuyến của
V tại v là tập
NV (v) = {p ∈ Rn : p.(v − v) ≥ 0, ∀v ∈ V }.
Hơn nữa, nếu V có biên thuộc lớp C 1 thì tất cả các nón pháp tuyến của V tại
điểm biên có số chiều bằng 1.
Định nghĩa 1.1.7. Hàm giá của tập lồi V được xác định bằng
σV (p) = sup v.p,
v∈V

p ∈ Rn .


Mặt tiếp xúc của tập lồi V theo hướng p, với p ∈ Rn \ {0} được định nghĩa bằng
V ∗ (p) = {v ∈ V : σV (p) = v.p}. Hơn nữa
p ∈ NV (v) ⇔ σV (p) = p.v.

Mệnh đề 1.1.8. Cho S ⊂ Rn là tập compact và đặt T = coS . Khi đó
max x.p = σT (p),
x∈S

∀p ∈ Rn .

Định lý 1.1.9. Cho V, M ⊂ Rn là hai tập lồi, với V là compact. Khi đó hai tính
chất sau là tương đương:
(i) ∃v ∈ V : M ⊂ NV (v);
(ii) σV (tp0 + (1 − t)p1 ) = tσV (p0 ) + (1 − t)σV (p1 ), ∀p0 , p1 ∈ M, ∀t ∈ [0, 1].
Bổ đề 1.1.10. Cho tập lồi M thỏa mãn tính chất
p ∈ M ⇒ tp ∈
/ M, ∀t = 1.

Định nghĩa KM = {tp : p ∈ M, t > 0}, khi đó ta có KM là tập lồi và
dimKM = dimM + 1.
8


Hệ quả 1.1.11. Cho V ⊂ Rn là tập lồi có biên là mặt trơn (n − 1)-chiều. Nếu
M ⊂ Rn là tập lồi và σV (p) = 1 với mọi p ∈ M thì M là đơn tử.
Cho Ω ⊂ Rn là tập mở và một hàm u : Ω → R. Một điểm x ∈ Ω được gọi là
điểm kì dị của hàm u nếu u là không khả vi tại x. Ký hiệu (u) là tập tất cả
các điểm kì dị trong Ω của hàm u được gọi là tập kì dị. Ta gọi cung là một ánh
xạ liên tục x : [0, ρ] → Rn , ρ > 0. Cung x là cung kì dị của hàm u nếu giá của x

là chứa trong Ω và x(s) ∈ (u) với mọi s ∈ [0, ρ].
Định lý 1.1.12. Cho x0 ∈ Ω là một điểm kì dị của hàm u ∈ SCL(Ω). Giả sử rằng
∂D+ u(x0 ) \ D∗ u(x0 ) = ∅. Khi đó tồn tại một cung kì dị Lipschitz x : [0, ρ] → Rn
của u, với x(0) = x0 và một số dương δ sao cho
lim+

s→0

x(s) − x0
= 0,
s

diam(D+ u(x(s))) ≥ δ,

s ∈ [0, ρ].

Hơn nữa, x(s) = x0 với mọi s ∈ (0, ρ].

1.2

Phương trình vi phân thường

Cho tập mở Ω ⊂ R × Rn , I là một khoảng trong R và hàm F : Ω → Rn , xét
phương trình vi phân thường
x (t) = F (t, x(t)).

Giả sử phương trình thỏa mãn điều kiện sau
(C): Hàm x → F (t, x) là liên tục với mọi t cố định và hàm t → F (t, x) là đo được
với mọi x cố định.
Gọi x : I → Rn , x được gọi là nghiệm của phương trình vi phân thường nếu nó

liên tục tuyệt đối và thỏa mãn
(t, x(t)) ∈ Ω, ∀t ∈ I, x (t) = F (t, x(t)).

Định lý 1.2.1. Cho F : Ω → Rn thỏa mãn giả thiết (C) và giả sử với mọi tập
compact K ⊂ Ω, tồn tại MK , LK > 0 sao cho
|F (t, x)| ≤ MK ,

∀(t, x) ∈ K.

|F (t, x1 ) − F (t, x2 )| ≤ LK |x1 − x2 |,

∀(t, x1 ), (t, x2 ) ∈ K.

Giả sử ma trận jacobian Fx tồn tại và liên tục hầu khắp theo x. Xét (t0 , x0 ) ∈ Ω
và tập x˜(.) = x(., t0 , x0 ), I là khoảng compact mà x˜(t) được xác định. Cho một
9


v ∈ Rn , gọi v(t) là nghiệm của bài toán Cauchy tuyến tính
v (t) = Fx (t, x˜(t))v(t)

với điều kiện đầu v(t0 ) = v . Khi đó với mọi t ∈ I ta có
lim

ε→0

x(t, t0 , x0 + εv) − x˜(t)
− v(t) = 0,
ε


giới hạn này là đều với t ∈ I, |v| ≤ 1.
Xét hệ phương trình vi phân tuyến tính có dạng
t ∈ I,

x (t) = A(t)x(t),

(1)

với A(t) là ma trận vuông cấp n × n đo được và bị chặn địa phương với t ∈ I .
Hệ phương trình liên hợp liên kết với (1) được cho bởi
w (t) = −AT (t)w(t),

t∈I

(2)

với AT là ma trận chuyển vị của ma trận A. Khi đó nghiệm của hai hệ phương
trình thỏa mãn mối liên hệ
d
[x(t).w(t)] = 0.
dt

Nghiệm ma trận cơ bản của hệ (1) là ma trận n × n M (t, s) phụ thuộc vào
(t, s) ∈ I × I , khi giải bài toán
∂M
(t, s) = A(t)M (t, s),
∂t

M (s, s) = I


với mọi s ∈ I . Nói cách khác, M (t, s) là ma trận có cột thứ i là giá trị tại thời
gian t của nghiệm (1) với điều kiện đầu x(s) = ei , với ei là vector thứ i trong cơ
sở tiêu chuẩn của Rn .

1.3

Nghiệm viscosity của phương trình Hamilton-Jacobi

Định nghĩa 1.3.1. Cho Ω ⊂ Rn là tập mở, u : Ω → R, x ∈ Ω tập
D− u(x) =

p ∈ Rn : lim inf

u(y) − u(x)− < p, y − x >
≥0
|y − x|

D+ u(x) =

p ∈ Rn : lim sup

u(y) − u(x)− < p, y − x >
≤0
|y − x|

y→x

y→x

lần lượt được gọi là dưới vi phân và trên vi phân của hàm u tại x.

10


Từ định nghĩa ta suy ra rằng, với mọi x ∈ Ω,
D− (−u)(x) = −D+ u(x).
D− u(x) và D+ u(x) là khác rỗng nếu và chỉ nếu u khả vi tại x, trong trường hợp

này ta có
D+ u(x) = D− u(x) = {Du(x)}.

Cho Ω ⊂ Rn và H ∈ C(Ω × R × Rn ). Xét phương trình đạo hàm riêng phi
tuyến cấp 1 tuyến tính tổng quát như sau
x ∈ Ω ⊂ Rn .

H(x, u, Du) = 0,

(∗)

Định nghĩa 1.3.2. Hàm u ∈ C(Ω) được gọi là một nghiệm dưới viscosity của
phương trình (∗) nếu với mọi x ∈ Ω thỏa mãn
∀p ∈ D+ u(x).

H(x, u(x), p) ≤ 0,

Tương tự, hàm u là một nghiệm trên viscosity của phương trình (∗) nếu với mọi
x ∈ Ω thỏa mãn
∀p ∈ D− u(x).

H(x, u(x), p) ≥ 0,


Nếu u vừa là nghiệm trên vừa là nghiệm dưới của phương trình (∗) thì u được
gọi là một nghiệm viscosity của phương trình (∗).
Mệnh đề 1.3.3. Cho u : Ω → R là hàm nửa lồi và là nghiệm viscosity của
phương trình (∗). Nếu H là lồi thì u thỏa mãn
H(x, u(x), p) = 0,

x ∈ Ω, p ∈ D− u(x).

Hơn nữa, với mọi (x, u) mà H(x, u, .) lồi chặt trong p thì u ∈ C 1 (Ω).
Định nghĩa 1.3.4. Cho u : Ω → R Lipschitz địa phương. Vector p ∈ Rn được
gọi là reachable gradient của u tại x ∈ Ω, nếu tồn tại một dãy {xk } ⊂ Ω \ {x} sao
cho u khả vi tại xk với mỗi k ∈ N và lim xk = x, lim Du(xk ) = p. Tập hợp tất
k→∞

cả reachable gradients của u tại x ký hiệu là

k→∞

D u(x).

Mệnh đề 1.3.5. Cho u : Ω → R là hàm nửa lõm với mô-đun ω và x ∈ Ω. Khi
đó các tính chất sau là đúng
(a) Nếu {xk } ⊂ Ω, xk → x và nếu pk ∈ D+ u(xk ), pk → p ∈ Rn thì p ∈ D+ u(x).
(b) D∗ u(x) ⊂ ∂D+ u(x).
11


(c) D+ u(x) = ∅.
(d) Nếu D+ u(x) là đơn tử thì u khả vi tại x.
(e) Nếu D+ u(y) là đơn tử với mọi y ∈ A thì u ∈ C 1 (Ω).

Định lý 1.3.6. Cho u : Ω → R là hàm nửa lõm. Khi đó
D+ u(x) = coD∗ u(x),

x ∈ Ω.

Do đó trên vi phân D+ u(x) là khác rỗng với mọi x, hơn nữa u khả vi tại x nếu
và chỉ nếu D+ u(x) là đơn tử.
Hệ quả 1.3.7. Cho Ω ⊂ Rn là tập lồi mở và u : Ω → R đồng thời vừa nửa lồi
và nửa lõm với mô-đun tuyến tính với hằng số C . Khi đó u ∈ C 1,1 (Ω) và hằng số
Lipschitz của Du là bằng C .
Cho S ⊂ Rn là tập đóng khác rỗng. Ký hiệu
projS (x) = {y ∈ S : dS (x) = |x − y|},

∀x ∈ Rn .

Hệ quả 1.3.8. Cho S ⊂ Rn là tập đóng khác rỗng, khi đó các tính chất sau đây
là thỏa mãn.
(i) dS là khả vi tại x ∈
/ S nếu và chỉ nếu projS (x) là đơn tử và trong trường hợp
x−y
với y là phần tử duy nhất của projS (x).
này DdS (x) = |x−y|
(ii) Nếu projS (x) là không đơn tử thì ta có
D+ dS (x) = co

1.4

x−y
: y ∈ projS (x)
|x − y|


=

x − co(projS (x))
,
dS (x)

D− dS (x) = ∅.

Bài toán điều khiển tối ưu

Định nghĩa 1.4.1. Một hệ điều khiển bao gồm một cặp (f, U ) với U ⊂ Rm là
một tập đóng và f : Rn × U → Rn là hàm liên tục. Tập U được gọi là tập điều
khiển, hàm f được gọi là hàm động lực của hệ. Phương trình trạng thái liên kết
với hệ là:


y (t) = f (y(t), u(t)),

y(t0 ) = x,
12

t ∈ [t0 , +∞),


với t0 ∈ R, x ∈ Rn và u ∈ L1loc ([t0 , +∞), U ). Hàm u được gọi là điều khiển chiến
lược hay điều khiển. Ký hiệu nghiệm của hệ là y(., t0 , x, u) và ta gọi là quỹ đạo
của hệ tương ứng với điều kiện đầu y(t0 ) = x và điều khiển u.
Ta đưa ra một vài giả thiết cơ sở cho hệ điều khiển như sau:
(H0) Tập điều khiển U là compact.

(H1) Tồn tại K1 > 0 sao cho |f (x2 , u) − f (x1 , u)| ≤ K1 |x2 − x1 | với mọi x1 , x2 ∈ Rn ;
u ∈ U.
(H2) fx tồn tại và liên tục. Hơn nữa, tồn tại K2 > 0 sao cho ||fx (x2 , u) −
fx (x1 , u)|| ≤ K2 |x2 − x1 |, với mọi x1 , x2 ∈ Rn ; u ∈ U .

Bổ đề 1.4.2. Cho t0 , t1 với t0 < t1 .
(i) Cho f thỏa điều kiện (H0), (H1). Khi đó với mọi r > 0 tồn tại R > 0 sao cho
|y(t, t0 , x, u)| ≤ R,

∀t ∈ [t0 , t1 ],

với mọi điều khiển u : [t0 , t1 ] → U và mọi x ∈ Br .
(ii) Cho f thỏa mãn (H1). Khi đó tồn tại c > 0 sao cho
|y(t, t0 , x0 , u) − y(t, t0 , x1 , u)| ≤ c|x0 − x1 |,

∀t ∈ [t0 , t1 ],

với mọi u : [t0 , t1 ] → U và x0 , x1 ∈ Rn .
(iii) Nếu f thỏa mãn (H1), (H2) thì tồn tại hằng số c trong (ii) sao cho
y(t, t0 , x0 , u) + y(t, t0 , x1 , u) − 2y(t, t0 ,

x0 + x1
, u) ≤ c|x0 − x1 |2 ,
2

với mọi u : [t0 , t1 ] → U và x0 , x1 ∈ Rn và t ∈ [t0 , t1 ].
Cho g : Rn → R là hàm liên tục và T > 0. Với mọi (t, x) ∈ [0, T ] × Rn , xét bài
toán Mayer (M P ) : minimize g(y(T, t, x, u)) theo mọi điều khiển u : [t, T ] → U .
Định nghĩa 1.4.3. Một điều khiển u : [t, T ] → U sao cho infimum trong bài
toán (M P ) đạt được thì u được gọi là tối ưu cho bài toán (M P ) với điểm đầu

(t, x). Nghiệm y(.) = y(., t, x, u) tương ứng của phương trình trạng thái được gọi

là quỹ đạo tối ưu.
Định lý 1.4.4. Giả sử (H0), (H1) là thỏa mãn và f (x, U ) = {f (x, u) : u ∈ U }
là tập lồi với x ∈ Rn . Xét {yk } là một dãy quỹ đạo của phương trình trạng
thái trên khoảng [t0 , t1 ], nghĩa là yk (.) = y(., t0 , xk , uk ) với điểm đầu xk ∈ Rn và
13


uk : [t0 , t1 ] → U . Nếu quỹ đạo yk là bị chặn đều, thì tồn tại dãy con {ykh } hội tụ

đều đến cung y : [t0 , t1 ] → Rn cũng là quỹ đạo của phương trình trạng thái.
Hàm Hamilton liên kết với bài toán (M P ) được định nghĩa là
∀x, p ∈ Rn , u ∈ U.

H(x, p) = max −p.f (x, u),
u∈U

1,1
Định lý 1.4.5. Nếu H ∈ Cloc
(Rn × (Rn \ {0})) thì với mọi (x, p) với p = 0,

Hx (x, p) = −fxT (x, u∗ (x, p))p,

Hp (x, p) = −f (x, u∗ (x, p)),

với u∗ (x, p) ∈ U là thỏa mãn −f (x, u∗ ).p = max −f (x, u).p.
u∈U

Cho hệ điều khiển (f, U ), hàm g ∈ C(Rn ) và thời gian T > 0. Xét hàm

L ∈ C(Rn × U ) được gọi là chi phí điều hành. Với mọi (t, x) ∈ [0, T ] × Rn , xét hàm
T

Jt,x (u) =

L(y(s), u(s))ds + g(y(T )),
t

với y(.) = y(., t, x, u) và bài toán điều khiển Bolza (BP ): minimize Jt,x (u) với mọi
điều khiển u : [t, T ] → U .
Giả sử hàm L thỏa mãn điều kiện sau đây,
(L1) Với mọi R > 0, tồn tại γR > 0 sao cho |L(x1 , u) − L(x2 , u)| ≤ γR |x1 − x2 |, với
mọi x1 , x2 ∈ BR , u ∈ U .
(L2) Với mọi x ∈ Rn , tập sau đây là lồi
L(x) := {(λ, v) ∈ Rn+1 : ∃u ∈ U sao cho v = f (x, u), λ ≥ L(x, u)}.

Định lý 1.4.6. Giả sử rằng (H0), (H1), (L1), (L2) thỏa mãn. Xét {yk } là một
dãy các quỹ đạo của phương trình trạng thái trên khoảng [t0 , t1 ] nghĩa là yk (.) =
y(., t0 , xk , uk ) với xk ∈ Rn và uk : [t0 , t1 ] → U . Nếu quỹ đạo yk là hội tụ đều thì tồn

tại dãy con ykh hội tụ đều đến cung y cũng là quỹ đạo của phương trình trạng
thái liên kết với điều khiển u và thỏa mãn
t1

t1

L(y(t), u(t))dt ≤ lim inf
t0

k→∞


14

L(yk (t), uk (t))dt.
t0


CHƯƠNG 2

NGHIỆM VISCOSITY CỦA BÀI
TOÁN ĐIỀU KHIỂN VỚI THỜI
GIAN THOÁT RA
Nội dung của chương được trích ra từ tài liệu tham khảo [6], 230 − 269.

2.1

Bài toán điều khiển tối ưu với thời gian thoát ra

Cho U ⊂ Rm là một tập đóng và f : Rn × U → Rn là hàm liên tục. Một hệ điều
khiển bao gồm một cặp (f, U ), tập U còn được gọi là tập điều khiển và hàm f
được gọi là hàm động lực của hệ. Phương trình trạng thái liên kết với hệ là:

y (t) = f (y(t), u(t)),

t ≥ 0.

y(0) = x,

x ∈ Rn .


(2.1)

Hàm số u ∈ L1 ([0, Tu ], U ) được gọi là hàm điều khiển chiến lược hay đơn giản là
điều khiển, được xác định trên khoảng thời gian hữu hạn Tu phụ thuộc vào từng
hàm u.
Ta đưa ra một vài giả thiết cơ sở cho hệ điều khiển như sau:
(H0) Tập điều khiển U là compact.
(H1) Tồn tại K1 > 0 sao cho |f (x2 , u) − f (x1 , u)| ≤ K1 |x2 − x1 | với mọi x1 , x2 ∈ Rn ,
u ∈ U.
(H2) fx tồn tại và liên tục. Hơn nữa, tồn tại K2 > 0 sao cho
||fx (x2 , u) − fx (x1 , u)|| ≤ K2 |x2 − x1 |, với mọi x1 , x2 ∈ Rn , u ∈ U.

Giả thiết (H1) nhằm để đảm bảo sự tồn tại và duy nhất nghiệm của hệ (2.1). Vì
15


thời gian đầu của hệ là bằng 0 nên ta ký hiệu quỹ đạo (nghiệm) của hệ (2.1) là
y x,u (.).
Tập đóng K ⊂ Rn cho trước được gọi là tập mục tiêu hay mục tiêu. Xét một
quỹ đạo y x,u (.) của hệ và ký hiệu
τ (x, u) = min{t ≥ 0 : y x,u (t) ∈ K}.

Khi đó τ (x, u) được gọi là thời gian thoát ra của quỹ đạo. Ta quy ước rằng
τ (x, u) = +∞ nếu y x,u (t) ∈
/ K, ∀t ∈ [0, Tu ]. Nếu τ (x, u) < +∞ thì ký hiệu
yτx,u := y x,u (τ (x, u))

là điểm mà quỹ đạo của hệ đạt được mục tiêu.
Ký hiệu R = {x ∈ Rn | ∃u ∈ L1 ([0, Tu ], U ) sao cho τ (x, u) < +∞}. Tập R được gọi
là tập điều khiển được. Trong phần này ta xét các bài toán điều khiển tối ưu

trong đó phiếm hàm mục tiêu cần cực tiểu hóa, nó không phải xác định trên
một khoảng thời gian cố định mà phụ thuộc vào thời gian thoát ra τ (x, u).
Một bài toán quan trọng bao gồm việc cực tiểu hóa của chính thời gian thoát
ra, được gọi là bài toán thời gian tối tiểu (M T P ) có dạng như sau
(M T P ) Cho trước x ∈ Rn , minimize τ (x, u), u ∈ L1 ([0, Tu ], U ).

Hàm giá trị tương ứng còn gọi là hàm thời gian tối tiểu được định nghĩa bởi
T (x) = inf{τ (x, u) : u ∈ L1 ([0, Tu ], U )},

x ∈ R.

(2.2)

Một điều khiển u để phiếm hàm đạt được minimum trong bài toán (M T P ) và
quỹ đạo tương ứng y = y x,u được gọi là tối ưu.
Ví dụ 2.1.1. Xét hệ phương trình: y (t) = u với u ∈ U = B1 và y(0) = x, x ∈ Rn .
Nghiệm của hệ có dạng y(t) = ut + x, là đường thẳng với vector chỉ phương
u ∈ B1 .
Với K ⊂ Rn là tập đóng cho trước, nếu y0 ∈ K, khi đó ∀x ∈ Rn , x = y0 , ta lấy
−x
u = |yy00 −x|
và t = |y0 − x| thì ut + x = y0 ∈ K, suy ra R = Rn . Từ định nghĩa hàm
T nên với mọi ε > 0 ta có τ (x, u) ≤ T (x) + ε. Mặt khác dK (x) ≤ |x − yτx,u | ≤ τ (x, u),
do đó T (x) = dK (x). Vậy quỹ đạo tối ưu là đoạn thẳng nối từ x đến hình chiếu
của x trên tập K. Với mọi x ∈ R luôn tồn tại nghiệm tối ưu và nghiệm này là
duy nhất khi và chỉ khi hình chiếu của x trên K là duy nhất. Theo Hệ quả 1.3.8,
tập các điểm hình chiếu của x trên K là duy nhất khi và chỉ khi dK là khả vi tại
x∈
/ K. Do vậy sự tồn tại duy nhất nghiệm tối ưu là liên quan đến tính khả vi
của hàm giá trị T .

16


Cho L : Rn × U → R là một hàm liên tục, dương được gọi là hàm chi phí điều
hành. g : Rn → R là hàm liên tục và bị chặn dưới được gọi là hàm chi phí cuối.
Xét hàm mục tiêu điều khiển
τ (x,u)

L(y x,u (s), u(s))ds + g(yτx,u )

J(x, u) =
0

và bài toán điều khiển như sau:
(ET P ) Cho x ∈ R; minimize J(x, u), với mọi u ∈ L1 ([0, Tu ], U ).

Bài toán có dạng như trên được gọi là bài toán thời gian thoát ra. Nếu chọn
L ≡ 1 và g ≡ 0 thì bài toán (ET P ) trở thành bài toán (M T P ).
Với x ∈ R, tồn tại u ∈ L1 ([0, Tu ], U ) sao cho τ (x, u) < +∞ do đó J(x, u) < +∞. Mặt
τ (x,u)

khác vì L > 0 nên 0
L(y x,u (s), u(s))ds > 0 và g bị chặn dưới nên J(x, u) ≥ inf g
với mọi u ∈ U . Suy ra inf J(x, u) = ±∞, ∀x ∈ R.
u∈U

Tiếp theo ta đưa ra một vài giả thiết sau đây đối với hàm L:
(L1) Với mọi R > 0, tồn tại γR > 0 sao cho |L(x1 , u) − L(x2 , u)| ≤ γR |x1 − x2 |, với

mọi x1 , x2 ∈ BR , u ∈ U .

(L2) Với mọi x ∈ Rn , tập sau đây là lồi
L(x) := {(λ, v) ∈ Rn+1 : ∃u ∈ U sao cho v = f (x, u), λ ≥ L(x, u)}.
(L3) Với mọi R > 0, tồn tại λR > 0 sao cho
L(x, u) + L(y, u) − 2L

x+y
, u ≤ λR |x − y|2
2

x, y ∈ BR , u ∈ U.

Một điều khiển u và quỹ đạo y x,u tương ứng được gọi là tối ưu đối với x nếu u
đạt được infimum trong bài toán (ET P ). Hàm giá trị của bài toán được định
nghĩa như sau:
V (x) = inf{J(x, u) : u ∈ L1 ([0, Tu ], U )}

x ∈ R.

(2.3)

Nguyên lý quy hoạch động của bài toán điều khiển được phát biểu trong định
lý sau.
Định lý 2.1.2. Với mọi x ∈ Rn và u : [0, Tu ] → U sao cho τ (x, u) < +∞. Ta có
t

L(y x,u (s), u(s))ds + V (y x,u (t)),

V (x) ≤

∀t ∈ [0, τ (x, u)].


0

Hơn nữa nếu u là điều khiển tối ưu thì dấu "=" xảy ra.
17

(2.4)


Chứng minh. Với mỗi t ∈ [0, τ (x, u)] cố định. Đặt x1 = y x,u (t) thì x1 ∈ Rn . Xét
hàm

y x,u (s) nếu s ∈ [0, t]
y ∗ (s) :=

y x1 ,u (s) nếu s ∈ [t, τ (x, u)].
Khi đó y ∗ cũng là một nghiệm của hệ (2.1), và y ∗ (0) = x, y ∗ (τ ) = y x1 ,u (τ ). Ta có
τ (x,u)

L(y ∗ (s), u(s))ds + g(y ∗ (τ ))

V (x) ≤
0
t

=

τ (x,u)

L(y


x,u

L(y x1 ,u (s), u(s))ds + g(y x1 ,u (τ ))

(s), u(s))ds +

0

t
t

L(y x,u (s), u(s))ds + J(x1 , u),

=

∀u ∈ U.

0

Suy ra
t

L(y x,u (s), u(s))ds + V (y x,u (t)),

V (x) ≤

∀t ∈ [0, τ (x, u)].

0


Nếu u là tối ưu đối với x, từ (2.4) suy ra
τ (x,u)

t

L(y x,u (s), u(s))ds + g(yτx,u ) ≤
0

L(y x,u (s), u(s))ds + V (y x,u (t))
0

τ (x,u)

L(y x,u (s), u(s))ds + g(yτx,u ) ≤ V (y x,u (t))
t

J(x1 , u) ≤ V (y x,u (t)).

Vậy
J(y x,u (t), u) = V (y x,u (t)),

∀t ∈ [0, τ (x, u)].

Ta có điều phải chứng minh.
Nội dung tiếp theo ta nghiên cứu sự tồn tại của quỹ đạo tối ưu. Trước tiên
ta xét trường hợp đối với bài toán thời gian tối tiểu (M T P ).
Định lý 2.1.3. Nếu các giả thiết (H0), (H1) là thỏa mãn và tập f (x, U ) :=
{f (x, u) : u ∈ U } là lồi với mọi x ∈ Rn thì với mọi x ∈ R tồn tại điều khiển là tối
ưu đối với x.

Chứng minh. Xét T (x) là hàm thời gian tối tiểu tương ứng của bài toán (M T P ).
Theo định nghĩa của infimum tồn tại dãy uk : [0, Tk ] → U sao cho τ (x, uk ) →
T (x), k → +∞.
Đặt yk = y x,uk là nghiệm của hệ (2.1) ứng với điều khiển uk và x ∈ R.
18


Đặt T cố định thỏa T (x) < T và giả sử uk (t) :=


uk (t) nếu t ∈ [0, Tk ]

nếu t ∈ [Tk , T ],
nếu Tk < T . Vì yk là nghiệm của hệ (2.1) với thời gian t0 = 0, theo Bổ đề 1.4.2(i)
suy ra nghiệm yk bị chặn đều trên mỗi khoảng [0, T ].
0

Mặt khác f (x, u) thỏa điều kiện (H1) nên |f (x, u)| ≤ C + K1 |x|, ∀x ∈ Rn , u ∈ U
với C = max |f (0, u)|.
u∈U

Áp dụng định lý giá trị trung bình ta có ∀t, t ∈ [0, T ] thì
|yk (t) − yk (t )| ≤ |f (yk (t∗ ), u(t∗ ))||t − t |

với t∗ ∈ (t, t )
với M = C + K1 R nên yk liên tục Lipzchits với hằng số M .
≤ (C + K1 R)|t − t | = M |t − t |,

Vì f (x, U ) là tập lồi và yk bị chặn đều trên [0, T ], theo Định lý 1.4.4 tồn tại dãy
con {ykh } của {yk } hội tụ đều đến y : [0, T ] → Rn cũng là nghiệm của hệ (2.1) có

điểm đầu x và điều khiển tương ứng u : [0, T ] → U . Suy ra sup |ykh (t) − y(t)| → 0
t∈[0,T ]

nên ta có

|y(T (x)) − yk (τ (x, uk ))| ≤ |(y − ykh )(T (x))| + |(ykh − yk )(T (x))| + |yk (T (x)) − yk (τ (x, uk ))|
≤ ||y − ykh ||∞ + ||ykh − yk ||∞ + M |T (x) − τ (x, uk )| → 0.

(2.5)
Suy ra yk (τ (x, uk )) → y(T (x)) khi k → ∞. Hơn nữa yk (τ (x, uk )) ∈ K, K là tập
đóng nên y(T (x)) ∈ K. Vậy T (x) = τ (x, u) nên u là tối ưu đối với x.
Nếu hàm g không phải là hàm hằng thì bài toán với những giả thiết trong
định lý trên chưa hẳn đảm bảo được sự tồn tại của nghiệm tối ưu, như ví dụ
sau đây.
Ví dụ 2.1.4. Xét hệ điều khiển trong không gian R2 với f (x, u) = u, u ∈ U = B1 .
Khi đó nghiệm tương ứng của hệ là y(t) = ut+x với y(t) = (y1 (t), y2 (t)), u = (u1 , u2 )
và x = (x1 , x2 ) = y(0). Chọn K = {(0, 0); (1, 0)}, L ≡ 1 và g ∈ C(R) sao cho
g(0, 0) = 0, g(1, 0) = 2.
Hàm mục tiêu điều khiển tương ứng là J(x, u) = τ (x, u) + g(y(τ )) với y(τ ) ∈ K.
Chọn y(0) = (2, 0).
Xét quỹ đạo y(t) đến điểm (1, 0) ∈ K ta tính được τ ≥ 1 khi −1 ≤ u1 ≤ 0, u2 = 0
và J(x, u) ≥ 3. Xét quỹ đạo y(t) đến điểm (0, 0) ∈ K mà không đi qua điểm (1, 0)
ta tính được τ > 2 khi −1 < u1 ≤ 0, u2 = 0 và J(x, u) > 2 và gần với 2 tùy ý. Do
19


vậy không tồn tại nghiệm tối ưu để phiếm hàm J(x, u) đạt được infimum.
Chọn y(0) = (x1 , x2 ), ta tính được V (x1 , x2 ) = x21 + x22 , ∀(x1 , x2 ) = (1, 0). Mặt
khác theo định nghĩa ta có V (x1 , x2 ) = inf{τ1 (x1 , x2 , u) + g(0, 0), τ2 (x1 , x2 , u) +
g(1, 0)}. Vì (1, 0) ∈ K nên V (1, 0) = g(1, 0) = 2. Xét dãy {xn } = ( n1 + 1, n1 ) → (1, 0)


khi đó V (xn ) → 1 khi n → ∞. Do vậy V (x1 , x2 ) → V (1, 0) khi (x1 , x2 ) → (1, 0).
Định lý 2.1.5. Nếu các giả thiết (H0), (H1), (L1), (L2) là thỏa mãn, giả sử
rằng luôn tồn tại các số N, G, α > 0 sao cho



L(x, u) ≥ α; |f (x, u)| ≤ N,
∀x ∈ Rn , u ∈ U,



(2.6)
|g(x) − g(y)| ≤ G|x − y|,
x, y ∈ ∂K,




α > N G,
thì với mọi x ∈ R là điểm đầu của hệ (2.1), luôn tồn tại điều khiển tối ưu cho
bài toán (ET P ).
Chứng minh. Xét V (x) là hàm giá trị tương ứng của bài toán (ET P ), theo định
nghĩa của infimum tồn tại dãy uk ∈ L1 ([0, Tk ], U ) sao cho J(x, uk ) → V (x) khi
k → ∞.
Để đơn giản ta đặt các ký hiệu sau: τk := τ (x, uk ), yk (.) = ykx,uk (.), zk = yk (τk ).
Theo giả thiết |f (x, u)| ≤ N, ∀x ∈ Rn , u ∈ U . Áp dụng định lý giá trị trung bình
ta có |yk (t) − yk (t )| ≤ N |t − t |, ∀t, t > 0.
Ta có |zk − z1 | ≤ |zk − x| + |x − z1 | ≤ N τk + N τ1 = N (τk − τ1 ).
Vì zk , z1 ∈ ∂K nên |g(zk ) − g(z1 )| ≤ G|zk − z1 | ≤ N G(τk + τ1 ).

τk

J(x, uk ) =

L(yk (s), uk (s))ds + g(yk (τk ))
0

Ta có

≥ ατk + g(zk ) ≥ ατk + g(z1 ) − N G(τk − τ1 )
= (α − N G)τk + g(z1 ) − N Gτ1 .

1
Do α − N G > 0 nên 0 ≤ τk ≤ α−N
G [J(x, uk ) + N Gτ1 − g(z1 )].
Vì J(x, uk ) → V (x) mà ∀x ∈ R, V (x) = ±∞, ngoài ra g bị chặn dưới, do đó τk bị
chặn.

Đặt T ∗ = max τk , khi đó ta có thể giả sử rằng uk , yk là xác định trên [0, T ∗ ] và
đặt uk (t) = u∗ với mọi t ≥ τk .
Vì {τk } bị chặn nên tồn tại dãy con của {τk } hội tụ cũng được kí hiệu {τk }, giả
sử rằng τk → τ .
Vì f thỏa điều kiện (H0), (H1) nên lập luận tương tự như trong chứng minh của
Định lý 2.1.3 thì yk bị chặn đều trên [0, T ∗ ] và liên tục Lipschitz với hằng số N .
20


Áp dụng Định lý 1.4.6 cho bài toán (ET P ), tồn tại dãy con {yki } của {yk } hội
tụ đến y là nghiệm của hệ (2.1) liên kết với điều khiển u : [0, T ∗ ] → U .
Ta có

|yk (τk ) − y(τ )| ≤ |yk (τk ) − yki (τk )| + |yki (τk ) − y(τk )| + |y(τk ) − y(τ )|
≤ ||yk − yki ||∞ + ||yki − y||∞ + N |τk − τ | → 0.

Suy ra yk (τk ) → y(τ ) và y(τ ) ∈ K do K đóng.
Ngoài ra theo Định lý 1.4.6 ta cũng có
τ

τ

L(y(t), u(t))dt ≤ lim inf
k→∞

0

∀τ ∈ [0, T ∗ ].

L(yk (t), uk (t))dt,
0

Vì L thỏa điều kiện (L1) nên hàm L bị chặn địa phương, đặt K = sup L(x, u), ∀x ∈
Rn , u ∈ U .
Ta có
τk

τk

L(yk (t), uk (t))dt| ≤

0≤|
τ


|L(yk (t), uk (t))|dt ≤ K|τk − τ | → 0.
τ

Do T ∗ = max τk mà τk → τ nên τ ≤ T ∗ . Và vì vậy ta được
τ

τ

L(y(t), u(t))dt ≤ lim inf
k→∞

0

τk

L(yk (t), uk (t))dt + lim
0

k→∞

τk

= lim inf

L(yk (t), uk (t))dt

k→∞

τk


0

≤ lim

k→∞

L(yk (t), uk (t))dt
τ

L(yk (t), uk (t))dt.
0

Mặt khác yk (τk ), y(τ ) ∈ ∂K nên: |g(yk (τk )) − g(y(τ ))| ≤ G|yk (τk ) − y(τ )| → 0.
Theo giả thiết ta có
τk

V (x) = lim J(x, uk ) = lim
k→∞

k→∞

L(yk (t), uk (t))dt + g(yk (τk ))
0

(2.7)

τ




L(y(t), u(t))dt + g(y(τ )).
0

Theo định nghĩa của τ (x, u) và y(τ ) ∈ K nên τ (x, u) ≤ τ .
Giả sử τ (x, u) = τ , từ (2.7) ta có V (x) ≥ J(x, u). Mặt khác từ định nghĩa của V
ta có V (x) ≤ J(x, u) vậy u là điều khiển tối ưu đối với x.
Giả sử τ (x, u) < τ , đặt t∗ = τ (x, u).
t∗

Vì V (x) ≤ 0 L(y(t), u(t))dt + g(y(t∗ )).
Từ (2.7) ta có

21


×