BỘ CƠNG THƢƠNG
ĐẠI HỌC CƠNG NGHIỆP TP HỒ CHÍ MINH
BÁO CÁO KHOA HỌC TỔNG KẾT ĐỀ TÀI
NGHIÊN CỨU KHOA HỌC CẤP TRƢỜNG
Tên đề tài: Nghiên cứu thiết kế chế tạo hệ thống điều khiển thơng minh
đồng bộ hóa robot bầy đàn
Mã số đề tài: IUH.KDT17/15
Chủ nhiệm đề tài: TS. Nguyễn Tấn Lũy
Đơn vị thực hiện: Khoa Công nghệ Điện tử
TP Hồ Chí Minh, 12/2016
THÔNG TIN KẾT QUẢ NGHIÊN CỨU
ĐỀ TÀI KHOA HỌC VÀ CƠNG NGHỆ CẤP TRƢỜNG
1. Thơng tin chung:
-
Tên đề tài: Nghiên cứu thiết kế chế tạo hệ thống điều khiển thông minh
đồng bộ hóa robot bầy đàn
-
Mã số: IUH.KDT17/15
-
Chủ nhiệm đề tài: TS. Nguyễn Tấn Lũy
-
Điện thoại: 0903640709
-
Đơn vị quản lý về chuyên môn (Khoa, Tổ bộ môn): Khoa Công nghệ Điện tử,
Email:
Bộ môn Điện tử-Tự động
-
Thời gian thực hiện: Từ 11/2015 đến 12/2016
2. Mục tiêu:
-
Nghiên cứu, thiết kế chế tạo hệ thống robot di động bầy đàn mang yếu tố cơng
nghệ mới.
-
Mơ hình đào tạo cho sinh viên chun ngành Điều khiển và Tự động hóa
-
Cơng cụ nền tảng để nghiên cứu phát triển dự án sản xuất robot bầy đàn ứng
dụng trong công nghiệp và dân dụng.
3. Nội dung chính:
-
Đề xuất mới luật điều khiển thơng minh đồng bộ hóa robot bầy đàn trong
trƣờng hợp tri thức của chuyên gia bị giới hạn
-
Thiết kế chế tạo các mô hình robot di động bầy đàn truyền đƣợc thơng tin lẫn
nhau
ii
-
Thiết kế hệ thống thị giác máy tính
-
Kết quả mơ phỏng và thực nghiệm trên cho robot di động bầy đàn để kiểm
chứng tính hiệu quả của bộ điều khiển đề xuất
4. Kết quả chính đạt đƣợc:
-
Bài báo khoa học trên Tạp chí quốc tế (SCIE, IF: 2.39): Luy N. T., Adaptive
dynamic programming-based design of integrated neural network structure for
cooperative control of multiple MIMO nonlinear systems, Neurocomputing
(2016), />
-
Mơ hình ba robot di động và và phần mềm điều khiển có thể dùng để giảng dạy
lý thuyết và thí nghiệm cho sinh viên chuyên ngành tự động tại trƣờng Đại học
Công Nghiệp TP. Hồ Chí Minh. Ngồi ra, kết quả đề tài cịn là cơ sở lý thuyết
để mở rộng cho các nghiên cứu tiếp theo.
-
Hai sinh viên tốt nghiệp chuyên ngành Điện tử-tự động với luận văn “Điều
khiển đội hình robot bầy đàn”.
iii
TĨM TẮT BÁO CÁO
Báo cáo này trình bày kết quả về nghiên cứu hệ thống điều khiển thông minh
đồng bộ hóa robot bầy đàn. Thứ nhất, thuật tốn điều khiển thông minh hợp tác nhiều
đối tƣợng phi tuyến MIMO đƣợc đề xuất. Thuật toán thiết kế dựa vào phƣơng pháp qui
hoạch hoạch động thích nghi và xấp xỉ hàm đã khắc phục các hạn chế so với các
nghiên cứu trƣớc đó bao gồm chi phí tính tốn, tài ngun lƣu trữ và tốc độ hội tụ.
Trong thuật toán, tham số xấp xỉ hàm và tham số luật điều khiển tối ƣu và luật nhiễu
xấu nhất đƣợc cập nhật đồng thời và liên tục trong một bƣớc lặp nhằm tăng tốc độ hội
tụ. Thuật tốn khơng chỉ bảo đảm hàm chi phí đƣợc tối thiểu, các tham số hội tụ về giá
trị cận tối ƣu mà cịn bảo đảm rằng tồn bộ trạng thái của hệ kín và các sai số xấp xỉ bị
chặn theo tiêu chuẩn Lyapunov mở rộng.
Thuật toán điều khiển thông minh nhiều đối tƣợng phi tuyến MIMO đƣợc áp
dụng trong bài toán đồng bộ robot bầy đàn. Mơ hình phần cứng và phần mềm của hệ
thống robot đƣợc phát triển bao gồm thị giác máy tính, truyền thông và bộ điều khiển.
Kết quả mô phỏng và thực nghiệm trên hệ thống robot thực cho thấy tính hiệu quả của
nghiên cứu.
.
iv
MỤC LỤC
DANH MỤC CÁC HÌNH ẢNH................................................................................... vii
DANH MỤC CÁC BẢNG BIỂU................................................................................. vii
DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................. viii
DANH MỤC CÁC KÝ HIỆU ........................................................................................ix
CHƢƠNG 1 GIỚI THIỆU ............................................................................................1
1.1 Tổng quan về điều khiển robot bầy đàn..................................................................1
1.2 Tính cấp thiết, mục tiêu và nhiệm vụ nghiên cứu...................................................2
1.2.1 Tính cấp thiết của đề tài...............................................................................2
1.2.2 Mục tiêu nghiên cứu ....................................................................................3
1.2.3 Nhiệm vụ nghiên cứu ..................................................................................3
1.3 Đối tƣợng, phạm vi và phƣơng pháp nghiên cứu ...................................................3
1.3.1 Đối tƣợng và phạm vi nghiên cứu ...............................................................3
1.3.2 Phƣơng pháp nghiên cứu .............................................................................4
1.4 Bố cục báo cáo ........................................................................................................4
CHƢƠNG 2 LÝ THUYẾT ĐỒ THỊ VÀ MƠ HÌNH HỢP TÁC NHIỀU HỆ PHI
TUYẾN MIMO ...............................................................................................................5
2.1 Các định nghĩa ........................................................................................................5
2.2 Đồ thị truyền thông phân tán ..................................................................................5
2.3 Động học nút ...........................................................................................................6
2.4 Mơ hình hợp tác nhiều hệ phi tuyến .......................................................................8
CHƢƠNG 3 PHÂN TÍCH VÀ THIẾT KẾ THUẬT TỐN ĐIỀU KHIỂN THƠNG
MINH
...............................................................................................................12
3.1 Mục tiêu điều khiển ..............................................................................................12
3.2 Cấu trúc điều khiển ...............................................................................................12
3.3 Thuật tốn điều khiển thơng minh, phân tích ổn định và hội tụ ...........................17
v
3.3.1 Thuật tốn ..................................................................................................17
3.3.2 Phân tích ổn định và hội tụ ........................................................................18
CHƢƠNG 4 ĐIỀU KHIỂN THÔNG MINH ĐỒNG BỘ ROBOT BẦY ĐÀN ........19
4.1 Mơ hình hệ thống robot bầy đàn ...........................................................................19
4.1.1 Cấu trúc chung của hệ thống .....................................................................19
4.1.2 Mơ hình động lực học và thiết kế phần cứng robot di động .....................19
4.1.3 Nhận dạng đặc trƣng robot ........................................................................25
4.2 Thuật toán điều khiển ...........................................................................................27
4.3 Kết quả mô phỏng và thực nghiệm .......................................................................28
4.3.1 Kết quả mô phỏng .....................................................................................28
4.3.2 Kết quả thực nghiệm .................................................................................33
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ....................................................................36
Kết luận..........................................................................................................................36
Hƣớng phát triển ............................................................................................................36
TS. Nguyễn Tấn Lũy .....................................................................................................37
TÀI LIỆU THAM KHẢO .............................................................................................38
PHỤ LỤC A CHỨNG MINH BỔ ĐỀ 3.1 ..................................................................42
vi
DANH MỤC CÁC HÌNH ẢNH
Hình 2.1 Đồ thị truyền thơng của 4 hệ phi tuyến ............................................................6
Hình 3.1 Cấu trúc điều khiển đồng bộ nhiều hệ phi tuyến ............................................17
Hình 4.1 Cấu trúc chung của hệ thống ..........................................................................19
Hình 4.2 Sơ đồ liên kết các thành phần trong hệ thống ................................................20
Hình 4.3 Mơ hình động học robot di động dạng xe: (a) Sơ đồ; (b) Phần cứng .............20
Hình 4.4 Sơ đồ mạch điện điều khiển robot ..................................................................25
Hình 4.5 Sơ đồ mạch in .................................................................................................25
Hình 4.6 Đội hình và nhận dạng: (a): Đội hình robot; (b): Phần cứng robot ................26
Hình 4.7 Nhận dạng đặc trƣng robot dựa vào xử lý ảnh ...............................................26
Hình 4.8 Cấu trúc điều khiển đồng bộ hóa robot ..........................................................27
Hình 4.9 Đồ thị truyền thơng giữa các robot mơ phỏng ................................................28
Hình 4.10 Đồng bộ hóa đội hình theo phƣơng 𝑥 ...........................................................29
Hình 4.11 Đồng bộ hóa đội hình theo phƣơng 𝑦 ...........................................................30
Hình 4.12 Đồng bộ hóa đội hình theo phƣơng 𝜃 ...........................................................30
Hình 4.13 Đội hình sau khi hội tụ .................................................................................30
Hình 4.14 Đồng bộ hóa đội hình theo vận tốc dài .........................................................31
Hình 4.15 Đồng bộ hóa đội hình theo vận tốc góc ........................................................31
Hình 4.16 Mơ men điều khiển .......................................................................................32
Hình 4.17 Đồng bộ hóa đội hình 𝑥 − 𝑦 bằng phần mềm mô phỏng V-REP PRO ........32
Hình 4.18 Cấu hình truyền thơng trong thực nghiệm: (a) Đội hình 1; (b) Đội hình 2 ..33
Hình 4.19 Quĩ đạo 𝑥 − 𝑦 của robot ở đội hình 1 ..........................................................33
Hình 4.20 Quĩ đạo robot theo 𝑥, 𝑦, 𝜃 ở đội hình 1 .........................................................34
Hình 4.21 Sai số bám vị trí của robot 1 so với robot tham chiếu ở đội hình 1 .............35
Hình 4.22 Sai số bám vận tốc của robot 1 so với robot tham chiếu ở đội hình 1 .........35
Hình 4.23 Quĩ đạo 𝑥 − 𝑦 của robot ở đội hình 2 ..........................................................35
DANH MỤC CÁC BẢNG BIỂU
Bảng 4.1 Thơng số kỹ thuật mơ hình phần cứng robot .................................................24
vii
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
ADP
Thuật ngữ tiếng anh
Adaptive Dynamic
Programming
HJI
Hamilton-Jacobi-Isaacs
HJB
Hamilton-Jacobi-Bellman
Giải thích
Qui hoạch động thích nghi, một phƣơng
pháp học củng cố để xấp xỉ luật điều
khiển tối ƣu online
Kích thích hệ thống bằng cách thêm nhiễu
PE
Persistence of Excitation
vào véc tơ tín hiệu vào/ra. PE là điều kiện
để tham số hội tụ trong nhận dạng và điều
khiển thích nghi.
Thuật tốn của học củng cố sử dụng một
PI
Policy Iteration
số bƣớc lặp để xấp xỉ luật điều khiển tối
ƣu
RL
Reinforcement Learning
Học củng cố
LQR
Linear Quaratic Regulation
Điều khiển tối ƣu tồn phƣơng tuyến tính
MIMO
Multi-Input-Multi-Output
Hệ thống một nhiều ngõ vào nhiều ngõ ra
NN
Neural Network
Mạng thần kinh nhân tạo
UUB
Uniform Ultimate Bounded
Bị chặn tới hạn đều
WMR
Wheeled Mobile Robot
Robot di động dạng xe
viii
DANH MỤC CÁC KÝ HIỆU
ℝ
Tập các số thực
ℝ𝑛
Không gian các tọa độ thực (khơng gian Euclide) 𝑛 chiều
ℝ𝑛×𝑚
Tập các ma trận có kích thƣớc 𝑛 × 𝑚 chứa các phần tử số thực
Ω𝑥
Tập đóng (Ω𝑥 ⊆ ℝ ) bao quanh gốc: nếu 𝑥 ∈ Ω𝑥 thì 𝑥 là lân cận quanh
𝑛
điểm cân bằng 𝑥0 .
.
𝑉𝑥 𝑥
⊗
Chuẩn véc tơ hoặc ma trận trong ℝ𝑛 hoặc ℝ𝑛 ×𝑚
Gradient của hàm 𝑉(𝑥) theo 𝑥: 𝑉𝑥 𝑥 =
𝜕𝑉(𝑥)
𝜕𝑥
Tích Kronecker, X Y X T Y T ,
T
X Y X Y X Y , trong đó X và Y là các ma trận còn 𝛽 là
đại lƣợng vơ hƣớng
𝐼𝑛
Ma trận đơn vị có chiều 𝑛 × 𝑛
𝟏
𝟏 = 1, … ,1
𝑇
∈ ℝ𝑛
Diag(αi ) Ma trận đƣờng chéo chứa các phần tử đƣờng chéo αi
𝐿2 0,∞
Không gian Banach, nếu ∀𝑑 ∈ 𝐿2 0,∞ thì
∞
0
𝑑
2
𝑑𝑡 < ∞
sub 𝑥(𝑡) Cận trên nhỏ nhất (cận trên đúng) của 𝑥(𝑡)
inf 𝑥(𝑡) Cận dƣới lớn nhất (cận dƣới đúng) của 𝑥(𝑡)
𝑊
Ma trận trọng số của NN
𝑤𝑖
Trọng số NN giữa đơn vị ẩn thứ 𝑖 và đơn vị ra (một ngõ ra)
𝑤𝑖𝑗
Trọng số NN kết nối giữa ngõ ra của đơn vị 𝑖 và ngõ vào đơn vị 𝑗
𝑛𝑖 , 𝑛
Số lƣợng ngõ vào, số lƣợng đơn vị ẩn của NN
𝜙(𝑥)
Véc tơ hàm tác động của NN
𝑉 𝑥
Hàm chi phí
ix
𝑉 ∗ (𝑥)
Hàm chi phí tối ƣu
𝑢, 𝑢∗
Véc tơ tín hiệu ngõ vào điều khiển và ngõ vào điều khiển tối ƣu
𝑑
Véc tơ nhiễu
𝑥
Véc tơ tín hiệu trạng thái
𝑦
Véc tơ ngõ ra đo đƣợc
𝜆𝑚𝑖𝑛 .
Trị riêng nhỏ nhất
𝜆𝑚𝑎𝑥 .
Trị riêng lớn nhất
𝑄 𝑥
Hàm xác định dƣơng, sao cho ∀𝑥 ≠ 0, 𝑄 𝑥 > 0 và 𝑄 𝑥 = 0 ⟺ 𝑥 = 0
𝑄
Ma trận trọng số xác định dƣơng
𝑅
Ma trận trọng số đối xứng, xác định dƣơng
𝑏1 , 𝑟1 , 𝑙
Bề rộng, bán kính bánh xe và khoảng cách từ tâm đến trục bánh sau của
robot di động
𝜏, 𝜏𝑚
x
Véc tơ mô men điều khiển và mô men nhiễu của robot di động
CHƢƠNG 1
GIỚI THIỆU
1.1 Tổng quan về điều khiển robot bầy đàn
Ngày nay, vấn đề điều khiển hệ thống nhiều robot hợp tác đƣợc nghiên cứu sâu
rộng trong lĩnh vực điều khiển và tự động hóa. Trong nhiều ứng dụng, ngƣời ta quan
tâm đến việc đồng bộ hóa các robot để đạt đƣợc các mục tiêu kết hợp [7], [9], [29],
[17], [20]. Bài tốn nhiều robot di động hợp tác có các dạng nhƣ các robot bám theo
đối tƣợng dẫn đầu (Leader-Follower), robot bầy đàn phân tán (Distributed Swarms)
hay đồng bộ hóa đội hình. Trong các nghiên cứu đó, lý thuyết đồ thị đƣợc sử dụng nhƣ
kiến thức nền tảng để thiết kế sơ đồ truyền thông hệ thống nhiều robot hợp tác, trong
đó bao gồm nhiều nút và nhánh liên kết [10], [30], [18].
Hệ thống robot tại mỗi nút trong đồ thị là hệ tuyến tính [24], [27] hoặc là hệ phi
tuyến [5], [6], [29], [30], [18], [14]. Dựa vào khả năng xấp xỉ, NN đƣợc sử dụng để
thiết kế các bộ điều khiển thích nghi hợp tác [5], [6], [18], [14]. Trong [18], NN phân
tán đƣợc sử dụng để thiết kế giải thuật điều khiển hợp tác hồi tiếp ngõ ra cho nhiều hệ
phi tuyến với thành phần động thiếu thông tin xác định. Trong [5], [31], [14] giải thuật
điều khiển thích nghi bền vững hợp tác dựa vào NN đƣợc thiết kế cho nhiều hệ phi
tuyến bám quỹ đạo của đối tƣợng dẫn đầu với sai số bám bị chặn. Trong [6], giải thuật
điều khiển thích nghi bền vững dựa vào NN đƣợc thiết kế cho nhiều hệ phi tuyến hợp
tác sử dụng kỹ thuật tuyến tính hóa.
Hầu hết các giải thuật nói trên khơng tối thiểu bất kỳ hàm chỉ tiêu chất lƣợng nên
không đƣợc xem là các giải thuật điều khiển tối ƣu. Kết hợp các đặc tính của điều
khiển thích nghi và tối ƣu cho bài toán điều khiển hợp tác là cần thiết. Tuy nhiên, đây
là bài toán phức tạp và nhiều thách thức. Giải thuật điều khiển tối ƣu cho từng đối
tƣợng riêng lẻ với thông tin tập trung [8], [21], [22] không thể áp dụng một cách thuần
túy vào hệ thống nhiều đối tƣợng hợp tác với thông tin phân tán. Gần đây, một vài giải
thuật điều khiển tối ƣu hợp tác dựa vào LQR mở rộng đã phát triển [32], [27]. Tuy
nhiên, bị giới hạn bởi LQR, các giải thuật này chỉ giới hạn trong bài tốn đồng bộ hóa
nhiều hệ tuyến tính. Ngồi ra, nhiễu bị bỏ qua trong phân tích và thiết kế.
1
Kỹ thuật qui hoạch động thích nghi (Adaptive Dynamic Progrraming-ADP) dựa
vào xấp xỉ hàm đã chứng tỏ là công cụ rất mạnh để phát triển giải thuật điều khiển tối
ƣu thích nghi hợp tác khơng cần biết chính xác động học hệ thống [33]. Trong [22],
tồn bộ nghiệm phƣơng trình Halmilton-Jacobi-Bellman (HJB) hợp tác trong đồ thị
truyền thông tại các nút đƣợc xấp xỉ bởi giải thuật Policy Iteration (PI). Tuy nhiên, đối
tƣợng tại các nút đồ thị là hệ tuyến tính với mơ hình xác định và bỏ qua nhiễu. Giải
thuật đề xuất trong Báo cáo này sẽ cho thấy hiệu quả về chi phí tính tốn và tài nguyên
lƣu trữ nhằm tăng tốc độ hội tụ. Bởi vì, nếu sử dụng giải thuật với ba xấp xỉ hàm để
điều khiển hợp tác nhiều hệ phi tuyến, thì việc tính tốn và tài ngun lƣu trữ sẽ rất
phức tạp và lãng phí theo cấp số nhân dẫn đến tốc độ hội tụ tồn hệ thống rất chậm.
1.2 Tính cấp thiết, mục tiêu và nhiệm vụ nghiên cứu
1.2.1 Tính cấp thiết của đề tài
Trong những năm qua điều khiển hệ thống robot bầy đàn đang đƣợc rất nhiều
nhà khoa học trong lĩnh vực điều khiển tự động nghiên cứu và phát triển bởi vì khả
năng ứng dụng rộng rãi trong nhiều lĩnh vực nhƣ công nghiệp (robot cứu hỏa, robot y
tế) dựa trên nền tảng các thuộc tính hợp tác, đồng bộ của các bầy đàn sinh học nhƣ
kiến, ong,…, trong đó điều khiển thơng minh hệ thống robot bầy đàn bám chính xác
quĩ đạo tham chiếu của robot dẫn đầu dƣới tác động của tham số thay đổi, mô hình
chứa sai số và nhiễu mơi trƣờng,… là một thách thức. Thiếu thơng tin thiết kế thuật
tốn điều khiển bầy đàn, bài toán robot tự học và điều khiển hành vi sao các cho robot
thích nghi bền vững với mơi trƣờng đang là đề tài rất mới, rất thời sự.
Nâng cao chất lƣợng đào tạo cho sinh viên ngành Tự động đang đƣợc các trƣờng
đại học quan tâm. Tuy nhiên, mơ hình thí nghiệm robot bầy đàn nhập từ nƣớc ngoài
giá thành rất đắt đang là vấn đề nan giải cho nhiều cơ sở đào tạo liên quan chuyên
ngành điều khiền tự động. Ngồi ra mơ hình nhập ngoại chỉ có phần cứng, khơng đi
kèm phần mềm điều khiển thơng minh. Mơ hình đề xuất trong đề tài sẽ có giá thành
giảm nhiều lần so với ngoại nhập. Hơn nữa thuật tốn điều khiển thơng minh đồng bộ
hóa bầy đàn sẽ đƣợc cài đặt trong hệ thống, đáp ứng nhu cầu đào tạo chuyên ngành
điều khiển và tự động hóa trong các cơ sở đào tạo.
2
1.2.2 Mục tiêu nghiên cứu
Phân tích, thiết kế chế tạo hệ thống điều khiển thơng minh đồng bộ hóa robot bầy
đàn nhằm:
-
Đề xuất thuật tốn điều khiển thơng minh đồng bộ robot bầy đàn
-
Hỗ trợ đào tạo về mặt lý thuyết lẫn thực tiễn cho sinh viên ngành Tự động hóa.
-
Hình thành cơng cụ nền tảng để nghiên cứu phát triển dự án sản xuất robot bầy
đàn ứng dụng trong công nghiệp và dân dụng.
1.2.3 Nhiệm vụ nghiên cứu
-
Thiết kế chế tạo các mơ hình robot di động bầy đàn quan sát đƣợc thông tin lẫn
nhau
-
Thiết kế chế tạo hệ thống thị giác máy tính
-
Đề xuất mới luật điều khiển thơng minh đồng bộ hóa robot bầy đàn trong
trƣờng hợp tri thức của chuyên gia bị giới hạn
-
Kết quả mô phỏng và thực nghiệm trên cho robot di động bầy đàn để kiểm
chứng tính hiệu quả của bộ điều khiển đề xuất
1.3 Đối tƣợng, phạm vi và phƣơng pháp nghiên cứu
1.3.1 Đối tượng và phạm vi nghiên cứu
Đối tƣợng lý thuyết cần nghiên cứu trong điều khiển robot bầy đàn là lớp 𝑁 hệ
phi tuyến MIMO với mỗi hệ con 𝑖, 1 ≤ 𝑖 ≤ 𝑁 có 𝑚 (𝑚 ≥ 2) phƣơng trình phi tuyến:
𝑥𝑖 = 𝑓𝑖 𝑥𝑖 + 𝑔𝑖 𝑥𝑖 𝑥𝑖
𝑥𝑖𝑚 = 𝑓𝑖𝑚 𝑥𝑖𝑚 + 𝑔𝑖𝑚 𝑥𝑖𝑚
+ 𝑘𝑖 𝑥𝑖 𝑑𝑖 +1 , 1 ≤ ≤ 𝑚 − 1
⋮
𝑢𝑖𝑚 + 𝑘𝑖𝑚 𝑥𝑖𝑚 𝑑𝑖𝑚
+1
(1.1)
𝑇
𝑇
𝑇 𝑇
trong đó với mọi 1 ≤ ≤ 𝑚, 𝑥𝑖 = [𝑥𝑖1
, 𝑥𝑖2
, … , 𝑥𝑖
] ∈ ℝ𝑛 1 +⋯+𝑛 với 𝑥𝑖 ∈ ℝ𝑛 là
véc tơ trạng thái, 𝑢𝑖𝑚 ∈ ℝ𝑛 𝑚 là véc tơ ngõ vào điều khiển, và 𝑑𝑖 ∈ ℝ𝑛 là véc tơ
nhiễu sao cho 𝑑𝑖 ∈ 𝐿2 [0, ∞), 𝑓𝑖 (𝑥𝑖 ) ∈ ℝ𝑛 , 𝑘𝑖 (𝑥𝑖 ) ∈ ℝ𝑛 ×𝑛 và 𝑔𝑖 (𝑥𝑖 ) ∈
ℝ𝑛 ×𝑛 +1 lần lƣợt là các véc tơ và ma trận hàm phi tuyến khả vi liên tục. Giả sử rằng
tồn bộ trạng thái có sẵn để hồi tiếp và 𝑓𝑖 (𝑥𝑖 ) là động học nội không biết trƣớc.
3
Đối tƣợng thực nghiệm nhằm kiểm chứng tính hiệu quả của phƣơng pháp điều
khiển là ba robot di động dạng xe thuộc lớp đối tƣợng phi tuyến (1.1) chứa thành phần
động khơng thể cấu trúc hóa hoặc mơ hình hóa, chịu tác động bởi nhiễu mơ men ngõ
vào có năng lƣợng hữu hạn.
1.3.2 Phương pháp nghiên cứu
Trên cơ sở lý thuyết về điều khiển hợp tác có tiếp cận đến những kết quả cơng bố
mới nhất, báo cáo phân tích ƣu nhƣợc điểm của từng phƣơng pháp, tiếp tục nghiên cứu
và phát triển để khắc phục các hạn chế còn tồn tại. Các phƣơng pháp nghiên cứu trong
báo cáo bao gồm:
Nghiên cứu tài liệu tham khảo có liên quan đến hệ thống đội hình robot di động,
phân tích và thiết kế hệ thống, tính tốn và chứng minh lý thuyết ổn định và hội tụ
bằng cơ sở toán học, kết hợp giữa mô phỏng và thực nghiệm nhằm mục đích kiểm
tra tính hiệu quả của lý thuyết.
Sử dụng các phần mềm để mơ phỏng.
Xây dựng mơ hình phần cứng cho ba robot di động, cài đặt thuật tốn cho bộ
điều khiển nhúng thời gian thực bằng ngơn ngữ C, VC++.
1.4 Bố cục báo cáo
Phần mở đầu đã trình bày tổng quan về điều khiển hợp tác, động cơ, mục tiêu và
nhiệm vụ nghiên cứu cũng nhƣ phƣơng pháp, đối tƣợng và phạm vi nghiên cứu. Nội
dung tiếp theo của báo cáo đƣợc bố cục nhƣ sau:
1. Chƣơng 2 trình bày cơ sở lý thuyết về lý thuyết đồ thị và mơ hình hợp tác nhiều hệ
phi tuyến MIMO.
2. Chƣơng 3 Phân tích, thiết kế cấu trúc và giải thuật điều khiển thơng minh:
Phân tích và thiết kế cấu trúc điều khiển.
Phân tích và thiết kế luật cập nhật tham số xấp xỉ hàm.
Xây dựng thuật tốn điều khiển.
3. Chƣơng 4 mơ phỏng và thực nghiệm trên hệ thống nhiều robot di động dạng xe.
4. Cuối cùng là phần kết luận và hƣớng phát triển.
4
CHƢƠNG 2
LÝ THUYẾT ĐỒ THỊ VÀ MƠ HÌNH HỢP TÁC
NHIỀU HỆ PHI TUYẾN MIMO
Trong chƣơng này, lý thuyết đồ thị phân tán truyền thông đƣợc giới thiệu. Dựa
vào đồ thị này, các hệ phi tuyến MIMO đƣợc chuyển đổi thành mơ hình động học bám
hợp tác.
2.1 Các định nghĩa
Định nghĩa 2.1 (Uniform Ultimate Bounded-UUB [16]): Xét hệ thống phi tuyến:
𝑥 = 𝑓(𝑥, 𝑡)
(2.1)
với trạng thái 𝑥(𝑡) ∈ ℝ𝑛 . Điểm cân bằng 𝑥0 đƣợc gọi là UUB nếu tồn tại một tập đóng
Ω𝑥 ⊂ ℝ𝑛 , sao cho với mọi 𝑥 ⊂ Ω𝑥 , luôn tồn tại chặn trên 𝐵 và thời gian 𝑇𝐵 (𝐵, 𝑥0 ) để
điều kiện 𝑥 𝑡 − 𝑥0 ≤ 𝐵 luôn thỏa với mọi 𝑡 ≥ 𝑡0 + 𝑇𝐵 .
Định nghĩa 2.2 (Zero-State Observability [34]): Hệ thống (2.1) với ngõ ra đo
đƣợc 𝑦 = (𝑥) gọi là quan sát đƣợc trạng thái không, nếu 𝑦 𝑡 ≡ 0, ∀𝑡 ≥ 0 kéo theo
𝑥 𝑡 ≡ 0, ∀𝑡 ≥ 0.
Định nghĩa 2.3 (Điều kiện PE (Persistently Exciting) [34]): Một véc tơ tín hiệu bị
chặn 𝜎 𝑡 gọi là thỏa điều PE trong khoảng thời gian 𝑡, 𝑡 + 𝑇𝑃 , 𝑇𝑃 > 0 nếu tồn tại
𝛽1 > 0 và 𝛽2 > 0 sao cho với mọi 𝑡:
𝑡+𝑇𝑃
𝛽1 𝐼 ≤
𝜎 𝑡 𝜎 𝑇 𝑡 𝑑𝑡 ≤ 𝛽2 𝐼
(2.2)
𝑡
trong đó 𝐼 là ma trận đơn vị có chiều phù hợp.
2.2 Đồ thị truyền thông phân tán
Xét 𝑁 đối tƣợng hợp tác trong hệ thống. Cấu hình hợp tác nhiều đối tƣợng có thể
đặc trƣng bởi đồ thị có hƣớng 𝒢(𝒱, ℰ, 𝒜) trong đó các đối tƣợng đƣợc biểu diễn bởi
tập nút 𝒱 = 𝑠0 , … , 𝑠𝑁 , với 𝑠0 là nút dẫn đầu. Sự truyền thông giữa các đối tƣợng
đƣợc đặc trƣng bởi tập cạnh 𝛤 ⊆ 𝒱 × 𝒱 với ma trận trọng số kết nối 𝒜 = [𝑎𝑖𝑗 ] trong
đó 𝑎𝑖𝑖 = 0, 𝑎𝑖𝑗 > 0 nếu 𝑎𝑖𝑗 ∈ 𝛤 và 𝑎𝑖𝑗 = 0 trong trƣờng hợp ngƣợc lại. Nếu 𝑠𝑗 nhận
đƣợc thông tin của đối tƣợng 𝑠𝑖 thì 𝑠𝑗 đƣợc gọi là đối tƣợng lân cận của 𝑠𝑖 . Tập lân cận
5
của đối tƣợng si đƣợc định nghĩa bởi ℕ𝑖 = 𝑆𝑗 ∈ 𝒱: (𝑠𝑖 , 𝑠𝑗 ) ∈ 𝛤 . Định nghĩa ma trận
Laplace ℒ = ℋ − 𝒜 ∈ ℝ 𝑁+1
×(𝑁+1)
trong đó ℋ = diag(𝑖 ) với 𝑖 =
𝑗 ∈ℕ𝑖
𝑎𝑖𝑗 . Để ý
rằng tổng mỗi hàng của ma trận ℒ cho giá trị khơng. Đƣờng đi có hƣớng từ đối tƣợng
𝑠0 đến 𝑠𝑘 là một chuỗi các cạnh có thứ tự đầu và cuối, với (𝑠𝑖 , 𝑠𝑖+1 ) ∈ 𝒱, 𝑖 = 0, … , 𝑘 −
1. Nếu tồn tại đƣờng đi có hƣớng từ 𝑠𝑖 đến 𝑠𝑗 , với 𝑠𝑖 , 𝑠𝑗 ∈ 𝒱 với mọi đối tƣợng khác
nhau, thì đồ thị có hƣớng đƣợc kết nối đầy đủ.
2
0
1
3
Hình 2.1 Đồ thị truyền thơng của 4 hệ phi tuyến
Ví dụ 2.1: Đồ thị kết nối truyền thơng giữa bốn đối tƣợng đƣợc trình bày trên H.
2.1 dùng để minh họa lý thuyết đồ thị và nhằm mục đích mơ phỏng sau này, trong đó
đối tƣợng mang số 0 là đối tƣợng dẫn đầu, ba đối tƣợng còn lại đƣợc đánh số thứ tự từ
1 đến 3. Cách trao đổi thông tin giữa các đối tƣợng đƣợc biểu diễn bằng các đƣờng
mũi tên. Chỉ có đối tƣợng 1 nhận đƣợc thông tin từ đối tƣợng 0, đối tƣợng 2 nhận
thông tin từ đối tƣợng 1 và trao đổi thông tin hai chiều đối tƣợng 3. Tƣơng tự đối
tƣợng 3 trao đổi hai chiều với cả đối tƣợng 1 và 2. Theo định nghĩa trên, đối tƣợng 1 là
lân cận của đối tƣợng 0, đối tƣợng 2 và 3 là các đối tƣợng lân cận của đối tƣợng 1. Đối
tƣợng 3 có hai lân cận là đối tƣợng 1, 2 trong khi đó đối tƣợng 2 chỉ có 1 lân cận là đối
tƣợng 3. Khi đó
s0 , s1 , s2 , s3 , s4 . Giả sử các đối tƣợng 𝑖 kết nối đối tƣợng 𝑗, trọng
số kết nối là 𝑎𝑖𝑗 = 1, ngƣợc lại 𝑎𝑖𝑗 = 0. Theo định nghĩa mơ tả trên, ta có các ma trận:
0
0
𝒜=
0
0
1
0
0
1
0
1
0
1
0
1
1
0
,ℋ=
1
0
0
0
Bổ đề 2.1[19]: Đồ thị
0
2
0
0
0
0
1
0
0
1
0
0
,ℒ=
0
0
2
0
−1
2
0
−1
0
−1
1
−1
0
−1
−1
2
( , , ) là cây bao phủ có hƣớng nếu và chỉ nếu
( , , ) tồn tại ít nhất một nút có đƣờng đi có hƣớng tất cả mọi nút cịn lại.
2.3 Động học nút
6
Xét 𝑁 nút đối tƣợng phi tuyến phân bố trong đồ thị phân tán, trong đó hệ thứ 𝑖
(1 ≤ 𝑖 ≤ 𝑁) có 𝑚(𝑚 ≥ 2) phƣơng trình:
𝑥𝑖 = 𝑓𝑖 𝑥𝑖 + 𝑔𝑖 𝑥𝑖 𝑥𝑖
+1
𝑥𝑖𝑚 = 𝑓𝑖𝑚 𝑥𝑖𝑚 + 𝑔𝑖𝑚 𝑥𝑖𝑚 𝑢𝑖𝑚
+ 𝑘𝑖 𝑥𝑖 𝑑𝑖 , 1 ≤ ≤ 𝑚 − 1
⋮
+ 𝑘𝑖𝑚 𝑥𝑖𝑚 𝑑𝑖𝑚
(2.3)
𝑇
𝑇 𝑇
trong đó ∀ = 1, … , 𝑚, 𝑥𝑖 = [𝑥𝑖1
, … , 𝑥𝑖
] ∈ ℝ𝑛 1 +⋯+𝑛 với 𝑥𝑖 ∈ ℝ𝑛 là véc tơ
trạng thái, 𝑢𝑖𝑚 ∈ ℝ𝑛 𝑚 +1 là véc tơ ngõ vào điều khiển, và 𝑑𝑖 ∈ ℝ𝑛 là véc tơ nhiễu sao
cho 𝑑𝑖 ∈ 𝐿2 [0, ∞), 𝑓𝑖 (𝑥𝑖 ) ∈ ℝ𝑛 , 𝑘𝑖 (𝑥𝑖 ) ∈ ℝ𝑛 ×𝑛 và 𝑔𝑖 (𝑥𝑖 ) ∈ ℝ𝑛 ×𝑛 +1 lần
lƣợt là các véc tơ và ma trận phi tuyến liên tục. Giả sử rằng tồn bộ trạng thái có sẵn
để hồi tiếp và 𝑓𝑖 (𝑥𝑖 ) là thành phần động học nội không biết trong hệ thống.
Giả thiết 2.1: Với mọi 1 ≤ 𝑖 ≤ 𝑁, 1 ≤ ≤ 𝑚, 𝑔𝑖 (𝑥𝑖 ) bị chặn với 𝑔𝑖𝑚𝑖𝑛 ≤
𝑔𝑖 (𝑥𝑖 ) ≤ 𝑔𝑖𝑚𝑎𝑥 , trong đó 𝑔𝑖𝑚𝑖𝑛 và 𝑔𝑖𝑚𝑎𝑥 là các hằng số dƣơng.
Giả thiết 2.2: Với mọi 1 ≤ 𝑖 ≤ 𝑁, 1 ≤ ≤ 𝑚, 𝑘𝑖 (𝑥𝑖 ) bị chặn với 𝑘𝑖𝑚𝑖𝑛 ≤
𝑘𝑖 (𝑥𝑖 ) ≤ 𝑘𝑖𝑚𝑎𝑥 , trong đó 𝑘𝑖𝑚𝑖𝑛 và 𝑘𝑖𝑚𝑎𝑥 là các hằng số dƣơng.
Giả thiết 2.3: Hệ (2.3) của nút đối tƣợng 𝑖 điều khiển đƣợc với điểm cân bằng
𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑚 = 0.
Giả thiết 2.4: Nút dẫn đầu phát sinh ra véc tơ quỹ đạo khả vi liên tục bị chặn 𝑥0 ,
𝑇
𝑇
𝑇 𝑇
với 𝑥0 = [𝑥01
, 𝑥02
, … , 𝑥0𝑚
] nhận đƣợc từ hệ thống (2.3) khi bỏ qua nhiễu:
𝑥0 = 𝑓0 𝑥0 + 𝑔0 𝑥0 𝑥0 +1 , 1 ≤ ≤ 𝑚 − 1
⋮
𝑥0𝑚 = 𝑓0𝑚 𝑥0𝑚 + 𝑔0𝑚 𝑥0𝑚 𝑢0𝑚
(2.4)
𝑇 𝑇
𝑇
trong đó 𝑥0 = [𝑥01
, … , 𝑥0
] , ∀ = 1, … , 𝑚.
Giả thiết 2.5: Thông tin về trạng thái của đối tượng 𝑖, 1 ≤ 𝑖 ≤ 𝑁 và đối tượng
dẫn đầu chỉ cho phép các đối tượng lân cận có liên kết được truy xuất.
Giả thiết 2.6: Đối tượng 𝑖, 1 ≤ 𝑖 ≤ 𝑁 khơng truy xuất được tín hiệu điều khiển
từ các đối tượng lân cận.
Giả thiết 2.6 là phù hợp với thực tế, bởi vì trong nhiều ứng dụng, đo lƣờng ngõ
vào điều khiển trong thời gian thực là khó khăn. Sau đây, một số thủ tục đƣợc thực
7
hiện để chuyển đổi động học phi tuyến của nút đối tƣợng riêng lẻ (2.3) thành sai số
động học bám hợp tác, từ đó, kỹ thuật RAODP có thể mở rộng để thiết kế các luật điều
khiển hợp tác sau này.
2.4 Mơ hình hợp tác nhiều hệ phi tuyến
𝑇
𝑇 𝑇
Gọi 𝑒𝑖 = [𝑒𝑖1
, … , 𝑒𝑖𝑚
] ∈ ℝ𝑛 1 +⋯+𝑛 𝑚 , với mọi 1 ≤ 𝑖 ≤ 𝑁 là véc tơ sai số bám giữa nút
đối tƣợng 𝑖 và các nút lân cận 𝑗 của nó, trong đó 𝑒𝑖 ∈ ℝ𝑛 đƣợc viết bởi phƣơng trình
thứ của động học nút (2.3):
𝑒𝑖 =
𝑎𝑖𝑗 𝑥𝑖 − 𝑥𝑗 + 𝑧𝑖 𝑥𝑖 − 𝑥0
(2.5)
𝑗 ∈ℕ𝑖
Nếu nút đối tƣợng 𝑖 mong muốn giữ đội hình với nút đối tƣợng 𝑗, ∀𝑗 ∈ ℕ𝑖 thì (2.5) có
thể viết thành:
𝑒𝑖 =
𝑎𝑖𝑗 𝑥𝑖 − 𝑥𝑗 + ∆𝑖𝑗 + 𝑧𝑖 𝑥𝑖 − 𝑥0
(2.6)
𝑗 ∈ℕ𝑖
trong đó 𝑥𝑖 , 𝑥𝑗 và 𝑥0 , lần lƣợt là các véc tơ trạng thái của nút đối tƣợng 𝑖, 𝑗 và nút
dẫn đầu. ∆𝑖𝑗 ∈ ℝℕ𝑖 là khoảng cách mong muốn giữa nút đối tƣợng 𝑖 và 𝑗. Với mọi
= 1, … , 𝑚, lấy đạo hàm (2.5) hoặc (2.6) và kết hợp với phƣơng trình thứ của động
học nút (2.3) ta có động học sai số bám giữa nút 𝑖 và các nút 𝑗 lân cận nó:
𝑒𝑖 = −𝑧𝑖 𝑥0 + 𝑖 + 𝑧𝑖 𝑓𝑖 𝑥𝑖 + 𝑔𝑖 𝑥𝑖 𝑥𝑖
−
𝑎𝑖𝑗 𝑓𝑗 𝑥𝑗 + 𝑔𝑗 𝑥𝑗 𝑥𝑗
+1
+1
+ 𝑘𝑖 𝑥𝑖 𝑑𝑖
(2.7)
+ 𝑘𝑗 𝑥𝑗 𝑑𝑗
𝑗 ∈ℕ𝑖
Sử dụng động học nút dẫn đầu (2.4) cho (2.7) ta có:
𝑒𝑖 = 𝑓𝑖𝑒 𝑡 + 𝑖 + 𝑧𝑖 𝑔𝑖 𝑥𝑖 𝑥𝑖
−
𝑎𝑖𝑗 𝑔𝑗 𝑥𝑗 𝑥𝑗
+1
+ 𝑘𝑖 𝑥𝑖 𝑑𝑖
+1
+ 𝑘𝑗 𝑥𝑗 𝑑𝑗 − 𝑧𝑖 𝑔0 𝑥0 𝑥0
(2.8)
+1
𝑗 ∈ℕ𝑖
trong đó 𝑓𝑖𝑒 𝑡 =
𝑗 ∈ℕ𝑖
𝑎𝑖𝑗 𝑓𝑖 𝑥𝑖 − 𝑓𝑗 𝑥𝑗
+ 𝑧𝑖 𝑓𝑖 𝑥𝑖 − 𝑓0 𝑥0 . Từ (2.8),
véc tơ sai số bám hợp tác cho toàn bộ nút đối tƣợng, đặc trƣng bởi chỉ số “*” với
= 1, … , 𝑚 − 1, sẽ là:
𝑒
𝑒∗ = 𝐹∗
+ ℒ + 𝑍 ⊗ 𝐼𝑛 𝐺∗ 𝑥∗ 𝑥∗ +1 + 𝐾∗ 𝑥∗ 𝑑∗ − 𝑍
⊗ 𝐼𝑛 𝐺∗0 𝑥∗0 𝑥∗0
8
+1
(2.9)
trong đó ℒ là ma trận Laplace của đồ thị con 𝒢 (𝒱 , ℰ , 𝒜 ), với thông tin kết nối giữa đối
tƣợng dẫn đầu và lân cận nó bị bỏ qua, ℒ = ℋ − 𝒜 , trong đó ℋ ∈ ℝ𝑁×𝑁 và 𝒜 ∈
ℝ𝑁×𝑁 là các ma trận con, đƣợc hình thành từ việc loại bỏ các phần tử có liên quan đến
𝑇
𝑇 𝑇
𝑒
𝑒𝑇
𝑒𝑇 𝑇
nút dẫn đầu 𝑒∗ = [𝑒1
, … , 𝑒𝑁
] ∈ ℝ𝑁𝑛 , 𝐹∗
= [𝑓1
, … , 𝑓𝑁
] ∈ ℝ𝑁𝑛 , 𝑥∗ =
𝑇
𝑇
𝑇
𝑇 𝑇
[𝑥1
, … , 𝑥𝑁
] ∈ ℝ𝑁(𝑛 1 +⋯+𝑛 ), 𝑥∗(+1) = [𝑥1(+1)
, … , 𝑥𝑁(+1)
]𝑇 ∈ ℝ𝑁𝑛 +1 , 𝐺∗ = diag
𝑔1 , … , 𝑔𝑁 ∈ ℝ𝑁𝑛 ×𝑁𝑛 +1 , 𝐺∗0 = diag 𝑔0
𝐼𝑛 𝑥0(+1) ∈ ℝ𝑁𝑛 +1 ,
𝑁
∈ ℝ𝑁𝑛 ×𝑁𝑛 +1 , 𝑥∗0(+1) = 1𝑁 ⊗
𝑥∗0 = 1𝑁 ⊗ 𝐼𝑛 𝑥0 ∈ ℝ𝑁𝑛 ,
𝑇
𝑇 𝑇
𝑑∗ = [𝑑1
, … , 𝑑𝑁
] ∈ ℝ𝑁𝑛 ,
𝐾∗ = diag 𝑘1 , … , 𝑘𝑁 ∈ ℝ𝑁𝑛 ×𝑁𝑛 .
Tƣơng tự nhƣ vậy, sai số bám hợp tác cho tất cả các nút với = 𝑚 đƣợc viết
thành:
𝑒
𝑒∗𝑚 = 𝐹∗𝑚
+ ℒ + 𝑍 ⊗ 𝐼𝑛 𝑚 𝐺∗𝑚 𝑥∗𝑚 𝑢∗𝑚 + 𝐾∗𝑚 𝑥∗𝑚 𝑑∗𝑚 − 𝑍
⊗ 𝐼𝑛 𝑚 𝐺∗0𝑚 𝑥∗0𝑚 𝑢∗0𝑚
(2.10)
𝑒𝑇
𝑒𝑇 𝑇
𝑇
𝑇
𝑒
trong đó 𝑒∗𝑚 = [𝑒1𝑚
, … , 𝑒𝑁𝑚
]𝑇 ∈ ℝ𝑁𝑛 𝑚 , 𝐹∗𝑚
= [𝑓1𝑚
, … , 𝑓𝑁𝑚
] ∈ ℝ𝑁𝑛 𝑚 , 𝑢∗𝑚 =
𝑇
𝑇
𝑇
𝑇
𝑇
𝑇
[𝑢1𝑚
, … , 𝑢𝑁𝑚
]𝑇 ∈ ℝ𝑁𝑛 𝑚 +1 , 𝑑∗𝑚 = [𝑑1𝑚
, … , 𝑑𝑁𝑚
]𝑇 ∈ ℝ𝑁𝑛 𝑚 , 𝑥∗𝑚 = [𝑥1𝑚
, … , 𝑥𝑁𝑚
]𝑇 ∈
ℝ𝑁(𝑛 1 +⋯+𝑛 𝑚 ) , 𝐺∗𝑚 = diag
𝑔1𝑚 , … , 𝑔𝑁𝑚 ∈ ℝ𝑁𝑛 𝑚 ×𝑁𝑛 𝑚 +1 , 𝐺∗0𝑚 = diag 𝑔0𝑚
𝑁
∈
ℝ𝑁𝑛 𝑚 ×𝑁𝑛 𝑚 +1 , 𝐾∗𝑚 = diag 𝑘1𝑚 , … , 𝑘𝑁𝑚 ∈ ℝ𝑁𝑛 𝑚 ×𝑁𝑛 𝑚 ,𝑥∗0𝑚 = 1𝑁 ⊗ 𝐼𝑛 𝑚 𝑥0𝑚 ∈ ℝ𝑁𝑛 𝑚
Để thiết kế luật điều khiển hợp tác tối ƣu cho toàn hệ thống, ta tiến hành 𝑙 bƣớc
(1 ≤ 𝑙 ≤ 𝑚) dựa vào các phƣơng trình (2.9) và (2.10).
Khi 𝑙 = 1, động học bám (2.9) đƣợc viết thành:
𝑒
𝑒∗1 = 𝐹∗1
+ ℒ+𝑍
⊗ 𝐼𝑛 1 𝐺∗1 𝑥∗1 𝑥∗02 + 𝐺∗1 𝑥∗1 𝑥∗2 − 𝑥∗02 + 𝐾∗1 𝑥∗1 𝑑∗1 − 𝑍
⊗ 𝐼𝑛 1 𝐺∗01 𝑥∗01 𝑥∗02
(2.11)
𝑒
∗
= 𝐹∗1
+ ℒ + 𝑍 ⊗ 𝐼𝑛 1 𝐺∗1 𝑥∗1 𝑒∗2 + 𝐺∗1 𝑥∗1 𝑥∗2
+ 𝐾∗1 𝑥∗1 𝑑∗1
∗
∗𝑇
∗𝑇 𝑇
trong đó 𝑥∗2
= [𝑥12
, … , 𝑥𝑁2
] là ngõ vào điều khiển ảo sẽ đƣợc thiết kế sau sao cho
𝑑𝑎
𝑑𝑎
∗
𝑥∗2
= 𝑥∗02 + 𝑥∗2
với 𝑥∗2
là nghiệm của phƣơng trình:
𝑑𝑎
𝑍 ⊗ 𝐼𝑛 1 𝐺∗01 𝑥∗01 𝑥∗02 + ℒ + 𝑍 ⊗ 𝐼𝑛 1 𝐺∗1 𝑥∗1 𝑥∗2
=0
Khi 2 ≤ 𝑙 ≤ 𝑚 − 1, động học (2.9) đƣợc viết thành:
9
𝑒∗𝑙 = 𝐹∗𝑙𝑒 + ℒ + 𝑍
⊗ 𝐼𝑛 𝑙 𝐺∗𝑙 𝑥∗𝑙 𝑥∗0
𝑙+1
+ 𝐺∗𝑙 𝑥∗𝑙 𝑥∗ 𝑙+1 − 𝑥∗0
+ 𝐾∗𝑙 𝑥∗𝑙 𝑑∗𝑙 − 𝑍 ⊗ 𝐼𝑛 𝑙 𝐺∗0𝑙 𝑥∗0𝑙 𝑥∗0
𝑙+1
(2.12)
𝑙+1
= 𝐹∗𝑙𝑒 + ℒ + 𝑍 ⊗ 𝐼𝑛 𝑙 𝐺∗𝑙 𝑥∗𝑙 𝑒∗ 𝑙+1 − 𝐺∗𝑇 𝑙−1 𝑥∗ 𝑙−1 𝑒∗ 𝑙−1
∗
+𝐺∗𝑙 𝑥∗𝑙 𝑥∗(𝑙+1)
+ 𝐾∗𝑙 𝑥∗𝑙 𝑑∗𝑙
∗
∗𝑇
∗𝑇
trong đó 𝑥∗(𝑙+1)
= [𝑥1(𝑙+1)
, … , 𝑥𝑁(𝑙+1)
]𝑇 là véc tơ ngõ vào điều khiển ảo sẽ đƣợc thiết
𝑑𝑎
𝑑𝑎
∗
kế sau sao cho 𝑥∗(𝑙+1)
= 𝑥∗0(𝑙+1) + 𝑥∗(𝑙+1)
với 𝑥∗(𝑙+1)
là nghiệm của phƣơng trình:
𝑑𝑎
𝑇
𝑍 ⊗ 𝐼𝑛 𝑙 𝐺∗0𝑙 𝑥∗0𝑙 𝑥∗0(𝑙+1) + ℒ + 𝑍 ⊗ 𝐼𝑛 𝑙 𝐺∗𝑙 𝑥∗𝑙 𝑥∗(𝑙+1)
+ 𝐺∗(𝑙−1)
𝑥∗(𝑙−1) 𝑒∗(𝑙−1)
=0
Cuối cùng, 𝑙 = 𝑚, động học hợp tác (2.10) có thể viết thành:
𝑒
𝑒∗𝑚 = 𝐹∗𝑚
+ ℒ + 𝑍 ⊗ 𝐼𝑛 𝑚 𝐺∗𝑚 𝑥∗𝑚 𝑢∗𝑚 + 𝐾∗𝑚 𝑥∗𝑚 𝑑∗𝑚 − 𝑍
⊗ 𝐼𝑛 𝑚 𝐺∗0𝑚 𝑥∗0𝑚 𝑢∗0𝑚
𝑒
= 𝐹∗𝑚
+ ℒ+𝑍
(2.13)
𝑇
∗
⊗ 𝐼𝑛 𝑚 𝐺∗𝑚 𝑥∗𝑚 𝑢∗𝑚
− 𝐺∗(𝑚
−1) 𝑥∗(𝑚 −1) 𝑒∗(𝑚 −1)
+ 𝐾∗𝑚 𝑥∗𝑚 𝑑∗𝑚
∗𝑇
∗𝑇 𝑇
∗
trong đó 𝑢∗𝑚
= [𝑢1𝑚
, … , 𝑢𝑁𝑚
] ∈ ℝ𝑁𝑛 𝑚 +1 là véc tơ ngõ vào điều khiển tối ƣu hợp tác
∗
𝑎
𝑎
sẽ thiết kế sau sao cho 𝑢∗𝑚
= 𝑢∗𝑚 + 𝑢∗𝑚
, trong đó 𝑢∗𝑚
là nghiệm của phƣơng trình:
𝑍 ⊗ 𝐼𝑛 𝑚 𝐺∗0𝑚 𝑥∗0𝑚 𝑢∗0𝑚 + ℒ + 𝑍
𝑇
𝑎
⊗ 𝐼𝑛 𝑚 𝐺∗𝑚 𝑥∗𝑚 𝑢∗𝑚
+ 𝐺∗(𝑚
−1) 𝑥∗(𝑚 −1) 𝑒∗(𝑚 −1) = 0
Gọi các tham số động học của toàn hệ thống là 𝐸 = 𝑒1𝑇 , … , 𝑒𝑁𝑇
𝑇
𝑇 𝑇
[𝑒𝑖1
, … , 𝑒𝑖𝑚
] ,𝑋 = 𝑥𝑇1 , … , 𝑥𝑇𝑁
∗𝑇
𝑢∗𝑇
1 , … , 𝑢𝑁
𝑇
𝑇
𝑇
𝐹𝑒1
, … , 𝐹𝑒𝑁
𝑇
𝑇
𝑇
(2.14)
∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁 , 𝑒𝑖 =
𝑇
𝑇 𝑇
∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁 ,𝑥𝑖 = [𝑥𝑖1
, … , 𝑥𝑖𝑚
] , 𝑈∗ =
∗𝑇 ∗𝑇
∗𝑇 𝑇
∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 +1 )𝑁 , 𝑢𝑖∗ = [𝑥𝑖2
, 𝑥𝑖3 , … , 𝑢𝑖𝑚
] ∈ ℝ𝑛 2 +⋯+𝑛 𝑚 +1 , 𝐹𝑒 (𝑡) =
∈
ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁 ,
𝑒𝑇
𝐹𝑒𝑖 (𝑡) = 𝐹𝑒𝑇
𝑖1 , … , 𝐹𝑖𝑚
𝑇
∈ ℝ𝑛 1 +⋯+𝑛 𝑚 , 𝐺𝑖 (𝑥𝑖 ) =
diag 𝐺𝑖1 , … , 𝐺𝑖𝑚 , 𝐺 𝑋 =
𝑇
𝑇 𝑇
diag 𝐺1 , … , 𝐺𝑁 ∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁×(𝑛 2 +⋯+𝑛 𝑚 +1 )𝑁 , 𝑑𝑖 = [𝑑𝑖1
, … , 𝑑𝑖𝑚
] , 𝐷 = 𝑑𝑇1 , … , 𝑑𝑇𝑁
∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁 ,
𝑇
𝐾(𝑋) = diag 𝐾1 , … , 𝐾𝑁 ∈ ℝ(𝑛 1 +⋯+𝑛 𝑚 )𝑁×(𝑛 1 +⋯+𝑛 𝑚 )𝑁 , 𝐾𝑖 (𝑥𝑖 ) = diag
𝐾𝑖1 , … , 𝐾𝑖𝑚 .
Bổ đề 2.2: Xét động học bám hợp tác cho nhiều đối tượng phi tuyến trong đồ thị
10
truyền thông phân tán
𝐸 = 𝐹𝑒 (𝑡) + ℒ + 𝑍 ⊗ 𝐼𝑛 1 +⋯+𝑛 𝑚 𝐺 𝑋 𝑈 ∗ + 𝐾 𝑋 𝐷
(2.15)
Nếu thiết kế được luật điều khiển 𝑈 ∗ ổn định cho hệ kín (2.15), thì luật điều khiển 𝑢𝑖∗
dẫn ra từ 𝑈 ∗ với mọi 𝑖 = 1, . . . , 𝑁 sẽ ổn định mọi hệ kín thứ 𝑖 (2.3).
Chứng minh: Chọn hàm Lyapunov 𝐿 = 𝐸 𝑇 𝐸. Đạo hàm 𝐿 sử dụng (2.11), (2.12) và
(2.13)
𝑚 −1
𝑚 −1
𝑒∗𝑙𝑇 𝐹∗𝑙𝑒
𝐿=
∗
𝑒∗𝑙𝑇 𝐺∗𝑙 𝑥∗𝑙 𝑥∗(𝑙+1)
+ 𝐾∗𝑙 𝑥∗𝑙 𝑑∗𝑙
+ ℒ + 𝑍 ⊗ 𝐼𝑛 1 +⋯+𝑛 𝑚 −1
𝑙=1
𝑙=1
𝑒
𝑇
∗
+ 𝐹∗𝑚
+ ℒ + 𝑍 ⊗ 𝐼𝑛 𝑚 𝑒𝑚
𝐺∗𝑚 𝑥∗𝑚 𝑢∗𝑚
+ 𝐾∗𝑚 𝑥∗𝑚 𝑑∗𝑚
𝑁
(2.16)
𝑒𝑖𝑇 𝐹𝑒𝑖 + ℒ + 𝑍 ⊗ 𝐼𝑛 1 +⋯+𝑛 𝑚 𝐺𝑖 𝑥𝑖 𝑢𝑖∗ + 𝐾𝑖 𝑥𝑖 𝑑𝑖
=
𝑖=1
= 𝐸 𝑇 𝐹𝑒 + ℒ + 𝑍 ⊗ 𝐼𝑛 1 +⋯+𝑛 𝑚 𝐺 𝑋 𝑈 ∗ + 𝐾 𝑋 𝐷
Quan sát (2.16) và (2.15), ta nhận thấy rằng cả hai đều sử dụng chung hàm
Lyapunov. Vậy, nếu hệ kín (2.15) ổn định thì hệ kín của tồn bộ động học nút (2.3)
cũng ổn định.
Ta có điều phải chứng minh.
Chú ý 2.1: 𝐺 𝑋 và 𝐾 𝑋 là các ma trận liên tục theo giả thiết 2.1 và 2.2, và 𝐹𝑒 𝑡
là véc tơ động học nội không biết trƣớc của toàn hệ thống.
11
CHƢƠNG 3
PHÂN TÍCH VÀ THIẾT KẾ THUẬT TỐN ĐIỀU
KHIỂN THƠNG MINH
3.1 Mục tiêu điều khiển
Mục tiêu của bài toán điều khiển trong báo cáo này đƣợc phát biểu rằng tìm luật
điều khiển hợp tác sao cho hệ kín (2.15) ổn định tiệm cận, thỏa mãn với mọi 𝑖 =
1, … 𝑁:
∞
∞
𝑄𝑖 𝑒𝑖 +
𝑢𝑖𝑇 𝑅𝑖 𝑢𝑖
𝜌𝑖2 𝑑
𝑑𝜏 ≤
0
2
𝑖 𝑑𝜏
(3.1)
0
trong đó 𝑄𝑖 𝑒𝑖 là hàm phi tuyến xác định dƣơng sao cho 𝑄𝑖 0 = 0 , 𝑅𝑖 là ma trận đối
xứng xác định dƣơng có chiều phù hợp, 𝜌𝑖 ≥ 𝜌𝑖∗ > 0 là mức giảm ảnh hƣởng nhiễu
cho trƣớc với 𝜌𝑖∗ là giá trị nhỏ nhất của 𝜌𝑖 để (2.15) còn ổn định [25].
Hàm chỉ tiêu chất lƣợng của đối tƣợng 𝑖 đƣợc định nghĩa:
∞
𝐽𝑖 𝑒𝑖 0 , 𝑢𝑖 , 𝑑𝑖 =
𝑟𝑖 𝑒𝑖 𝜏 , 𝑢𝑖 𝜏 , 𝑑𝑖 𝜏 𝑑𝜏
(3.2)
0
trong đó
𝑟𝑖 𝑒𝑖 , 𝑢𝑖 , 𝑑𝑖 = 𝑄𝑖 𝑒𝑖 + 𝑢𝑖𝑇 𝑅𝑖 𝑢𝑖 − 𝜌𝑖2 𝑑𝑖𝑇 𝑑𝑖
(3.3)
Hàm chi phí tối ƣu theo đƣợc định nghĩa:
𝑉𝑖 𝑒𝑖 (0), 𝑢𝑖∗ , 𝑑𝑖∗ = 𝑚𝑖𝑛 𝑚𝑎𝑥 𝐽𝑖 𝑒𝑖 (0), 𝑢𝑖 , 𝑑𝑖
𝑢𝑖
𝑑𝑖
(3.4)
trong đó 𝑢𝑖∗ là luật điều khiển nhằm cực tiểu 𝐽𝑖 𝑒𝑖 (0), 𝑢𝑖 , 𝑑𝑖 trong khi 𝑑𝑖∗ là luật nhiễu
xấu nhất nhằm cực đại 𝐽𝑖 𝑒𝑖 (0), 𝑢𝑖 , 𝑑𝑖 . Trong lý thuyết trò chơi ZDGT (Zero-sum
Differential Game Theory) [1], [3], [11], [21], [23], [26] phƣơng trình (3.4) mang ý
nghĩa: Luật chơi của ngƣời thứ nhất (luật điều khiển 𝑢𝑖∗ ) nhằm giảm thiểu chi phí của
mình trong khi luật chơi của ngƣời thứ hai (luật nhiễu xấu nhất 𝑑𝑖∗ ) nhằm tăng tối đa
chi phí của đối thủ 𝑢𝑖∗ . Lời giải của lý thuyết trò chơi này cũng chính là nghiệm của
phƣơng trình (3.4), đó là điểm yên ngựa (Saddle) (𝑢𝑖∗ , 𝑑𝑖∗ ) [21], [23] sao cho:
𝑉𝑖 𝑒𝑖 (0), 𝑢𝑖∗ , 𝑑𝑖 ≤ 𝑉𝑖 𝑒𝑖 (0), 𝑢𝑖∗ , 𝑑𝑖∗ ≤ 𝑉𝑖 𝑒𝑖 (0), 𝑢𝑖 , 𝑑𝑖∗
3.2 Cấu trúc điều khiển
12
(3.5)