Nâng cao chất lượng điều khiển dựa trên mô hình bằng phương pháp học lặp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.65 MB, 24 trang )

MỞ ĐẦU
1. Lý do chọn đề tài
Hệ điều khiển truyền thống thì sau một khoảng thời gian làm việc đủ
lâu, đối tượng sẽ sinh ra hiện tượng mệt mỏi về cơ cấu vật lý, dẫn đến
chất lượng điều khiển không còn được đảm bảo như thủa ban đầu.
Giải pháp đơn giản để hỗ trợ cho hệ truyền thống mà ở đó xuất hiện
những lỗi tương tự như trên, là phương pháp điều khiển học lặp. Với
điều khiển học lặp, người ta không cần phải chỉnh định lại bộ điều
khiển truyền thống, không cần can thiệp sâu vào hệ thống đã có. Tuy
nhiên, điều khiển học lặp khơng phải áp dụng được thành công cho
mọi lớp hệ, nhất là những hệ mất ổn định. Vì vậy việc nghiên cứu,
tìm ra giải pháp thông minh để can thiệp sơ bộ trước vào hệ, tạo khả
năng áp dụng được điều khiển học lặp cho nó, cũng như xác định
được luật chỉnh định áp dụng được cho nhiều lớp hệ, là mang tính
cấp thiết.
2. Mục tiêu nghiên cứu của luận án
Luận án thực hiện nghiên cứu, đề xuất nguyên tắc hiệu chỉnh hợp lý
tín hiệu điều khiển từ kinh nghiệm quá khứ cho bộ điều khiển học
lặp. Sẽ là tốt nhất nếu việc hiệu chỉnh lại tín hiệu điều khiển này
khơng phụ thuộc vào mơ hình tốn của q trình.
Nếu xem sai lệch mơ hình tốn của q trình và sai lệch của cơ cấu
chấp hành như nhiễu tổng thì luận án cần phải ước lượng thông minh
được thành phần nhiễu tổng này. Điều này, thông qua việc điều khiển
bù nhiễu tổng, sẽ mở rộng được phạm vi ứng dụng của phương pháp
điều khiển kết hợp giữa ILC và phương pháp truyền thống.
Luận án thiết kế thuật toán điều khiển dựa trên hai mục tiêu trước để
điều khiển hai đối tượng làm việc theo mẻ trong cơng nghiệp là
robots và hệ phản ứng hóa học khuấy trộn liên tục.
3. Đối tượng và phạm vi nghiên cứu của luận án
Đối tượng nghiên cứu của luận án: Robots cơng nghiệp và lị phản
ứng hóa học liên tục (CSTR).

Phạm vi nghiên cứu của luận án: xác định tham số cho hàm học tuyến
tính, đảm bảo tính hội tụ cho quá trình học. Ứng dụng điều khiển học lặp
cho robot cơng nghiệp và lị phản ứng hóa học liên tục.
4. Ý nghĩa khoa học và thực tiễn của luận án
Ý nghĩa khoa học:

1

Thứ nhất là xác định điều kiện hội tụ cho cho các q trình học tuyến
tính. Thứ hai là xây dựng phương pháp nhận dạng nhiễu. Thứ ba là
đề xuất phương pháp điều khiển học lặp cho nhiều nhiều lớp đối
tượng khác nhau.
Ý nghĩa thực tiễn:
Các kết quả nghiên cứu đã được kiểm chứng thông qua thực nghiệm
mô phỏng với những đối tượng công nghiệp, chứng tỏ khả năng ứng
dụng thực tiễn, giúp cho việc ứng dụng của phương pháp điều khiển
học lặp là có triển vọng.
5. Phương pháp nghiên cứu
Kết hợp nghiên cứu lý thuyết và kiểm chứng bằng thực nghiệm

Nghiên cứu lý thuyết xác định điều kiện hội tụ cho cho các
q trình học tuyến tính, từ đó chọn được tham số học tối ưu cho
hàm học của điều khiển học lặp;

Xây dựng phương pháp nhận dạng nhiễu nói riêng và các
thành phần bất định hàm nói chung có trong đối tượng điều khiển
mà khơng cần sử dụng đến mơ hình tốn của đối tượng điều khiển,
phục vụ điều khiển bù sai lệch mơ hình;


Kiểm chứng kết quả lý thuyết bằng thực nghiệm mô phỏng
với những đối tượng cơng nghiệp có tính chất động học khác xa
nhau, bản chất vật lý cũng khác nhau.
6. Kết quả mới của luận án
Kết quả nghiên cứu mới của luận án có thể được tóm tắt tập trung
vào các điểm chính sau:
 Luận án đã đã xây dựng được các điều kiện xác định tham số hàm
học tuyến tính để q trình học là hội tụ.
 Luận án đã đề xuất được nguyên tắc ước lượng thông minh thành
phần nhiễu tổng.
 Luận án đã xây dựng được thuật toán điều khiển dựa trên những đề
xuất trên để điều khiển hai đối tượng làm việc theo mẻ (batch
processes) trong công nghiệp là robots và hệ CSTR
7. Cấu trúc của luận án
Luận án được trình bày trong 4 chương với nội dung tóm tắt như sau:

Chương 1 nêu tổng quan các kết quả đã có liên quan đến điều
khiển học lặp, đánh giá tính hội tụ của quá trình học.

2



Chương 2 trình bày một số kết quả bổ sung về việc xác định
tham số cho hàm học tuyến tính, đảm bảo tính hội tụ cho q trình
học.

Chương 3 trình bày một ứng dụng các kết quả lý thuyết nêu
lên ở chương 2 cho đối tượng robots công nghiệp và phân tích kết

quả đạt được.

Chương 4 trình bày ứng dụng kết quả lý thuyết của luận án, đã
được trình bày ở chương 2, cho đối tượng lị phản ứng hóa học
liên tục (CSTR).
Cuối cùng, phần Kết luận và kiến nghị tổng hợp các kết quả nghiên
cứu đã đạt được, những đóng góp mới và hướng mở rộng nghiên cứu
phát triển của luận án.
CHƯƠNG 1. TỔNG QUAN VỀ ĐIỀU KHIỂN HỌC LẶP VÀ TÍNH
HỘI TỤ CỦA Q TRÌNH HỌC
1.1. Điều khiển học lặp và lý do nên kết hợp với truyền thống
1.1.1. Về nguyên lý điều khiển học lặp
Điều khiển học lặp làm việc theo nguyên tắc là dựa vào tín hiệu điều
khiển u (t ) và sai lệch bám e (t )  r (t )  y (t ) trong q khứ để
chình định lại tín hiệu điều khiển ở chu kỳ làm việc hiện tại, gọi là
chu kỳ thứ k , mà khơng cần đến mơ hình tốn, sao cho sai lệch bám
ở chu kỳ k hiện tại nhỏ hơn ở các chu kỳ trước và tiến tới e  0
hoặc e (t )   sau một vài chu kỳ làm việc nào đó.
1.1.2. Về hàm Q-learning và hàm học
Kiểu hàm Q-learning f Q [ ] là kiểu hàm tuyến tính

f Q u j1 (i1 )    0 u j1 (i1  1)  1u j1 (i1 )   2 u j1 (i1  1)

(1.5)

Cấu trúc hàm học f [ ]
L

f L e j2 (i2 )   K1e j2 (i2  1)  K 2e j2 (i2 )  K 3e j2 (i2  1) (1.7)
1.1.3. Về khả năng hội tụ của luật chỉnh định

Để thuận tiện cho việc chọn được hàm học thỏa mãn điều kiện hội tụ

3

ek (i )  0, i  0,1,

,N 1

1.1.4. Về việc nên kết hợp với phương pháp điều khiển truyền
thống
Để tránh phải xác định lại tham số điều khiển cho các bộ điều khiển
truyền thống đã có sau một thời gian làm việc lâu dài của hệ, một giải
pháp đơn giản là áp dụng học lặp để bổ sung thêm cho bộ điều khiển
truyền thống đã có. Điều khiển học lặp khơng áp dụng trực tiếp được
các q trình khơng ổn định BIBO. Do đó, để áp dụng được học lặp
cho các hệ này, người ta thường phải làm cho nó ổn định BIBO trước
bằng bộ điều khiển truyền thống.
1.2 Tổng quan về tình hình nghiên cứu và các vấn đề cịn tồn tại
Các cơng trình liên quan tới ILC là rất nhiều và đa dạng, chủ yếu là
để cải thiện chất lượng điều khiển của các q trình cơng nghiệp, như
robot, hệ thống điều khiển bằng máy tính (CNC), chế biến hóa chất,
xử lý nước, chế biến thực phẩm, động cơ không đồng bộ, dây chuyền
sản xuất .
1.3 Một số bài toán đặt ra cho luận án
1.3.1 Nghiên cứu lý thuyết

Xác định mối quan hệ trực tiếp giữa các tham số ai ,b j của mơ
hình hàm truyền (1.21), (1.22) hoặc ma trận hàm truyền (nếu quá
trình là MIMO) với tham số hội tụ của hàm học.


Xây dựng phương pháp xác định tham số hội tụ cho hàm học
mà khơng cần sử dụng đến mơ hình tốn của đối tượng điều khiển.

Xây dựng phương pháp nhận dạng nhiễu nói riêng và các
thành phần bất định hàm tổng nói chung, mà khơng sử dụng đến mơ
hình tốn của đối tượng điều khiển.
1.3.2 Nghiên cứu thực nghiệm: Hai q trình cơng nghiệp được sử
dụng để kiểm chứng kết quả lý thuyết

Robots công nghiệp. Đây là đối tượng làm việc theo chu kỳ
thường gặp trong các nhà máy lắp ráp, chế biến, .

Hệ phản ứng khuấy trộn liên tục. Đây cũng là đối tượng điển
hình làm việc theo mẻ thường gặp trong các nhà máy hóa chất.
1.4 Tổng kết chương 1
Luận án đã định hướng được các bài toán cần giải quyết:
Về lý thuyết:

4


Xác định điều kiện hội tụ cho tham số hàm học tuyến tính từ
mơ hình trong miền phức của đối tượng điều khiển.

Xây dựng phương pháp xác định online tham số hàm học dựa
trên mơ hình trong miền thời gian theo tiêu chuẩn tối ưu.

Xây dựng phương pháp xác định online tham số hàm học

khơng sử dụng mơ hình của đối tượng.

Xây dựng phương pháp áp dụng trực tiếp điều khiển học lặp
cho cả những hệ (tuyến tính hoặc phi tuyến) không ổn định mà không
cần tới việc phải ổn định hóa nó trước theo tiêu chuẩn Lyapunov
bằng phương pháp điều khiển truyền thống.
Về thực nghiệm (mô phỏng):



Kiểm chứng kết quả lý thuyết với hệ robot công nghiệp.
Kiểm chứng kết quả lý thuyết trên hệ CSTR.

CHƯƠNG 2. NHỮNG ĐỀ XUẤT LÝ THUYẾT BỔ SUNG CHO
ĐIỀU KHIỂN HỌC LẶP
2.1 Xác định tham số hàm học dựa trên mơ hình trong miền phức
2.1.1 Điều kiện đủ cho hàm học kiểu P khi sử dụng hàm truyền
hệ thống (quá trình SISO)
Điều kiện đủ để quá trình học và chỉnh định (2.4) được hội tụ với mọi
tần số s là tham số K của hàm học được chọn thỏa mãn:

a0  Kb0

, a1  Kb1 ,  , an 1  Kbn 1 , 1  Kbn  

(2.5)
 a0 , a1 ,  , an 1 , 1
2.1.2 Điều kiện đủ cho hàm học kiểu P khi sử dụng ma trận hàm
truyền (quá trình MIMO)

 

Các phần tử của ma trận K  K ji các tham số hàm học sẽ được
xác định từ điều kiện tương đương với (2.5), tức là

5

a

(ij )
0



 K jib0(ij ) , a1(ij )  K jib1(ij ) ,  , an(ij1)  K jibn(ij1) , 1  K jibn(ij ) 





 a1(ij ) , a1(ij ) ,  , an(ij ) , 1

(2.11)
Nói cách khác, tiêu chuẩn đề xuất (2.5) này cho hệ SISO là áp dụng
được cho cả hệ MIMO (2.9) dưới dạng liên tục hoặc rời rạc, mà cũng
ˆ ˆ  0.
không cần phải thỏa mãn điều kiện CB
2.1.3 Kiểm chứng chất lượng hội tụ nhờ mơ phỏng

Hình 2.3: Kết quả mơ phỏng
Hình 2.2: Kết quả mô phỏng
sau
5 lần thử.
sau 2 lần thử.
2.2 Xác định online tham số hàm học theo tiêu chuẩn tối ưu bằng
cách cực tiểu hóa tổng bình phương sai lệch bám
Điều kiện đủ để hệ rời rạc tuyến tính hội tụ hội tụ là
I  CBK  1 (2.15)

và nó cần tới giả thiết CB  0
2.2.1 Chứng minh tính cần và đủ cho điều kiện (2.15)

 k 1   I  K   k   k (2.18)
Ta thấy được cần và đủ để có tính hội tụ

 k  0 cho quá trình học

và chỉnh định là
phải là ma trận Schur. Điều này tương đương với
(2.15) và đó chính là điều phải chứng minh.

6

2.2.2 Xác định online tham số hàm học tối ưu theo tổng bình
phương sai lệch bám ở đầu ra
Xác định tham sô hàm học tối ưu theo công thức:
T
Kk  arg min Tk  K   K   k  2Tk K  k  (2.24)



a K b 

2.2.3 Kiểm chứng chất lượng hội tụ của tham số hàm học tối ưu
online bằng mơ phỏng

Hình 2.5: Kết quả điều khiển
Hình 2.4: Kết quả điều khiển bám
bám sau 4 lần thử.
sau 2 lần thử.
2.3 Xác định online tham số hàm học khơng dựa vào mơ hình
(giải pháp thơng minh)
2.3.1 Nguyên tắc xác định online tham số hàm học
Hãy xác định tham số hàm học Kk cho lần thử thứ k  1 từ hai
vector sai lệch bám đo được trong tồn bộ hai lần thử ngay trước đó
là  k và  k 1 sao cho với Kk thu được này chắc chắn sẽ có được

vector các sai lệch bám  k 1 cho lần thử thứ k  1 khơng xấu hơn
hai lần thử trước đó.
2.3.1.1 Trường hợp hệ là SISO
Luận án đưa ra công thức xác định tham số hàm học kiểu P như sau:
Kk  k  arg min z  k  1  z   k 1 . (2.26)
0z 1

ý nghĩa thay đổi online tham số học một cách “thông minh” cho ở
công thức (2.26) là hoàn toàn tương đương với

7

Kk  k  arg min 1  z   k  z  k 1 . (2.29)
0z 1

2.3.1.2 Trường hợp hệ là MIMO
Với hệ MIMO ta cũng vẫn áp dụng được các công thức xác định
tham số hàm học đã giới thiệu ở trên cho hệ SISO
Kk( pq )  k( pq )  arg min z k(q )  1  z  k(q)1 (2.31)
0z 1

Và
Kk( pq )  k( pq )  arg min 1  z  k(q )  z k(q)1 (2.32)
0z 1

2.3.2 Khảo sát tính hội tụ

 k 1  I   ( vk )Kk   k  k  k với k  I   ( vk )Kk
(2.39)
Vậy tham số hàm học K k làm cho ma trận  k định nghĩa ở (2.39)
là ma trận Schur thì sẽ có  k  0 .
2.3.2 Kiểm chứng chất lượng hội tụ thông qua mô phỏng
Hệ

2
 2 0
0


 
x   2 4 0  x   1  u và y  1 , 0 , 1 x .

 0 0.5 2 
1


 

Hình 2.10: Kết quả điều khiển Hình 2.7: Kết quả điều khiển
bám sau 5 lần thử khi sử dụng
bám khi sử dụng (2.29).
(2.26).
2.4 Ổn định hóa và tuyến tính hóa khơng cần sử dụng mơ hình

8

2.4.1Ước lượng đạo hàm của vector hàm số từ các dữ liệu đo
được nhờ phép phân tích Taylor
Ta sẽ sử dụng cơng thức phân tích chuỗi Taylor để thực hiện bài toán
ước lượng trên
x (i )  x k (i  1)
(2.42)
x k (i )  k
Ts
2.4.2 Ứng dụng vào tuyến tính hóa ổn định hệ phi tuyến mà khơng
cần sử dụng mơ hình tốn
Áp dụng cơng thức xấp xỉ đạo hàm (2.42) có được nhờ phân tích
chuỗi Taylor.



dˆk (i )  BT B



1

 x (i )  x k (i  1)

BT  k
 Ax k (i )  Bu k (i ) 
Ts



 x (i )  x k (i  1)

 BT  k
 Ax k (i )  Bu k (i )  .
Ts



(2.51)

Công thức cuối cùng (2.51) sẽ được sử dụng để ước lượng dˆ(t )
dạng hằng số từng đoạn như sau
dˆ(t )  dˆk (i ) khi kT  iTs  t  kT  (i  1)Ts
trong đó i  0,1,

, N  1 với N  T Ts .

2.4.3 Ví dụ minh họa

Hình 2.11: Kết quả tuyến tính hóa phản hồi cho 2 trường hợp có sử
dụng và khơng sử dụng mơ hình tốn của đối tượng.

9

2.5 Tổng kết chương 2
Đề xuất điều kiện trong miền phức cho việc xác định tham số hội tụ
đối với hàm học kiểu P.
Đề xuất phương pháp xác định online tham số hội tụ cho hàm học
theo nguyên lý cực tiểu hóa tổng bình phương các sai lệch bám trong
chu trình làm việc trước đó.
Đề xuất phương pháp xác định online tham số hàm học trên cơ sở
cực tiểu hóa tồn bộ hai vector sai lệch bám có từ hai lần thử trước
đó.
Xây dựng được phương pháp phản hồi làm hệ ổn định BIBO (hoặc
UUB) mà không cần đến mô hình tốn của hệ (phương pháp ổn định
hóa thơng minh). Với phương pháp này ta có thể áp dụng được học
lặp cho những hệ khơng thích ứng trực tiếp với điều khiển học lặp.
CHƯƠNG 3. ỨNG DỤNG VÀO ĐIỀU KHIỂN CÁC HỆ ROBOT
CÔNG NGHIỆP
3.1 Tổng quan về các phương pháp điều khiển đã có
3.1.1 Phương pháp điều khiển rõ
Bộ điều khiển:
u  M (q ) r  A1e  A2e   C (q , q )  F  q  g (q ) (3.3)
3.1.2 Phương pháp điều khiển thích nghi sử dụng nghịch đảo mơ
hình

Bộ điều khiển động:
p  T BT Px  T BT P 
(3.6)

u  M (q , p )(r  A1e  A2e )  C (q ,q , p )q  g (q , p )
3.1.3 Phương pháp điều khiển thích nghi Li-Slotine
Bộ điều khiển của phương pháp Li-Slotine có cấu trúc như sau:
p  GT e   e 
(3.7)

u  M (q , p )v  C (q ,q , p )v  g (q , p )  A3 (v  q )
3.1.4 Phương pháp điều khiển trượt
Bộ điều khiển trượt:

10

u  M (q , ) BT r  Ke  Ex    sgn(S )  (3.9)


3.1.5 Bù bất định bằng mạng neural
Tín hiệu điều khiển:
u  M (q , ) BT r  Ke  Ex    sgn(S )  ˆ  (3.10)



3.1.6 Điều khiển học lặp
Tín hiệu điều khiển u (t ) trong khoảng thời gian T của một chu kỳ
làm việc kT  t  (k  1)T được cập nhật, chỉnh sửa theo một hàm
học:





u k ( )  u k i ( )  f ek i ( / ) với 0   / T (3.11)
3.1.7 Xác nhận qua mô phỏng khả năng không đảm bảo được chất
lượng của điều khiển truyền thống khi trong hệ xuất hiện lỗi
Kết quả mơ phỏng với robot planar:

a)Khi hệ khơng có lỗi
b)Khi hệ có lỗi
Hình 3.2: Điều khiển truyền thống bằng bộ điều khiển rõ
3.2 Đề xuất cấu trúc điều khiển hai mạch vịng khơng sử dụng mơ
hình tốn của robots (điều khiển thơng minh)
3.2.1 Nhiệm vụ của bộ điều khiển vịng trong
Nhiệm vụ đặt ra cho việc thiết kế bộ điều khiển vòng trong này là:
Phải làm cho kết quả ước lượng  bởi ˆ càng chính xác càng tốt.
Nếu kết quả ước lượng càng chính xác, thành phần bất định cịn lại là
 sẽ càng nhỏ.

11

3.2.2 Ước lượng đạo hàm của vector hàm số từ các dữ liệu đo được
Ta lại sử dụng phương pháp ước lượng nhờ phân tích Taylor đã trình
bày ở chương 2, mục 2.4.1:
T2
x k (i )  D1 x k (i )  D0 x k (i  1)  s x k ( ) (3.20)
2

3.3 Điều khiển robot công nghiệp nhờ học lặp với tham số hàm
học tối ưu online đã đề xuất
3.3.1 Điều khiển vòng trong bằng bộ điều khiển tuyến tính hóa
thơng minh nhờ phản hồi trạng thái
Bài tốn cài đặt cơng thức (3.20) để ước lượng đạo hàm của vector
hàm số từ các giá trị đo được của nó cho bài tốn điều khiển robots
cơng nghiệp
D1 x k (i )  D0 x k (i  1)  Ax k (i )  B v k (i )   (i )  ˆ (i  1)  (3.27)

ˆ (i )  BT D1 x k (i )  D0 x k (i  1)  Ax k (i )   vk (i )  ˆ (i  1) (3.29)




Định lý 3.1: Giá trị ước lượng ˆ (i ) theo công thức truy hồi (3.29) sẽ
làm cho sai lệch xấp xỉ (3.27) là nhỏ nhất.
3.3.2 Điều khiển vòng ngoài bằng bộ điều khiển học lặp
Bộ điều khiển học kiểu P với tham số K k được chỉnh định tối ưu
online theo từng lần thử k đã được trình bày ở chương 2, như sau:
v k 1 (i )  v k (i )  Kk ek (i )

với Kk  arg min

a K b

I  K   k

3.3.3 Thuật toán điều khiển
Algorithm 3.1: Điều khiển robot cơng nghiệp (3.1) bằng học lặp có sử

dụng tham số học online theo cực tiểu hóa tổng bình phương sai lệch bám.
1

Chọn hai ma trận A1 , A2 làm cho A định nghĩa ở (3.32) là Hurwitz.

12

Xác định A, B ,C theo (3.32) và  theo(3.37).
Chọn 0  Ts 1 . Tính N  T Ts .

2
3
4

Xác định D1  1 Ts và D0  D1 .
Tùy chọn ˆ . Gán v (i )  r (i ), i  0,1,  , N  1 và z  0 .
Chọn thích hợp hai ma trận giới hạn a , b .
while continue the control do
, N  1 do
for i  0,1,
Đưa u (i )  v (i )  A1q  A2 q  ˆ vào điều khiển robot trong khoảng
thời gian Ts .

5
6
7
8
9
10

Đo y (i )  q và x  vec(q , q ) . Xác định e (i )  r (i )  y (i ) .
Tính ˆ   , I  zD0  xD1  Ax   v (i )  ˆ ..


Gán z  x
end for
, v (N  1)  và
Lập các vector v  vec v (0),
e  vec e (0),
,e (N  1)  .
Tính K  arg min

a  b

I    e và

v  v  Ke .

11 end while
3.4 Điều khiển robot công nghiệp nhờ học lặp với tham số hàm
học online thông minh đã đề xuất
3.4.1 Thiết kế bộ điều khiển
3.4.1.1 Nội dung của hai mạch vòng điều khiển
Mạch vịng ngồi sử dụng bộ điều khiển học lặp kiểu P với ma trận
tham số hàm học dạng đường chéo

 

Kk  diag Kk( j ) , j  1, 2,  , n

Mạch vòng trong sử dụng phép phân tích chuỗi Taylor để ước lượng
ˆ tại thời điểm t  kT  iTs từ 2 giá trị đo được trước đó gồm

q k ( j ), q k ( j ) , với j  i , i  1 .

13

3.4.1.2 Thuật tốn điều khiển
Algorithm 3.2: Điều khiển robot cơng nghiệp (3.1) bằng học lặp có sử dụng
tham số học online thông minh.

1 Chọn hai ma trận A1 , A2 làm cho A ở (3.32) là Hurwitz. Tùy chọn
0  Ts

1 . Tính N  T Ts . Xác định D1  1 Ts và D0  D1 .
Tùy chọn giá trị ước lượng bất định ban đầu ˆ và sai lệch bám khởi phát e 0 .

2
3
4

Gán trạng thái ban đầu của robots và đầu ra khởi phát cho bộ điều khiển
vịng ngồi (bộ điều khiển học lặp) z  0 , v (i )  r (i ), i  0,1,  , N  1 .
while continue the control do
for i  0,1,
, N  1 do
Đưa u (i )  v (i )  A1q  A2q  ˆ vào điều khiển robot trong khoảng
thời gian Ts .

5

Đo y (i )  q và x  vec(q ,q ) . Xác định e (i )  r (i )  y (i ) .

6

Tính ˆ   , I  zD0  xD1  Ax   v (i )  ˆ . Gán z  x .

7
8
9





end for
Lập các vector v  vec v (0),

, v (N  1)  và

e  vec e (0),
,e (N  1)  .
Tính K từ e 0 và e theo (2.26) hoặc (2.29). Gán v  v  Ke và

e0  e .

10 end while
3.4.2 Kiểm chứng chất lượng bằng mô phỏng

Mô phỏng cho robot planar hai bậc tự do:

14

Hình 3.7: Đáp ứng vị trí của Hình 3.8: Đáp ứng vị trí của khớp
khớp thứ nhất khi sử dụng (2.26)
thứ hai khi sử dụng (2.26).

Hình 3.9: Sự thay đổi tham số Hình 3.10: Sự thay đổi tham số
hàm học thứ nhất khi sử dụng hàm học thứ hai khi sử dụng
(2.26).
(2.26).
3.5 Tổng kết chương 3
Ở chương này luận án đã thực hiện được những công việc sau:
 Đề xuất được cấu trúc điều khiển hai vòng lặp cho robot, trong đó
vịng trong là bộ ước lượng thành phần bất định hàm để bù đầu
vào của robot, và vịng ngồi là bộ điều khiển học lặp (hình 3.5).
 Đã xây dựng được bộ điều khiển vòng trong dựa trên phương
pháp phân tích chuỗi Taylor.
 Xây dựng được hai phương án cài đặt bộ điều khiển học lặp ở
vịng ngồi.
 Đã tiến hành cài đặt hai mạch vòng điều khiển đề xuất thành
thuật tốn điều khiển và mơ phỏng với robot planar nhằm đánh
giá chất lượng.

15

CHƯƠNG 4 ỨNG DỤNG VÀO ĐIỀU KHIỂN HỆ PHẢN ỨNG

HÓA HỌC KHUẤY TRỘN LIÊN TỤC
4.1 Sơ lược về bài toán điều khiển hệ CSTR và các phương pháp
điều khiển hiện có
Tìm một phương pháp nào đó càng ít liên quan tới mơ hình tốn của
hệ CSTR mà vẫn đảm bảo được chất lượng bám ở đầu ra và các yêu
cầu về tính bị chặn của tín hiệu, của trạng thái.
4.2 Đề xuất hai giải pháp điều khiển

Hình 4.2: Đề xuất giải pháp điều Hình 4.3: Đề xuất giải pháp
khiển thứ nhất.
điều khiển thứ hai.
4.3 Triển khai cấu trúc điều khiển theo đề xuất thứ nhất
4.3.1 Thiết kế bộ điều khiển vòng trong
Nhiệm vụ của bộ điều khiển vòng trong này là tạo ra được u f làm
hệ ổn định (không cần tiệm cận), tức là để các biến trạng thái x của
hệ là bị chặn và có xu hướng tiến về một lân cận của gốc tọa độ.
4.3.2 Thiết kế bộ ước lượng thành phần bất định hàm
Định lý 4.2: Giá trị ước lượng nhiễu kiểu truy hồi





1
dˆk (i )  D1 x k ,2 (i )  D0 x k ,2 (i  1)  f2 x k ,2 (i )   vk (i )  dˆk (i  1)


(0.8)

cho tín hiệu dˆ(t ) hằng số từng đoạn, sẽ cực tiểu hóa được sai lệch

chất lượng điều khiển sinh ra bởi nhiễu d (t ) .
4.3.3 Thiết kế bộ điều khiển học lặp
Bộ điều khiển học lặp được sử dụng ở đây có hàm học kiểu P

16

vk 1 (i )  vk (i )  Kek (i ) (4.13)

Định lý 4.3: Nếu tham số học K được chọn sao cho

Ak  I  Dk K (4.16)
là ma trận Schur với mọi k  0,1,

thì bộ điều khiển học lặp

(4.13), và cũng là (4.14), sẽ đảm bảo được tính hội tụ ek  0 ,
trong

đó





Dk  diag  / ( k (i )) , i  1,2,

,N 1

và

 k (i )  vk 1 (i ) , vk (i ) 
4.3.4 Thuật toán điều khiển
Algorithm 4.1: Điều khiển hệ CSTR có nhiễu đầu vào (4.4) nhờ học lặp và bù
nhiễu.
1

Chọn 0  Ts

1 đủ nhỏ. Tính N  T Ts . Xác định D1  1 Ts và

D0  D1 . Gán dˆ  0 và v = v (0), v (1),
v (i )  r (i ) . Chọn K .

2
3
4
5

, v (N  1) 

T

có

while continue the control do
T
Gán trạng thái đầu zx   z1 , z 2   (C A ,TA )T
, N  1 do
for i  0,1,

Đưa u  v (i )  dˆ    (x1  x 2 ) (x 2 )  vào điều khiển hệ trong
đúng một khoảng thời gian Ts . Sau đó đo trạng thái x  (x1, x 2 )T và
đầu ra y .

6
7
8
9

Gán dˆ  D1 x 2  D0 z 2  f2 (x 2 )    v (i )  dˆ .


Tính e (i )  r (i )  y . Gán z  x .
end for
T
Lập vector e  vec e (0),
,e (N  1)  . Gán v  v  Ke .

10 end while
4.3.5 Kiểm chứng chất lượng bằng mô phỏng
4.3.5.1 Khi đầu ra là nhiệt độ

17

Hình 4.5: Đáp ứng của kênh
Hình 4.4: Đáp ứng của kênh nhiệt độ sau 150 lần thử.
nhiệt độ sau 20 lần thử.

Hình 4.7: Kết quả ước lượng

Hình 4.6: Sự thay đổi tương ứng
nhiễu d cho điều khiển bù.
của kênh nồng độ sau 150 lần
thử.
4.3.5.2 Khi đầu ra là nồng độ

Hình 4.9: Đáp ứng của kênh
Hình 4.8: Đáp ứng của kênh nồng nồng độ sau 200 lần thử.
độ sau 30 lần thử.

18

Hình 4.11: Kết quả ước lượng
Hình 4.10: Sự thay đổi tương ứng nhiễu d cho điều khiển bù.
của kênh nhiệt độ sau 200 lần thử.
4.4 Triển khai cấu trúc điều khiển theo đề xuất thứ hai
4.4.1 Thiết kế bộ ước lượng thành phần bất định hàm
Định lý 4.5: Giá trị ước lượng nhiễu kiểu truy hồi





1
D x (i )  D0 xk ,2 (i  1)  h2 x k ,2 (i )   vk (i )  ˆk (i  1)

  1 k ,2
(0.11)

ˆk (i ) 

cho tín hiệu ˆk (i ) hằng số từng đoạn, sẽ cực tiểu hóa được sai lệch
chất lượng điều khiển sinh ra bởi nhiễu  (t ) có trong mơ hình(4.22).
4.4.2 Thiết kế bộ điều khiển học lặp
Định lý 4.6: Nếu tham số học K được chọn sao cho

Ak  I  Dk K
là ma trận Schur với mọi k  0,1,
thì bộ điều khiển học lặp (0.9)
, sẽ đảm bảo được tính hội tụ về 0 của sai lệch bám, trong đó





Dk  diag  / ( k (i )) , i  1,2,

,N 1

Và  k (i )  vk 1 (i ) , vk (i ) 
4.4.3 Thuật toán điều khiển
Algorithm 4.2: Điều khiển hệ CSTR (4.22) nhờ học lặp và bù nhiễu tổng.
1

Chọn 0  Ts

1 đủ nhỏ. Tính N  T Ts . Xác định D1  1 Ts và D0  D1

19

. Gán ˆ  0 và v = v (0), v (1),
, v (N  1)  có v (i )  r (i ) . Chọn K .
while continue the control do
T
Gán trạng thái đầu z   z1 , z 2   (C A ,TA )T
, N  1 do
for i  0,1,
Đưa u  v (i )  ˆ vào điều khiển hệ trong khoảng thời gian Ts .
T

2
3
4
5
6
7
8
9
10

Đo trạng thái x  (x1, x 2 )T và đầu ra y
Gán ˆ  D1 x 2  D0 z 2  h2 (x 2 )    v (i )  ˆ .


Tính e (i )  r (i )  y . Gán z  x .
end for
T
Lập vector e  vec e (0),

,e (N  1)  . Gán v  v  Ke .

11 end while
4.4.4 Kiểm chứng chất lượng bằng mô phỏng
4.4.4.1 Kết quả mô phỏng khi đầu ra là nhiệt độ

Hình 4.13: Đáp ứng của kênh
Hình 4.12: Đáp ứng của kênh
nhiệt độ sau 100 lần thử.
nhiệt độ sau 10 lần thử.

Hình 4.14: Sự thay đổi tương
ứng của kênh nồng độ sau 100 Hình 4.15: Kết quả ước lượng
nhiễu cho điều khiển bù (1s đầu
lần thử.
tiên).

20

4.4.4.2 Kết quả mô phỏng khi đầu ra là nồng độ

Hình 4.16: Đáp ứng của kênh Hình 4.17: Đáp ứng của kênh
nồng độ sau 15 lần thử.
nồng độ sau 150 lần thử.

Hình 4.18: Sự thay đổi tương Hình 4.19: Nhiễu tổng  và kết
ứng của kênh nhiệt độ sau 150 quả ước lượng sau 1s.
lần thử.
4.5 Tổng kết chương 4

Hai giải pháp ứng dụng học lặp vào điều khiển hệ (CSTR) :
 Giải pháp thứ nhất phụ thuộc vào tham số hàm  (x 2 ) nên tính
thơng minh của nó chưa cao. Bù lại đáp ứng của bộ điều khiển lại
nhanh. Bộ điều khiển thiết kế theo giải pháp thứ nhất đã mang lại
cho hệ chất lượng bám tín hiệu đặt rất tốt, không những xung quanh
các điểm làm việc mà cịn cả trong tồn bộ thời gian một chu kỳ làm
việc.
 Giải pháp thứ hai cho ra bộ điều khiển chỉ còn phụ thuộc hai
tham số q ,  của hệ CSTR và hai tham số này luôn được cung cấp
kèm theo thiết bị. Do đó khả năng xử lý thông minh của giải pháp
được nâng cao hơn. Bộ điều khiển thiết kế theo giải pháp thứ hai này
cũng mang lại chất lượng bám tín hiệu đặt xung quanh điểm làm việc

21

cho trước không thua kém so với giải pháp thứ nhất. Khơng những
thế, với giải pháp thứ hai thì nhiễu tổng, gồm nhiễu đầu vào và sai
lệch mơ hình, được ước lượng nhanh hơn.
Thêm nữa, cả hai giải pháp đề xuất đều có khả năng kháng nhiễu đầu
vào.
KẾT LUẬN VÀ ĐỊNH HƯỚNG PHÁT TRIỂN
Các đóng góp mới của luận án
Luận án đã có các đóng góp mới sau:
1. Đã xây dựng được các điều kiện xác định tham số hàm học tuyến
tính để q trình học là hội tụ, bao gồm:
a) Điều kiện trong miền phức, áp dụng được cho những đối
tượng tuyến tính có mơ hình thời gian (2.13) không thỏa mãn
ˆ ˆ 0
CB

.
b) Điều kiện tối ưu dựa trên mơ hình trong miền thời gian, để
xác định tham số hàm học thay đổi thích nghi theo tổng bình
phương sai lệch bám của từng vòng lặp. Điều kiện này cho phép
cải thiện được chất lượng hội tụ của quá trình học.
c) Xây dựng phương pháp xác định tham số hội tụ khơng dựa
vào mơ hình tốn. Đây là kết quả mà luận án đã cải tiến phương
pháp xác định thông minh tham số hội tụ cho hàm học tuyến tính
của tài liệu [69]. Phương pháp cải tiến này áp dụng được cho
những hệ phi tuyến có đạo hàm của ánh xạ vào ra đổi dấu.
Chất lượng của những đề xuất trên đã được luận án kiểm chứng
thông qua mô phỏng.
2. Đề xuất được nguyên tắc ước lượng thông minh thành phần nhiễu
tổng (trong [CT4] được NCS gọi là lumped disturbance). Phương
pháp này được xây dựng dựa trên phép phân tích chuỗi Taylor
cho vector trạng thái và hồn tồn khơng sử dụng mơ hình tốn
của hệ.Nó cho phép tuyến tính hóa phản hồi, cũng như ổn định
hóa thơng minh cho hệ.
Nhờ có khối ước lượng thành phần bất định hàm này mà nguyên tắc
điều khiển học lặp áp dụng trực tiếp được ngay cho những hệ không
ổn định, bỏ qua được bước ổn định hóa chúng trước nhờ bộ điều
khiển truyền thống.

22

Chất lượng của đề xuất này đã được luận án kiểm chứng thơng qua
mơ phỏng.
3. Xây dựng được thuật tốn điều khiển dựa trên những đề xuất trên
để điều khiển hai đối tượng làm việc theo mẻ (batch processes)

trong công nghiệp là robots và hệ CSTR. Các thuật toán điều
khiển này đều mang đặc điểm là không sử dụng mô hình tốn của
đối tượng điều khiển (hoặc rất hạn chế).
Chất lượng của những thuật toán điều khiển này cũng đã được luận
án kiểm chứng thông qua mô phỏng.
Những vấn đề còn tồn tại và hướng giải quyết
Những vấn đề phát sinh trong quá trình thực hiện đề tài mà luận án
cịn bỏ ngỏ, chưa giải quyết được, gồm có:
 Xây dựng các phương pháp xác định tập tham số hội tụ

cho

hàm học phi tuyến có cấu trúc đã biết.
Định hướng nghiên cứu trong tương lai của NCS cho bài toán vừa
nêu sẽ là:
1)
Chọn trước một cấu trúc hàm học:
uk 1 (i )  uk (i )  f L el ( j ),  ; j [0, N ) và l  k
2)
Sau đó tìm
cho hàm học đó để q trình học và chỉnh
, N  1.
định thỏa mãn điều kiện hội tụ e k (i )  0, i  0,1,
 Giải quyết bài tốn điều khiển có ràng buộc bằng học lặp. Chẳng
hạn ở bài toán điều khiển hệ CSTR ở chương 4 khi có thêm ràng
buộc đầu vào u U .
Định hướng nghiên cứu trong tương lai của NCS để giải quyết bài
tốn điều khiển có ràng buộc đó sẽ là dựa vào hai bước:
1)
Xác định tập hợp tất cả các tín hiệu đặt r (t ) thỏa mãn yêu

cầu về điều kiện ràng buộc u U và chất lượng bám y  r ở đầu
ra.
2)
Sau đó chọn một tín hiệu đặt hợp lý trong tập đó để với nó có
được tín hiệu điều khiển u thỏa mãn điều kiện ràng buộc.

23

Nói cách khác, định hướng tương lai của NCS sẽ là giải quyết bài
tốn điều khiển học lặp có ràng buộc nhờ giải pháp “constrained path
planning”.

24

Nâng cao chất lượng điều khiển dựa trên mô hình bằng phương pháp học lặp

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về