BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
LÂM GIA ĐỨC
ĐIỀU KHIỂN TỐI ƯU HỆ ROBOT CÂN BẰNG
MỘT BÁNH XE DÙNG QUI HOẠCH ĐỘNG
THÍCH NGHI
Ngành: KỸ THUẬT ĐIỆN TỬ
Mã ngành: 8520203
LUẬN VĂN THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2022
Cơng trình được hồn thành tại Trường Đại học Cơng nghiệp TP. Hồ Chí Minh.
Người hướng dẫn khoa học: PGS.TS. Nguyễn Tấn Lũy
Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường
Đại học Cơng nghiệp thành phố Hồ Chí Minh ngày 15 tháng 05 năm 2022
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. GS.TS Hồ Phạm Huy Ánh
- Chủ tịch Hợi đồng
2. TS. Trần Hữu Tồn
- Phản biện 1
3. PGS.TS Lê Mỹ Hà
- Phản biện 2
4. TS. Nguyễn Ngọc Sơn
- Ủy viên
5. TS. Ong Mậu Dũng
- Thư ký
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
CHỦ TỊCH HỘI ĐỒNG
TRƯỞNG KHOA CÔNG NGHỆ ĐIỆN TỬ
BỘ CƠNG THƯƠNG
CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC CƠNG NGHIỆP
THÀNH PHỐ HỒ CHÍ MINH
Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Lâm Gia Đức
MSHV: 19630431
Ngày, tháng, năm sinh: 18/09/1996
Nơi sinh: Tỉnh Bạc Liêu
Ngành: Kỹ thuật Điện Tử
Mã ngành: 8520203
I. TÊN ĐỀ TÀI:
Điều Khiển Tối Ưu Hệ Robot Cân Bằng Mợt Bánh Xe Dùng Qui Hoạch Đợng
Thích Nghi
NHIỆM VỤ VÀ NỘI DUNG:
Xây dựng mơ hình robot, thiết kế thuật tốn điều khiển tối ưu dùng qui hoạch
đợng thích nghi. Mô phỏng và thực nghiệm tiến hành lấy số liệu và so sánh.
II. NGÀY GIAO NHIỆM VỤ: 25/03/2021
III. NGÀY HOÀN THÀNH NHIỆM VỤ: 20/01/2022
IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Tấn Lũy
Tp. Hồ Chí Minh, ngày … tháng … năm 20 …
NGƯỜI HƯỚNG DẪN
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
(Họ tên và chữ ký)
(Họ tên và chữ ký)
TRƯỞNG KHOA CÔNG NGHỆ ĐIỆN TỬ
(Họ tên và chữ ký)
LỜI CẢM ƠN
Để có thể hồn thành luận văn này không thể thiếu sự quan tâm giúp đỡ và hỗ trợ tận
tình tạo điều kiện tối đa của PGS.TS Nguyễn Tấn Lũy dành cho em. Em xin trân trọng
bày tỏ lòng biết ơn chân thành đến Thầy Nguyễn Tấn Lũy người đã truyền dạy em nhiều
thứ về lĩnh vực điều khiển tự đợng hóa, cũng như đã giúp em có nguồn cảm hứng về lĩnh
vực học củng cố. Nếu không có những lời hướng dẫn, dạy bảo của thầy thì luận văn này
của em rất khó để hồn thiện được.
Trong suốt thời gian học tập và rèn luyện tại Trường Đại học Cơng nghiệp Thành phố
Hồ Chí Minh đến nay, em rất chân thành cảm ơn sự quan tâm, giúp đỡ của q Thầy Cơ
và các bạn. Với lịng biết ơn sâu sắc nhất, em xin gửi đến quý Thầy Cơ ở Đại học Cơng
Nghiệp Thành phố Hồ Chí Minh nói chung và Khoa Cơng Nghệ Điện Tử nói riêng, đã
cùng với tri thức và tâm huyết của mình để truyền đạt vốn kiến thức quý báu cho chúng
em trong suốt thời gian học tập tại trường.
Con xin bày tỏ lịng biết ơn sâu sắc đến Ba, Mẹ đã ln động viên và bên cạnh con những
lúc bế tắc nhất. Gia đình chính là đợng lực để con nỗ lực và cố gắng hoàn thành thật tốt
luận văn này.
Kết quả của luận văn này là thành quả nỗ lực, tìm tòi, học hỏi trong suốt thời gian qua
của em. Mặc dù đã cố gắng hết sức, song chắc chắn không tránh khỏi những thiếu sót.
Em rất mong nhận được sự thơng cảm và chỉ bảo tận tình của q Thầy Cô.
i
TÓM TẮT LUẬN VĂN THẠC SĨ
Trong điều khiển học, các mơ hình như con lắc ngược và mơ hình robot thăng bằng trên
hai bánh xe được coi là kinh điển trong thí nghiệm thuật tốn điều khiển. Tuy nhiên, do
đợ khó nên robot cân bằng trên mợt bánh xe có 3 bợ phận chính gồm đợng cơ có bánh
xe ở chân robot để cân bằng góc nghiêng, đợng cơ có bánh đà ở đầu robot để cân bằng
góc quay, đã thu hút sự chú ý của cộng đồng điều khiển trong những năm gần đây. Thiết
kế các luật điều khiển ổn định, đặc biệt là tính tối ưu, cho robot là mợt vấn đề đầy thách
thức. Luận văn này trình bày mợt thuật tốn điều khiển tách rời tối ưu sử dụng quy hoạch
đợng thích nghi (Adaptive Dynamic Programming - ADP) để cân bằng hệ thống robot
một bánh. Dựa trên mơ hình đợng lực học của robot thơng qua phương trình Euler
Lagrange ta tính tốn được mơ hình tốn học của robot phù hợp với mục đích điều khiển.
Sau đó bộ điều khiển chuyển tiếp được đề xuất sẽ tách mơ hình đợng học robot thành hai
phần riêng biệt, đợng lực học phương tiến lùi và động lực học phương ngang. Bộ điều
khiển ADP được thiết kế để điều khiển robot bám theo quỹ đạo thẳng cho trước, góc
nghiêng ở vị trí cân bằng khác 0 và điều khiển góc quay về vị trí cân bằng, trong đó tham
số là không chắc chắn. Mô phỏng so sánh được thực hiện để cho thấy rằng thuật toán
được đề xuất là hiệu quả.
ii
ABSTRACT
This thesis investigates a novel optimal decoupled control scheme for single-wheel
(unicycle) robots with unknown physical coupling effects. First, the dynamics of the roll
and pitch axes are presented by a strict-feedback nonlinear system, then the feedforward
control is proposed to decouple the centralized dynamics to the separate dynamics, where
the interaction between them are handed as general disturbance. Second, from the
adaptive dynamic programming (ADP) principle, consensus value functions are defined
and the Hamilton-Jacobi-Bellman (HIB) equations are derived, to which the solutions
are estimated by an online function approximation method. From the estimated HJB
solutions and the Lyapunov theory, the optimal control laws and provento be ultimately
uniformly bounded stable. Finally, the effectiveness of the proposed control scheme is
validated through simulation and experiment results.
iii
LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của bản thân tôi. Các kết quả
nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất
kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã
được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Học viên
(Chữ ký)
Lâm Gia Đức
iv
MỤC LỤC
LỜI CẢM ƠN ...................................................................................................................i
TÓM TẮT LUẬN VĂN THẠC SĨ ................................................................................. ii
ABSTRACT ................................................................................................................... iii
LỜI CAM ĐOAN ...........................................................................................................iv
MỤC LỤC ........................................................................................................................ v
DANH MỤC HÌNH ẢNH ............................................................................................ vii
DANH MỤC BẢNG .......................................................................................................ix
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................................. x
MỞ ĐẦU .......................................................................................................................... 1
1.
2.
3.
4.
Đặt vấn đề ............................................................................................................ 1
Mục tiêu nghiên cứu............................................................................................. 1
Mục tiêu chung ..................................................................................................... 1
Mục tiêu cụ thể ..................................................................................................... 1
Đối tượng, phạm vi và phương pháp nghiên cứu ................................................ 2
Đối tượng và phạm vi nghiên cứu ........................................................................ 2
Phương pháp nghiên cứu...................................................................................... 2
Ý nghĩa của đề tài ................................................................................................. 2
Ý nghĩa về mặt lý thuyết ...................................................................................... 2
Ý nghĩa về mặt thực tiễn ...................................................................................... 3
TỔNG QUAN LĨNH VỰC NGHIÊN CỨU ............................................ 4
Tổng quan............................................................................................................. 4
Các nghiên cứu trong nước .................................................................................. 5
Các nghiên cứu ngoài nước .................................................................................. 5
CƠ SỞ LÝ THUYẾT ............................................................................... 8
Cơ sở lý thuyết về hệ robot cân bằng mợt bánh xe .............................................. 8
2.1.1
2.1.2
2.1.3
Phương trình đợng học phương tiến – lùi (Pitch) .......................................................... 8
Phương trình đợng học phương trái – phải (Roll)........................................................ 10
Hệ robot cân bằng một bánh xe ................................................................................... 11
v
Cơ sở lý thuyết qui hoạch đợng thích nghi (ADP) ............................................. 13
THIẾT KẾ HỆ THỐNG ........................................................................ 14
Thiết kế phần cứng ............................................................................................. 14
3.1.1
3.1.2
3.1.3
Sơ đồ khối phần cứng .................................................................................................. 14
Sơ đồ mạch điện hệ thống ............................................................................................ 15
Thiết kế cơ khí ............................................................................................................. 17
Thiết kế bộ điều khiển tối ưu ............................................................................. 21
3.2.1
3.2.2
3.2.3
Thiết kế động lực học tách rời cho hệ robot ................................................................ 21
Thiết kế bộ điều khiển tối ưu cho hệ tách rời .............................................................. 25
Phân tích ổn định của thuật tốn OADP ...................................................................... 31
Thiết kế giải thuật phần mềm ............................................................................. 37
3.3.1
3.3.2
3.3.3
3.3.4
Xác định các trạng thái của tín hiệu ............................................................................. 37
Giải thuật phần mềm .................................................................................................... 37
Chương trình chính ...................................................................................................... 37
Chương trình ngắt ngồi .............................................................................................. 39
MƠ PHỎNG VÀ THỰC NGHIỆM ...................................................... 40
Mô phỏng giải thuật điều khiển OADP ............................................................. 40
4.1.1
4.1.2
4.1.3
4.1.4
4.1.5
Mơ hình mơ phỏng robot ............................................................................................. 40
Mơ phỏng robot với bộ điều khiển .............................................................................. 40
Xây dựng quỹ đạo bám theo phương thẳng cho robot ................................................. 41
Thiết lập thông số ........................................................................................................ 41
Kết quả mô phỏng và so sánh ...................................................................................... 42
Thực nghiệm ...................................................................................................... 47
4.2.1
Kết quả thực nghiệm và so sánh .................................................................................. 47
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ..................................................................... 54
TÀI LIỆU THAM KHẢO .............................................................................................. 55
LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN .............................................................. 59
vi
DANH MỤC HÌNH ẢNH
Hình 1.1 Mơ hình bợ điều khiển trượt kết hợp LQR ................................................. 6
Hình 1.2 Mơ hình bợ điều khiển FSMC kết hợp LQR .............................................. 6
Hình 2.1 Mơ hình thực tế robot mợt bánh xe ............................................................ 8
Hình 2.2 Mơ hình tốn học trục pitch ....................................................................... 9
Hình 2.3 Mơ hình tốn học trục roll ........................................................................ 10
Hình 3.1 Sơ đồ khối hệ thống .................................................................................. 14
Hình 3.2 Mạch điều khiển trung tâm ....................................................................... 16
Hình 3.3 Mạch driver cơng suất và cảm biến .......................................................... 17
Hình 3.4 Phần chân robot ........................................................................................ 17
Hình 3.5 Phần thân trên của robot ........................................................................... 18
Hình 3.6 Phần mặt đế của robot. ............................................................................. 18
Hình 3.7 Bánh xe robot ........................................................................................... 19
Hình 3.8 Bánh đà robot ........................................................................................... 19
Hình 3.9 Cấu trúc điều khiển trong giải thuật OADP ............................................. 31
Hình 3.10 Lưu đồ giải thuật chương trình chính ..................................................... 38
Hình 3.11 Lưu đồ giải thuật ngắt ngồi ................................................................... 39
Hình 4.1 Mơ hình phi tuyến hệ thống trên Matlab. ................................................. 40
Hình 4.2 Quỹ đạo tham chiếu cho robot ................................................................. 41
Hình 4.3 Quá trình học hội tụ trọng số mạng NN của OADP trục pitch ................ 43
vii
Hình 4.4 Q trình học hợi tụ trọng số mạng NN của OADP trục roll ................... 43
Hình 4.5 Quỹ đạo bám của robot ............................................................................ 44
Hình 4.6 Bám vận tốc của robot .............................................................................. 45
Hình 4.7: Đáp ứng góc roll của robot ...................................................................... 46
Hình 4.8 Đáp ứng góc pitch của robot .................................................................... 47
Hình 4.9 Quỹ đạo bám của robot thực nghiệm ....................................................... 48
Hình 4.10 Vận tốc robot thực nghiệm ..................................................................... 49
Hình 4.11 Đáp ứng góc roll của robot thực nghiệm ................................................ 50
Hình 4.12 Đáp ứng góc pitch của robot thực nghiệm ............................................. 51
Hình 4.13 Đáp ứng góc roll robot thực nghiệm – tải 0.15 (kg)............................... 52
Hình 4.14 Đáp ứng góc pitch robot thực nghiệm – tải 0.15 (kg) ............................ 53
viii
DANH MỤC BẢNG
Bảng 3.1 Thơng số mơ hình robot ........................................................................... 20
ix
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
ADP
Thuật ngữ tiếng anh
Giải thích
Adaptive Dynamic
Qui hoạch đợng thích nghi, mợt phương
Programming
pháp học củng cố để xấp xỉ luật điều
khiển tối ưu
AI
Artifical Intelligence
Trí tuệ nhân tạo
HJB
Hamilton Jacobi Bellman
Phương trình chỉ tiêu chất lượng hệ phi
tuyến
LQR
OADP
Linear Quadratic
Điều khiển tối ưu tuyến tính hóa dạng
Regulation
tồn phương
Online Adaptive Dynamic
Qui hoạch đợng thích nghi online: mợt
Programming
giải thuật học củng cố để xấp xỉ luật điều
khiển tối ưu online
ORADP
Online Robust Adaptive
Qui hoạch đợng thích nghi bền vững
Dynamic Programming
online: mợt giải thuật học củng cố để tìm
luật điều khiển tối ưu thích nghi bền
vững online
RL
Reinforcement Learning
Học củng cố
SMC
Sliding Mode Control
Điều khiển mặt trượt hệ phi tuyến
UUB
Uniform Ultimate Bou-ded Bị chặn tới hạn đều
x
MỞ ĐẦU
1. Đặt vấn đề
Trong điều khiển học, các mô hình như con lắc ngược và mơ hình robot thăng bằng trên
hai bánh xe được coi là kinh điển trong thí nghiệm thuật tốn điều khiển. So với mơ hình
con lắc ngược và mơ hình robot thăng bằng trên hai bánh xe, mơ hình robot cân bằng
trên mợt bánh xe phức tạp và khó khăn hơn rất nhiều. Robot này bao gồm 3 bợ phận
chính: đợng cơ có bánh xe ở chân robot để cân bằng góc nghiêng (Pitch), đợng cơ có
bánh đà ở đầu robot để cân bằng góc quay (Roll). Do động học robot đồng thời không
ổn định theo phương dọc và phương ngang, thiết kế luật điều khiển ổn định đã thu hút
sự quan tâm của cộng đồng điều khiển trong những năm gần đây. Để tối thiểu hàm chỉ
tiêu chất lượng, bài toán điều khiển tối ưu cho robot được đề xuất. Ngồi ra, với mơ hình
chứa các tham số bất định, luật điều khiển tối ưu thích nghi cũng được thiết kế.
2. Mục tiêu nghiên cứu
Mục tiêu chung
Xây dựng mơ hình đợng học phi tuyến của robot cân bằng một bánh xe, đề xuất luật điều
khiển tối ưu cho robot, thiết kế và thi công phần cứng, lập trình mơ phỏng và thực
nghiệm, phân tích và đánh giá kết quả.
Mục tiêu cụ thể
1. Xây dựng mơ hình phi tuyến của robot với đợng học nợi khơng biết
2. Thiết kế thuật tốn điều khiển tối ưu giúp robot thăng bằng và đồng thời bám quỹ
đạo tham chiếu theo đường thẳng
3. Thiết kế được mơ hình cơ khí, phần cứng cho robot mợt bánh xe
4. Mơ phỏng và thực nghiệm
5. Phân tích và đánh giá kết quả
1
Các mục tiêu đưa ra ở trên sẽ giúp xây dựng hồn chỉnh mơ hình robot thăng bằng trên
mợt bánh xe, đưa ra được bộ điều khiển tối ưu giúp robot thăng bằng và bám quỹ đạo
thẳng.
3. Đối tượng, phạm vi và phương pháp nghiên cứu
Đối tượng và phạm vi nghiên cứu
Đối tượng điều khiển được tiến hành nghiên cứu trong luận án là hệ thống phi tuyến
robot thăng bằng mợt bánh xe. Thuật tốn điều khiển áp dụng cho robot là giải thuật điều
khiển tối ưu.
Phương pháp nghiên cứu
Dựa trên những nghiên cứu mới nhất về học thích nghi tăng cường (Reinforcement
Learning-RL) cùng với phương pháp xấp xỉ hàm quy hoạch đợng thích nghi (Apdative
Dynamic Programming-ADP) xây dựng thuật toán điều khiển tối ưu cho hệ thống,
phương pháp nghiên cứu cho luận văn được đưa ra như sau:
-
Sử dụng cơng cụ tốn để xây dựng về mơ hình đợng học của robot một bánh xe.
-
Nghiên cứu các tài liệu liên quan về thuật tốn điều khiển thích nghi trên nền tảng
quy hoạch đợng thích nghi ADP.
-
Xây dựng mơ hình mơ phỏng trên Matlab – Simulink.
-
Xây dựng mơ hình phần cứng robot một bánh xe, nhúng bộ điều khiển tối ưu thời
gian thực bằng ngơn ngữ lập tình C vào vi điều khiển.
4. Ý nghĩa của đề tài
Ý nghĩa về mặt lý thuyết
Trong luận án này, lần đầu tiên bộ điều khiển tối ưu được thiết kế cho robot một bánh
xe tự cân bằng với động học nội không biết. Các đóng góp của luận văn bao gồm:
2
1. Phân tách mơ hình đợng học của robot thành hai phần riêng biệt, động học trục pitch
và động học trục roll. Ngược lại với các bộ điều khiển phi tập trung [1]–[3], một đa
thức phi tuyến của robot được đề xuất.
2. Tìm nghiệm của phương trình Hamilton-Jacobi-Bellman (HJB) thơng qua việc sử
dụng thuật toán xấp xỉ hàm trực tuyến đơn giản. Sai số của bộ điều khiển tối ưu sau
khi phân tách hệ thống được đảm bảo luôn tồn tại chặn giới hạn tối thiểu (Unifrom
Ultimate Bounded-UUB).
Ý nghĩa về mặt thực tiễn
Mơ hình phần cứng robot được thi cơng. Thuật toán điều khiển nhúng được cài đặt trên
vi điều khiển. Kết quả thực nghiệm cho thấy mơ hình phần cứng và thuật tốn là đáng
tin cậy. Mơ hình có thể sử dụng để đào tạo hoặc làm nền tảng phục vụ nghiên cứu các
thuật toán điều khiển nâng cao.
3
TỔNG QUAN LĨNH VỰC NGHIÊN CỨU
Tổng quan
Điều khiển cân bằng và bám quỹ đạo tham chiếu cho hệ robot một bánh xe tự cân bằng
là một vấn đề hấp dẫn, đã thu hút được sự chú ý của cộng đồng điều khiển trong nhiều
thập kỹ qua [4]–[11]. Quan trọng là việc phát triển được các thuật toán điều khiển nâng
cao cho robot, cơ chế hoặc đợng của robot có thể được áp dụng rộng rãi trong các hệ
thống công nghiệp cũng như quân sự như: tàu thuyền, xe tăng, máy bay,…. Hiện tại, có
rất nhiều thuật tốn điều khiển đã được phát triển cho điều khiển xe hai bánh thăng bằng
[7]–[11], trong khi đó chỉ có mợt số ít đề cập đến việc thiết kế bộ điều khiển cho robot
một bánh xe [4]–[6]. Việc thiết kế bộ điều khiển cho robot một bánh xe gặp nhiều thách
thức, do cấu tạo đợng học của robot đồng thời có đến hai điểm không ổn định theo
phương dọc và phương ngang, trong khi với xe hai bánh thăng bằng chỉ có mợt điểm
khơng ổn định [7]–[11]. Hơn nữa, việc điều khiển cân bằng và bám quỹ đạo cho robot
phải được thực hiện song song [4]–[6]. Mặc dù việc thiết kế thuật toán điều khiển tương
đối đơn giản, nhưng hiệu suất điều khiển có thể kém hoặc không ổn định, đặc biệt là ở
những vị trí có sai số góc lớn hoặc khi thay đổi khối lượng robot. Mợt thuật tốn điều
khiển tối ưu sẽ giúp khắc phục những nhược điểm trên, nhưng việc thiết kế địi hỏi mợt
sự hiểu biết sâu rợng và vững chắc cả về lý thuyết và thực nghiệm.
Luận văn này trình bày thiết kế phần cứng và thuật tốn điều khiển tối ưu sử dụng quy
hoạch đợng thích nghi ADP để cân bằng hệ thống robot một bánh. Dựa trên mơ hình
đợng lực học của robot thơng qua phương trình Euler Lagrange ta tính tốn được mơ
hình tốn học của robot phù hợp với mục đích điều khiển. Bợ điều khiển tối ưu sử dụng
thuật toán ADP được thiết kế để điều khiển cân bằng và bám quỹ đạo tham chiếu cho
robot, trong đó đợng học nợi là khơng biết. Mô phỏng và thực nghiệm được thực hiện để
cho thấy rằng thuật toán được đề xuất là hiệu quả.
4
Các nghiên cứu trong nước
Tác giả của bài báo [12], đã sử dụng thuật tốn điều khiển tồn phương tuyến tính (Linear
quadratic regulator-LQR) để tiến hành điều khiển cho cả hệ thống robot một bánh tự
thăng bằng. Nội dung trong nghiên cứu này, tác giả sử dụng cảm biến MPU6050 và
LG3G4200D để đọc các góc roll và picth của robot. Sử dụng bộ lọc kalman số để tiến
hành lọc nhiễu các góc đo được sau đó đưa thơng số góc sau khi lọc nhiễu vào bộ điều
khiển LQR, bộ điều khiển sau q trình xử lý sẽ xuất tính hiệu điều khiển cho động cơ
bánh đà và động cơ bánh xe quay nhằm giúp robot giữ được thăng bằng. Phiên bản robot
một bánh trong bài báo chỉ tập trung vào việc kiểm soát thăng bằng cho robot mà chưa
tiến hành xem xét kiểm soát quỹ đạo bám của robot.
Các nghiên cứu ngồi nước
Robot cân bằng mợt bánh xe đã được nhiều nhà nghiên cứu quan tâm [4], [6], trong
nghiên cứu [4] tác giả đã sử dụng một động cơ trực tiếp momen lớn để truyền đợng cho
bánh đà. Phía dưới là mợt bánh xe lốp hơi, có tác dụng giảm chấn. Các động cơ chuyển
động đều được hồi tiếp Encoder để hồi tiếp đầy đủ trạng thái hệ thống. Vì đặc điểm động
học của trục Pitch và trục Roll là khác nhau, hai bộ điều khiển khác nhau đã được tác giả
thiết kế: điều khiển LQR cho trục thăng bằng phương tiến lùi và điều khiển trượt (Sliding
Mode Control-SMC) cho trục thăng bằng phương ngang (Hình 1.1). Trong nghiên cứu
này, tác giả chỉ tập trung vào việc kiểm soát sự cân bằng của hệ thống, điều khiển bám
quỹ đạo tham chiếu của robot vẫn chưa được xem xét.
Ở trục Pitch vì mơ hình tốn học của hệ thống là khơng chắc chắn nên việc thiết kế bộ
điều khiển LQR tuyến tính là gần như khơng thể, thay vào đó tác giả đã sử dụng mộ bộ
điều khiển LQR phi tuyến với điểm đặt khác khơng, để có thể khắc phục được thiếu sót
về mơ hình tốn. Như đã nói ở trên, ở trục Roll vì mơ hình tốn học khơng chắc chắn
nên bộ điều khiển trượt (SMC) với ưu điểm kiểm sốt hệ thống phi tuyến khơng chắc
chắn mơ hình tốn học đã được sử dụng, nhưng cùng với đó tác giả nhận thấy nhiễu là
5
một vấn đề lớn của hệ thống.
Bộ điều khiển
trượt SMC
Trái phải
Robot mợt bánh
xe cân bằng
Bợ điều khiển
tồn phương
tuyến tính LQR
Tiến lùi
Các trạng thái của robot
robot
Hình 1.1 Mơ hình bợ điều khiển trượt kết hợp LQR
Trong nghiên cứu [6], tác giả đã tách hệ thống thành hai hệ riêng biệt. Sau đó, tiến hành
thiết kế bợ điều khiển cho từng hệ thống, bộ điều khiển LQR cho trục Pitch và bộ điều
khiển mờ - trượt (Fuzzy Sliding Mode Control-FSMC) được sử dụng cho trục Roll để
hạn chế hiện tượng “chattering” của ngõ ra khi chỉ sử dụng bộ điều khiển trượt (Hình
1.2). Điều khiển bám quỹ đạo tham chiếu đã được tác giả thực hiện, nhưng bản chất của
bộ điều khiển LQR là thực hiện trên mơ hình tuyến tính hóa của hệ thống nên khi áp
dụng vào hệ thống thực với động học nội không biết việc điều khiển bám cho ra kết quả
không thực sự tốt.
Các trạng thái trục tiến lùi
Quỹ đạo
tham chiếu
Bợ điều khiển
tồn phương
tuyến tính LQR
Đợng học trục tiến
lùi (Pitch)
Robot một bánh xe
Bộ điều khiển
trượt-mờ (FSMC)
Động học trục trái
phải (Roll)
Các trạng thái trục trái phải
Hình 1.2 Mơ hình bợ điều khiển FSMC kết hợp LQR
6
Để có thể khắc phục những hạn chế và cải tiến hệ thống trên, luận văn này sử dụng thuật
toán quy hoạch đợng thích nghi (ADP) với khả năng điều khiển robot không biết rõ các
động học nội của hệ thống, không chỉ ổn định cân bằng tối thiểu hàm chi phí cho trước
mà cịn điều khiển robot di chuyển bám theo quỹ đạo tham chiếu.
7
CƠ SỞ LÝ THUYẾT
Cơ sở lý thuyết về hệ robot cân bằng một bánh xe
Mơ hình robot mợt bánh thăng bằng (Hình 2.1) là sự kết hợp của 2 mơ hình: con lắc bánh
đà và con lắc ngược, vì bản chất cả hai mơ hình trên điều có đợ phi tuyến rất lớn nên
việc điều khiển khá khó. Mơ hình động lực một bánh sở hữu đến hai điểm cân bằng
không ổn định. Việc quan trọng là phải kết hợp hai mơ hình trên để hệ thống hoạt đợng
ổn định.
Hình 2.1 Mơ hình thực tế robot mợt bánh xe
2.1.1 Phương trình động học phương tiến – lùi (Pitch)
Xét hệ robot mợt bánh tự thăng bằng ở bài tốn con lắc ngược, bánh xe xem như thẳng
đứng và chỉ di chuyển theo mợt phương 𝑖⃗. Bánh đà phía trên xem như là một vật không
mang động năng quay và kết hợp với phần thân robot để tạo thành một thể duy nhất. 𝑙 là
khoảng cách từ tâm bánh xe đến tâm của thân robot. 𝑅𝑤 là bán kính của bánh xe, góc
quay của bánh xe và góc quay của thân robot lần lượt được biểu diễn là 𝜃 và 𝜓.
8
𝐽⃗
𝜓
𝑚𝑏𝑑 , 𝐽𝜓
𝑙1
𝜃
⃗⃗⃗⃗
𝑟2
𝑟1
⃗⃗⃗⃗
𝑚𝑤 , 𝐽𝑤
𝑅𝑤
𝑖⃗
Hình 2.2 Mơ hình tốn học trục pitch
Khi xét hệ thống ở bài toán thăng bằng con lắc ngược, khối lượng của bánh xe và khối
lượng tổng của phần thân robot hợp với bánh đà được định nghĩa lần lượt là 𝑚𝑤 và 𝑚𝑏𝑑 .
Các véc tơ vị trí, lần lượt vecto ⃗⃗⃗⃗
𝑟1 và ⃗⃗⃗⃗
𝑟2 được xác định từ góc tọa đợ đến tâm bánh xe và
từ góc tọa đợ đến tâm của phần thân robot [6].
𝑟1 = 𝑅𝑤 𝜃𝑖⃗ + 𝑅𝑤 𝑗⃗
⃗⃗⃗⃗
(1)
⃗⃗⃗⃗
𝑟2 = (𝑅𝑤 𝜃 + 𝑙1 𝑠𝑖𝑛 𝜓)𝑖⃗ + (𝑅𝑤 + 𝑙1 𝑐𝑜𝑠 𝜓)𝑗⃗
(2)
Động năng toàn phần của robot:
𝑇=
Với 𝑣
⃗⃗⃗⃗1 =
⃗⃗⃗⃗⃗
𝑑𝑟
1
𝑑𝑡
1
1
1
1
𝑚 𝑤 (𝑣
⃗⃗⃗⃗.
⃗⃗⃗⃗1 ) + 𝑚𝑏𝑑 (⃗⃗⃗⃗⃗.
𝑣2 ⃗⃗⃗⃗⃗
𝑣2 ) + 𝐽𝑤 𝜃̇ 2 + 𝐽𝜓 𝜓̇ 2
1 𝑣
2
2
2
2
1
2
+ 𝑛2 𝐽𝑚 (𝜃̇ − 𝜓̇)
2
và ⃗⃗⃗⃗⃗
𝑣2 =
⃗⃗⃗⃗⃗
𝑑𝑟
2
𝑑𝑡
(3)
, 𝐽𝑤 , 𝐽𝜓 𝑣à 𝐽𝑚 lần lượt là quán tính của bánh xe, quán tính của
thân robot và lực cảm ứng của động cơ, 𝑛 là tỷ số truyền đợng của đợng cơ.
Thế năng tồn phần của robot:
9
𝑉 = 𝑚𝑤 𝑔𝑅𝑤 + 𝑚𝑏𝑑 𝑔(𝑅𝑤 + 𝑙1 cos 𝜓)
(4)
Ta có đa thức Lagrange: 𝐿 = 𝑇 – 𝑉
2
1
1
1
1
1
𝐿 = 𝑚 𝑤 (𝑣
⃗⃗⃗⃗.
⃗⃗⃗⃗1 ) + 𝑚𝑏𝑑 (⃗⃗⃗⃗⃗.
𝑣2 ⃗⃗⃗⃗⃗
𝑣2 ) + 𝐽𝑤 𝜃̇ 2 + 𝐽𝜓 𝜓̇ 2 + 𝑛2 𝐽𝑚 (𝜃̇ − 𝜓̇) −
1 𝑣
2
2
2
2
2
(5)
𝑚𝑤 𝑔𝑅𝑤 − 𝑚𝑏𝑑 𝑔(𝑅𝑤 + 𝑙1 cos 𝜓)
2.1.2 Phương trình động học phương trái – phải (Roll)
Ở bài toán con lắc bánh đà, bánh xe xem như không di chuyển tiến lùi
mà chỉ nghiêng qua lại (phương trái – phải). Bánh đà phía trên sẽ quay theo sự điều khiển
của mô men lực 𝜏𝑑 . Về nguyên lý, khi bánh đà quay theo một chiều, giả định là chiều
kim đồng hồ theo một tốc độ thay đổi. Bánh đà sẽ mang một gia tốc và gây ra một mô
men lực theo cùng chiều tại trục quay. Lực này tác dụng vào khung con lắc, và làm bộ
khung quay theo chiều quay của bánh đà, vì điểm tiếp đất được giữ cố định nên chính
khung quay sẽ di chuyển theo chiều kim đồng hồ. Đây chính là nguyên lý để con lắc
bánh đà lấy lại vị trí điểm trọng tâm khi bị nghiêng.
𝐽⃗
𝜃𝑑
𝑅𝑝
𝑚𝑑 , 𝐽𝑑
𝜃𝑏
𝑙2
𝑙3
𝑚𝑏𝑤 , 𝐽𝑏
𝑘⃗⃗
Hình 2.3 Mơ hình tốn học trục roll
Mơ hình đợng lực góc nghiêng trái – phải (Roll) được sử dụng, bằng cách xem thân robot
10
và bánh xe là một thể cố định. 𝑙2 𝑣à 𝑙3 lần lượt là chiều dài tính từ góc đến tâm bánh đà
và chiều dài tính từ góc cho đến tâm của thân robot. 𝑅𝑝 𝑣à 𝜃𝑑 là bán kính và góc quay
của bánh đà, tương ứng thì 𝜃𝑏 chính là góc quay của phần thân robot.
Để có thể xác định được phương trình đợng học của robot. Ta gọi 𝑚𝑏𝑤 là khối lượng của
phần thân robot và bánh xe. Hai véc tơ vị trí, ⃗⃗⃗⃗
𝑟3 𝑣à ⃗⃗⃗⃗
𝑟4 được xác định để có thể tính được
phương trình Lagrangian, trong đó véc tơ ⃗⃗⃗⃗
𝑟3 là véc tơ chỉ gia tốc hướng tâm của bánh đà
khi quay và ⃗⃗⃗⃗
𝑟4 là véc tơ thể hiện gia tốc hướng tâm của phần thân và bánh xe của robot.
⃗⃗⃗⃗
𝑟3 = 𝑙3 sin 𝜃𝑏 𝑘⃗⃗ + 𝑙3 cos 𝜃𝑏 𝐽⃗
(6)
𝑟4 = 𝑙2 sin 𝜃𝑏 𝑘⃗⃗ + 𝑙2 cos 𝜃𝑏 𝐽⃗
⃗⃗⃗⃗
(7)
Đợng năng tồn phần của robot, T như sau:
𝑇=
Với ⃗⃗⃗⃗⃗
𝑣3 =
1
1
1
1
2
𝑚𝑏𝑤 (⃗⃗⃗⃗⃗.
𝑣3 ⃗⃗⃗⃗⃗
𝑣3 ) + 𝑚𝑑 (𝑣
⃗⃗⃗⃗.
⃗⃗⃗⃗4 ) + 𝐽𝑏 𝜃̇𝑏2 + 𝐽𝑑 (𝜃̇𝑏 + 𝜃̇𝑑 ) cos 𝜃𝑏 𝐽⃗
4 𝑣
2
2
2
2
⃗⃗⃗⃗⃗
𝑑𝑟
3
𝑑𝑡
và 𝑣
⃗⃗⃗⃗4 =
(8)
⃗⃗⃗⃗⃗
𝑑𝑟
4
𝑑𝑡
, 𝐽𝑑 𝑣à 𝐽𝑏 là lực quán tính khi bánh đà quay và lực quán tính
khi thân robot và bánh xe nghiêng tạo ra. Thế năng toàn phần của robot, 𝑉 như sau:
𝑉 = 𝑚𝑏𝑤 𝑔𝑙3 cos 𝜃𝑏 + 𝑚𝑑 𝑔𝑙2 cos 𝜃𝑏
(9)
Với 𝑔 = 9.81𝑚/ sec 2 .
Ta có đa thức Lagrange: 𝐿 = 𝑇 − 𝑉
𝐿=
1
1
1
1
2
𝑚𝑏𝑤 (⃗⃗⃗⃗⃗.
𝑣3 ⃗⃗⃗⃗⃗
𝑣3 ) + 𝑚𝑑 (𝑣
⃗⃗⃗⃗.
⃗⃗⃗⃗4 ) + 𝐽𝑏 𝜃̇𝑏2 + 𝐽𝑑 (𝜃̇𝑏 + 𝜃̇𝑑 ) 𝑐𝑜𝑠 𝜃𝑏 𝐽⃗
4 𝑣
2
2
2
2
(10)
− 𝑚𝑏𝑤 𝑔𝑙3 𝑐𝑜𝑠 𝜃𝑏 − 𝑚𝑑 𝑔𝑙2 𝑐𝑜𝑠 𝜃𝑏
2.1.3 Hệ robot cân bằng một bánh xe
Dựa vào (5) và (10), các ma trận khối lượng, 𝑀𝑟 và 𝑀𝑝 , trên trục roll và trục pitch được
định nghĩa lại như sau:
11
𝑀𝑟 (𝜃𝑏 , 𝜃𝑑 ) = [
𝐽𝑏 + 𝑙32 𝑚𝑏𝑤 + 𝑙22 𝑚𝑑
𝐽𝑑
0
]
𝐽𝑑
2
𝐽𝑤 + 𝐽𝑚 𝑛2 + (𝑚𝑤 + 𝑚𝑏𝑑 )𝑅𝑤
𝑀𝑝 (𝜃, 𝜓) = [
𝑙1 𝑚𝑏𝑑 𝑅𝑤 cos 𝜓
(11)
𝑙1 𝑚𝑏𝑑 𝑅𝑤 cos 𝜓 − 𝐽𝑚 𝑛2
]
𝐽𝜓 + 𝑙12 𝑚𝑏𝑑 + 𝐽𝑚 𝑛2
(12)
Trong đó 𝐽𝑑 , 𝐽𝑤 , 𝑚𝑑 , 𝑚𝑤 lần lượt là mơ men qn tính bánh đà, mơ men quán tính bánh
xe, khối lượng bánh đà và khối lượng bánh xe. 𝐽𝑏 là quán tính trục roll của robot 𝑚𝑏𝑤
khối lượng của phần thân robot và bánh xe. 𝐽𝜓 , 𝑚𝑏𝑑 lần lượt là quán tính trục pitch của
robot và khối lượng tổng của phần thân robot và bánh đà, 𝐽𝑚 momen qn tính phần ứng
của đợng cơ, 𝑛 là tỉ số truyền của động cơ.
Sử dụng phương trình Euler-Lagrange cho mơ hình robot mợt bánh [4], ta có phương
trình phi tuyến của robot như sau:
{
𝑥̇ 1 = 𝑥2
𝑥̇ 2 = 𝑓1 (𝑥1 , 𝑥2 ) + 𝑔1 (𝑥1 , 𝑥2 )𝑢1
(13)
{
𝑥̇ 3 = 𝑥4
𝑥̇ 4 = 𝑓2 (𝑥3 , 𝑥4 ) + 𝑔2 (𝑥3 , 𝑥4 )𝑢2
(14)
𝑇
Với 𝑥1 = [𝜃, 𝜓]𝑇 , 𝑥2 = [𝜃̇, 𝜓̇] , 𝑥3 = 𝜃𝑏 , 𝑥4 = 𝜃𝑏̇ , 𝑥̅ = [𝑥1𝑇 , 𝑥2𝑇 , 𝑥3 , 𝑥4 ], 𝑔1 (∙) = 𝑀𝑝−1 (𝑥1 , 𝑥2 ),
2
2
𝑔2 (∙) = 1/ (𝐽𝑏 + 𝑙3 𝑚𝑏𝑤 + 𝑙2 𝑚𝑑) , 𝑓1 (∙) = 𝑀𝑝−1 [0, 𝑔𝑙𝑚𝑏𝑑 sin 𝜓]𝑇 , 𝑓2 (∙) = 𝑔𝑙3 𝑚𝑏𝑤 sin 𝜃𝑏 /
2
2
𝑇
(𝐽𝑏 + 𝑙3 𝑚𝑏𝑤 + 𝑙2 𝑚𝑑) , 𝑢1 = [𝜏𝜃 , 𝜏𝜓 ] , 𝑢2 = 𝜏𝑏 . 𝜏𝜃 là mô men điều khiển bánh xe, 𝜏𝑏 , 𝜏𝜓
lần lượt là mô men điều khiển trục roll và trục pitch.
Các giả thuyết sau đây được đưa ra để tạo điều khiển thuận lợi cho việc thiết kế robot.
Giả thuyết 2.1: Với 𝑖 = 1,2, 𝜉1 = [𝑥1𝑇 , 𝑥2𝑇 ]𝑇 , 𝜉2 = [𝑥3𝑇 , 𝑥4𝑇 ]𝑇 , ‖𝑔𝑖 𝜉𝑖 ‖ ≤ 𝑔𝑖𝑚𝑎𝑥 , ‖𝜅𝑖 𝜉𝑖 ‖ ≤
𝜅𝑖𝑚𝑎𝑥 trong đó 𝑔𝑖𝑚𝑎𝑥 , 𝜅𝑖𝑚𝑎𝑥 là các hằng số dương chưa biết. Giả định 𝑓𝑖 (𝜉𝑖 ) thỏa điều
kiện Lipschitz với ‖𝑓𝑖 (𝜉𝑖 )‖ ≤ 𝛽𝑖 ‖𝜉𝑖 ‖ có 𝛽𝑖 là hằng số dương.
Giả thuyết 2.2: Góc tham chiếu của bánh xe và vận tốc bánh xe 𝜃𝑟𝑒𝑓 , 𝜃̇𝑟𝑒𝑓 thay đổi đều
và có giới hạn.
12