Tải bản đầy đủ (.pdf) (121 trang)

NHẬN DẠNG HỆ TAY MÁY DÙNG MẠNG NEURON

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.47 MB, 121 trang )

Trang 1

CHƯƠNG 1: TỔNG QUAN
1.1 Khái quát vấn đề và các công trình liên quan
Trong sự phát triển không ngừng của khoa học và công nghệ làm xuất
hiện các đối tượng điều khiển có độ phức tạp ngày càng gia tăng, lý thuyết
điều khiển thông minh là phương pháp điều khiển phỏng theo các đặc điểm cơ
bản trí thông minh của con người, bao gồm khả năng học, khả năng xử lý
thông tin không chắc chắn và khả năng tìm lời giải tối ưu, có vai trò hết sức
quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển, độ
ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay
thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại. Hàng
loạt các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi,
điều khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong
những năm gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp
thế giới và những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này.
Alavandar và Nigam [11] phát triển Nơron-Mờ được dựa trên cách tiếp
cận đối với giải pháp động học ngược của cánh tay robot công nghiệp, bằng
cánh sử dụng khả năng của ANFIS ( hệ thống suy diễn nơron mờ thích nghi)
để học từ dữ liệu huấn luyện nhằm tạo ra mạng ANFIS, thực hiện một biểu
diễn hệ thống suy luận mờ điển hình bằng cách sử dụng cấu trúc giống mạng
thần kinh BP. Guez và Ahmad [13] phát triển giải pháp cho vấn đề động học
ngược bằng cách sử dụng mạng nơron trong robot, mạng nơron có thể được
huấn luyện để cho ra một giải pháp khá chính xác sẽ đưa đến tải trọng tối
thiểu trong xử lý tải của mỗi chu kỳ điều khiển và do đó cho phép điều khiển
thời gian thực robot bằng thuật toán lan truyền ngược.
Karlik và Aydinb [14] phát triển cách tiếp cận cải tiến giải pháp của
động học ngược đối với cánh tay robot 6 bậc. Một phương pháp tiếp cận cấu


Trang 2



trúc mạng nơron nhân tạo (ANN) được đề xuất ở đây để điều khiển các
chuyển động của cánh tay robot. Mô hình mạng nơron sử dụng các đơn vị
ngưỡng với hàm chuyển sigmoid và luật học theo kiểu suy giảm độ dốc.
Ngoài ra sử dụng các phương pháp khác nhau như phương pháp số và
các phương pháp thông minh để giải quyết động học thuận và động học
ngược của cánh tay robot công nghiệp được nghiên cứu trong [16]. Trong
thập niên trước đây một số mô hình mạng nơron thích nghi và học kết hợp đã
được áp dụng cho học offline và online của động lực học cánh tay robot [11].
Ahn và Anh [4] đã thành công trong việc tối ưu hóa một mô hình nơron thích
nghi NARX của động học ngược dựa trên cánh tay robot PAM bằng cách sử
dụng thuật toán di truyền. Các tác giả trong [7] đã nhận dạng động học ngược
của cánh tay robot công nghiệp dựa trên mạng nơron thích nghi. Như chúng ta
đã biết, các hệ thống thực là các mô hình phi tuyến hết sức phức tạp nên các
phương pháp thiết kế kinh điển dựa trên điều khiển tuyến tính trong nhiều
trường hợp không đảm bảo được yêu cầu do đặc tính phi tuyến của động học
đối tượng điều khiển, đặc tuyến đầu đo hoặc cơ cấu chấp hành cũng như tính
chất không đầy đủ, chính xác của các mô hình thay thế (chưa biết đặc tính
động học, nhiễu, điều kiện ban đầu).
Sự phát triển không ngừng của khoa học công nghệ làm xuất hiện các đối
tượng điều khiển có độ phức tạp ngày càng tăng. Yêu cầu thực tiễn đặt ra là
phải điều khiển các hệ thống động ngày càng phức tạp, trong điều kiện các
yếu tố bất định ngày càng gia tăng với yêu cầu chất lựợng điều khiển ngày
càng cao. Các yêu cầu trên không thể được đáp ứng một cách trọn vẹn, đồng
thời nếu chỉ dùng các lí thuyết điều khiển thông thường sẵn có. Đây chính là
động lực cho sự ra đời của hàng loạt các lí thuyết điều khiển thông minh hứa
hẹn một hướng giải quyết triệt để các bài toán điều khiển phi tuyến phức tạp.
Nhiều sơ đồ điều khiển dùng mạng nơ ron MLP với thuật toán Lan Truyền



Trang 3

Ngược (Back Propagation - BP) được ứng dụng để giải các bài toán điều
khiển các hệ phi tuyến phức tạp và bất ổn định. Tính thích nghi cho phép mô
hình mạng nơ-ron sau khi được huấn luyện vẫn thực hiện tốt chức năng của
nó dù nhiễu động môi trường và thông số đối tượng điều khiển thay đổi theo
thời gian. Đó là nhờ mô hình mạng nơ ron có khả năng tự cập nhật các trọng
số của mình.
Mạng nơ-rơn nhân tạo là một mô hình toán học đơn giản của bộ não
con người. Các nghiên cứu về mạng nơ-rơn nhân tạo được bắt đầu từ thập
niên 1940. Năm 1944, McCulloh và Pitts là những người đầu tiên đã xuất bản
một công trình nghiên cứu có tính hệ thống về mạng nơ-rơn nhận tạo. Tuy
nhiên nghiên cứu về mạng nơ ron chỉ phát triển mạnh từ sau những năm 1980.
Mối quan tâm về mạng nơ-rơn nhân tạo bắt nguồn từ khả năng của mạng
trong việc mô phỏng, bắt chước khả năng học và phản ứng của bộ no con
người. Kết quả là mạng nơ-rơn nhân tạo đã được ứng dụng trong rất nhiều các
lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, dự báo. Các hệ thống
điều khiển đã chứng tỏ được tính hiệu quả của chúng trong lĩnh vực này. Đến
nay đã có rất nhiều cấu hình mạng và các thuật tóan huấn luyện tương ứng
được công bố để giải quyết các bài tóan khác nhau.
Đã có nhiều công trình nghiên cứu mạng nơ-rơn trong nhận dạng, điều
khiển hệ phi tuyến và đã chứng tỏ được những ưu điểm vượt trội.
Vì lẽ đó trên cơ sở tham khảo bài báo [7] sử dụng mạng nơron thích nghi
(Adaptive neural) để huấn luyện và lập trình của tay máy. Tác giả đã mạnh
dạn sử dụng mô hình mạng nơron thích nghi (Adaptive neural network
model) thông qua mô hình nơ ron thích nghi NARX để huấn luyện, lập trình,
mô phỏng cho hệ tay máy. Các giả định được điều khiển từ GUI ghi lại tất cả
các chuyển động của cánh tay máy. Các dữ liệu ghi lại được sử dụng như tập
dữ liệu dùng để huấn luyện.



Trang 4

Luận văn này đầu tiên phác thảo cơ sở lý thuyết và ứng dụng mô hình
nơron NARX dùng để nhận dạng cho hệ tay máy đa bậc.
Xuất phát từ những lý do nêu trên, học viên quyết định chọn đề tài: “mô
hình hóa, nhận dạng hệ tay máy phi tuyến dùng mô hình mạng nơron thích
nghi” với mục đích sử dụng những ưu điểm của mạng nơ-ron thích nghi, từ
đó đề xuất một thuật toán khả thi để nhận dạng hệ tay máy đa bậc phi tuyến.
Cụ thể là: ứng dụng một số giải thuật để giải bài toán nhận dạng động học hệ
tay máy. Khẳng định ưu thế vượt trội của phương pháp được ứng dụng trong
nhận dạng đối với mô hình này qua đánh giá kết quả mô phỏng sử dụng thuật
toán mô hình nơron thích nghi NARX.
1.2 Giới thiệu luận văn
1.2.1 Phát biểu bài toán
Một trong các vấn đề cơ bản trong lý thuyết điều khiển là nghiên cứu
để sử dụng phản hồi nhằm làm thay đổi động học của đối tượng sao cho đạt
được đặc tính theo mong muốn. Trong luận văn, các nghiên cứu tập trung vào
phương pháp ứng dụng mô hình nơ ron thích nghi NARX để nhận dạng cho
hệ tay máy 3 bậc với mục tiêu là sử dụng mô hình nơron thích nghi NARX để
huấn luyện mô hình động học thuận, ngược của tay máy ba bậc.
1.1.2 Nhiệm vụ của luận văn
1. Thành lập mô hình động học thuận và ngược kinh điển của tay máy theo
quy tắc D_H ( Denavit_Hartenberg).
2. Nghiên cứu giải thuật giải bài toán động học thuận, ngược cho hệ tay máy
ba bậc với mô hình phi tuyến theo các phương pháp sau:
- Phương pháp huấn luyện mạng nơron thích nghi NARX.


Trang 5


- Phương pháp dùng giải thuật học của mạng nơ ron truyền thẳng 3 lớp.
3. Dùng ngôn ngữ lập trình của phần mềm Matlab 7.0 để mô phỏng và nhận
dạng mô hình động nơron thích nghi NARX cho hệ tay máy ba bậc.
1.2.3. Bố cục của luận văn
Với nhiệm vụ thực hiện luận văn ở trên, bố cục của luận văn gồm 5 chương:
Chương 1: Tổng quan
Giới thiệu khái quát một số công trình đã được công bố có liên quan đến điều
khiển thông minh sử dụng mạng nơ-ron thích nghi, ý nghĩa ứng dụng của mô
hình này trong thực tế, mục đích nghiên cứu, nhiệm vụ thực hiện và nội dung
sơ lược của luận văn.
Chương 2: Cơ sở lý thuyết
Lý thuyết điều khiển mạng nơ-ron, thích nghi, giải pháp điều khiển sử dụng
mô hình nơron thích nghi NARX cho hệ phi tuyến và thuật toán lan truyền
ngược huấn luyện mạng nơ-ron truyền thẳng 3 lớp.
Chương 3: Xây dựng mô hình động học thuận và ngược kinh điển theo quy
tắc D_H (Denavit_Hartenberg)
Trình bày chi tiết bài toán động học thuận và ngược kinh điển theo quy tắc
D_H.
Chương 4: Giải pháp để huấn luyện mô hình nơron thích nghi NARX của tay
máy ba bậc
Trình bày bài toán nhận dạng cho hệ tay máy 3 bậc, giải thuật nhận dạng theo
các phương pháp và kết quả mô phỏng của từng phương pháp:


Trang 6

- Giải thuật nhận dạng sử dụng mô hình nơron thuận thích nghi NARX dùng
thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số
kết nối của mạng.

- Giải thuật nhận dạng sử dụng mô hình nơron ngược thích nghi NARX dùng
thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số
kết nối của mạng.
Chương 5: Kết quả mô phỏng bằng Matlab Simulink
Chương 6: Kết luận và hướng phát triển của đề tài
Phân tích, đánh giá các kết quả đã thực hiện, khẳng định tính ưu việt của
phương pháp được lựa chọn cho mô hình này. Rút ra những vấn đề chưa thực
hiện được trong luận văn và đề xuất hướng phát triển của đề tài.


Trang 7

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Mạng nơ-rôn nhân tạo
Mạng nơ-rôn nhân tạo là mô hình toán học đơn giản của bộ não con người.
Các nghiên cứu về mạng nơ ron nhân tạo đã bắt đầu từ thập niên 1940. McCulloch
và Pitts là những người đầu tiên đã xuất bản một công trình nghiên cứu có tính hệ
thống về mạng nơ-rôn nhận tạo. Tuy nhiên nghiên cứu về mạng nơ-rôn chỉ phát
triển mạnh từ sau những năm 1980. Mối quan tâm về mạng nơ-rôn nhân tạo bắt
nguồn từ khả năng của mạng trong việc mô phỏng, bắt chước khả năng học và phản
ứng của bộ não con người. Kết quả là mạng nơ ron nhân tạo đã được ứng dụng
trong rất nhiều các lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, các hệ
thống điều khiển, dự báo… và cũng đã chứng tỏ được tính hiệu quả của chúng
trong lĩnh vực này. Đến nay đã có rất nhiều cấu hình mạng và các thuật toán huấn
luyện tương ứng được công bố để giải quyết các bài toán khác nhau.
2.1.1 Khái quát về mạng nơ-rôn nhân tạo
Nơ-rôn nhân tạo là một thành phần cơ bản và quan trọng nhất của một mạng
nơ-rôn nhân tạo. Năm 1943 McCulloch và Pitts đã đề xuất mô hình nơ ron nhân
tạo đầu tiên được mô tả như hình 2.1.
x1


w i1

x2

w i2

xn
Ngõ
vào

yi

θi

Đơn vị xử


w in

Ngõ
ra

Nút

Hình 2.1 Cấu trúc một nơ ron nhân tạo


Trang 8


Trong đó X = [x1 , x2 ,..., xn ]T là ngõ vào từ môi trường ngoài hay ngõ ra
của đơn vị xử lý khác, y là ngõ ra của nơ-rôn. Các giá trị W = [wi1 , wi 2 ,..., win ]T là
các trọng số kết nối với các nơ-rôn khác để xác định cường độ của vector ngõ
vào. Do đó giá trị ngõ vào hàm kích hoạt là XTW. Tuỳ thuộc vào hàm kích
hoạt, nếu trọng số là dương XTW sẽ kích thích nơ-rôn ở ngõ ra và ngược lại.
Đơn vị xử lý tính tổng trọng số của các ngõ vào và tạo lại tín hiệu ra yi = 1
hoặc yi = 0 nếu giá trị tổng của nó ở trên hoặc dưới mức ngưỡng θ i . Trong đó
giá trị θ i là giá trị biên độ lệch ảnh hưởng đến sự kích hoạt ngõ ra nơ-rôn.
Trên cơ sở đó, mô hình toán đơn giản cho đơn vị xử lý i:
y i (t + 1) = a ( X T W − θ i )

(2.1)

Trong đó, hàm tác động a(f) là một hàm bậc thang đơn vị.
2.1.2 Các thành phần cơ bản của mạng nơ-rôn nhân tạo
Có 3 thành phần cơ bản của các mạng nơ-rôn nhân tạo: đó là đơn vị
xử lý, mô hình kết nối và luật học.
2.1.2.1 Đơn vị xử lý
Một mạng nơ-rôn có nhiều lớp: lớp vào, lớp ẩn và lớp ra. Lớp vào phục
vụ như nơi chứa tín hiệu vào, các lớp ẩn chứa các nơ-rôn được xem như các
đơn vị xử lý, lớp ra chứa các nơ-rôn để ra quyết định.
Kết hợp với mỗi đơn vị xử lý có hàm tổng hợp và hàm kích hoạt, hàm
tổng hợp có chức năng tổng hợp tất cả tín hiệu vào và hàm kích hoạt có chức
năng tạo tín hiệu ra.
a. Hàm tổng hợp
Hàm tổng hợp có thể là dạng tuyến tính hoặc phi tuyến
+ Hàm tổng hợp dạng tuyến tính


Trang 9


m

f i = net i = ∑ wij x j − θ i

(2.2)

j =1

+ Hàm tổng hợp dạng phi tuyến
m

f i = net i = ∑ wij x 2j − θ i

(2.3)

j =1

b. Hàm kích hoạt
Có nhiều kiểu hàm kích hoạt khác nhau nhưng trong luận văn chỉ trình
bày một số hàm kích hoạt phổ biến. Các kiểu hàm kích hoạt khác cũng có thể
sử dụng tuỳ thuộc vào bài toán mà mạng nơ-rôn đang giải quyết.
+ Hàm nấc : (H.2.2.a)

⎧1 neáu
a( f ) = ⎨
⎩0 neáu

+ Hàm dấu : (H.2.2.b)


⎧ 1 neáu
a( f ) = ⎨
⎩− 1 neáu

+ Hàm tuyến tính bão hoà: (H.2.2.c)

f ≥0
f <0

(2.4)

f ≥0
f <0

(2.5)

f >1
⎧ 1 neáu

a ( f ) = ⎨ f neáu 0 ≤| f |≤ 1
⎪− 1 neáu
f < −1


(2.6)
+ Hàm Sigmoid: (H.2.2.d)

a( f ) =

1

1 + e − λf

(2.7)

Trong đó, λ là hệ số hình dạng của hàm Sigmoid, bằng cách thay đổi
hệ số này có thể thay đổi dạng của các hàm Sigmoid minh chứng như hình vẽ.
+ Hàm hyperpolic (Tang-hyperbol): (H.2.2.e)

a( f ) =

e λf − e − λf
e λf + e − λf

(2.8)
Trong đó, λ là hệ số hình dạng của hàm hyperpolic đặc trưng như hình (e)


Trang 10

Khi sử dụng các phương trình (2.7) và (2.8) có một điều cần lưu ý là
đạo hàm của 2 phương trình này có thể biểu diễn bằng các hàm của chính nó.
Đây là một ưu điểm rất quan trọng để phát triển các thuật toán học cho mạng
nơ-rôn có sử dụng một trong 2 phương trình trên.

1

1

1


0
f

a)

d)

a(f)

a(f)

a(f)

f

-1

0

f

0
f
-1

-1

b)

c)


e)

Hình 2.2 Các dạng hàm kích hoạt thường dùng

1

f


Trang 11

2.1.2.2 Luật học
Một thành phần quan trọng của mạng nơ ron đó là luật học, có hai loại
đó là học thông số và học cấu trúc. Học thông số là cập nhật các trọng số kết
nối trong mạng và học cấu trúc là tập trung vào việc thay đổi cấu trúc, bao
gồm số đơn vị xử lý và loại kết nối. Hai thuật toán học này có thể thực hiện
đồng thời hoặc tách rời. Hiện nay bài toán học on-line đồng thời cả thông số
và cấu trúc của mạng đã, đang được nghiên cứu và đưa vào ứng dụng trong
nhiều lĩnh vực khác nhau.
2.1.2.3 Mô hình kết nối
Mô hình kết nối của mạng nơ ron hay còn gọi là cấu trúc mạng. Có hai
mô hình kết nối trong các mạng nơ ron đó là mô hình kết nối truyền thẳng
(mạng truyền thẳng) và mô hình kết nối lan truyền ngược (mạng hồi quy).
Tùy thuộc vào số lớp của mạng mà ta có mạng truyền thẳng một lớp
hay nhiều lớp, cấu trúc của mạng phải phù hợp với từng bài toán cụ thể.
Ví dụ 2.1: Để giải bài toán XOR nếu dùng mạng truyền thẳng một lớp
không giải quyết được mà phải dùng mạng truyền thẳng 3 lớp. Cấu trúc mạng
như hình 2.3 Với ngõ vào 00, tổng có trọng số của nơ-rôn A1 và nơ-rôn A2 là
0 dẫn đến ngõ ra là 0, lúc này tổng có trọng số của nơ-rôn B là 0 < 0.5 vì thế

ngõ ra của mạng y = 0. Với ngõ vào 01, tổng có trọng số nơ-rôn A1 là 1 > 0.5
dẫn đến ngõ ra là 1, tổng có trọng số nơ ron A2 là 1 < 1.5 dẫn đến ngõ ra là 0.
Tổng có trọng số nơ-rôn B là 1 > 0.5 vì thế ngõ ra của mạng y = 1. Tương tự
như vậy cho trường hợp 10. Đối với ngõ vào 11, tổng có trọng số của nơ-rôn
A1 và A2 đều là 2 >1.5 dẫn đến ngõ ra 2 nơ ron này đều là 1. Tổng có trọng số
của nơ-rôn B là 0 < 0.5 dẫn đến ngõ ra y = 0. Như vậy bài toán XOR đã được
giải quyết đúng đắn.


Trang 12

Hình 2.3 Giải bài toán XOR dùng mạng truyền thẳng 3 lớp
Sự khác nhau cơ bản giữa mạng hồi quy và mạng truyền thẳng là thông
tin có thể lan truyền theo 2 hướng trong mạng hồi quy. Có 2 loại mạng hồi
quy là hồi quy bán phần và hồi quy toàn phần.
2.1.3 Một số mạng nơron cơ bản
2.1.3.1 Mạng nơ-ron một lớp
Mạng nơ-ron một lớp là cấu trúc mạng nơ ron đơn giản nhất nó có cấu trúc
như hình 2.4, mạng chỉ gồm một lớp nơ-ron.

Hình 2.4 Mạng nơ ron một lớp
Thuật toán huấn luyện cho mạng nơ-ron một lớp có đặc điểm:
+ Giá trị ban đầu của trọng số và ngưỡng là những giá trị ngẫu nhiên
+ Tính toán theo từng mẫu ngõ vào và ngõ ra mong muốn
+ Ngõ ra của mạng được tính theo phương trình: y = f ( X TW )


Trang 13

+ Luật cập nhật trọng số được thực hiện theo biểu thức

(2.9)

wij (t + 1) = wij (t ) + η [ d i (t ) − yi (t )] x (t)

Trong đó η là tốc độ học; di (t ) là ngõ ra mong muốn thứ i.
Có nhiều thuật toán huấn luyện cho mạng nơ ron một lớp như thuật toán
Perceptron, thuật toán Widrow-Hoff... Nhưng thuật toán Widrow-Hoff hay
được sử dụng hơn, thuật toán này tính toán sai lệch giữa ngõ ra mong muốn
với ngõ ra thực sự của mạng Δ = d(t) − y(t) với d(t) là ngõ ra mong muốn của
mạng và y(t) là ngõ ra của mạng. Sau đó luật cập nhật trọng số của mạng
được tính theo (2.9).
2.1.3.2 Perceptron nhiều lớp (mạng MLP)
z1

ω1

x1

z2

x2

.
.
.

.
.
.


ω2

v1

ω3

.
.
.

z3 .
.
.

xn

zl

v9

y1

.
.
.
yp

ωl

Hình 2.5 Mạng nơron nhiều lớp ( mạng MLP)

Đã có nhiều công trình trình bày nhiều thuật học cho mạng MLP và chỉ
rõ sức mạnh của những lớp mô hình này. Cần nhắc tới là thuật toán lan truyền
ngược (the Back-Propagation Learning Algorithm) và khả năng xấp xỉ hàm
liên tục bằng mạng MLP.


Trang 14

Thuật toán lan truyền ngược cụ thể như sau: Tập dữ liệu đã cho có N
mẫu (xn, dn), n = 1,2, … , N. Với mỗi n, xn là tín hiệu đầu vào, dn là đầu ra
mong muốn. Quá trình huấn luyện thực chất là làm cực tiểu hàm G với
G=

N

∑G
n =1

n

, với Gn =

1
N



N
q


(2.10)

( yq ( xn ) − dq ( xn )) 2

Q là số nút tại lớp ra của mạng. Còn trọng số liên kết mạng được điều
chỉnh theo phép lặp sau:
ω (k + 1) = ω (k ) − μ

∂G
∂ω

Trong đó μ > 0 là hằng số tỷ lệ học

Mạng nơ ron nhiều lớp lan truyền ngược là một giải pháp hữu hiệu cho
công việc mô hình hóa, đặc biệt với quá trình phức tạp hoặc cơ chế chưa rõ
ràng. Nó không đòi hỏi biết trước dạng hàm hoặc các tham số.
Mạng truyền thẳng nhiều lớp được sử dụng để biểu diễn chính xác và
biểu diễn xấp xỉ các hàm phi tuyến. Một công cụ cơ bản là sử dụng định lý
kolmogorov như sau:
Gọi In là khối n chiều của đoạn [0,1], In = [0,1]n . Bất kỳ hàm liên tục
f(x1, x2…., xn) nào của n biến x1, x2…., xn trên In đều có thể biểu diễn dưới dạng
f(x1, x2…., xn) =

2 n +1

n

j =1

i =1


∑ h j ∑ gij xi

(2.11)

Trong đó hj, gij là hàm liên tục một biến, hơn nữa gij là hàm đơn điệu cố
định không phụ thuộc vào hàm f.
2.1.3.3 Mạng nơron với hàm cơ sở xuyên tâm (Mạng RBF)
Hàm cơ sở xuyên tâm đã có từ lâu trong lý thuyết xấp xỉ và được sử
dụng để xấp xỉ hàm chưa biết dựa trên cơ sở các cặp điểm vào- ra biểu diễn
hàm chưa biết đó.
Trong nhận dạng mô hình hệ thống RBF có thể biểu diễn theo cấu trúc
mạng perceptron. Mọi hệ phi tuyến có thể xấp xỉ bằng RBF. Đây là đặc điểm
làm cho RBF đặc biệt phù hợp với bài toán nhận dạng mô hình.


Trang 15

Đối với mỗi hàm, việc xấp xỉ được lưu giữ trong các trọng số và tâm của
RBF. Tuy nhiên các trọng số này không phải là duy nhất RBF có biểu diễn
toán học như sau:
N −1

F ( x ) = C0 + ∑ Ciϕ (|| x − Ri ||)

(2.12)

i =0

Trong đó

C – véc tơ chứa trọng số RBF
R – véc tơ chứa các tâm RBF
ϕ - hàm cơ sở hoặc hàm kích hoạt của mạng

F(x) - hàm nhận được từ đầu ra của mạng
C0 hệ số chệch (có thể là 0)
|| . || - chuẩn euclidean
Mỗi tâm R j có cùng số chiều với véc tơ đầu vào. Các tâm cũng là các
điểm bên trong không gian giữ liệu đầu vào và được chọn sao cho chúng là
thể hiện của dữ liệu đầu vào. Khi RBF tính toán quá trình xấp xỉ đối với một
số điểm dữ liệu đầu vào thì khoảng cách giữa các điểm đầu vào và mỗi tâm
được tính theo khoảng cách euclidean. Những khoảng cách này được chuyển
qua ϕ sau đó được trọng số hóa bằng Ci và được tổng hợp lại để sinh ra toàn
bộ RBF. Một trong những lựa chọn thông thường nhất là hàm Gauss:
( x − a)2
)
ϕ ( x) = exp(−


(2.13)

Trong đó σ là tham số tỷ lệ
Mạng RBF được Moody và Darken đề xuất năm 1989 dựa trên sự tương
đồng giữa triển khai hàm cơ sở xuyên tâm và mạng nơ ron một lớp ẩn.
Nhờ khả năng xấp xỉ các hàm phi tuyến bất kỳ với độ chính xác tùy ý, mạng
nơron và sau này là hệ mờ nơron sẽ là công cụ quan trọng, đặc biệt là mạng


Trang 16


RBF, cho mô hình hóa hệ thống và cho điều khiển thích nghi các hệ thống phi
tuyến.
2.1.3.4 Luật học Delta-Bar-Delta
Phương pháp suy giảm độ dốc (gradient descent) là một trong những
phương pháp tối ưu hóa đơn giản nhất thường được áp dụng để cập nhật trọng
số kết nối của mạng nơ-ron truyền thẳng. Phương pháp này có ưu điểm là quá
trình học ổn định, nhưng nhược điểm là tốc độ học chậm. Một trong những
phương pháp làm tăng tốc độ huấn luyện của mạng và cải thiện độ hội tụ của
thuật toán là sử dụng luật học Delta-Bar-Delta. Thuật toán này điều chỉnh giá
trị học thông qua quan sát sự biến thiên tín hiệu suy giảm độ dốc trung bình
theo quy luật hàm mũ. Quá trình này được mô tả như sau [7]:
+ Chọn một vài giá trị khởi đầu nhỏ cho tốc độ học η (0)
+ Thích nghi tốc độ học:
η (t ) = η (t − 1) * a nếu

δE
δE
(t ).
(t − 1) ≥ 0
δw δw

η (t ) = η (t − 1) * b nếu

δE
δE
(t ).
(t − 1) ≤ 0
δw δw

(2.14)


η (t ) = η (t − 1) nếu ngoài các điều kiện trên

Tuy nhiên rất khó chọn các giá trị a,b. Nếu chọn các giá trị này nhỏ thì khả
năng thích nghi chậm, nếu chọn giá trị lớn thì gây nguy hiểm cho quá trình
học.
2.1.4 Mạng nơ ron trong các hệ thống điều khiển
Mạng nơ ron được sử dụng trong các hệ thống điều khiển có ưu điểm là
chúng có khả năng học xấp xỉ bất kỳ một hàm phi tuyến nào, cho dù hàm đó
có bậc cao, với độ chính xác có thể đạt như ý muốn. Có bốn cấu hình chuẩn
của mạng nơ ron được đưa ra để ứng dụng cho các hệ thống điều khiển: sao
chép từ một bộ điều khiển sẵn có, nhận dạng hệ thống, nhận dạng hệ thống
đảo và điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron.


Trang 17

2.1.4.1 Cấu hình sao chép từ một bộ điều khiển sẵn có
Nếu một bộ điều khiển có khả năng điều khiển đối tượng thì thông tin
được yêu cầu để huấn luyện một mạng nơ ron có thể được thu thập từ bộ điều
khiển này. Đầu ra mong muốn của mạng là đầu ra của bộ điều khiển sẵn có,
và đầu vào của mạng là đầu ra của đối tượng. Mục tiêu của ứng dụng này là
để sao chép lại thông tin từ một bộ điều khiển sẵn có.

Hệ thống

Bộ điều
khiển

y(d)


y(k)

Hình 2.6 Cấu hình sao chép từ một bộ điều khiển sẵn có
2.1.4.2 Cấu hình nhận dạng hệ thống
Dữ liệu huấn luyện mạng có thể được thu thập bằng cách giám sát cặp
vào ra của đối tượng mạng nhận cùng đầu vào với đối tượng, còn đầu ra của
đối tượng là đầu ra mong muốn của mạng.


Trang 18

Hệ thống

Y(d)

Y(k)

Hình 2.7 Cấu hình nhận dạng hệ thống
2.1.4.3 Cấu hình nhận dạng hệ thống đảo
Một mạng nơ ron có thể được sử dụng để nhận dạng đảo một đối
tượng, trong đó đầu vào của mạng là đầu ra mong muốn của đối tượng, còn
đầu ra mong muốn của mạng là đầu vào của đối tượng.

Y(d)

Hệ thống

Y(k)


Hình 2.8 Cấu hình hệ thống nhận dạng đảo


Trang 19

2.1.4.4 Điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron
Các phương pháp điều khiển đối tượng phi tuyến sử dụng các mạng nơ
ron thường được sử dụng là phương pháp điều khiển thích nghi trực tiếp (direct
adaptive control), phương pháp điều khiển thích nghi gián tiếp ( indirect
adaptive control), phương pháp điều khiển tối ưu, Fuzzy… trong nội dung
chương bốn của luận văn ta sẽ nghiên cứu kỹ về phương pháp nhận dạng sử
dụng mô hình nơ ron thích nghi NARX.
2.1.5 Mô hình nơ ron thích nghi NARX
Mạng nơ ron có thể phân thành 2 loại đó là mạng động (NNARX) và
mạng tĩnh (ANN). Mạng tĩnh không có phần tử phản hồi và không bao gồm sự
chậm trễ, các đầu ra là tính toán trực tiếp từ các đầu vào thông qua kết nối
truyền thẳng. Mạng động, các đầu ra không những phụ thuộc vào đầu vào hiện
tại của mạng mà còn phụ thuộc vào hướng hay đầu vào trước đó, đầu ra hay
trạng thái của mạng. Mạng động hầu hết mạnh hơn nhiều so với mạng tĩnh
(mặc dù hơi khó khăn hơn trong việc huấn luyện). Bởi vì mạng động có bộ
nhớ, chúng có thể được đào tạo để học liên tiếp hoặc thay đổi thời gian mô
hình.
Mô hình này có một thành phần tham số cộng với một phần phi tuyến,
nơi mà một phần phi tuyến là xấp xỉ bởi một lớp ẩn truyền thẳng ANN. Các
mạng (NNARX) là mạng năng động hiện nay, với các kết nối thông tin phản
hồi kín vài lớp của mạng. Mô hình NNARX dựa trên mô hình tuyến tính ARX,
nó thường được sử dụng trong mô hình chuỗi thời gian.
Phương trình xác định cho mô hình NNARX như sau:
y (t ) = f ( y (t − 1), y (t − 2),... y (t − n y ), u (t − 1), u (t − 2),...u (t − nu ))


(2.15)

Trường hợp, giá trị kế tiếp phụ thuộc vào tín hiệu đầu ra y (t) là quay
trở lại giá trị trước đó của tín hiệu đầu ra và giá trị trước đó của một tín hiệu
đầu vào độc lập (ngoại sinh). Đầu ra là phản hồi trở lại đầu vào của mạng


Trang 20

truyền thẳng, như phần mẫu cấu trúc NNARX được biểu diễn ở hình 2.9 a. Bởi vì
đầu ra thực là có được trong việc huấn luyện mạng, chúng ta có thể tạo ra một dãy
cấu trúc song song ở hình 2.9 b, trong đó đầu ra thực được sử dụng thay cho phản
hồi đầu ra ước lượng. Điều này có hai ưu điểm. Đầu tiên là đầu vào cho mạng
truyền thẳng là chính xác hơn. Thứ hai là kết quả cấu trúc mạng đã hoàn truyền
thẳng, cấu trúc và lan truyền ngược tĩnh có thể được sử dụng cho huấn luyện.
u(t)

T
D
L
T
D
L

Mạng
truyền
thẳng

u(t)
Λ


y (t)

y(t)

T
D
L
T
D
L

Mạng
truyền
thẳng

Λ

y (t)

a) Cấu trúc song song
b) Dãy cấu trúc song song
Hình 2.9 Mạng truyền thẳng
Mạng động là huấn luyện giống như thuật toán suy giảm độ dốc được
sử dụng trong "lan truyền ngược." Mặc dù chúng có thể được đào tạo bằng
cách sử dụng các thuật toán dựa trên suy giảm độ dốc cũng được sử dụng cho
các mạng tĩnh, hiệu quả của các thuật toán trên mạng động có thể khá khác
nhau, và độ dốc phải được tính toán một cách phức tạp hơn .
Đầu vào


Lớp 1

Lớp 2

Hình 2.10 Sơ đồ cấu trúc nơ ron thích nghi NARX


Trang 21

Một sơ đồ kết quả của mạng được hiển thị bằng hình 2.10, nơi mà một
mạng truyền thẳng hai lớp được sử dụng để ước lượng.
Đây là loại trọng số của mạng có hai tác động khác nhau trên đầu ra
mạng. Đầu tiên là tác động trực tiếp, vì một sự thay đổi trong trọng số gây ra
một thay đổi ngay lập tức trong đầu ra ở các bước thời gian hiện tại (đây là
hiệu quả đầu tiên có thể được tính bằng cách sử dụng tiêu chuẩn lan truyền
ngược). Thứ hai là tác động gián tiếp, bởi vì một số đầu vào tới các lớp, chẳng
hạn như a(t, 1), cũng là hàm của các trọng số. Để giải thích cho tác động gián
tiếp, chúng ta phải sử dụng mạng lan truyền ngược động để tính toán độ dốc.
Mạng lan truyền ngược động có nhiều thời gian hơn để huấn luyện,
ngoài ra, sai số ngoài cho mạng động có thể phức tạp hơn so với mạng tĩnh.
Huấn luyện có nhiều khả năng bị mắc kẹt tại cực tiểu địa phương. Điều này
cho thấy chúng ta có thể cần phải huấn luyện mạng nhiều lần để đạt được một
kết quả tối ưu.
2.2 Kết luận
Qua nội dung lý thuyết đã trình bày, ta có thể nhận thấy rõ nét những ưu
nhược điểm của mạng nơ ron là:
+ Ưu điểm:
• Tính phi tuyến (nonlinearity).
• Mô hình tổng quát cho ánh xạ từ tập vào đến tập ra (input-output mapping):
Nonparametric models.

• Tính thích ứng (adaptivity): training, online-training, nonstationary
environments.
• Chấp nhận lỗi (Fault Tolerance).
• Thích ứng với nhiễu dữ liệu (noise).
• Khả năng song song: Parallelism, VLSI implementation.


Trang 22

+ Nhược điểm:
• Tiếp cận hộp đen : không thích hợp trong những trường hợp cần sự giải
thích cho tri thức tiếp nạp.
• Thách thức về việc tích hợp các mạng nơ ron cỡ lớn như não bộ của con
người.
• Việc thiết kế, xác định một số thông số của mạng nơ ron đòi hỏi có nhiều
kinh nghiệm .
• Việc thay đổi cấu trúc tương đối hạn chế gặp khó khăn khi lời giải đòi hỏi
phải có cấu trúc phức tạp hay biến đổi.
Bên cạnh đó, giải pháp nhận dạng sử dụng mô hình nơ-ron thích nghi NARX
là chiến lược nhận dạng được sử dụng cho các đối tượng phi tuyến. Mô hình
nhận dạng sử dụng mô hình nơ ron thích nghi NARX ghi lại các chuyển động
tại các thời điểm rời rạc trong một phạm vi dự kiến nhất định. Dựa vào đáp
ứng dự kiến này để tính toán chuỗi tín hiệu vào ra tương lai trong phạm vi
nhận dạng sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu tham
chiếu cho trước là tối thiểu.
Kết hợp những ưu điểm nổi trội của mạng nơ-ron và phương pháp sử dụng
mô hình nơ-ron thích nghi NARX, trong chương tiếp theo, học viên trình bày
một số vấn đề về xây dựng mô hình động học thuận, ngược kinh điển theo
quy tắc D_H. Những nội dung này là công cụ lý thuyết để giải bài nhận dạng
cho hệ phi tuyến và áp dụng cụ thể vào hệ tay máy 3 bậc được đề cập trong

chương 4.


Trang 23

CHƯƠNG 3: XÂY DỰNG MÔ HÌNH ĐỘNG
HỌC THUẬN VÀ NGƯỢC KINH ĐIỂN CỦA
TAY MÁY BA BẬC THEO QUY TẮC D_H
(DENAVIT_HARTENBERG)
3.1 Đặt vấn đề
Mục đích của chương này là xây dựng bài toán thuận và ngược theo
quy tắc D_H. Tìm mối liên hệ giữa các khâu, được xác định trong các hệ tọa
độ địa phương và thể hiện qua các hệ tọa độ suy rộng qi của chúng, với tọa độ
của chúng được thể hiện trong hệ tọa độ cơ sở đối với bài toán thuận và cho
trước cơ cấu tay máy và yêu cầu dịch chuyển ( vị trí và hướng ) của các khâu
tác động cuối được mô tả trong hệ tọa độ Descartes, ta phải xác định quy luật
chuyển động của các khâu thành viên thông qua các biến di chuyển đối với
bài toán ngược.
3.2 Xây dựng mô hình động học thuận và ngược kinh điển theo quy tắc
D_H
3.2.1 Cơ sở động học về Robot
3.2.1.1 Vị trí và hướng của vật rắn trong không gian
Xét vật rắn B trong hệ quy chiếu cố định Ox0y0z0 (hình 3.1). Lấy A là một
điểm nào đó thuộc vật rắn B. Gắn chặt vào vật rắn B hệ quy chiếu động Axyz.
Hệ tọa độ Ox0y0z0 được dùng làm hệ tọa độ gốc, hệ tọa độ Axyz gọi là hệ tọa
JG (0) JJG (0) JG (0)

độ vật. Ký hiệu e1 , e2 , e3

JG JJG


là các vectơ đơn vị trên hệ trục Ox0y0z0, e1 , e2 ,

JG
e3 là các vectơ đơn vị trên hệ trục Axyz.


Trang 24

Hình 3.1 Vị trí và hướng của vật rắn trong không gian
Vị trí của vật rắn B đối với hệ quy chiếu cố định Ox0y0z0 được xác định
bởi vị trí của hệ quy chiếu Axyz đối với hệ quy chiếu Ox0y0z0, tức là được xác
định bởi vị trí của điểm A và hướng của hệ tọa độ Axyz so với hệ tọa độ
Ox0y0z0.
Vị trí của điểm A được xác định thông qua vectơ:
JJG
JG (0)
JJG (0)
JG (0)
rA = x A(0) e1 + y A(0) e2 + z (0)
A e3

(3.1)

Để định hướng hệ tọa độ Axyz so với hệ tọa độ Ox0y0z0, người ta dùng
khái niệm ma trận cosin chỉ hướng.
Định nghĩa ma trận vuông cấp 3:
⎡ →(0) →
⎢ e1 . e1
⎢ →(0) →

R = ⎢ e2 . e1
⎢ →(0) →
⎢ e3 . e1


→(0) →

e1 . e2

→(0) →

e2 . e2

→(0) →

e3 . e2


e1 . e3 ⎥
⎡ r11
→(0) → ⎥
e2 . e3 ⎥ = ⎢⎢ r21
→(0) → ⎥
⎢r
e3 . e3 ⎥ ⎣ 31

→(0) →

r12
r22

r32

r13 ⎤
r23 ⎥⎥
r33 ⎥⎦

(3.2)

Là ma trận cosin chỉ hướng của vật rắn B đối với hệ quy chiếu Ox0y0z0
(hình 3.2), với:


Trang 25

→ (0) →
⎛ →(0) → ⎞
rij = ei . e j = cos ⎜ ei , e j ⎟ (i, j = 1, 2,3)



(3.3)

Từ định nghĩa trên trong hệ quy chiếu Ox0y0z0 ta có các hệ thức liên hệ:


e1 = r11.e1→(0) + r21.e2→(0) + r31.e3→(0)


e2 = r12 .e1→(0) + r22 .e2→(0) + r32 .e3→(0)


(3.4)



e3 = r13 .e1→(0) + r23 .e2→(0) + r33 .e3→(0)

Ma trận cosin chỉ hướng R còn được gọi là ma trận quay của vật rắn.

Hình 3.2 Các phép quay quanh trục x0, y0, z0
Quy ước hướng quay dương là hướng quay ngược chiều kim đồng hồ như
hình. Các phép quay quanh trục x, y, z của hệ tọa độ vuông góc Oxyz được
gọi là phép quay cơ bản.
Ma trận quay cơ bản của phép quay quanh các trục x0, y0, z0:


×