Giải thuật điều khiển tối ưu robot scara

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.54 MB, 76 trang )

Đại Học Quốc Gia Tp. Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGÔ NHỰT QUANG

GIẢI THUẬT ĐIỀU KHIỂN TỐI ƯU
ROBOT SCARA
Chuyên Nghành: TỰ ĐỘNG HĨA

LUẬN VĂN THẠC SĨ

Tp. HỒ CHÍ MINH, tháng 12 năm 2008

CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học : ............................................................................

Cán bộ chấm nhận xét 1 :...................................................................................

Cán bộ chấm nhận xét 2 :...................................................................................

Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN
THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày . . . . . tháng . . . . năm . . . . .

ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
----------------

CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc
---oOo--Tp. HCM, ngày 28 tháng 11 năm 2008

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ và tên học viên: Ngơ Nhựt Quang

Giới tính : Nam

Ngày, tháng, năm sinh : 24/9/1982

Nơi sinh : Tiền Giang

Chuyên ngành : Điện Tử- Tự Động Hóa
Khố (Năm trúng tuyển) : 2006

1- TÊN ĐỀ TÀI: GIẢI THUẬT ĐIỀU KHIỂN TỐI ƯU ROBOT SCARA
2- NHIỆM VỤ LUẬN VĂN:
- Nghiên cứu giải thuật điều khiển tối ưu kết hợp mạng nơ ron (mạng RBF) điều khiển tay máy
scara.
- Mô phỏng giải thuật điều khiển sử dụng phần mềm Matlab 7.01
- Thực hiện mạch driver điều khiển servo motor DC
- Nghiên cứu thiết kế mạch điều khiển và giao tiếp máy tính dùng phần mềm Matlab 7.01 điều

khiển cánh tay robot 2 bậc tự do.
3- NGÀY GIAO NHIỆM VỤ : Tháng 12 năm 2007
4- NGÀY HOÀN THÀNH NHIỆM VỤ : Tháng 12 năm 2008
5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN.:
PGS.TS. Hồ Đắc Lộc
Nội dung và đề cương Luận văn thạc sĩ đã được Hội Đồng Chuyên Ngành thông qua.

CÁN BỘ HƯỚNG DẪN
(Họ tên và chữ ký)

CHỦ NHIỆM BỘ MÔN
QUẢN LÝ CHUYÊN NGÀNH
(Họ tên và chữ ký)

LỜI CẢM ƠN
Tác giả chân thành cảm ơn các thầy cô bộ môn Điều Khiển Tự Động, những người
đã truyền đạt kiến thức và kinh nghiệm cho tôi trong quá trình học tập cũng như
trong thời gian thực hiện luận văn.
Tác giả đặc biệt gửi lời cảm ơn đến PGS.TS. HỒ ĐẮC LỘC đã truyền đạt những
kiến thức quý báu và hướng dẫn rất tận tình để tơi hồn thành luận văn này.

Tác giả
NGÔ NHỰT QUANG

i

TĨM TẮT

Bài luận văn trình bày ứng dụng của phương pháp tối ưu tồn phương
tuyến tính kết hợp với mạng nơron để tìm luật điều khiển hồi tiếp tối ưu cho
đối tượng phi tuyến là robot scara. Phương pháp đã áp dụng phương trình
Hamilton-Jacobi-Bellman để tìm luật điều khiển tối ưu cho hệ thống robot
bằng việc giải phương trình đại số Riccati. Nhiệm vụ của mạng nơron là sắp xỉ
tất cả những đặc tính phi tuyến khơng tường minh của hệ thống và ảnh hưởng
của môi trường làm việc lên hệ thống. Luật học thích nghi của mạng nơron thu
được từ phân tích ổn định hệ thống theo tiêu chuẩn Lyapunov. Kết quả mô
phỏng trên tay máy robot 2 bậc tự do dùng phần mềm matlab cho thấy hàm chỉ
tiêu chất lượng đề ra được thỏa mãn dưới tầm rộng của sai số mơ hình và ảnh
hưởng của mơi trường.

ii

MỤC LỤC
LỜI CẢM ƠN

i

TÓM TẮT LUẬN VĂN

ii

MỤC LỤC

iii

Chương 1 : GIỚI THIỆU ĐỀ TÀI

1

1.1 Lý do chọn đề tài

1

1.2 Tổng quan

1

1.3 Giới thiệu hệ thống

2

1.4 Yêu cầu luận văn

3

1.5 Tóm tắt nội dung luận văn

4

Chương 2 : CƠ SỞ LÝ THUYẾT

5

2.1 Mạng nơrôn nhân tạo

5

2.2 Điều khiển tối ưu

23

2.3 Tiêu chuẩn ổn định Lyapunov

30

2.4 Đặc tính và động học cánh tay robot

31

Chương 3 : THIẾT KẾ BỘ ĐIỀU KHIỂN CÁNH TAY MÁY

33

3.1 Xây dựng mơ hình tốn động học thuận, ngược, và mơ hình động lực học
của Robot SCARA

33

3.2 Thiết kế bộ điều khiển tay máy

35

Chương 4: MÔ PHỎNG VÀ KẾT QUẢ

44

4.1 Khảo sát bộ điều khiển tối ưu H-J-B

48

4.2 Khảo sát bộ điều khiển kết hợp mạng nơron và bộ điều khiển tối ưu 52
Chương 5: MƠ HÌNH VẬT LÝ

55

TÀI LIỆU THAM KHẢO

61

PHỤ LỤC

62

iii

Chương 1

GIỚI THIỆU ĐỀ TÀI
1.1 LÝ DO CHỌN ĐỀ TÀI
Cánh tay máy công nghiệp là đối tượng được nhiều nhà nghiên cứu quan
tâm vì sự ứng dụng hiệu quả của nó trong cơng nghiệp. Điều khiển tối ưu các
cánh tay máy là chìa khóa cho sự thành cơng của cơng nghệ sản xuất tự động.
Ngoài yêu cầu tối ưu thời gian, trong nhiều trường hợp, các cánh tay máy được
cần đến để mang một vật nào đó từ điểm này đến điểm khác với năng lượng ít

nhất khi có thể, đặc biệt là đối với các robot di động sử dụng nguồn pin hay ắcquy. Dẫn đến sự cần thiết phải thiết kế một bộ điều khiển hiệu quả đòi hỏi năng
lượng ít nhất nhưng các cánh tay máy vẫn có thể làm việc với hiệu suất tối đa
của chúng. Sự suy xét này tự nhiên dẫn đến việc nghiên cứu bài toán tối ưu theo
tiêu chuẩn tối thiểu năng lượng. Robot Scara là một đối tượng điều khiển phức
tạp do tính phi tuyến rất cao, làm việc trong mơi trường có nhiễu ngẫu nhiên.
Phương pháp điều khiển thơng thường không cho kết quả tốt nên phải sử dụng
phương pháp điều khiển thơng minh có khả năng thích nghi cao với sự biến đổi
của đối tượng. Bài Luận Văn này nghiên cứu thiết kế bộ điều khiển thích nghi
đối tượng động phi tuyến dựa trên công nghệ mạng nơron kết hợp với phương
pháp điều khiển tối ưu để tìm lời giải tối ưu cho robot scara 2 bậc tự do theo tiêu
chuẩn tối thiểu năng lượng.
1.2

TỔNG QUAN
Trong những năm gần đây lý thuyết điều khiển phi tuyến được ứng dụng

rộng rãi. Có nhiều phương pháp áp dụng cho hệ phi tuyến: phương pháp tuyến
tính hóa, điều khiển trượt, điều khiển mạng thần kinh, điều khiển mờ,…Đa số
các đối tượng cần điều khiển trong thực tế là hệ phi tuyến và nó phải chịu tác
động của nhiễu từ mơi trường làm việc. Do đó cần phải xây dựng một bộ điều

1

khiển để có thể điều khiển các đối tượng này với chất lượng tốt, đối tượng điều
khiển có thể bám theo tín hiệu mong muốn hay điều khiển ổn định đối tượng.
Điều này chỉ đảm bảo khi đối tượng có đặc tính tương tự như đặc tính của mơ
hình đã được sử dụng khi thiết kế. Các mơ hình này được xây dựng theo những
điều kiện nhất định: điều kiện làm việc, chế độ làm việc của đối tượng. Thực tế

điều kiện và chế độ làm việc luôn thay đổi cũng như chính bản thân của đối
tượng cũng thay đổi theo thời gian, sự lão hóa, tác động của nhiễu. Do đó việc
xấp xỉ hay mơ phỏng mơ hình dù áp dụng phương pháp nào cũng có sai số của
mơ hình.
Vì vậy một bộ điều khiển chất lượng cao cần có khả năng tự chỉnh định
thơng số điều khiển của chính nó để đảm bảo được chất lượng điều khiển
mong muốn trước những thay đổi bất định này. Có nhiều phương pháp để
xây dựng bộ điều khiển với các đối tượng trên. Trong phạm vi luận văn này,
em sẽ nghiên cứu phương pháp điều khiển thích nghi hệ phi tuyến dùng mạng
neuron kết hợp với phương pháp điều khiển tối ưu.
1.3 GIỚI THIỆU HỆ THỐNG
Giới thiệu robot scara
Theo quan điểm động học, một tay máy có thể
được biểu diễn bằng một chuỗi động học hở, gồm các
khâu, liên kết với nhau bằng các khớp quay hoặc khớp
trượt. Một phần của chuỗi được gắn lên thân, còn đầu kia
được nối với phần cơng tác. Các thao tác trong q trình
làm việc địi hỏi phần cơng tác phải được định vị và định
hướng chính xác trong khơng gian.

2

Các tham số liên kết

Các góc khớp

Động học thuận

q1(t),…, qn(t)

Vị trí và hướng của
phần cơng tác

Các tham số liên kết

Các góc khớp

Động học ngược

q1(t),…, qn(t)

Hình 1.1 Mối quan hệ giữa động học thuận và động học ngược.
Động học thuận căn cứ vào các biến khớp để xác định vùng làm việc
của phần công tác và mô tả chuyển động của phần cơng tác trong vùng làm
việc của nó.
Động học ngược xác định các biến khớp để đảm bảo chuyển động cho
trước của phần cơng tác.
Trong khi đó, động lực học tay máy nghiên cứu quan hệ giữa lực,
mômen, năng lượng, … với các thơng số chuyển động của nó. Việc nghiên
cứu động lực học tay máy phục vụ cho các mục đích sau đây:
- Mơ phỏng hoạt động của tay máy, để khảo sát, thử nghiệm quá trình
làm việc của nó mà khơng phải dùng tay máy thật.
- Phân tích, tính tốn kết cấu của tay máy.
- Phân tích, thiết kế hệ thống điều khiển tay máy.
1.4 YÊU CẦU LUẬN VĂN
- Nghiên cứu giải thuật điều khiển tối ưu kết hợp mạng nơ ron (mạng
RBF) điều khiển tay máy scara.
- Mô phỏng giải thuật điều khiển sử dụng phần mềm Matlab 7.01

- Thực hiện mạch driver điều khiển servo motor DC
- Nghiên cứu thiết kế mạch điều khiển và giao tiếp máy tính dùng phần
mềm Matlab 7.01 điều khiển cánh tay robot 2 bậc tự do.

3

1.5 TÓM TẮT NỘI DUNG LUẬN VĂN
Luận văn gồm 5 chương:
Chương 1: Giới thiệu đề tài
Giới thiệu đề tài, yêu cầu luận văn.
Chương 2: Cơ sở lý thuyết
Giới thiệu các phương phương pháp điều khiển tối ưu, phương pháp
điều khiển tối ưu H-J-B, giới thiệu bộ điều khiển dùng mạng thần kinh nhân
tạo, mạng RBF. Tìm hiểu động học tay máy.
Chương 3: Giải thuật điều khiển
Thiết kế bộ điều khiển tối ưu H-J-B kết hợp mạng nơron điều khiển tay
máy scara
Chương 4: Mơ phỏng và kết quả
Chương 5: Mơ hình vật lý

4

Chương 2

CƠ SỞ LÝ THUYẾT

2.1 MẠNG THẦN KINH NHÂN TẠO
2.1.1

Tổng quan về mạng thần kinh nhân tạo
Mạng nơron : có thể xem là mơ hình tốn học đơn giản của bộ não và

nó hoạt động như là một mạng tính tốn phân bố song song. Tuy nhiên khác
với máy tính thơng thường cần phải lập trình để thực hiện một cơng việc cụ
thể nào đó. Phần lớn mạng thần kinh phải được huấn luyện. Nó có thể học các
liên kết mới, quan hệ chức năng mới và mẫu mới. Mạng thần kinh là công cụ
cơ bản để trang bị cho hệ thống thơng minh có khả năng học. Lợi điểm quan
trọng nhất của mạng thần kinh là tính thích nghi. Mạng thần kinh có thể tự
động điều chỉnh trọng số của nó để tối ưu hóa các hoạt động như nhận dạng
mẫu, ra quyết định điều khiển hệ thống. Tính thích nghi cho phép mạng thần
kinh vẫn thực hiện tốt chức năng của nó khi mơi trường, đối tượng điều khiển
thay đổi theo thời gian.
Mạng Perceptron nhiều lớp và thuật toán truyền ngược. Mạng
perceptron nhiều lớp (gồm một lớp nhập, một hoặc nhiều lớp ẩn và một lớp
xuất) với thuật toán lan truyền ngược là mạng neuron được sử dụng nhiều
nhất để giải quyết nhiều vấn đề trong nhiều lĩnh vực khác nhau. Được phát
triển một cách độc lập bởi Werbos vào năm 1974, Parker vào năm 1985,
Rumelhart, Hinton và Williams vào năm 1986, thuật toán lan truyền ngược
được nhiều nhà nghiên cứu cải thiện nhằm cải tiến tốc độ hội tụ cũng như
tăng cường tính ổn định của thuật toán

5

Về cơ bản, thuật toán truyền ngược là một thuật tốn tìm theo chiều gradient

âm và có giám sát. Thuật tốn truyền ngược bao gồm hai q trình: q trình
lan truyền tiến và quá trình lan truyền ngược sai số. Trong q trình lan
truyền tiến tín hiệu, tín hiệu nhập được đưa vào mạng và tín hiệu này truyền
này xuyên qua mạch từ lớp này đến lớp khác. Cuối cùng một tập các tín hiệu
xuất được tạo ở ngõ ra. Trong suốt quá trình lan truyền tiến các trọng số của
mạng khơng thay đổi. Trong q trình truyền ngược, một tín hiệu sai số (có
được từ hiệu của đáp ứng mong muốn và đáp ứng thực của mạng) được
truyền ngược xuyên qua mạng. Trong quá trình này các trọng số được hiệu
chỉnh sao cho đáp ứng thực tế của mạng ngày càng đến gần với đáp ứng mong
muốn.
Mạng RBF (Radial Basis Function network). Mạng RBF được
Broomhead và Lpwe đưa ra vào năm 1988 và ngày càng chứng tỏ hiệu quả
trong việc giải các bài toán thực tế. Mạng RBF bao gồm ba lớp khác biệt
nhau. Lớp nhập được tạo bởi các nút nguồn và khơng có chức năng tính tốn.
Lớp hai là một lớp ẩn và được nối kết hoàn toàn với lớp ba là lớp xuất. Đặc
điểm của mạng RBF làm các tác động của các neuron trong lớp ẩn là các hàm
đối xứng xuyên tâm. Mạng RBF được xem như là một thay thế đánh giá của
mạng perceptron nhiều lớp và vì vậy các ứng dụng của mạng RBF ngày càng
nhiều.
Mạng Hopfield. Mạng Hopfied là mạng chỉ có một lớp neuron duy
nhất vừa là lớp nhập vừa là lớp xuất. Trong đó ngõ ra của mỗi neuron được
cấp ngược về các neuron khác. Vì vậy trạng thái của mỗi neuron tùy thuộc
vào tín hiệu nhập, vào trạng thái trước đó của các neuron và vào hàm tác động
của riêng nó. Mạng Hopfield rất hiệu quả trong các bài tốn tối ưu hóa tổ hợp.
Mạng Kohonen. Mạng Kohonen là mạng truyền tiến khơng có giám
sát dùng các neuron thích nghi để nhận các tín hiệu từ khơng gian sự kiện.

6

Mạng gồm các neuron được sắp xếp trong một dãy một chiều hoặc trên một
mặt hai chiều. Các neuron này có ngõ ra truyền ngược về chính nó và về các
neuron kế cận với mức độ ảnh hưởng giảm dần theo khoảng cách. Ý tưởng
chính yếu trong mạng Kohonen là tạo ra một hệ thống tự sửa đổi sao cho các
neuron gần nhau đáp ứng tương tự như nhau. Khi một neuron đáp ứng tốt với
một tín hiệu vào, neuron này và các neuron kế cận với nó sẽ có các trọng số
dẫn truyền thay đổi sao cho tất cả đều đáp ứng giống như neuron có đáp ứng
tốt nhất.
Đặc tính của mạng neuron
Một số tính chất về mạng neuron:
- Rất thích hợp với các bài tốn phân lớp và nhận dạng.
- Có khả năng tổng quát hóa cao.
- Đáp ứng nhanh, tin cậy và hiệu quả.
- Loại được nhiễu, có tính thích nghi và tối ưu.
Bộ điều khiển dùng mạng neuron
Trên hình 2.1 giới thiệu sơ đồ khối hệ thống điều khiển trên cơ sở mạng
nơ rôn
unet(k)

Bộ điều khiển
Nơ rơn
e(k)

ec(k)

Bộ điều khiển
(chun gia)

Đối

uc(k)

Tượng

Hình.2.1. Sơ đồ khối điều khiển với mạng nơ rôn

7

y(k)

Tiêu chuẩn huấn luyện mạng là cực tiểu hóa hàm sai số có dạng:
e( k ) =

1 N
[u c ( k ) − u net ( k )]2
∑
2 k =1

Trong đó, uc ( k ) là ngõ ra của bộ điều khiển trên kinh nghiệm chun
gia, đó cũng chính là ngõ ra mong muốn của mạng và unet ( k ) là ngõ ra thực sự
của mạng tại mỗi mẫu vào thứ k. Mạng sẽ được huấn luyện với dữ liệu vào ra
của bộ điều khiển chuyên gia nhờ giải thuật học giám sát lan truyền ngược
hoặc lan truyền ngược động và bộ điều khiển nơ rôn sẽ được huấn luyện thay
thế bộ điều khiển.
Bộ điều khiển thích nghi trực tiếp với mạng nơ rôn. Giả sử đối tượng
với cặp vào-ra [u( k ), y p ( k )] được cho và mơ hình tham chiếu ổn định được chỉ
định bằng cặp vào-ra của nó [r( k ), y m ( k )] trong đó r:NỈR là hàm bị chặn và
ym là ngõ ra mong muốn của đối tượng. Mục tiêu là xác định tín hiệu điều

khiển u( k ) cho k ≥ k 0 sao cho:
Hằng số với ε ≥ 0

lim y p ( k ) − y m ( k ) ≤ ε

k →∞

Mơ hình
Tham chiếu

ym

r
ec

Mạng
điều khiển

u

Đối
Tượng

yp

Hình.2.2. Sơ đồ khối điều khiển thích nghi trực tiếp

8

Với phương pháp điều khiển nơ rơn thích nghi trực tiếp, cấu trúc được
sử dụng chính là mơ hình nhận dạng đối tượng như một bộ điều khiển. Giải
thuật hiệu chỉnh các thông số của bộ điều khiển (mạng nơ rơn) dựa trên tín
hiệu sai số giữa ngõ ra của đối tượng và ngõ ra của mơ hình tham chiếu.
Bộ điều khiển thích nghi gián tiếp. Bộ điều khiển nơ rơn thích nghi gián tiếp
được mơ tả như lưu đồ khối hình 2.3.
ym

Mơ hình
Tham chiếu

ynet

Mạng
Nhận dạng

r

ei

Mạng
điều khiển

u

Đối
Tượng

ei

ec

yp

Hình 2.3. Sơ đồ khối điều khiển thích nghi gián tiếp

Ngõ vào của bộ phân nhận dạng là các ngõ vào ra trước đó của đối
tượng. Tín hiệu ra của bộ điều khiển là các tín hiệu vào ra trước đó của đối
tượng. Tiêu chuẩn huấn luyện mạng nhận dạng là dựa trên tín hiệu sai số giữa
ngõ ra của đối tượng và ngõ ra của mạng và tiêu chuẩn huấn luyện mạng điều
khiển là dựa trên tín hiệu sai số giữa ngõ ra của mạng và tiêu chuẩn huấn
luyện mạng điều khiển là dựa trên tín hiệu sai số giữa ngõ ra của đối tượng và
ngõ ra của mơ hình tham chiếu.
Như vậy, có thể thấy mạng nơ rơn với tính chất thích nghi của mình có
thể được ứng dụng rộng rãi trong các hệ thống điều khiển tự động.

9

2.1.2 Cấu trúc mạng nơrôn nhân tạo (Artifical Neural Networks - ANN)

Hình 2.4 Cấu trúc một nơrơn sinh học
Mạng thần kinh gồm các tế bào thần kinh kết nối với nhau bởi các liên
kết. Mỗi liên kết kèm theo một trọng số, đặc trưng cho tính kích thích hay ức
chế giữa các tế bào thần kinh. Cấu trúc cơ bản của một nơrôn gồm các ngõ
vào, thân nơrôn và các ngõ ra. Thân nơrơn là phần tử xử lý có chức năng thu
thập thơng tin từ các ngõ vào, tính toán và cho kết quả ở ngõ ra và tiếp tục
truyền kết quả này tới ngõ vào của nơrôn khác. Tín hiệu truyền từ nơrơn này

đến nơrơn khác dưới dạng điện áp. Nếu tín hiệu truyền là điện áp dương thì
tín hiệu đó đựơc gọi là tín hiệu kích hoạt, điện áp âm gọi là ức chế. Nếu điện
áp là zero thì khơng có sự kết nối giữa hai nơrơn. Cấu trúc cơ bản của một
nơrơn như sau :
x1
x2

w1
w2

hàm kích hoạt

∑

•
•

xm

•

ngưỡng θ

wm

Hình 2.5 Cấu trúc cơ bản một nơrơn
x = [ x1 x2 ... xm ]T : vector tín hiệu vào.

10

y

w = [ w1 w2 ... wm ]T : vector trọng số kết nối.

θ : ngưỡng phân cực – bias. Ngưỡng là giá trị biên độ độ lệch, nó ảnh

hưởng đến sự kích hoạt ngõ ra của nơrơn.
Q trình xử lý thơng tin của một nơrơn có thể chia thành hai phần : xử
lý tín hiệu ở ngõ vào và xử lý tín hiệu ở ngõ ra. Hàm xử lý ngõ vào là hàm
tổng có dạng như sau :
⎛m
⎞
f = net = ⎜ ∑ w j x j ⎟ − θ
j
=
1
⎝
⎠

+ Hàm tuyến tính
+ Hàm tồn phươn g

( 2.1)

⎛m
⎞
f = net = ⎜ ∑ wj x2j ⎟ − θ
⎝ j =1

⎠

( 2.2)

m
2⎞
⎛
f = net = ⎜ ρ −2 ∑ ( x j − w j ) ⎟ − θ
j =1
⎝
⎠

+ Hàm cầu :

( 2.3)

Ngõ ra của nơrơn được tính bởi biểu thức y = a( f ) . Hàm a( f ) gọi là
hàm kích hoạt. Các hàm kích hoạt thường dùng là :
+ Hàm nấc
⎧1
a( f ) = ⎨
⎩0

, f ≥0
, f <0

( 2.4 )

+ Hàm dấu
⎧ 1

a( f ) = sgn( f ) = ⎨
⎩−1

, f ≥0
, f <0

( 2.5)

+ Hàm dốc bão hòa
⎧1
⎪
a( f ) = ⎨ f
⎪0
⎩

, f >1
, 0 ≤ f ≤1
, f <0

+ Hàm tuyến tính bão hịa :

11

( 2.6 )

⎧ 1
⎪
a( f ) = ⎨ f

⎪ −1
⎩

,

f >1

, 0 ≤ f ≤1
, f <0

( 2.7 )

+ Hàm dạng S (sigmoid) đơn cực
a( f ) =

1
−λ f
1+ e

( 2.8)

(λ > 0)

+Hàm dạng S lưỡng cực :
a( f ) =

2
−1
−λ f
1+ e

( 2.9 )

(λ > 0)

+ Hàm Hyperbolic Tangent
f
−f
e −e
a( f ) =
−f
f
e +e

( 2.10 )

Mạng nơrơn có thể được phân loại dựa trên các tính chất của nó :
+ Mạng một lớp : mạng chỉ gồm một lớp nơrôn xử lý.
+ Mạng nhiều lớp : mạng gồm nhiều lớp nơrôn xử lý.
+ Mạng truyền thẳng : các tín hiệu trong mạng chỉ truyền theo một
chiều từ ngõ vào đến ngõ ra.
+ Mạng hồi quy : có tín hiệu hồi tiếp từ ngõ ra trở về ngõ vào.
Có hai kiểu học cho mạng nơrôn là học thông số và học cấu trúc. Trong
đề tài này tác giả sử dụng phương pháp học thơng số với luật học có giám sát.
Kỹ thuật huấn luyện như sau :
Các trọng số được cập nhật ngay sau khi mỗi ngõ vào và mỗi ngõ ra
được thể hiện. Cách huấn luyện này cho phép mạng có khả năng học on-line
ngay trong lúc hệ thống đang hoạt động. Do đó, mọi thay đổi biến động mới
phát sinh trong hệ đều được cập nhật. Ưu điểm của cách huấn luyện này là
mạng có tính thích nghi tốt hơn khi hệ thống thay đổi theo thời gian. Khuyết

12

điểm là trong thời gian đầu mạng chạy không ổn định. Trong đề tài luận văn
này, tác giả sử dụng mạng truyền thẳng ba lớp và mạng RBF để huấn luyện
mạng, cụ thể sẽ được trình bày ở phần tiếp theo.
2.1.3 Mạng nơrôn truyền thẳng ba lớp
Xét mạng nơrôn truyền thẳng ba lớp gồm lớp vào, lớp ẩn và lớp ra. Lớp
vào có m nơrơn, lớp ẩn có l nơrơn và lớp ra có n nơrơn.

x1

xj

xm

z1

v11
•
•

vqj

•
•
•

•

zq

•

y1

w11
•
•

yi

wiq

•
•
•

•
•

•
•
•

•

vlm

zl

yn

wnl

Hình 2.6 Mạng nơrơn truyền thẳng ba lớp
xj

( j = 1, m)

là các ngõ vào của lớp vào.

zq

(q = 1, l )

ngõ ra của đơn vị q của lớp ẩn.

y
i

(i = 1, n)

là các ngõ ra của lớp ra.

vqj

( q = 1, l ; j = 1, m )

là trọng số kết nối giữa lớp vào và lớp ẩn.

wiq

(i = 1, n ; q = 1,l )

là trọng số kết nối giữa lớp ẩn và lớp ra.

Tổng có trọng số của các tín hiệu vào nơrôn thứ q ở lớp ẩn là :
m

( 2.11)

netq = ∑ vqj x j
j =1

13

Tín hiệu ra của nơrơn thứ q ở lớp ẩn là :
⎛m
⎝ j =1

⎞
⎠

zq = ah ( netq ) = ah ⎜ ∑ vqj x j ⎟

( 2.12 )

Tổng có trọng số của các tín hiệu vào nơrơn thứ i ở lớp ra là :
⎛m
⎝ j =1

⎞
⎠

neti = ∑ wiq zq = ∑ wiq ah ( netq ) = ∑ wiq ah ⎜ ∑ vqj x j ⎟
l

l

l

q =1

q =1

q =1

( 2.13)

Tín hiệu ra của nơrơn thứ i ở lớp ra là :
⎛

⎞

l

yi = ao ( neti ) = ao ⎜ ∑ wiq zq ⎟
⎝ q =1

⎠

( 2.14 )

Giả sử ta có tập dữ liệu huấn luyện gồm K mẫu ( x(k ), d (k ) ) , k = 1, K .
Tiêu chuẩn để huấn luyện mạng là làm tối thiểu sai số :
1 n
2
E = ∑ ( d i - yi )
2 i =1

( 2.15 )

Hàm E hình thành một mặt cong lỗi trong không gian, tồn tại trên đó
điểm cực tiểu. Với bộ trọng số bất kỳ ta sẽ tính được giá trị E trên mặt cong
lỗi. Để lỗi của hệ thống nhanh chóng hội tụ về cực tiểu thì các trọng số của
mạng phải được thay đổi một lượng thích hợp theo hướng làm cho E trượt
nhanh nhất về đáy mặt cong lỗi. Áp dụng thuật tốn suy giảm độ dốc, ta có
luật học cho các trọng số là :

Trong đó :

wiq ( k + 1) = wiq ( k ) + ∆wiq ( k )

( 2.16 )

vqj ( k + 1) = vqj ( k ) + ∆vqj ( k )

( 2.17 )

∆wiq ( k ) = −η

∂E ( k )
∂wiq

( 2.18 )

14

∆vqj ( k ) = −η

∂E ( k )
∂vqj

( 2.19 )

∂E ( k ) ⎛ ∂E ( k ) ⎞⎛ ∂yi ⎞ ⎛ ∂neti ⎞
=⎜
⎟⎟
⎟⎜
⎟ ⎜⎜
∂wiq
⎝ ∂yi ⎠⎝ ∂neti ⎠ ⎝ ∂wiq ⎠

Đặt

( 2.20 )

( 2.17 ) ⇒

∂E ( k )
= − ( di ( k ) − yi ( k ) )
∂yi

( 2.21)

( 2.16 ) ⇒

∂yi
= ao′ ( neti (k ) )
∂neti

( 2.22 )

( 2.15) ⇒

∂neti
= zq (k )
∂wiq

( 2.23)

δoi ( k ) = −

∂E (k )

= [ di (k ) − yi ( k )] ⎡⎣ ao′ ( neti ( k ) ) ⎤⎦
∂neti

( 2.24 )

( 2.18) ⇒ wiq (k + 1) = wiq (k ) + ηδoi (k ) zq (k )

( 2.25)

Tương tự ta có :
∂E (k ) ⎛ ∂E (k ) ⎞⎛ ∂zq ⎞⎛ ∂netq ⎞
=⎜
⎜ ∂z ⎟⎜
⎟⎜ ∂net ⎟⎜
⎟⎜ ∂v ⎟⎟
∂viq
q ⎠⎝
q ⎠⎝
qj ⎠
⎝

( 2.26 )

∂E (k ) ⎡ n
⎤
= ⎢ −∑ ( di (k ) − yi (k ) ) ( ao′ ( neti (k ) ) ) wiq (k ) ⎥
∂zq
⎣ i =1
⎦

( 2.27 )

∂zq
∂netq
∂netq
∂vqj

= ah′ ( netq (k ) )

( 2.28)

= x j (k )

( 2.29 )

15

δ hq (k ) = −

∂E (k ) ⎡ n
⎤
= ⎢ ∑ ( di (k ) − yi (k ) ) ( ao′ ( neti (k ) ) ) wiq (k ) ⎥ ah′ ( netq (k ) )
∂netq ⎣ i =1
⎦

⎡ n
⎤
Thay (2.26) vào (2.32) : δhq (k ) = ⎢∑ δoi (k ) wiq (k ) ⎥ ah′ ( netq (k ) )

⎣ i =1
⎦

Từ (2.19), (2.21) và (2.33) :

vqj ( k + 1) = vqj ( k ) + ηδhq (k ) x j ( k )

( 2.30 )

( 2.31)
( 2.32 )

Do trọng số của mạng được cập nhật dựa vào tín hiệu sai số

(δ

oi

( k ), δ hq (k ) ) nên thuật toán lan truyền ngược cịn được gọi là thuật tốn học

Delta tổng qt. Thuật toán lan truyền ngược để huấn luyện mạng truyền
thẳng ba lớp như sau :
Bước 1
Chọn tốc độ học
Chọn sai số cho phép mạng hội tụ
Thiết lập
Trọng số ban đầu:
vqj ( k ), wiq ( k )

( j = 1, m ; q = 1, l ; i = 1, n )

Bước 2
Tính ngõ ra của mạng với tín hiệu vào là x( k )
Lớp ẩn :

Lớp ra :

netq (k ) = ∑ vqj (k ) x j (k )

( q = 1, l )

zq (k ) = ah ( netq (k ) )

( q = 1, l )

m

j =1

l

neti (k ) = ∑ wiq (k ) zq (k )
q =1

16

( i = 1, n )

( i = 1, n )

yi (k ) = ao ( neti (k ) )

Bước 3
Lan truyền ngược cập nhật trọng số kết nối giữa các lớp.
Lớp ra : δoi ( k ) = [ d i (k ) − yi (k )] ⎡⎣ ao′ ( neti ( k ) ) ⎤⎦
wiq ( k + 1) = wiq (k ) + ηδoi ( k ) zq (k )

⎡

⎤

n

Lớp ẩn : δhq (k ) = ⎢ ∑ δoi (k ) wiq (k ) ⎥ ah′ ( netq (k ) )
⎣ i =1

⎦

vqj ( k + 1) = vqj ( k ) + ηδ hq ( k ) x j ( k )

( i = 1, n )
( i = 1, n ; q = 1, l )

( q = 1, l )
( j = 1, m ; q = 1, l )

Bước 4
Tính sai số tích lũy :

(

1 n
E = E + ∑ di (k ) − yi (k )
2 i =1

)

2

Bước 5
Nếu k < K thì gán k = k + 1 và trở lại bước 2.
Nếu k = K thì tiếp tục bước 6.
Bước 6
Kết thúc một chu kỳ huấn luyện.
Nếu E ≤ Emax thì kết thúc quá trình học.
Nếu E > Emax thì gán E = 0, k = 1 và trở lại bước 2 bắt đầu một
chu kỳ huấn luyện mới.

17

2.1.4 Mạng hàm cơ sở xuyên tâm (Radial Basis Function Networks RBF)
Mạng RBF là trường hợp đặc biệt của mạng truyền thẳng ba lớp, trong đó:
- Hàm tổng ngõ vào của nơrơn ở lớp ẩn là hàm cầu.
- Hàm kích hoạt ở lớp ẩn là hàm mũ.
- Hàm tổng ngõ vào của nơrơn ở lớp ra là hàm tuyến tính.
- Hàm kích hoạt ngõ ra là hàm tuyến tính.

- Mức ngưỡng của các nơrơn bằng khơng.
z1
x1

•
•

•
•

•

xj

∑

wiq

•
•
•

•

xm

•
•

∑

y1

•

zq

•

•
•

w11

yi

•
•
•

zl

wnl

∑

yn

Hình 2.7 Mạng hàm cơ sở xun tâm
Phương trình tốn truyền tín hiệu từ lớp vào đến lớp ra của mạng :

Ngõ ra nơrôn thứ q (lớp ẩn)
− x − µq

2

zq = e

2σ q

x − µq =

(x − µ ) (x − µ )

( 2.33)

( 2.34 )

T

q

q

x

vector ngõ vào

µq

tâm hàm cơ sở thứ q

σq

độ rộng hàm cơ sở thứ q

18

Ngõ ra nơrôn thứ i (lớp ra):

(i = 1, n ; q = 1, l )

l

yi = ∑ wiq zq
q =1

Hàm sai số : E =

( 2.35)

1 n
2
( di − yi )
∑
2 i =1

( 2.36 )

Mạng RBF thường được huấn luyện qua hai bước. Bước thứ nhất là xác
định tâm và độ rộng của hàm cơ sở. Bước thứ hai là huấn luyện trọng số lớp
ra của mạng. Thuật toán như sau :
Bước 1
Chọn tốc độ học η > 0 , chọn sai số cực đại Emax
Gán các trọng số wiq ( k ) ,

( i = 1, n ;

q = 1, l

)

bằng các giá trị nhỏ

nhẫu nhiên. Đặt giá trị đầu E = 0, k = 1
Bước 2
Tính ngõ ra của mạng với tín hiệu vào là x ( k )
− x ( k ) − µq

zq ( k ) = e

2

2σ q

l

yi (k ) = ∑ wiq (k ) zq (k )
q =1

(i = 1, n )

Bước 3
Cập nhật trọng số lớp ra của mạng :
wiq ( k + 1) = wiq ( k ) + η ( d i ( k ) − yi ( k ) ) z q ( k )

Bước 4
Tính sai số tích lũy
2
1 n
E = E + ∑ ( di ( k ) − yi ( k ) )
2 i =1

19

( i = 1, n ;

q = 1, l

)

Giải thuật điều khiển tối ưu robot scara

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về