BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------PHẠM VĂN LƯỢNG
TÊN ĐỀ TÀI LUẬN VĂN
NHẬN DẠNG CHUYỂN ĐỘNG ỨNG DỤNG CHO ĐIỀU KHIỂN MÁY TÍNH
Chuyên ngành : KỸ THUẬT ĐIỆN TỬ
LUẬN VĂN THẠC SĨ KỸ THUẬT
KỸ THUẬT ĐIỆN TỬ
NGƯỜI HƯỚNG DẪN KHOA HỌC :
PGS.TS. ĐỖ TRỌNG TUẤN
Hà Nội – 2016
Luận Văn Tốt Nghiệp
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu riêng của tôi. Các số liệu, kết quả nêu
trong luận văn là trung thực và tham khảo có dẫn chứng cụ thể. Luận văn có sử dụng
bộ thư viện của Matlab, bộ thư viện của STmicroelectronics, bộ thư viện chip CC2500
của Texas Instruments, bộ thư viện USB của Tilen Majerle .
Học viên:
Phạm Văn Lượng
Phạm Văn Lượng
14BKĐT
Trang: 1
CB140212
Luận Văn Tốt Nghiệp
Danh mục các chữ viết tắt
Từ viết tắt
IMU
VQ
DTW
HMM
ANN
MLP
DPS
IC
SPI
UART
GPIO
QFN
Từ gốc
Inertial measurement unit
Vector quantization
Dynamic time warping
Hidden markov model
Artificial neural network
Multilayer perceptron
Degrees Per Second
Integrated circuit (Chip)
Serial Peripheral Interface
Universal asynchronous receiver/transmitter
General-purpose input/output
Quad-flat no-leads
Danh mục các bảng
Bảng 2. 1 Bảng ràng buộc chức năng giữa linh kiện và chip chính. ............................ 43
Bảng 2. 2 Bảng nguồn cấp cho các linh kiện .............................................................. 46
Bảng 3. 1 Lệnh và thao tác tay tương ứng. ................................................................. 69
Bảng 3. 2 Định dạng khung dữ liệu lệnh của bàn phím .............................................. 82
Bảng 3. 3 Định dạng khung dữ liệu lênh của chuột .................................................... 82
Bảng 3. 4 Các lệnh của bàn phím và chuột tương ứng với các thao tác tay ................. 83
Danh mục các hình vẽ, đồ thị
Phạm Văn Lượng
14BKĐT
Trang: 2
CB140212
Luận Văn Tốt Nghiệp
Hình 1. 1 Một thiết bị hỗ trợ trình chiếu trên thị tường............................................... 12
Hình 1. 2 Sơ đồ hệ thống nhận dạng .......................................................................... 14
Hình 1. 3 Sơ đồ nhận dạng chuyển động dùng IMU. .................................................. 16
Hình 1. 4 Ảnh minh họa neuron của người................................................................. 17
Hình 1. 5 Mô hình mạng neuron nhân tạo. ................................................................. 17
Hình 1. 6 Đồ thị Hard-limite ...................................................................................... 18
Hình 1. 7 Đồ thị Piecewise linear ............................................................................... 19
Hình 1. 8 Đồ thị Sigmoid ........................................................................................... 19
Hình 1. 9 Đồ thị Hyperbolic tangent ......................................................................... 20
Hình 1. 10 Mạng neuron truyền thẳng một lớp ........................................................... 20
Hình 1. 11 Mạng neuron truyền thẳng nhiều lớp ........................................................ 21
Hình 1. 12 Mạng neuron hồi quy một lớp ................................................................. 22
Hình 1. 13 Hồi quy tuyến tính Y = a1X + a2. ............................................................. 23
Hình 1. 14 Xấp xỉ bằng neuron Y = f(X, a1, ..., an). .................................................... 23
Hình 1. 15 Mạng perceptron một lớp ......................................................................... 25
Hình 1. 16 Đồ thị kết quả phép toán XOR.................................................................. 27
Hình 1. 17 Thực hiện hàm XOR bằng mạng MLP ..................................................... 28
Hình 1. 18 Lan truyền tín hiệu trong quá trình học theo phương pháp lan truyền ngược
sai số ................................................................................................................... 29
Hình 2. 1 Sơ đồ khối module chính ............................................................................ 32
Hình 2. 2 Sơ đồ khối module USB ............................................................................. 33
Hình 2. 3 Sơ đồ khối chip LSD9DS0 ......................................................................... 35
Hình 2. 4 Kiểu dáng và sơ đồ chân của LSD9DS0 ..................................................... 36
Hình 2. 5 Mạch nguyên lý của của LSD9DS0 ............................................................ 36
Hình 2. 6 Nút bấm. .................................................................................................... 37
Hình 2. 7 Sơ đồ khối của BQ24074............................................................................ 38
Hình 2. 8 Sơ đồ chân của BQ24074 ........................................................................... 39
Hình 2. 9 Mạch nguyên lý của BQ24074 ................................................................... 39
Hình 2. 10 LED RGB ................................................................................................ 40
Hình 2. 11 Sơ đồ khối IC CC2500. ............................................................................ 41
Phạm Văn Lượng
14BKĐT
Trang: 3
CB140212
Luận Văn Tốt Nghiệp
Hình 2. 12 Sơ đồ chân của chíp CC2500 . .................................................................. 42
Hình 2. 13 Mạch nguyên lý của chíp CC2500. ........................................................... 42
Hình 2. 14 Sơ đồ khối chíp STM32F401CBxx........................................................... 45
Hình 2. 15 Sơ đồ chân chíp STM32F401CBxx .......................................................... 46
Hình 2. 16 Sơ đồ khối chíp TPS76933 ....................................................................... 47
Hình 2. 17 Sơ đồ chân TPS76933. ............................................................................. 47
Hình 2. 18 Sơ đồ khố Module chính và các chuẩn giao tiếp ...................................... 48
Hình 2.19 Ý tưởng tách mạch thành 2 phần. .............................................................. 49
Hình 2. 20 Nguyên lý mạch chip chính. ..................................................................... 50
Hình 2. 21 Mạch nguyên lý cảm biến LSM9DS0. ...................................................... 51
Hình 2. 22 Mạch nguyên lý sạc pin và ổn áp 3.3V. .................................................... 52
Hình 2. 23 Layout mạch chính. .................................................................................. 53
Hình 2. 24 Biên dạng 3D mạch chính. ....................................................................... 53
Hình 2. 25 Mạch nguyên lý module usb ..................................................................... 54
Hình 2. 26 Layout mạch usb ...................................................................................... 55
Hình 2. 27 Biên dạng 3D mạch usb............................................................................ 55
Hình 2. 28 Nguyên lý mạch thu phát không dây......................................................... 56
Hình 2. 29 Layout mạch thu phát không dây .............................................................. 57
Hình 2. 30 Biên dạng 3D mạch thu phát không dây ................................................... 57
Hình 2. 31 Khung dữ liệu cảm biến chuyển động....................................................... 58
Hình 2. 32 Lưu đồ thuật toán huấn luyện bằng neuron. .............................................. 60
Hình 2. 33 Lưu đồ thuật toán chíp STM32F401CBU6 đọc dữ liệu cảm biến. ............. 62
Hình 2. 34 Lưu đồ thuật toán đọc dữ liệu cho việc nhận dạng .................................... 63
Hình 2. 35 Lưu đồ nhận dạng trên chip chính. ........................................................... 64
Hình 2. 36 Lưu đồ thuật toán mạch USB. .................................................................. 65
Hình 3. 1 Các thao tác tay được chọn. ........................................................................ 68
Hình 3. 2 Đồ thị tín hiệu động tác phất tay xuống dưới. ............................................. 69
Hình 3. 3 Đồ thị so sánh tín hiệu gốc vói tín hiệu đã qua bộ lọc. ................................ 70
Hình 3. 4 Dạng tín hiệu động tác phất tay lên trên...................................................... 71
Hình 3. 5 Dạng tín hiệu động xoay tay sang phải 1 lần............................................... 72
Phạm Văn Lượng
14BKĐT
Trang: 4
CB140212
Luận Văn Tốt Nghiệp
Hình 3. 6 Dạng tín hiệu động tác xoay tay sang trái 1 lần.......................................... 73
Hình 3. 7 Dạng tín hiệu động tác xoay tay sang phải 2 lần. ....................................... 74
Hình 3. 8 Dạng tín hiệu động tác xoay tay sang trái 2 lần........................................... 75
Hình 3. 9 Dạng tín hiệu động tác đưa tay ra trước. ..................................................... 76
Hình 3. 10 Dạng tín hiệu động tác đưa tay về sau. .................................................... 77
Hình 3. 11 Sơ đồ khối huấn luyện mẫu với khung dữ liệu đầu vào là 606. ................. 78
Hình 3. 12 Biểu đồ đánh giá chất lượng khâu huấn luyện với khung dữ liệu 606. ...... 78
Hình 3. 13 Sơ đồ khối huấn luyện mẫu với khung dữ liệu đầu vào là 120. ................. 79
Hình 3. 14 Biểu đồ đánh giá chất lượng khâu huấn luyện với khung dữ liệu 120. ...... 79
Hình 3. 15 Sơ đồ khối huấn luyện mẫu với khung dữ liệu đầu vào là 120. ................. 80
Hình 3. 16 Biểu đồ đánh giá chất lượng khâu huấn luyện với khung dữ liệu 72. ........ 80
Hình 3. 17 Máy tính nhận thiết bị .............................................................................. 83
Phạm Văn Lượng
14BKĐT
Trang: 5
CB140212
Luận Văn Tốt Nghiệp
Mục lục
LỜI CAM ĐOAN................................................................................................... 1
Danh mục các chữ viết tắt ...................................................................................... 2
Danh mục các bảng ................................................................................................ 2
Danh mục các hình vẽ, đồ thị ................................................................................. 2
LỜI MỞ ĐẦU ........................................................................................................ 8
CHƯƠNG 1
TỔNG QUAN .............................................................................. 12
1.1.
Giới thiệu về các thiết bị hỗ trợ trình chiếu đang có trên thị trường ........ 12
1.2.
Thiết bị mà luận văn hướng tới .............................................................. 13
1.3.
Lý thuyết nhận dạng ............................................................................... 13
1.4.
Giới thiệu về mạng neuron ..................................................................... 16
1.5.
Mô hình mạng Neuron ........................................................................... 17
1.5.1. Mô hình một neuron ........................................................................... 17
1.5.2. Liên kết trong mạng neuron nhân tạo .................................................. 20
1.5.3. Khả năng ứng dụng của mạng neuron nhân tạo trong nhận dạng ......... 22
1.6.
Mạng neuron lan truyền thẳng nhiều lớp ................................................ 24
1.6.1. Mạng perceptron một lớp .................................................................... 24
1.6.2. Mạng perceptron nhiều lớp ................................................................. 27
Kết luận chương 1 ............................................................................................. 29
CHƯƠNG 2
THIẾT KẾ THIẾT BỊ ĐIỀU KHIỂN MÁY TÍNH ....................... 30
2.1.
Yêu cầu chức năng ................................................................................. 30
2.2.
Yêu cầu kỹ thuật .................................................................................... 30
2.2.1. Yêu cầu kỹ thuật phần cứng ................................................................ 30
2.2.2. Yêu cầu kỹ thuật phần mềm ................................................................ 31
Phạm Văn Lượng
14BKĐT
Trang: 6
CB140212
Luận Văn Tốt Nghiệp
2.3.
Sơ đồ khối của hệ thống ......................................................................... 32
2.4.
Mạch ...................................................................................................... 34
2.4.1. Mạch chính ......................................................................................... 34
2.4.2. Mạch USB .......................................................................................... 54
2.4.3. Mạch thu phát không dây .................................................................... 56
2.5.
Phầm mềm ............................................................................................. 58
2.5.1. Chương trình huấn luyện .................................................................... 58
2.5.2. Chương trình mạch chính.................................................................... 61
2.5.3. Chương trình mạch usb ....................................................................... 65
Kết luận chương 2 ............................................................................................. 66
Chương 3
KIỂM THỬ VÀ ĐÁNH GIÁ .......................................................... 67
3.1.
Khảo sát các phím thường dùng khi trình chiếu ...................................... 67
3.2.
Lựa chọn thao tác tay tương ứng với lệnh điều khiển ............................. 67
3.3.
Khảo sát tín hiệu cảm biến ..................................................................... 69
3.4.
Đánh giá chất lượng nhận dạng .............................................................. 78
3.5.
Kết nối bàn phím và chuột qua chuẩn USB. ........................................... 82
KẾT LUẬN ...................................................................................................... 84
TÀI LIỆU THAM KHẢO .................................................................................... 85
Phạm Văn Lượng
14BKĐT
Trang: 7
CB140212
Luận Văn Tốt Nghiệp
LỜI MỞ ĐẦU
Ngày nay với sự phát triển của khoa học kỹ thuật, đặc biệt là sự bùng nổ của công
nghiệp bán dẫn tạo ra những chiếc máy tính phục vụ rất nhiều lĩnh vực cho con người.
Con người sử dụng máy tính để tăng hiệu suất công việc, có thể kể ra ở đây như lưu
trữ, tính toán, giải trí, giảng dậy, thuyết trình… Máy tính ngày nay có thể nói là không
thể thiếu trong mọi công việc.Tuy vậy đối với những công việc đặc thù người ta vẫn
tạo ra những thiết bị phụ trợ dành riêng cho từng công việc như chuột và bàn phím cho
game thủ, bàn vẽ WACOM cho người thiết kế đồ họa, máy đọc mã vạch cho nhân viên
thu ngân và cả các remote cho những người thuyết trình hoặc giảng viên sử dụng
PowerPoint… Tất cả những thiết bị phụ trợ cũng chung một mục đích là nâng cao hiệu
suất công việc. Một thiết bị phụ trợ rất thân thuộc với tất cả mọi người dùng máy tính
đều biết là chuột máy tính.Trước khi chuột máy tính ra đời tất cả việc nhập liệu đều
thông qua bàn phím, việc điều khiển và nhập liệu cho máy tính là công việc không hề
đơn giản, thật khó để mô tả điều khó khăn này. Sau đó chuột máy tính được phát minh,
nó đã giải phóng con người với những phím nhấn cứng nhắc, tương tác giữa người và
máy tính được thực hiện một cách trơn tru, thân thiện hơn và từ đó hiệu suất cũng tăng
lên.
Với những giáo viên, người thuyết trình việc sử dụng các phần mềm trình chiếu
như PowerPoint… là thường xuyên. Đối với các công việc đặc thù này con người cũng
có những thiết bị hỗ trợ là những chiếc remote để điều khiển việc trình chiếu. Tuy
nhiên những chiếc remote này làm hạn chế việc truyền đạt nội dung thông qua ngôn
ngữ hình thể.Từ đó tôi có ý tưởng làm một thiết bị hỗ trợ việc trình chiếu nhưng phải
làm sao ít gây cản trở cho việc truyền đạt bằng ngôn ngữ hình thể nhất có thể. Thay vì
việc cầm một chiếc remote trên tay tôi sẽ đeo nó trên ngón tay, chuyển động trên ngón
tay sẽ được nhận dạng và tùy vào những chuyển động khác nhau sẽ có những lệnh
tương ứng cho việc trình chiếu.
Phạm Văn Lượng
14BKĐT
Trang: 8
CB140212
Luận Văn Tốt Nghiệp
Qua đây em cũng gửi lời cám ơn đến PGS.TS. Đỗ Trọng Tuấn đã hướng dẫn em
trong suốt thời gian học tập và làm luận văn. Dưới sự hướng dẫn của thầy em đã được
cung cấp rất nhiều phương pháp luận, cơ sở lý thuyết, phương pháp phân tích, phương
pháp tiếp cận vấn đề. Quan trọng hơn cả là cách vận dụng lý thuyết vào thực tế. Em
cũng cám ơn các thầy các, các cô đã giúp đỡ em trong quá trình học tập tại trường Đại
Học Bách Khoa Hà Nội. Em xin chân thành cám ơn!
Hà Nội, Ngày… tháng… năm 2016
Học viên:
Phạm Văn Lượng
Phạm Văn Lượng
14BKĐT
Trang: 9
CB140212
Luận Văn Tốt Nghiệp
Lý do chọn đề tài
Ngày nay, trong giai đoạn phát triển mạnh mẽ về kỹ thuật điện tử, máy tính và các
chip vi điều khiển tạo điều kiện cho việc nghiên cứu phát triển các ứng dụng công
nghệ cao. Các công nghệ sensor cũng rất phát triển đặc biệt là công nghệ theo dõi
chuyển động như accelerometer, gyroscope, magnetometer. Công nghệ theo dõi
chuyển động được ứng dụng rất nhiều trong việc dựng phim đồ hoa, theo dõi sức
khỏe… điển hình là Misfit một hãng công nghệ chuyên về việc theo dõi thể vận động
của người sử dụng. Công nghệ nhận dạng chuyển động dùng sensor accelerometer,
gyroscope… tương đối mới và đang được phát triển bởi khá nhiều phòng nghiên cứu,
Ngoài các ứng dụng đã kể ở trên còn các ứng dụng khác đang được sử dụng trong các
điện thoại, máy bay không người lái, tay cầm chơi game, điều khiển tv... Với tôi, tôi
muốn ứng dụng công nghệ nhận dạng chuyển động mới mẻ này vào việc điều khiển
trình chiếu hỗ trợ việc thuyết trình và giảng dạy.
Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu
Luận văn này trình bày cơ bản về giải pháp cho một thiết bị hỗ trợ trình chiếu,
thuyết trình và giảng day sử dụng màn hình lớn.
Đối tượng nghiên cứu của luận văn là thiết kế một thiết bị điều khiển hỗ trợ trình
chiếu với trọng tâm là việc theo dõi và nhận dạng các chuyển động của ngón tay.
Phạm vi nghiên cứu của luận văn là thiết kế mạch, đưa ra phương pháp nhận dạng
chuyển động phù hợp với các sensor theo dõi chuyển động trên ngón tay. Từ đó đưa ra
các lệnh điều khiển máy tính ứng dụng cho việc trình chiếu.
Mục tiêu của đề tài
-
Nhận dạng được 8 động tác của ngón tay.
-
Nhận dạng chuyển động với thời gian thực.
-
Tỉ lệ chính xác đạt 80%.
Phạm Văn Lượng
14BKĐT
Trang: 10
CB140212
Luận Văn Tốt Nghiệp
Phương pháp nghiên cứu
Thiết kế mạch sao cho theo dõi được chuyển động của ngón tay. Mạch phải nhỏ
gọn sao cho thao tác thu thập dữ liệu chuyển động của ngón tay phải đơn giản.
Theo dõi các đặc trưng chuyển động ngón tay, sau đó dưa ra giải pháp huấn luyện
và nhận dạng mẫu. Tìm hiểu các phương pháp nhận dạng mẫu như Neuron, vector
quantization , dynamic time warping.
Nội dung của luận văn
Phần nội dung chính của luận văn gồm 3 chương:
Chương 1
Tổng quát
Giới thiệu các chức năng và ứng dụng của các thiết bị hỗ trợ trình chiếu đang có
trên thị trường. Đưa ra cái nhìn tổng quan về lý thuyết nhận dạng mẫu, giới thiệu các
bước trong kỹ thuật nhận dạng. Giới thiệu mạng neuron nhân tạo.
Chương 2
Thiết kế thiết bị điều khiển máy tính
Trình bày các bước thiết kế thiết bị điều khiển máy tính, phân tích thiết kế từ ý
tưởng đến các bước thực hiện, thiết kế mạch, lập trình.
Chương 3
Kiểm thử và đánh giá
Chương này trình bày các bước kiểm thử, đánh giá và tối ưu các bước thiết kế ở
chương 2 từ đó đưa ra kết luận.
Phạm Văn Lượng
14BKĐT
Trang: 11
CB140212
Luận Văn Tốt Nghiệp
CHƯƠNG 1
1.1.
TỔNG QUAN
Giới thiệu về các thiết bị hỗ trợ trình chiếu đang có trên thị trường
Trên thị trường hiện tại có rất nhiều loại thiết bị hỗ trợ trình chiếu với những ưu
nhược điểm khác nhau. Nhưng hầu hết các thiết bị này đều có các đặc điểm chung.Các
thiết bị này đều có từ 2 đến 8 nút chức năng phục vụ cho việc trình chiếu như điều
khiển slide tới, lùi, hiển thị toàn màn hình, thoát chế độ toàn màn hình, chiếu laser.
Điều tiện lợi khi sử dụng thiết bị là không cần dùng bàn phím máy tính, chuột, que chỉ
hay ra hiệu cho đồng nghiệp hỗ trợ điều khiển slide. Phạm vi hoạt động trong bán kính
15-30m vì vậy người sử dụng có thể di chuyển khắp phòng để thuyết trình. Thiết bị
được kết nối không dây với máy tính thông qua một đầu thu tín hiệu không dây. Đầu
thu tín hiệu không dây được kết nối với máy tính qua cổng USB.
Hình 1. 1 Một thiết bị hỗ trợ trình chiếu trên thị tường
Phạm Văn Lượng
14BKĐT
Trang: 12
CB140212
Luận Văn Tốt Nghiệp
1.2.
Thiết bị mà luận văn hướng tới
Các thiết bị hỗ trợ trình chiếu đang có hiện nay có rất nhiều ưu điểm nhưng nó vẫn
tồn tại những nhược điểm như kích thước vẫn còn tương đối lớn cho việc luôn phải
cầm thiết bị trên tay. Khi cầm thiết bị trên tay sẽ gây cản trở việc truyền đạt ngôn ngữ
hình thể, vướng víu khi cần thực hiện những việc cần đến đôi tay.
Mong muốn khắc phục được nhược điểm đã kể trên của những thiết bị đang có trên
thị trường tôi muốn thiết kế một thiết bị nhỏ gọn nhưng vẫn có đầy đủ các chức năng
của những thiết bị hỗ trợ trình chiếu. Ngoài ra thiết bị phải hỗ trợ việc truyền đạt ngôn
ngữ hình thể một cách tốt nhất. Từ đó tôi có một ý nghĩ sao không dùng chính ngôn
ngữ hình thể để điều khiển, hỗ trợ trình chiếu.
Qua những kiến thức đã tích lỹ trong quá trình học tập và công việc tôi nhận thấy
rằng lý thuyết nhận dạng rất phù hợp cho việc nhận dạng những chuyển động dùng để
ra lệnh điều khiển máy tính hỗ trợ việc trình chiếu.
1.3.
Lý thuyết nhận dạng
Trích dẫn từ “Nhận dạng mẫu” của Wikipedia.
“Nhận dạng mẫu (pattern
recognition) là một ngành thuộc lĩnh vực học máy (machine learning). Nói cách khác,
nó có thể được xem là việc cần thực hiện một tác động vào dữ liệu thô mà tác động cụ
thể là gì sẽ tùy vào loại của dữ liệu đó. Như vậy nó là một tập các phương pháp học có
giám sát (supervised learning).
Nhận dạng mẫu nhằm mục đích phân loại dữ liệu (là các mẫu) dựa trên: hoặc là
kiến thức tiên nghiệm (a priori) hoặc dựa vào thông tin thống kê được trích rút từ các
mẫu có sẵn. Các mẫu cần phân loại thường được biểu diễn thành các nhóm của các dữ
liệu đo đạc hay quan sát được, mỗi nhóm là một điểm ở trong một không gian đa chiều
phù hợp. Đó là không gian của các đặc tính để dựa vào đó ta có thể phân loại.
Một hệ thống nhận dạng mẫu hoàn thiện gồm một thiết bị cảm nhận (sensor) để thu
thập các quan sát cần cho việc phân loại hay miêu tả; một cơ chế trích rút đặc trưng
(feature extraction) để tính toán các thông tin dưới dạng số hay dạng tượng trưng
(symbolic) từ các dữ liệu quan sát được; và một bộ phân loại (hay lược đồ mô tả)
Phạm Văn Lượng
14BKĐT
Trang: 13
CB140212
Luận Văn Tốt Nghiệp
nhằm thực hiện công việc phân loại thực sự (hay miêu tả các quan sát đó) dựa vào các
đặc tính đã được trích rút.
Việc phân loại (hay lược đồ mô tả) thường dựa vào sự có sẵn của một tập các mẫu
đã được phân loại (hay miêu tả) sẵn. Tập các mẫu này được gọi là tập huấn luyện và
chiến lược học nhằm phân loại mẫu vào một trong các lớp có sẵn được gọi là học có
giám sát. Việc học cũng có thể là không có giám sát, theo nghĩa là hệ thống không
được cung cấp các mẫu được đánh nhãn (phân loại) tiên nghiệm, mà nó phải tự đưa ra
các lớp để phân loại dựa vào tính ổn định trong thống kê của các mẫu.
Việc phân loại (hay lược đồ mô tả) thường dùng một trong các hướng tiếp cận sau:
thống kê (hay lí thuyết quyết định), cú pháp (hay cấu trúc). Nhận dạng mẫu dùng
thống kê là dựa vào các đặc tính thống kê của các mẫu, chẳng hạn rằng các mẫu được
tạo mới một hệ thống xác suất. Nhận dạng dùng cấu trúc là dựa vào tương quan cấu
trúc giữa các mẫu.
Các ứng dụng phổ biến là nhận dạng tiếng nói tự động, phân loại văn bản thành
nhiều loại khác nhau (ví dụ: những thư điện tử nào là spam/non-spam), nhận dạng tự
động các mã bưu điện viết tay trên các bao thư, hay hệ thống nhận dạng danh tính dựa
vào mặt người. Ba ví dụ cuối tạo thành lãnh vực con phân tích ảnh của nhận dạng mẫu
với đầu vào là các ảnh số.”
Hình 1. 2 Sơ đồ hệ thống nhận dạng
Phạm Văn Lượng
14BKĐT
Trang: 14
CB140212
Luận Văn Tốt Nghiệp
Có thể nói ngắn gọn lý thuyết nhận dạng được chia thành hai phần: huấn luyện,
nhận dạng.Phần huấn luyện có hai phần chính là trích chọn đặc trưng và các phương
pháp nhận dạng dùng để huấn luyện. Phần nhận dạng cũng có hai phần chính là trích
chọn đặc trưng, nhận dạng.Ở phần huấn luyện dùng phương pháp trích chọn đặc trưng
và nhận dạng nào thì phần nhận dạng cũng dùng phương pháp đó. Sự khác nhau ở đây
là huấn luyện để tạo ra các bộ tham số cho phần nhận dạng, nhận dạng là việc sử dụng
các tham số đã được huấn luyện so sánh, phân loại tín hiệu đầu vào thành tín hiệu đầu
ra đã được định nghĩa.
Ngày nay các phương pháp nhận dạng được phát triển rất mạnh và được ứng dụng
cho rất nhiều ứng dụng khác nhau. Các ứng dụng sử dụng phương pháp nhận dạng phổ
biến hiện nay phải kể đến việc nhận dạng giọng nói, nhận dạng hình ảnh... Nhận dạng
giọng nói với các phương pháp vector quantization - VQ, dynamic time warping DTW, Hidden Markov Model – HMM,Neuron. Nhận dạng ảnh với các ứng dụng nhận
dạng khuôn mặt, nhận dạng chữ viêt… sẽ có những phương pháp nhận dạng riêng
nhưng Neuron là phương pháp nhận dạng phổ biến nhất đang được sử dụng.
Mạng Neuron nhân tạo được coi là một công cụ mạnh để giải quyết các bài toán có
tính phi tuyến, phức tạp và đặc biệt trong các trường hợp mà mối quan hệ giữa các quá
trình không dễ thiết lập một cách tường minh.Tôi nhận thấy điều này rất phù hợp với
ứng dụng mà đề tài đang hướng tới vì vậy tôi quết định sử dụng phương pháp nhận
dạng này cho luận văn của mình.
Để thực hiện bài toán nhận dạng chuyển động theo yêu cầu của đề bài cũng phải
trải qua các bước tuần tự như lấy dữ liệu sensor, trích trọn đặc trưng, dạy và nhận
dạng.
Phạm Văn Lượng
14BKĐT
Trang: 15
CB140212
Luận Văn Tốt Nghiệp
Hình 1. 3 Sơ đồ nhận dạng chuyển động dùng IMU.
1.4.
Giới thiệu về mạng neuron
Theo các nhà nghiên cứu sinh học về bộ não, hệ thống thần kinh của con người bao
gồm khoảng 100 tỷ tế bào thần kinh, thường gọi là các neuron. Mỗi tế bào neuron gồm
ba phần:
Thân neuron với nhân bên trong (gọi là soma), là nơi tiếp nhận hay phát
ra các xung động thần kinh.
Một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite) để đưa tín
hiệu tới nhân neuron. Các dây thần kinh vào tạo thành một lưới dày đặc xung
quanh thân neuron, chiếm diện tích khoảng 0,25 mm2.
Đầu dây thần kinh ra (gọi là sợi trục axon) phân nhánh dạng hình cây, có
thể dài từ một cm đến hàng mét. Chúng nối với các dây thần kinh vào hoặc trực
tiếp với nhân tế bào của các neuron khác thông qua các khớp nối (gọi là
synapse). Thông thường mỗi neuron có thể có từ vài chục cho tới hàng trăm
ngàn khớp nối để nối với các neuron khác. Có hai loại khớp nối, khớp nối kích
thích (excitatory) sẽ cho tín hiệu qua nó để tới neuron còn khớp nối ức chế
(inhibitory) có tác dụng làm cản tín hiệu tới neuron. Người ta ước tính mỗi
neuron trong bộ não của con người có khoảng 104 khớp nối (hình 2.1)
Phạm Văn Lượng
14BKĐT
Trang: 16
CB140212
Luận Văn Tốt Nghiệp
Chức năng cơ bản của các tế bào neuron là liên kết với nhau để tạo nên hệ thống
thần kinh điều khiển hoạt động của cơ thể sống. Các tế bào neuron truyền tín hiệu cho
nhau thông qua các dây thần kinh vào và ra, các tín hiệu đó có dạng xung điện và được
tạo ra từ các quá trình phản ứng hoá học phức tạp. Tại nhân tế bào, khi điện thế của tín
hiệu vào đạt tới một ngưỡng nào đó thì nó sẽ tạo ra một xung điện dẫn tới trục dây
thần kinh ra. Xung này truyền theo trục ra tới các nhánh rẽ và tiếp tục truyền tới các
neuron khác.
Hình 1. 4 Ảnh minh họa neuron của người
1.5.
Mô hình mạng Neuron
Một mạng Neuron là một tập hợp liên kết lẫn nhau của các phần tử tính toán phi
tuyến đơn giản.
1.5.1. Mô hình một neuron
Hình 1. 5 Mô hình mạng neuron nhân tạo.
Phạm Văn Lượng
14BKĐT
Trang: 17
CB140212
Luận Văn Tốt Nghiệp
X1…Xm là các tín hiệu đầu vào có thể là tín hiệu thô hoặc tín
hiệu đã qua xử lý.
W là trọng số kết nối của mỗi đầu vào.
∑ tính tổng các tín hiệu đầu vào đã nhân trọng số tương ứng. Từ
đó tạo nên một bộ tổng hợp tuyến tính.
Công thức hàm cộng tuyến tính.
m
u wjxj
j 1
(.) hàm kích hoạt để giới hạn biên độ đầu ra cả Neuron.
Công thức hàm kích hoạt
y (u b)
Bais b là hệ số hiệu chỉnh tác động điều chỉnh đầu ra, có thể coi là
một hằng số đầu vào có w cố định.
Y là đầu ra. Giá trị của nó phụ thuộc vào loại hàm kích hoạt.
Hàm kích hoạt quết định rất nhiều tính hiệu đầu ra của mỗi neuron. Ở
đây tôi trình bày một số hàm kích hoạt phổ biến.
Hard-limite
Hình 1. 6 Đồ thị Hard-limite
1 if v 0
0 if v 0
v
Hàm hard limite là hàm sét ngưỡng đầu ra của nó chỉ có 2 mức logic là 0 và 1.
Phạm Văn Lượng
14BKĐT
Trang: 18
CB140212
Luận Văn Tốt Nghiệp
Piecewise linear
Hình 1. 7 Đồ thị Piecewise linear
if v 1 2
1
v v if 1 2 v 1 2
0
if v 1 2
Hàm picewise linear là hàm biến đổi phân đoạn tuyến tính, đoạn tuyến tính được
thể hiện ở -0.5 đến 0.5.
Sigmoid
Hình 1. 8 Đồ thị Sigmoid
v
1
1 exp(av)
Hàm ngưỡng đầu ra này là hàm đường cong lôgit.
Phạm Văn Lượng
14BKĐT
Trang: 19
CB140212
Luận Văn Tốt Nghiệp
Hyperbolic tangent
Hình 1. 9 Đồ thị Hyperbolic tangent
v tanh v
1.5.2. Liên kết trong mạng neuron nhân tạo
Mạng neuron nhân tạo gồm các neuron và liên kết có trọng số giữa chúng. ANN
tạo nên một hệ thống xử lý thông tin làm việc trên cơ sở phỏng theo cách làm việc của
hệ thống các neuron trong bộ não con người. Tuy nhiên, trong bộ não của con người,
các tế bào neuron liên kết với nhau chằng chịt và tạo nên một mạng lưới vô cùng phức
tạp. Các loại mạng neuron nhân tạo được xác định bởi cách liên kết giữa các neuron ,
trọng số của các liên kết đó và hàm chuyển tại mỗi neuron.
Hình 1. 10 Mạng neuron truyền thẳng một lớp
(Single-layer feedforward network)
Phạm Văn Lượng
14BKĐT
Trang: 20
CB140212
Luận Văn Tốt Nghiệp
Mạng neuron truyền thẳng một lớp là loại mạng chỉ có lớp neuron đầu vào và một
lớp neuron đầu ra (thực chất lớp neuron đầu vào không có vai trò xử lý, do đó ta nói
mạng chỉ có một lớp). Loại mạng này còn được gọi là mạng perceptron một lớp. Mỗi
neuron đầu ra có thể nhận tín hiệu từ các đầu vào x1, x2, …, xm để tạo ra tín hiệu đầu
ra tương ứng.
Hình 1. 11 Mạng neuron truyền thẳng nhiều lớp
(Multil-layer feedforward network).
Trong mạng neuron truyền thẳng nhiều lớp, lớp nhận tín hiệu vào của mạng gọi là
lớp vào (input layer), nó thường không thực hiện việc chuyển đổi thông tin mà chỉ làm
chức năng nhận tín hiệu. Tín hiệu ra của mạng được đưa ra từ lớp ra (output layer).
Các lớp ở giữa lớp vào và lớp ra gọi là các lớp ẩn. Trong mạng truyền thẳng
(feedforward network) không có nút nào mà đầu ra của nó là đầu vào của một nút khác
trên cùng lớp với nó hoặc lớp trước. Mạng có phản hồi (feedback network) là mạng
mà đầu ra của một neuron có thể trở thành đầu vào của neuron trên cùng một lớp hoặc
của lớp trước đó. Mạng feedback có chu trình khép khín gọi là mạng quy hồi
(recurrent network).
Phạm Văn Lượng
14BKĐT
Trang: 21
CB140212
Luận Văn Tốt Nghiệp
Z
Z
Hình 1. 12 Mạng neuron hồi quy một lớp
1.5.3. Khả năng ứng dụng của mạng neuron nhân tạo trong nhận dạng
Đặc trưng của mạng neuron nhân tạo là khả năng học và xử lý song song. Nó
có thể gần đúng mối quan hệ tương quan phức tạp giữa các yếu tố đầu vào và đầu ra
của các quá trình cần nghiên cứu và khi đã học được thì việc kiểm tra độc lập thường
cho kết quả tốt. Sau khi đã học xong, mạng neuron nhân tạo có thể tính toán kết quả
đầu ra tương ứng với bộ số liệu đầu vào mới. Về mặt cấu trúc, mạng neuron nhân tạo
là một hệ thống gồm nhiều phần tử xử lý đơn giản cùng hoạt động song song. Tính
năng này của ANN cho phép nó có thể được áp dụng để giải các bài toán lớn. Về khía
cạnh toán học, theo định lý Kolmogorov, một hàm liên tục bất kỳ f( x1, x2,.. , xn ) xác
định trên khoảng In ( với I =[0,1]) có thể được biểu diễn dưới dạng:
trong đó : χj , Ψij là các hàm liên tục một biến. Ψij là hàm đơn điệu, không phụ
thuộc vào hàm f. Mặt khác, mô hình mạng neuron nhân tạo cho phép liên kết có trọng
số các phần tử phi tuyến (các neuron đơn lẻ) tạo nên dạng hàm tổng hợp từ các hàm
thành phần. Do vậy, sau một quá trình điều chỉnh sự liên kết cho phù hợp (quá trình
học), các phần tử phi tuyến đó sẽ tạo nên một hàm phi tuyến phức tạp có khả năng xấp
xỉ hàm biểu diễn quá trình cần nghiên cứu. Kết quả là đầu ra của nó sẽ tương tự với kết
Phạm Văn Lượng
14BKĐT
Trang: 22
CB140212
Luận Văn Tốt Nghiệp
quả đầu ra của tập dữ liệu dùng để luyện mạng. Khi đó ta nói mạng neuron nhân tạo đã
học được mối quan hệ tương quan đầu vào - đầu ra của quá trình và lưu lại mối quan
hệ tương quan này thông qua bộ trọng số liên kết giữa các nơ ron. Do đó, mạng neuron
nhân tạo có thể tính toán trên bộ số liệu đầu vào mới để đưa ra kết quả đầu ra tương
ứng.
Hình 1. 13 Hồi quy tuyến tính Y = a1X + a2.
Hình 1. 14 Xấp xỉ bằng neuron Y = f(X, a1, ..., an).
Với những đặc điểm đó, mạng nơron nhân tạo đã được sử dụng để giải quyết nhiều
bài toán thuộc nhiều lĩnh vực của các ngành khác nhau. Các nhóm ứng dụng mà mạng
neuron nhân tạo đã được áp dụng rất có hiệu quả là:
Phạm Văn Lượng
14BKĐT
Trang: 23
CB140212
Luận Văn Tốt Nghiệp
Bài toán phân lớp: Loại bài toán này đòi hỏi giải quyết vấn đề phân loại các đối
tượng quan sát được thành các nhóm dựa trên các đặc điểm của các nhóm đối tượng
đó. Đây là dạng bài toán cơ sở của rất nhiều bài toán trong thực tế: nhận dạng chữ viết,
tiếng nói, phân loại gen, phân loại chất lượng sản phẩm,…
Bài toán dự báo: Mạng neuron nhân tạo đã được ứng dụng thành công trong việc xây
dựng các mô hình dự báo sử dụng tập dữ liệu trong quá khứ để dự đoán số liệu trong
tương lai. Đây là nhóm bài toán khó và rất quan trọng trong nhiều ngành khoa học.
Bài toán điều khiển và tối ưu hoá: Nhờ khả năng học và xấp xỉ hàm mà mạng
neuron nhân tạo đã được sử dụng trong nhiều hệ thống điều khiển tự động cũng như
góp phần giải quyết những bài toán tối ưu trong thực tế.
Tóm lại, mạng neuron nhân tạo được xem như là một cách tiếp cận đầy tiềm năng
để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt là trong tình huống
mối quan hệ bản chất vật lý của quá trình cần nghiên cứu không dễ thiết lập tường
minh.
1.6.
Mạng neuron lan truyền thẳng nhiều lớp
1.6.1. Mạng perceptron một lớp
Mạng perceptron một lớp do F.Rosenblatt đề xuất năm 1960 [1] là mạng truyền
thẳng chỉ một lớp vào và một lớp ra không có lớp ẩn. Trên mỗi lớp này có thể có một
hoặc nhiều neuron. Mô hình mạng neuron của Rosenblatt sử dụng hàm ngưỡng đóng
vai trò là hàm chuyển. Do đó, tổng của các tín hiệu vào lớn hơn giá trị ngưỡng thì giá
trị đầu ra của neuron sẽ là 1, còn trái lại sẽ là 0.
Phạm Văn Lượng
14BKĐT
Trang: 24
CB140212