Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Xây dựng mạng giám sát hành vi người trong tịa nhà
sử dụng cơng nghệ WIFI
ĐÀO TƠ HIỆU1,2
Trường Đại học Cơng nghệ Thơng tin và Truyền thông
2
Học viện Khoa học và Công nghệ-VAST
Email:
TRẦN ĐỨC NGHĨA
Viện Công nghệ Thông tin IOIT-VAST
Viện Hàn Lâm KH&CN Việt Nam
Email:
1
đặc trưng này được trích xuất trên từng phân đoạn
dữ liệu theo thời gian với kích thước cố định ngiây và được huấn luyện với thuật toán học máy
cây quyết định để tìm ra các ngưỡng đặc trưng
quan trọng.
II. TỔNG QUAN
Tóm tắt – Hệ thống giám sát hành vi người qua
wifi/internet được triển khai để dự đoán năm hành
động cơ bản bao gồm: ngồi, nằm, đứng, đi bộ và
chạy bộ. Bài viết này trình bày giải pháp phân loại
hành động dựa trên các ngưỡng đặc trưng gia tốc
điển hình theo thời gian thực. Để phát hiện các
ngưỡng đặc trưng tín hiệu, nhóm nghiên cứu xây
dựng mơ hình phân loại hành động ứng dụng thuật
toán học máy cây quyết định (DT) với đầu vào là
các đặc trưng dữ liệu gia tốc ba trục. Từ đó, các
hoạt động thường ngày của con người được theo
dõi, quan sát từ xa trên điện thoại thông minh và
máy chủ dữ liệu qua mạng wifi/internet. Nghiên cứu
này hướng đến xây dựng hệ thống giám sát hành vi
người trong tịa nhà có hiệu suất cao, giá thành rẻ
và hoạt động theo thời gian thực. Kết quả thực
nghiệm đạt được độ chính xác hơn 90% là tốt khi
gắn cố định thiết bị phân loại trên eo người các tình
nguyện viên tham gia thử nghiệm.
Từ khóa: machine learning, decision tree, wifi,
phân loại, hành động, đặc trưng, gia tốc.
A. Mơ hình phân loại hành động
Mơ hình phân loại hành động (Hình 1) gồm 3
giai đoạn chính: i> Thu thập dữ liệu; ii> Chọn lọc
đặc trưng; iii> Phân loại hành động.
Dữ liệu thô
Tiền xử lý
Phân đoạn
theo thời gian
Thu thập dữ liệu
Hành vi
Huấn luyện,
phân loại
Phân loại hành động
Trích chọn
đặc trưng
Chọn lọc đặc trưng
Hình 1: Mơ hình phân loại hành động
Thu thập dữ liệu: Các hành vi người được
thu thập nhờ thiết bị giám sát mang trên người và
được chuyển thành các tín hiệu điện tương ứng.
Dữ liệu cần được tiền xử lý giảm nhiễu và loại bỏ
dữ liệu lỗi xảy ra trong quá trình lấy mẫu dữ liệu
Chọn lọc đặc trưng: Dữ liệu sau khi tiền xử
lý được chia thành các phân đoạn theo thời gian.
Lựa chọn độ dài của cửa sổ thời gian hợp lý giúp
cho hiệu quả phân loại tốt. Bên cạnh đó, chọn lọc
đặc tính nổi bật của dữ liệu để tăng hiệu quả phân
loại và giảm kích thước dữ liệu đầu vào.
Phân loại hành động: Các đặc trưng chọn lọc
được gán nhãn tương ứng với hoạt động và chia
thành tập dữ liệu đào tạo, tập dữ liệu kiểm tra. Dữ
liệu đặc trưng được huấn luyện với các thuật tốn
học máy để nâng cao độ chính xác.
B. Thuật toán học máy
Hai phương pháp phổ biến áp dụng cho bài
toán nhận dạng hành động bao gồm: 1> học có
giám sát; 2> Học khơng giám sát. Phương pháp
<1> nhận dạng hoạt động người dựa trên thị giác
máy sử dụng đầu vào là camera, video… để quan
sát hành động người [10], [11]. Phương pháp này
I. GIỚI THIỆU
Trong những năm gần đây, nhiều cơng trình
khoa học đã được cơng bố dựa trên phân loại
hành động người trong y tế như theo dõi sức khỏe
[1], [2], cảnh báo người già bị ngã [3], [4]; an
ninh [5]; thể thao, nghệ thuật, giải trí [6]–[8];
cơng nghiệp [9]. Điển hình trong y tế là các giải
pháp điều trị, theo dõi bệnh nhân từ xa giúp tiết
kiệm được rất nhiều thời gian, kinh phí cho bệnh
nhân nhờ ứng dụng khoa học kỹ thuật. Hơn thế
nữa, bệnh nhân sau phẫu thuật khi không phải ở
lại viện lâu ngày mà có thể được y bác sĩ giám sát
hành vi từ xa để dự đoán thể trạng phục hồi. Do
đó, nghiên cứu này hướng đến xây dựng hệ thống
giám sát hành vi người dựa trên một thiết bị nhỏ
được gắn cố định trên eo của mỗi người và có khả
năng kết nối máy chủ dữ liệu qua hạ tầng mạng
wifi/internet. Nhóm nghiên cứu đề xuất sử dụng
năm loại đặc trưng dữ liệu bao gồm trung bình,
bình phương trung bình, phạm vi liên phần tư, độ
lệch chuẩn và phạm vi trên cả 3 trục X, Y, Z. Các
ISBN 978-604-80-5958-3
LÊ MINH HỊA
Khoa Điện-Điện tử
Trường Đại học Giao thơng Vận tải
Email:
TRẦN ĐỨC TÂN*
Khoa Điện – Điện tử
Trường Đại học Phenikaa
Email:
48
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
giới hạn trong một không gian nhất định do các
thiết bị được lắp đặt cố định, khơng có tính di
động, chi phí triển triển khai và bảo trì lớn. Vì
vậy, việc giám sát hoạt động có thể bị gián đoạn,
khơng liên tục và khó khăn khi triển khai rộng rãi.
Với hướng tiếp cận thứ 2, dựa trên dữ liệu hành vi
được thu thập, các thuật toán học máy đã được
triển khai trong một số hệ thống nhận dạng hành
động như cây quyết định (DT) [12], cây quyết
định tăng cường (GBDT) [13]. Nghiên cứu của
Tian [14] đề xuất phương pháp đặc tính bộ lọc
chung dựa trên các đặc trưng phổ năng lượng
sóng để phát hiện hành vi người. Nghiên cứu này
đã sử dụng hai thuật toán học máy gồm K láng
giềng gần (KNN) và vector máy hỗ trợ (SVM) để
cải thiện độ chính xác của hệ thống. Hussain và
cộng sự [15] đạt được độ chính xác 99.80% khi
sử dụng KNN và 96.82% với rừng ngẫu nhiên
(RF). Balli và cộng sự [16] đã nghiên cứu phương
pháp phát hiện chuyển động người bằng cách sử
dụng đồng hồ thơng minh đếm bước, góc quay,
gia tốc kế và cảm biến nhịp tim. Các đặc trưng
được trích xuất bởi phương pháp phân tích thành
phần chính (PCA) và RF để phân loại.
C. Mạng giám sát hành vi
Mạng giám sát hành vi thiết bị thu thập và
phân loại được kết nối đến máy chủ dữ liệu thông
qua công nghệ wifi. Bộ xử lý trung tâm
(ESP8266) được tích hợp cơng nghệ wifi tiêu thụ
năng lượng thấp hỗ trợ giao tiếp vào/ra ở mức
logic tối đa 3.3V và nguồn pin lipo 3.7V850maH.
khắc phục sự chênh lệch giữa điện áp chịu đựng
và điện áp pin do điện áp nguồn pin thông thường
từ 3.7V - 4.2V, tín hiệu điện áp pin được đi qua
mạch phân áp. Tiếp theo, phương pháp đo pin
được minh họa theo cơng thức (2) sẽ giúp tính
tốn dung lượng pin theo tỷ lệ %.
adc * Vref
Perpin =
Cảm biến
gia tốc
Hình 2: Sơ đồ khối thiết bị
R - Oi / Si
(1)
Với Ai là Giá trị gia tốc theo hướng i; 𝑆𝑎𝑚𝑖 là
giá trị sau khi lấy mẫu trục i; R là điện trở treo
tham chiếu điện áp; 𝑂𝑖 là phần bù và 𝑆𝑖 là độ nhạy
của gia tốc trên trục i.
Bên cạnh đó, thiết bị có thơng tin cảnh báo
đến người giám sát khi năng lượng sụt xuống qua
ứng dụng điện thoại hoặc đèn báo trên thiết bị. Để
ISBN 978-604-80-5958-3
(2)
A. Lấy mẫu và tiền xử lý
Tình nguyện viên
Nhóm nghiên cứu đã tiến hành ghi dữ liệu thử
nghiệm với một nhóm gồm 15 tình nguyện viên
(tám nam và bảy nữ, tuổi: 18-32, chiều cao: 1.561.75m, cân nặng: 43-62 kg, được chọn từ trường
Đại học CNTT). Mỗi tình nguyện viên mang thiết
bị được đề xuất trên eo (Hình 4) sao cho trục Ax
song song với véc tơ trọng lực và thực hiện các
hành vi: ngồi, nằm, đứng, đi bộ và chạy bộ.
Để thu thập dữ liệu hành động, bộ xử lý trung
tâm ESP8266 kết nối cảm biến gia tốc ADXL345
theo giao thức I2C tới xung đồng bộ 100KHz. Giá
trị gia tốc được thu thập trên cả ba trục Ax, Ay,
Az với tần số lấy mẫu 1Hz và đơn vị gia tốc g.
Giá trị gia tốc được tính theo cơng thức (1).
Sami
1024
R5
Sau khi thiết lập xong, mỗi thiết bị thu thập,
giám sát là một node với mã địa chỉ riêng và giao
tiếp với máy chủ dữ liệu theo giao thức
HTTP/GET. Dữ liệu hành động và kết quả phân
loại được lưu trên cơ sở dữ liệu MySQL.
III. PHƯƠNG PHÁP NGHIÊN CỨU
BỘ NHỚ LƯU TRỮ
Ai =
100%
− 3.7
0.5
R4 + R5
Hình 3: Ứng dụng phân loại hành động và máy chủ dữ liệu
WIFI/
WIFI/
INTERNET/LAN
INTERNET
BỘ XỬ LÝ
ESP8266
TRUNG
TÂM
−1
Trong đó, adc là giá trị chuyển đổi tại chân
đọc tín hiệu điện áp pin; re là độ phân giải của bộ
chuyển đổi tương tự - số; R4 và R5 là hai điện trở
phân áp mắc nối tiếp.
Khi các thiết bị giám sát hành vi gửi dữ liệu
về máy chủ, dữ liệu có thể truy xuất trực tiếp
thơng qua địa chỉ trên web hoặc ứng dụng trên
điện thoại thơng minh (Hình 3).
Nguồn ni
Cảm biển gia tốc
2
re
Hình 4: Hướng thiết bị thu thập
49
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
đến -0.9g. Do đó, có thể dùng những đặc trưng
như giá trị trung bình, giá trị phạm vi liên phần tư
để phân biệt 3 hành động nằm, ngồi và đứng.
Thu thập dữ liệu
Các hành động được giám sát bao gồm: nằm,
ngồi, đứng, đi bộ và chạy bộ được định nghĩa
trong Bảng 1.
Bảng 1: Các hành động cơ bản
HÀNH
ĐỘNG
Nằm
Ngồi
Đứng
Đi bộ
Chạy bộ
ĐỊNH NGHĨA
Toàn thân người trên mặt phẳng trong tư thế
nghỉ
Đầu và lưng không chạm nền trong tư thế
nghỉ
Người thẳng, đôi chân không di chuyển
Người thẳng và di chuyển chậm đến vị trí
khác nhau, có ít nhất 1 chân chạm đất
Trạng thái chuyển nhanh đến vị trí khác nhau,
2 chân khơng chạm đất vào một thời điểm.
Hình 8: Biểu đồ hành động đứng với một phần dữ liệu Ax
Bên cạnh đó, các hành động ở trạng thái di
chuyển (đi bộ và chạy bộ) có phạm vi giá trị lớn
hơn so với hành động ở trạng thái ít di chuyển
(nằm, ngồi và đứng). Ví dụ: Hành động đi bộ
(Hình 9) có phạm vi trong khoảng (-1.8g, -0.6g);
hành động chạy bộ (Hình 10) có phạm vi trong
khoảng (-2.0g, 0g). Bởi vậy, đặc trưng phạm vi có
thể phân biệt các hành động ở trạng thái tĩnh, ít di
chuyển với các hành động ở trạng thái động.
Sau khi loại bỏ lỗi tín hiệu, tập dữ liệu thu
được gồm: 4200 mẫu nằm, 3432 mẫu ngồi, 3240
mẫu đứng, 4368 mẫu đi bộ và 3030 mẫu chạy bộ
(Hình 5).
Hình 5: Tập dữ liệu thu thập
Lựa chọn đặc trưng hành vi điển hình sẽ giúp
nâng cao hiệu suất phân loại. Do đó, nghiên cứu
đã phân tích một phần dữ liệu với 200 mẫu dữ
liệu đầu tiên thu được từ cảm biến theo hướng Ax
như Hình 1. Với hành vi nằm (trạng thái nghỉ),
các giá trị cảm biến trên trục Ax có xu hướng dao
động quanh giá trị -0.025g (Hình 6).
Hình 9: Biểu đồ hành động đi bộ với một phần dữ liệu Ax
Hình 10: Biểu đồ hành động chạy bộ với phần dữ liệu Ax
Hơn thế nữa, sự phân bố các giá trị giữa các
hành động có sự khác nhau rõ rệt. Hành vi chạy
bộ có sự phân bố khá đồng đều trong khi các hành
vi cịn lại có sự thưa thớt ở hai bên. Do đó, độ
lệch chuẩn giữa các giá trị với giá trị trung bình
được dùng để phân biệt sự khác nhau giữa khác
hành vi. Ngoài ra, các hành động có giá trị có độ
lớn khác nhau trên trục Ax. Ví dụ: Hành động
nằm có độ lớn các giá trị xấp xỉ 0g; hai hành động
ngồi và đứng có các độ lớn tiệm cận 1g; hai hành
động đi bộ và chạy bộ có các giá trị với độ lớn
hơn 1g. Bởi vậy, đặc trưng bình phương trung
bình có thể sử dụng để phân biệt giữa các hành vi
với nhau.
B. Phân đoạn dữ liệu
Kích thước cửa sổ có ảnh hưởng quan trọng
đến kết quả phân loại [17]. Trong nghiên cứu này,
tập dữ liệu thu thập được phân đoạn thành các cửa
sổ thời gian với kích thước 10 giây và tỷ lệ chồng
Hình 6: Biểu đồ hành động nằm với một phần dữ liệu Ax
Phạm vi giá trị của hành động nằm tương đối
rộng, trong khoảng từ -0.1g đến 0.1g. Khác với
hành động nằm, hành động ngồi (Hình 7) và hành
động đứng (Hình 8) có miền giá trị tương đối hẹp
và lệch âm trên trục Ax.
Hình 7: Biểu đồ hành động ngồi với một phần dữ liệu Ax
Hành động ngồi có miền giá trị từ -0.94g đến 0.7g; hành động ngồi có phạm vi giá trị từ -0.97g
ISBN 978-604-80-5958-3
50
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
lấp 50%. Số lượng cửa sổ sau khi phân đoạn được
thống kê trong Bảng 3.
Đào tạo
588
480
453
611
424
2556
Kiểm tra
251
205
194
261
181
1092
N
N
Range ( X ) = max x − min x
j
i
i
i =1
i =1
Bảng 3: Cửa sổ thời gian các hành động
Hành động
Nằm
Ngồi
Đứng
Đi bộ
Chạy bộ
Tổng
Phạm vi:
Cửa sổ
839
685
647
872
605
3648
(7)
Năm đặc trưng đã nêu được trích xuất trên
từng cửa sổ dữ liệu (Hình 11) cho thấy các hành
vi được tách biệt tốt. Tuy nhiên còn một chút
nhầm lẫn giữa hành động đi bộ và chạy bộ.
D. Phân loại hành động
Sau khi trích chọn đặc trưng trên tập dữ liệu
đào tạo và kiểm tra, các đặc trưng này được huấn
luyện với thuật tốn DT (Hình 12).
Hình 11 biểu diễn dữ liệu đã được phân đoạn
trước và sau khi áp dụng các đặc trưng. Hành
động nằm và ngồi được tách biệt trong khi ba
hành động đứng, đi bộ và chạy bộ thì có sự trùng
lặp khá lớn. Tuy nhiên hai hành động đứng và đi
bộ có mật độ tập trung cao cịn hành động chạy
bộ có sự phân tán.
Hình 12: Đặc trưng quan trọng
Do đó, các ngưỡng đặc trưng quan trọng được
sử dụng bao gồm: mean_x, rms_x, std_x, Irq_x,
range_x (những đặc trưng theo hướng Ax) và
std_y (độ lệch chuẩn theo hướng y).
Hình 11: Biểu diễn dữ liệu với cửa sổ kích thước 10s
Do đó, các cửa sổ đặc trưng với kích thước đề
xuất trong nghiên cứu này đã có hiệu quả khá tốt.
Tiếp theo, tập dữ liệu sau phân đoạn được chia
thành tập dữ liệu đào tạo/ kiểm tra với tỷ lệ 6/4
cùng nhãn tương ứng. Chi tiết số lượng hành vi
trên dữ liệu đào tạo và kiểm tra được thống kê
trong Bảng 3.
C. Trích xuất đặc trưng
Đặc trưng điển hình sẽ giúp cải thiện hiệu suất
mơ hình phân loại. Nghiên cứu này sử dụng năm
đặc trưng cơ bản được trích xuất theo cơng thức
(3) – (7).
Trung bình:
(X ) =
j
N
N
x
i =1 i
(X ) =
j
1
N
N
2
i =1 ( xi - )
Đứng
ISBN 978-604-80-5958-3
X
j
S
Irq_x <= 0.415
Đ
Đ
S
std_y <= 0.02
std_x <= 0.253
Đ
Đ
S
range_x <= 0.685
Đi bộ
S
Đi nhanh
Đ
Đi bộ
S
Hình 13: Thuật tốn phân loại
Thuật tốn phân loại được xây dựng sẽ dựa
trên các ngưỡng đặc trưng quan trọng theo thời
gian thực để dự đốn hành vi (Hình 13). Do đó,
sau mỗi 5 mẫu dữ liệu mới và 5 mẫu dữ liệu cũ,
hệ thống sẽ dự đoán hành vi.
D. Phương pháp đánh giá
Hiệu suất của mơ hình phân loại thường được
đánh giá trên tập dữ liệu kiểm tra thông qua ma
trận tổng hợp kết quả phân loại từng hành vi. Các
chỉ số đánh giá gồm độ chính xác (acc), độ nhạy
(sen), tỷ lệ đoán đúng dương (PPV), tỷ lệ dự đoán
âm (NPV) cho từng hành vi được phân loại. Các
chỉ số này thể hiện qua công thức (8) - (11).
(6)
đã được sắp xếp từ nhỏ đến lớn; Q1 là
vị của N/2 giá trị sau trong
rms_x <= 0.923
S
Đ
Phạm vi liên phần tư (IQR)
Q3 là
std_x <= 0.05
std_y <= 0.386
(5)
trung vị của N/2 giá trị đầu trong X j ;
S
Ngồi
Trung bình bình phương (RMS)
Xj
Đi nhanh
Đ
(4)
1 N 2
xi
N i =1
Trích chọn đặc
trưng
mean_x <= -0.342
S
Đ
(3)
Iqr ( X i ) = Q3 − Q1
Với
Nằm
Độ lệch chuẩn (SD):
RMS Xj =
1
Cửa sổ 10s, chồng
lấp 50%
Dữ liệu gia tốc
acc =
trung
TP + TN
TP + FP + TN + FN
ppv =
.
51
(8);
TP
TP + FP
(10);
sen =
npv =
TP
(9);
TP + FN
TN
TN + FN
(11).
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
IV. KẾT QUẢ VÀ ĐÁNH GIÁ
các hành động khác. Hành động ngồi và đứng có
số hành động nhầm lẫn cao nhất với 10/226 hành
động ngồi bị phân loại thành hành động đứng và
9/236 hành động đứng bị phân loại thành hành
động ngồi. Điều này xảy ra do 2 hành động này
có sự tương đồng về tư thế trong trạng thái nghỉ.
Bên cạnh đó, một tỷ lệ nhỏ các hành động nằm,
ngồi, đứng có xu hướng bị phân loại hành động đi
bộ hoặc chạy bộ. Ví dụ: Số hành động nằm bị
phân loại thành đi bộ là 5/219 và chạy bộ là
4/2019. Nguyên nhân khi chuyển trạng thái tĩnh
với nhau (đứng, ngồi, nằm) và từ trạng thái tĩnh
sang trạng thái di chuyển (đi bộ, chạy bộ) thì có
sự tương đồng nhất định. Dù có sự giảm nhẹ so
với kết quả phân loại trên tập dữ liệu kiểm tra
nhưng các chỉ số đánh giá đạt được khi thực
nghiệm đạt được tổng thể trên 94% là rất tốt. Độ
chính xác phân loại với từng hành vi trên 97%.
Bên cạnh đó, độ nhạy thấp nhất khi phân loại
hành động đứng, tiếp theo đó là ngồi, nằm. Tuy
nhiên, chỉ số PPV đạt 100% với hành động nằm
trong khi khác hành động khác đạt xấp xỉ 95%.
Tương tự PPV, chỉ số NPV của các hành động đạt
trên 98%.
Mơ hình phân loại được nhóm nghiên cứu đề
xuất cho kết quả trên tập dữ liệu kiểm tra thể hiện
qua ma trận nhầm lẫn (Bảng 3) có 1089/1092
hành vi được phân loại đúng.
Bảng 3: Kết quả phân loại trên dữ liệu thu thập
DỰ ĐỐN
Đứng Đi bộ
HÀNH
ĐỘNG
Nằm
Ngồi
Nằm
251
0
0
0
0
Ngồi
0
205
0
0
0
Đứng
0
0
194
0
0
Đi bộ
0
0
0
260
1
Chạy bộ
Chạy bộ
0
0
0
2
179
Tổng
251
205
194
262
180
Hiệu suất mơ hình khi sử dụng thuật toán DT
được đánh giá qua các chỉ số được thống kê tại
Bảng 4. Các chỉ số đều đạt kết quả tốt trên 99%.
Độ chính xác thấp nhất khi phân loại hành vi đi
bộ và chạy bộ (99.7%). Nhìn chung, sự chênh
lệch giữa các chỉ số đánh giá là khơng đáng kể.
Bảng 4: Hiệu năng thuật tốn DT với từng hành vi
Chỉ số
Nằm
Ngồi
Đứng
Đi
bộ
Chạy bộ
Acc (%)
100.0
100.0
100.0
99.7
99.7
Sen (%)
100.0
100.0
100.0
99.6
98.9
PPV (%)
100.0
100.0
100.0
99.2
99.4
NPV (%)
100.0
100.0
100.0
99.9
99.8
Bảng 7: Hiệu suất phân loại khi thực nghiệm
Hiệu năng của mơ hình đề xuất được kiểm
chứng qua q trình thực nghiệm phân loại hành
động theo thời gian thực. Để nhận biết sự thay đổi
giữa khác hành vi xảy ra nhanh, tần số lấy mẫu
được tăng lên 10Hz. Các hành động được luân
phiên thay đổi với tốc độ vừa phải và diễn ra với
thời gian khảo sát liên tục giữa các hành động,
mỗi hành động có thời gian khảo sát từ 3 phút đến
4 phút. Từ đó, nhóm nghiên cứu thu được ma trận
nhầm lẫn thực nghiệm như Bảng 6.
DỰ ĐOÁN
Đứng Đi bộ
Nằm
Ngồi
Nằm
210
0
0
5
4
Ngồi
0
212
10
3
1
Đứng
0
9
220
4
3
Đi bộ
0
0
0
230
4
Chạy bộ
0
0
0
0
215
Tổng
210
221
230
242
227
Ngồi
Đứng
Đi bộ
Chạy
bộ
Acc (%)
99.2
97.9
97.7
98.5
98.9
Sen (%)
95.9
93.8
93.2
98.3
100.0
PPV (%)
100.0
95.9
95.7
95.0
94.7
NPV (%)
99.0
98.4
98.2
99.5
100.0
Trong cuộc sống hiện đại ngày nay, nhu cầu
chăm sóc sức khỏe ngày càng được chú trọng, đặc
biệt là người bệnh và người già. Các ứng dụng
nhận dạng hoạt động nâng cao được tích hợp để
hỗ trợ các hoạt động của con người. Đã có nhiều
nghiên cứu lựa chọn khá nhiều đặc điểm để nâng
cao tỷ lệ nhận diện hoạt động. Ví dụ: Các nghiên
cứu [17], [18], [19] sử dụng 43 đặc trưng; nghiên
cứu [20] sử dụng 64 đặc trưng. Nghiên cứu hiện
tại của chúng tôi chỉ sử dụng 5 đặc trưng trên các
phân đoạn dữ liệu 10 giây và kết hợp thuật toán
DT nhưng hiệu quả đạt được trên 99% với dữ liệu
thu thập và trên 97% với dữ liệu thực nghiệm theo
thời gian thực. Không những vậy,
Để so sánh hiệu năng mơ hình đề xuất, các
thuật tốn học máy phổ thông như SVM, RF,
KNN, GBDT được áp dụng trên bộ dữ liệu thu
thập đều có độ chính xác 99.9%. Bên cạnh đó, các
thuật tốn SVM, RF, KNN có NPV đạt 100%
trong khi thuật toán DT và GBDT thấp hơn một
chút với 99.9%.
Chạy bộ
Kết quả thực nghiệm cho thấy hành động chạy
bộ được phân loại hoàn toàn trong khi các hành
động nằm, ngồi, đứng, đi bộ có sự nhầm lẫn với
ISBN 978-604-80-5958-3
Nằm
V. THẢO LUẬN
Bảng 6: Kết quả phân loại khi thực nghiệm
HÀNH
ĐỘNG
Chỉ số
52
Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Bảng 8: So sánh hiệu năng các thuật tốn học máy
Tiêu chí
Acc (%)
Sen (%)
PPV (%)
NPV (%)
TR (s)
TT (s)
DT
99.9
99.7
99.7
99.9
0.01
0.005
GBDT
99.9
99.7
99.7
99.9%
4.25
0.03
SVM
99.9
99.8
99.8
100.0
0.621
0.123
RF
99.9
99.8
99.8
100.0
0.012
0.016
[5]
KNN
99.9
99.8
99.8
100.0
0.005
0.071
[6]
[7]
Nhìn chung các thuật tốn có các chỉ số tương
đương. Thuật tốn DT có thời gian phân loại trên
tập dữ liệu kiểm tra tốt nhất với 0.005 giây, theo
sau đó là RF, GBDT, KNN với 0.016, 0.03, 0.071
giây tương ứng và cuối cùng là SVM với 0.123
giây. Thuật tốn có thời gian đào tạo lâu nhất là
GBDT với 4.25 giây và thấp nhất là KNN với
0.05 giây. Do đó, thuật tốn DT có ưu thế khi tốc
độ phân loại nhanh hơn 14 lần so với KNN và các
thuật tốn cịn lại. Bên cạnh đó, nghiên cứu
hướng đến xây dựng thuật toán nhúng trên thiết bị
giá thành rẻ, tốc độ xử lý nhanh và bộ nhớ lưu trữ
thấp, do đó thuật tốn DT có tính khả dụng cao.
VI. KẾT LUẬN
[8]
[9]
[10]
[11]
Bài báo này đã trình bày mơ hình phân loại sử
dụng năm đặc trưng cơ bản và thuật toán phân
loại cây quyết định giúp dự đoán tốt năm hành vi
người cơ bản theo thời gian thực. Nghiên cứu
hướng đến xây dựng mạng giám sát hành vi người
với độ chính xác cao, thời gian trễ thấp và giá
thành rẻ. Kết quả thực nghiệm với cửa sổ thời
gian 10 giây và độ chồng lấp 50% có kết quả tốt,
sự chênh lệch với kết quả khảo sát trên tập dữ liệu
kiểm tra là nhỏ. Trong nghiên cứu sâu hơn, chúng
tôi sẽ mở rộng theo hướng phát hiện trạng thái
ngã, bất tỉnh và một số hành vi di chuyển khác
như bò, trườn, lên xuống cầu thang…
[12]
LỜI CẢM ƠN
Nghiên cứu của chúng tôi được hỗ trợ bởi
Viện Hàn lâm Khoa học và Công nghệ Việt Nam
(VAST), mã đề tài ĐLTE00.02/20-21.
[16]
[13]
[14]
[15]
[17]
TÀI LIỆU THAM KHẢO
[1]
[2]
[3]
[4]
K. K. B. Peetoom, M. A. S. Lexis, M. Joore, C. D.
Dirksen, and L. P. De Witte, “Literature review on
monitoring technologies and their outcomes in
independently living elderly people,” Disabil. Rehabil.
Assist. Technol., vol. 10, no. 4, pp. 271–294, 2015.
M. Pham, Y. Mengistu, H. M. Do, and W. Sheng,
“Cloud-Based Smart Home Environment (CoSHE) for
home healthcare,” IEEE Int. Conf. Autom. Sci. Eng.,
vol. 2016-Novem, pp. 483–488, 2016.
T. D. Tan and N. Van Tinh, “Reliable fall detection
system using an 3-DOF accelerometer and cascade
posture recognitions,” 2014 Asia-Pacific Signal Inf.
Process. Assoc. Annu. Summit Conf. APSIPA 2014,
2014.
P. Van Thanh et al., “Development of a Real-Time,
Simple and High-Accuracy Fall Detection System for
Elderly Using 3-DOF Accelerometers,” Arab. J. Sci.
ISBN 978-604-80-5958-3
[18]
[19]
[20]
53
Eng., vol. 44, no. 4, pp. 3329–3342, 2019.
A. Jain and V. Kanhangad, “Exploring orientation and
accelerometer sensor data for personal authentication in
smartphones using touchscreen gestures,” Pattern
Recognit. Lett., vol. 68, pp. 351–360, 2015.
C. Ladha, N. Y. Hammerla, P. Olivier, and T. Plötz,
“ClimbAX: Skill assessment for climbing enthusiasts,”
UbiComp 2013 - Proc. 2013 ACM Int. Jt. Conf.
Pervasive Ubiquitous Comput., pp. 235–244, 2013.
D. Minnen, T. Starner, M. Essa, and C. Isbell,
“Discovering characteristic actions from on-body
sensor data,” Proc. - Int. Symp. Wearable Comput.
ISWC, pp. 11–20, 2006.
K. Kunze, M. Barry, E. A. Heinz, P. Lukowicz, D.
Majoe, and J. Gutknecht, “Towards recognizing Tai Chi
- an initial experiment using wearable sensors,” IFAWC
2006 - 3rd Int. Forum Appl. Wearable Comput. 2006,
Proc., pp. 183–188, 2006.
T. Stiefmeier, D. Roggen, G. Ogris, P. Lukowicz, and
G. Tröster, “Wearable activity tracking in car
manufacturing,” IEEE Pervasive Comput., vol. 7, no. 2,
pp. 42–50, 2008.
P. Washington et al., “Activity Recognition with
Moving Cameras and Few Training Examples:
Applications for Detection of Autism-Related
Headbanging,” Conf. Hum. Factors Comput. Syst. Proc., 2021.
J. Lee and B. Ahn, “Real-time human action
recognition with a low-cost RGB camera and mobile
robot platform,” Sensors (Switzerland), vol. 20, p.
2886, 2020.
V. G. Sánchez and N.-O. Skeie, “Decision Trees for
Human Activity Recognition in Smart House
Environments,” Proc. 59th Conf. imulation Model.
(SIMS 59), 26-28 Sept. 2018, Oslo Metrop. Univ.
Norw., vol. 153, no. September, pp. 222–229, 2018.
N. T. Priyadarshini RK, Banu AB, “Gradient Boosted
Decision Tree based Classification for Recognizing
Human Behavior,” IEEE Int. Conf. Adv. Comput.
Commun. Eng., pp. 1–4, 2019.
Y. Tian, J. Zhang, J. Wang, Y. Geng, and X. Wang,
“Robust human activity recognition using single
accelerometer via wavelet energy spectrum features and
ensemble feature selection,” Syst. Sci. Control Eng.,
vol. 8, no. 1, pp. 83–96, 2020, doi:
10.1080/21642583.2020.1723142.
F. Hussain, F. Hussain, M. Ehatisham-Ul-Haq, and M.
A. Azam, “Activity-Aware Fall Detection and
Recognition Based on Wearable Sensors,” IEEE Sens.
J., vol. 19, no. 12, pp. 4528–4536, 2019.
S. Balli, E. A. Sağbaş, and M. Peker, “Human activity
recognition from smart watch sensor data using a
hybrid of principal component analysis and random
forest algorithm,” Meas. Control (United Kingdom),
vol. 52, no. 1–2, pp. 37–45, 2019.
J. R. Kwapisz, G. M. Weiss, and S. A. Moore, “Activity
recognition using cell phone accelerometers,” ACM
SIGKDD Explor. Newsl., vol. 12, no. 2, pp. 74–82,
2011.
Y. Min, Y. Yin, and K. Khin, “Comparing the
Performance of Machine Learning Algorithms for
Human Activities Recognition using WISDM Dataset,”
Int. J. Comput., vol. 38, pp. 61–72, 2020.
C. Catal, S. Tufekci, E. Pirmit, and G. Kocabag, “On
the use of ensemble of classifiers for accelerometerbased activity recognition,” Appl. Soft Comput. J., vol.
37, pp. 1018–1022, 2015.
G. Vavoulas, C. Chatzaki, T. Malliotakis, M. Pediaditis,
and M. Tsiknakis, “The MobiAct dataset: Recognition
of activities of daily living using smartphones,” in
ICT4AWE 2016 - 2nd International Conference on
Information and Communication Technologies for
Ageing Well and e-Health, Proceedings, 2016, pp. 143–
151.