Tải bản đầy đủ (.doc) (5 trang)

Phương pháp trừ nền background subtraction

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (344.86 KB, 5 trang )

Phát Hiện Mật Độ Xe Trên Đường Dùng Phương
Pháp Trừ Nền
Subtitle as needed (paper subtitle)
Le Huu Duc
University Ho Chi Minh City of
Technology and Education.

Chu Nguyen Duc Long
University Ho Chi Minh City of
Technology and Education.

Tran Dinh Trong
University Ho Chi Minh City of
Technology and Education.

Tóm tắt—Trong đề tài này trình bày về vấn đề phát
hiện mật độ xe trên đường thông từ dữ liệu thu bằng
camera hoặc máy ảnh lắp đặt trên đường, sử dụng phương
pháp trừ nền. Phương pháp trừ nền là phương pháp. Với
phương pháp này nhóm làm đề tài đã xác định được lượng
xe trên đường qua dữ liệu thu được xử lý khi nào mật độ
xe lưu thông ít khi nào mật độ xe lưu thông đông, từ đó
đưa thông tin đã xử lý hiển thị lên màn hình và đưa ra
thông báo cảnh báo cho các phương tiện khác biết được ở
đoạn đường nào có mật độ xe như thế nào để thuận tiện
cho việc lưu thông trên đường.
Từ khóa—Phương pháp trừ nền; mật độ xe.
I. GIỚI THIỆU
Việc giám sát trực tiếp bằng các thiết bị giám sát hiện đại
(camera) là một trong những chủ đề được phát triển và nghiên
cứu rất nhiều trong những năm gần đây. Dựa vào sự phát triển


không ngừng của kĩ thuật xử lý hình ảnh đã giúp cho con
người dễ dàng hơn trong việc triển khai các hệ thống giám sát
tự động thông minh hơn điển hình như nó có phát hiện đối
tượng chuyển động, phân loại đối tượng, bám đối tượng
chuyển động, dự đoán các hành vi của đối tượng…Vì những
lý do đó mà các hệ thống giám sát được ứng dụng ngày một
rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội.
Đề tài này được đưa ra để giúp một hệ thống giám sát có
thể nhận về mật độ lưu thông từ đó hệ thống sẽ đưa ra các tín
hiệu cảnh báo cho các tài xế. Đề tài dựa trên việc phát hiện
chuyển động của xe trên đường từ đó đưa ra đánh giá về mật
độ sau khi đã loại bỏ nền đường
Việc phát hiện đối tượng chuyển động không chỉ giúp ích
trong việc theo dõi các đối tượng chuyển động để phát hiện
mật độ xe trên một hệ thống giám sát trực tiếp mà còn mang
lại nhiều ứng dụng trong cuộc sống. Các đối tượng được phát
hiện nhờ những thông tin trong một frame ảnh. Có rất nhiều
hướng tiếp cận để giải quyết vấn đề trên sử dụng nhiều thuật
toán và phương pháp khác nhau. Một số công trình nghiên cưu
đã được thực hiện như là:
• Ashwani Aggarwal, Susmit Biswas, Sandeep Singh,
Shamik Sural, and A.K. Majumdar [1] Object
Tracking Using Background Subtraction and Motion
Estimation in MPEG Videos
• Mahamuni P. D, R. P. Patil, H.S. Thakar [2] Moving
Object Detection Using Background Subtraction
Algorithm Using Simulink
• Mark Smids [3] Background Subtraction for Urban
Traffic Monitoring using Webcams
Trong bài báo này, để phát hiện vật thể chuyển động nhóm

thực hiện đề tài sử dụng phương pháp đơn giản nhất cũng như
được sử dụng nhiều nhất là Background Subtraction (trừ
nền).Thuật toán Background Subtraction là một trong những
thuật toán được sử dụng phổ biến nhất trong lĩnh vực Thị giác
máy tính (Computer Vision). Thuật toán được sử dụng nhằm
xác định những pixel thuộc những vật chuyển động trong video
hay còn được gọi là Foreground (FG), còn những vật không
chuyển động được gọi là Background (BG). Sau đó đưa ra các
đánh giá về mật độ pixels của FG từ đó đưa ra nhận xét về mật
độ xe di chuyển trên đường.
Trong các phần tiếp theo, bài báo này sẽ trình bày những
vấn đề sau:
II. Trình bày các phương pháp và thuật toán được sử dụng
trong đề tài.
III. Kết quả của đề tài được thể hiện trong phần 3.
IV. Trình bày những kết luận của đề tài.
II. PHƯƠNG PHÁP THỰC HIỆN
A. Tài liệu và phương pháp
Để xác định được lượng mật độ xe trên đường, phương
pháp thực hiện được trình bày trong sơ đồ:
Bước 1: Lấy từng khung hình từ video quay từ video.
Hình 1: Một khung hình lấy từ video
Bước 2: Khởi tạo background. Bước này lúc đầu sẽ lấy khung
hình đầu tiên để làm background.
Hình 2: Background đã được cập nhật
Bước 3: Tìm sự khác biệt giữa background và foreground. Trừ
các giá trị giữa ảnh khung hình và ảnh nền để tìm được ảnh
khác biệt.
Hình 3: Ảnh khác biệt thu được bằng phương pháp trừ nền
Bước 4: Xử lý đưa ra ảnh nhị phân. Sau khi tìm được ảnh khác

biệt thì tiến hành chuyển đổi ảnh gray, tìm ngưỡng bằng
phương pháp Otsu và đưa ra ảnh nhị phân.
Hình 4: Ảnh mức xám chuyển từ ảnh khác biệt
Hình 5: Ảnh nhị phân xác định dùng phương pháp Otsu
Bước 5: Đếm số pixel trắng tương ứng với xe đang lưu thông
sau đó chia phần trăm theo số pixel của đường ta được mật độ
xe lưu thông.
Frame 336 of 3433.
100 200 300 400 500 600
100
200
300
400
Adaptive Background Binarized Difference Image
0 0.2 0.4 0.6 0.8 1
0
0.2
0.4
0.6
0.8
1
Frame 335 co mat do 3.938802e+00.
Hình 6: Mật độ xe đang lưu thông
Bước 6: Do ảnh hưởng của các yếu tố thay đổi bên ngoài cần
cập nhật background và sau đó quay lại bước 3
B. Công thức tính toán
1. Khởi tạo Background
Để tìm đối tượng chuyển động sử dụng phương pháp trừ
nền, bước đầu tiên phải xây dựng mô hình background tại thời
điểm bắt đầu của video. Nhóm giả sử trường hợp tại thời điểm

bắt đầu không có đối tượng di chuyển. Nhóm sử dụng phương
pháp chọn lọc để khởi tạo background ban đầu:
1
( , )
( , )
N
m
m
N
I x y
BM x y
N
=
=

Với
( , )
N
BM x y
là giá trị tại pixel (x,y) của background,
),( yxI
m
là giá trị của pixel (x,y) của khung thứ m, và N là
số khung sử dụng để xây dựng background. Nó được đưa ra
rằng N=100 là tốt nhất cho giá trị N [10].
2. Background Subtraction
Sau khi thu được background từ bước khởi tạo, chúng ta
cần tìm ra sự khác nhau giữa khung hình hiện tại và
background.
1

( , ) | ( , ) ( , ) |
t t t
D x y I x y BM x y

= −

Với
( , )
t
BM x y
là cường độ của pixel (x,y) của
background tại thời điểm t, và
),( yxI
t
là cường độ của pixel
(x,y) trong khung hình hiện tại tại thời điểm t.
Sự khác biệt
),( yxD
t
được so sánh với một ngưỡng
ad
Th
để phân loại giữa foreground với background, phần tính
toán ngưỡng
ad
Th
sẽ được trình bày ở phần Tìm ngưỡng
Otsu.
ad
Th

sẽ được xác định lặp đi lặp lại tại mỗi
),( yxD
t
khác nhau với sự thay đổi của background. Nếu
),( yxD
t
<
ad
Th
, thì pixel đó thuộc về phần background. Nếu ngược lại
),( yxD
t
>
ad
Th
thì pixel đó thuộc về foreground:
( , )
( , )
if ( , )
t ad
t ad
foreground if D x y Th
x y
background D x y Th





<




3. Mô hình cập nhật Background
Vì do các yếu tố động của background như độ sáng, độ
tương phản, các yếu tố ngoại cảnh như bóng mấy, cây cối
Nên các background phải liên tục cập nhật mỗi khi nhảy qua
fame mới. Nhóm đề xuất một phương pháp dùng để cập nhật
Background trong từng kiểu pixel, mỗi pixel sẽ có một tỉ lệ
học thích hợp,
),(
,
yx
tad
α
được định nghĩa bên dưới.
Công thức cập nhật background:
, , 1
( , ) ( , ) ( , ) (1 ( , )) ( , )
t ad t t ad t t
BM x y x y I x y x y BM x y
α α

= + −
Với
,
0 ( , ) 1
ad t
x y
α

≤ ≤
. Tỉ lệ học
),(
,
yx
tad
α
sẽ phụ thuộc
vào hai trọng số,
1
α

2
α
:
, 1 1 2 2
( , )
ad t
x y
α ωα ω α
= +

Với
1
w

2
w
là hai trọng số tương ứng với
1

α

2
α
,

1
w
+
2
w

1≤
.
Thông số thứ nhất
1
α
phụ thuộc vào độ lớn của
),( yxD
t
. Một giá trị lớn hơn cho
1
α
thì được gán cho giá
trị nhỏ hơn
),( yxD
t
.
2
2

1
( , )1
2
1
( , )
0
t
D x y
t ad
e if D x y Th
otherwise
σ
α



<
=




Với
1
σ

5
ad
Th
.

1
σ
là một hàm số phụ thuộc
ad
Th
để
đảm bảo rằng các phần của các điểm ảnh với
),( yxD
t
giá trị
nhỏ nhất và cao hơn
1
α
.
Thông số thứ hai
2
α
thu được phụ thuộc vào thời gian
tồn tại của pixel đó trong background. Giả sử còn một điểm
ảnh là ở trong background, thì ổn định hơn và đáng tin cậy là
một điểm ảnh nền. Sự ổn định và độ tin cậy được đo bằng
background count tạm thời
bg
C
. Theo công thức:
' 2
max
( )
1
2

min
2
,
0
bg
C
bg
e if C
otherwise
ζ
ζ
α





=




Với
2 max min
15, 150, 30and
σ ζ ζ
= = =
đã
được xác định bằng thực nghiệm, và
1

( , )
( , )
N
m
m
N
I x y
BM x y
N
=
=


'
max
min( , )
bg bg
C C
ζ
=
. Nếu một điểm ảnh vẫn còn là
một điểm ảnh nền cho nhiều hơn
min
ζ
khung, thì một giá trị
khác không sẽ được gán cho
2
α
. Thông số thứ hai
2

α
tăng
với
bg
C
cho đến khi
bg
C
lớn hơn
max
ζ
. Tham số này giúp
loại bỏ các đối tượng không đáng kể với chuyển động nhỏ và
lặp đi lặp lại như vẫy lá cây và những gợn sóng nước mà có
thể dẫn đến kết quả sai. Nó hoạt động dưới sự giả định rằng
nếu một pixel chuyển đổi giữa trạng thái foreground và
background thường xuyên (có nghĩa là pixel không được giữ
lại ở trạng thái của background nhiều hơn
min
ζ
khung). Do
đó nó rất có thể là một pixel của background. Lưu ý rằng
bg
C
sẽ được gán lại bằng 0 khi có một pixel tìm thấy thuộc
foreground.
4. Tìm ngưỡng Ostu
Sau khi thống kê mức xám trên ảnh ban đầu, chúng ta sẽ
nhận được một đồ thị biểu diễn mức xám có hai đỉnh, một
đỉnh biểu diễn cho những vùng là foreground, đỉnh còn lại

biểu diễn cho những vùng là Background của ảnh. Theo Otsu,
ngưỡng k* tốt nhất được chọn là giá trị mà tại đó nó làm cho
sự chênh lệch
2
b
σ
giữa hai đoạn trên đồ thị đạt cực đại. Giá trị
2
b
σ
được định nghĩa như sau:
2
22
2
11
2
)()(
ttb
mmamma −+−=
σ
,
Thay
2211
mamam
t
+=
,
1
21
=+ aa

, ta được:
2
2121
2
)( mmaa
b
−=
δ
, Trong đó
1
m

2
m
biểu diễn giá
trị trung bình tương ứng với đoạn 1 và đoạn 2, a
1
và a
2
là tần
suất xuất hiện của m
1
và m
2
. Tỷ lệ
j
a
của diện tích đoạn
j
với tổng diện tích được tính như sau:

,2,1, ==


jpa
j
Ci
ij
: tổng xác suất trên đoạn j
Trong đó
i
p
là thương của số lần xuất hiện của mức xám thứ
i và tổng số lần xuất hiện của tất cả các mức xám cho nên,
,1
1
0
=


=
I
i
i
p
Với I biểu diễn tổng số những mức xám. Thông thường, đối
với ảnh văn bản, I có giá trị là 256.
1
C
(
2

C
) biểu diễn tập
hợp tất cả những điểm có giá trị nhỏ hơn hoặc bằng (lớn hơn)
ngưỡng k. Chú ý rằng, giá trị trung bình
j
m
được tính như
sau:


=⋅=
j
Ci
jij
japim .2,1,
mức xám trung bình trên đoạn j
Ngưỡng k* tốt nhất sẽ được xác định bằng cách tìm ra
đỉnh của
2
b
σ
.
III. KẾT QUẢ VÀ THẢO LUẬN
Sau khi tiến hành chạy ứng dụng và nhóm đã thu được kết
quả xác định được mật độ xe trong video tại mỗi thời điểm từ
đó đưa ra nhận định lưu lượng xe nhiều hay ít tại mỗi thời điểm
khác nhau.
Đối với Video: />Số pixel của Backpround: 184320 (Pixel).
Thì có bảng thông kê mật độ xe như sau:
Thời điểm

(frame)
Số pixel trong
foreground
Mật độ
(%)
100 5891 3.195
107 6332 3.435
124 6325 3.432
242 4124 2.237
564 5537 3.004
805 8188 4.442
A. Nhận xét kết quả
Kết quả thu được còn chưa khách quan do nhiều hạn chế
của cách triển khai phương pháp trừ nền này
Đề tài còn tồn tại nhiều khuyết điểm và một số ưu điểm.
Khai thác những khía cạnh dễ hiểu của phương pháp trừ
nền, ứng dụng thành công phương pháp này.
Hạn chế:
1. Phụ thuộc vào góc quay của camera.
2. Không xác định hết được các pixel của phương tiện
lưu thông.
3. Cách xác định mật độ trên đường chưa chính xác
B. So sánh với những phương pháp khác
So sánh với phương pháp Motion Vector thì phương pháp
trừ nền dễ thực hiện hơn, bên cạnh đó việc thu thập dữ liệu
cho phương pháp trừ nền khó hơn tại vì nếu dữ liệu hình
ảnh thì phải có 2 ảnh được chụp không có độ sai lệch pixel.
Còn phương pháp Motion Vector có thể khác phục được
hạn chế đó.
IV. KẾT LUẬN

After
LỜI CẢM ƠN
Lời đầu tiên nhóm xin gửi lời cảm ơn sâu sắc và chân
thành nhất đến thầy Ngô Quốc Cường, người đã tận tình giúp
đỡ nhóm thực hiện đề tài trong thời gian qua.
Nhóm xin cám ơn trường Đại học Sư Phạm Kỷ Thuật
Thành phố Hồ Chí Minh đã tạo môi trường học tập và nghiên
cứu để hoàn thành tốt đề tài.
Bên cạnh đó nhóm xin cảm ơn các bạn thành viên trong
lớp 111190 đã giúp đỡ trong quá trình thực hiện đề tài
TÀI LIỆU THAM KHẢO
Trong đề tài nhóm đã sử dụng một số tài liệu tham khảo
như sau:
[1] Ashwani Aggarwal, Susmit Biswas, Sandeep Singh,
Shamik Sural, and A.K. Majumdar, Object Tracking
Using Background Subtraction and Motion Estimation in
MPEG Videos
[2] Mahamuni P. D, R. P. Patil, H.S. Thakar, Moving Object
Detection Using Background Subtraction Algorithm
Using Simulink
[3] Mark Smids, Background Subtraction for Urban Traffic
Monitoring using Webcams
[4] K. K. Ng and E. J. Delp, “Object tracking initialization
using automatic moving object detection,” Pro-ceedings
of SPIE/IS&T Conference on Visual Information
Processing and Communication, vol. 7543, SanJose, CA,
January 2010.
[5] S K. Wang, B. Qin, Z H. Fang, and Z S. Ma, “Fast
shadow detection according to the moving
region,”Proceedings of the International Conference on

Machine Learning and Cybernetics, vol. 3, August 2007,
pp.1590–1595.

×