Tải bản đầy đủ (.pptx) (46 trang)

Histogram of oriented gradients

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.46 MB, 46 trang )

Traffic sign detection using
Histogram of Oriented
Gradients and SVM

Question and Answer


Bài toán:
• Input: ảnh thu được từ camera

• Output: đóng khung vùng có biển báo giao thông


Phương án giải quyết:
• Ý tưởng:
– Đây là bài toán nhận dạng vật thể đặc trưng bởi hình dạng
⇒ Ta sử dụng các pp rút trích đặc trưng hình dạng và góc cạch của
vật thể
− Có nhiều pp để giải quyết, trong báo cáo này sử dụng đặc
trưng HOG


Tổng quan các bước tiến hành:
• Có 2 công đoạn chính:
– Chuẩn bị công cụ để phát hiện biển báo: cần dữ liệu thu thập
từ thực tế.
– Tính toán dữ liệu đầu vào -> xác định vị trí biển báo


Công đoạn 1:
Tính đặc


trưng HOG
của ảnh
chứa biến
báo

Tính đặc
trưng HOG
của ảnh
không chứa
biến báo

Đưa 2 tập dữ
liệu bên vào
công cụ phân
lớp để xác
định mặt phân
cách (sử dụng
svm)


Công đoạn 2:
Tính đặc trưng
HOG

• tính toán với từng
khung detect của
ảnh
• Khung này dịch
chuyển sau mỗi lần
detect


Quay lại bước 1
cho tới khi
khung detect đi
hết ảnh

Dựa vào mặt phân
cách để biết ảnh
có phải biển báo
hay không

Nếu có biển báo
thì đóng khung


Công đoạn 2:
• Detection window sẽ dịch chuyển đến hết ảnh


Sau đây ta đi chi tiết vào công đoạn 1
• Công đoạn 1 có công việc lớn:
– 1) Cách tính đặc trưng HOG
– 2) Cách xác định mặt phân cách 2 lớp có biển báo và không có
biển báo sử dụng support vector machine (SVM)


Công việc 1: Tính toán đặc trưng HOG
Tổng quan về Gradient histogram
HOG Descriptor
Ứng dụng trong nhận dạng biển

báo


Tổng quan về
GRADIENT HISTOGRAMS


Gradient Histograms computing
• Lược đồ Gradients
tính toán dựa trên
thông tin về hướng và
cường độ biến thiên
màu/mức xám tại mỗi
pixel trên ảnh


Histogram of Oriented Gradient
• Đây là đặc trưng được dùng trong lĩnh vực phát hiện đối tượng.
• Được đề xuất bởi Bill Triggs và Navel Dalal năm 2005 tại viện
nghiên cứu INRIA.


HOG Descriptor
Scale ảnh chứa đối tượng
nhận dạng về cỡ chuẩn
chọn trước
=> Ví dụ: 32x32

Ảnh input


Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Gamma normalization
• Mục đích: làm giảm bớt ảnh hưởng của sự thay đổi ánh sáng và
ảnh hưởng của bóng mờ.
• Thử nghiệm với:
• RGB
• CIELAB
• Grayscale
• Phương pháp chuẩn hóa:
• Square root

• Log compression
Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Tính Gradients
• One sided:
• Two sided:
• Kernel:
– One sided


-1

– Two sided

-1 0

Ảnh input

Chuẩn hóa
Gamma và
Colour

1

Digonal
1

Tính Gradients

0

1 Sobel

-1 0

1

-1

0


-2 0

2

-1 0

1

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Tính gradients
• Gradients:

 

– Cường độ:


s

– Hướng:
 

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Tại sao phải chia hướng và nhóm đặc

trưng tại mỗi cell ?
• Nếu dùng vector gradient tại từng pixel thì số lượng sẽ rất lớn
thậm chí còn gây nhiễu không đáng có
– => ta tìm cách lấy vector gradient của một tập hợp các pixel
được gọi là cell
• Độ lớn của cell được chọn tùy theo từng bài toán khác nhau
– => ví dụ: 5x5

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector



Gradient của một cell ?

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Chia hướng không gian
• Việc lưu chính xác giá trị hướng biến thiên tại từng điểm ảnh (x,y)
tốn nhiều chi phí
⇒ Chia không gian hướng biến thiên thành các bin

⇒ Góc hướng nghiêng r tại pixel (x,y) có độ lớn được rời rạc hóa
giá trị vào một trong p bins.
⇒ Trường hợp rời rạc hóa unsigned-HOG:

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Chia hướng không gian
•=> Trường hợp rời rạc hóa signed-HOG:


135

90

45

180

135
0

90
45

180

0
Unsigned-HOG

225
Ảnh input

270

315
Chuẩn hóa
Gamma và
Colour

Tính Gradients


Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Tính gradient histogram cho từng cell
biên độ
6
4
2
0

0 - 20

21 - 40

41 - 60

61 - 80


81 - 100 101 - 120 121 - 140 141 - 160 160 - 180

Giá trị bin được định lượng bới tổng cường độ biến thiên của các pixels thuộc
về bin đó
Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector

Hướng



Question
Số đặc trưng của một cell có phụ thuộc vào kích thước của cell hay
không ?
⇒ Không
⇒ Số đặc trưng của một cell chỉ phụ thuộc vào số bin hướng


Tính và chuẩn hóa đặc trưng cho khối

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector



Tính và chuẩn hóa đặc trưng cho khối
• Vector đặc trưng của khối được tính bằng cách ghép vector đặc
trưng của từng ô lại với nhau.
• Số thành phần của vector đặc trưng tại mỗi khối:

– Trong đó:
• là số cell có trong 1 block
• là kích thước vector đặc trưng tại mỗi cell (số bins hướng
chọn ở trên)
Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và
chuẩn hóa

Tính vector
đặc trưng cho

cửa sổ
detector


Chuẩn hóa đặc trưng cho khối
• Chuẩn hóa vector đặc trưng trên từng block
• Một số dạng chuẩn hóa:
• L1-norm:

L2-norm:

• Trong đó:
– v : là vector đặc trưng ban đầu của từng block
– e : hằng số

Ảnh input

Chuẩn hóa
Gamma và
Colour

Tính Gradients

Chia hướng và
gom nhóm đặc
trưng tại mỗi
cell

Tính đặc trưng
cho khối và

chuẩn hóa

Tính vector
đặc trưng cho
cửa sổ
detector


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×