Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (245.53 KB, 10 trang )
<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
Từ trước đến nay, trong cuốn sách này, chúng ta đã xem xét những phương pháp
chủ yếu để cải thiện ảnh hiển thị. Trong chương 16, tham vọng chúng ta là đạt được
một ảnh gần giống hơn so với ảnh ban đầu, ảnh không suy biến.
Trong chương này và hai chương tiếp theo, chúng ta sẽ đưa ra một vài hướng
phân tích nội dung của một ảnh. Nghĩa là chúng ta cố gắng tìm ra những gì có trong
ảnh. Chúng ta sẽ xem xét hai cách tiếp cận, nhận dạng mẫu thống kê và mạng nơ ron,
mỗi một phương pháp đều có thể áp dụng vào ảnh số. Các cuốn sách đã viết nhiều
về cả hai phương pháp này, giúp độc giả những người mong muốn tiếp tục tìm hiểu
với những giới thiệu về lĩnh vực này rất nhiều.
Trong 3 chương về nhận dạng mẫu này, chúng ta sẽ đưa ra một tập các chủđề về
lĩnh vực này. Trong thực tế, chúng ta nghiên cứu nhận dạng mẫu thống kê, được thực
hiện bằng các kỹ thuật xử lý ảnh số. Việc này trước hết bao gồm việc định vị và cô
lập các đối tượng trong một ảnh và sau đó nhận biết (phân loại) những đối tượng đó
sử dụng kỹ thuật dựa trên lý thuyết quyết định thống kê. Chúng ta cũng xem qua việc
sử dụng mạng nơ ron nhân tạo cho việc nhận dạng mẫu.
<b>18.1.1. Nhận dạng mẫu thống kê </b>
Chi nhánh thị giác máy của lĩnh vực trí tuệ nhân tạo được nghiên cứu bằng cách
phát triển các thuật giải phân tích nội dung ảnh. Một sựđa dạng của những phương
pháp tiếp với mục đích <i>hiểu ảnh</i>đã được dùng, nhưng việc hiểu nó là nền tảng cho
sự nhận thức tồn bộ q trình nhận dạng mẫu, tuy nhiên nó có thểđược thực hiện.
Nhận dạng mẫu thống kê giả thiết rằng ảnh có thể chứa một hay nhiều đối tượng
và mỗi đối tượng đó thuộc một trong các kiểu, các loại hay <i>các lớp mẫu</i> đã định
nghĩa trước đây. Trong khi có thể thực hiện nhận dạng mẫu bằng nhiều cách, chúng
ta chỉ quan tâm tới việc thực hiện nó bằng các kỹ thuật xử lý ảnh số.
Cho một ảnh số có chứa một vài đối tượng, quá trình nhận dạng mẫu gồm có 3
pha chính. (Xem Hình 18-1) Pha đầu tiên được gọi là <i>phân đoạn ảnh</i> hay <i>cơ lập đối </i>
<i>tượng</i>, trong đó mỗi đối tượng được tìm ra và ảnh của nó tách ra khỏi cảnh còn lại.
Pha thứ hai gọi là <i>trích chọn đặc trưng</i>. Đây là pha mà các đối tượng được đo
lường. Một <i>sốđo</i> là giá trị của một tính chất nào đó có thể xác định số lượng của một
đối tượng. Một <i>đặc trưng</i> là một hàm của một hay nhiều số đo, được tính tốn sao
cho nó có thể nó xác định được một tính chất quan trọng nào đấy của đối tượng. Q
trình trích chọn đặc trưng tạo ra một tập các đặc trưng, cùng nhận được, bao gồm <i>vec </i>
<i>tơ</i> <i>đặc trưng</i>. Điều này đã làm giảm khối lượng thông tin (so với ảnh ban đầu) biểu
diễn mọi tin tức mà các quyết định thống kê phải dựa vào đó. Thật là hữu ích để nhận
thức hố một khơng gian <i>n</i> chiều mà trong đó mọi vec tơđặc trưng <i>n</i> phần tử có thể
có đều tập trung vào. Vì thế, một đối tượng riêng biệt bất kỳđều tương ứng với một
điểm trong <i>không gian đặc trưng</i>.
ấn định vào một trong nhiều nhóm (lớp) đã thiết lập trước đó biểu diễn cho tất cả các
loại đối tượng có thể có trong ảnh. Một <i>lỗi khơng phân loại nhầm</i> sẽ xảy ra nếu đối
<i>lỗi phân loại nhầm</i>.
Sự phân loại chỉ dựa vào vec tơđặc trưng. Trong hai chương tiếp theo, chúng ta
sẽ xem xét kỹ thuật phân loại xuất phát từ các phạm trù trong lý thuyết quyết định
thống kê và mạng nơ ron.
<b>Hình 18-1 </b> Ba pha nhận dạng mẫu
<b>18.1.2. Ví dụ về nhận dạng mẫu </b>
Các khái niệm cơ bản về nhận dạng mẫu thống kê có thểđược minh hoạ tốt nhất
bằng một ví dụ. Giả sử chúng ta muốn thực hiện một hệ thống sắp xếp trái cây đổ
xuống trên một băng truyền. Việc sắp xếp thực sự có thể bịảnh hưởng bởi các phần
có thể di chuyển từ trên xuống và làm chệch hướng đi của các loại trái cây khác nhau
ra khỏi băng truyền và rơi vào trong các hộp chuyên chở thích hợp, như minh hoạ
trong hình 18-2. Hãy giả sử rằng đó là các quả là các trái anh đào, các quả táo, chanh
và các quả nho. Những gì chúng ta cần là một hệ thống xử lý ảnh mà có thể quan sát
các quảđang đến gần, phân ra từng loại và thả phần đã phân loại thích hợp đúng lúc
vào hộp đựng trái cây tương ứng.
<b>Hình 18-2 H</b>ệ thống sắp xếp trái cây
từng ảnh số hố và tính đường kính trái cây theo đơn vị milimet và một tham số biểu
thị màu sắc.
Giả sử chúng ta sử dụng một camera TV màu và chương trình tính độ sáng của
từng đối tượng theo các kênh đỏ, lục và lam. (Xem chương 21) Sau đó có thể nhận
được một đặc trưng (ví dụ tỷ lệ độ sáng đỏ-lục) nhận các giá trị thấp cho quả màu
vàng và các giá trị cao cho quả màu đỏ. Chúng ta có thể gọi tham số này là <i>độđo sắc </i>
<i>đỏ</i>.
Hình 18-3 cho thấy không gian hai đặc trưng chiều định nghĩa bằng hai tham số,
đường kính và sắc đỏ, và các nhóm được đưa ra tương ứng với mỗi một trong bốn
lớp quả. Bằng cách đặt các đường quyết định xấp xỉ trong không gian đặc trưng,
chúng ta có thể phân chia nó ra thành mỗi vùng thuộc một lớp và thiết lập một <i>quy </i>
<i>tắc phân loại</i>.
Khi một quả nào đó đến gần camera TV, nó sẽ được xác định, và các đặc trưng
xác định một điểm trong không gian hai chiều. Tuỳ thuộc vào nơi mà điểm này nằm
trong không gian, mà trái cây được ấn định vào một trong bốn lớp. Ngay khi quyết
định phân loại được thực hiện, cơ chế bỏ vào phần mà sau đó sẽ được làm lệch
hướng đi đểđẩy quả vào trong thùng chứa thích hợp.
<b>Hình 18-3 </b>Khơng gian đặc trưng
Trong khi hệ thống tiền xử lý không được sử dụng rộng rãi trong ngành cơng
tác động qua lại giữa các PDF đó, theo cách để tránh hay có ít ra là tối thiểu hoá, các
lỗi phân loại nhầm.
<b>18.1.3. Thiết kế hệ thống nhận biết mẫu </b>
Thiết kế một hệ thống nhận biết mẫu thường được thực hiện theo năm bước liệt kê
trong bảng 18.1: thiết kế bộđịnh đối tượng, chọn lựa đặc trưng, thiết kế bộ phân loại
và thực hiện việc đánh giá.
<i>Bộđịnh vịđối tượng</i> là thuật toán tách ảnh của đối tượng riêng biệt trong một ảnh
phức hợp. Việc phân tách các đối tượng được gọi là phân đoạn ảnh hay phân đoạn
cảnh, sẽ được trình bày trong chương này. <i>Chọn lựa đặc trưng</i> có tác dụng quyết
định thuộc tính của đối tượng (kích thức, hình dạng,…). điểm khác biệt nhất giữa các
lớp đối tượng cần phải tính tốn. <i>Thiết kế bộ phân loại</i> bao gồm việc thiết lập một cơ
sở toán học cho thủ tục phân loại. Các tham số có thể điều chỉnh (ngưỡng quyết
Cuối cùng, nó thường cần được thiết lập các tỷ lệ lỗi phân loại khi hệ thống hoạt
động. Đây là bước <i>thực hiện việc đánh giá</i>.
Chúng ta có thểđịnh nghĩa q trình phân đoạn ảnh như là việc phân chia một ảnh
điểm ảnh gần kề hay sát nhau. Định nghĩa chuẩn của tính liên thơng như sau: giữa
hai điểm ảnh bất kỳ trong một tập liên thông, tồn tại một đường liên thông trong
phạm vi tập, ởđó một <i>đường liên thơng</i> là một đường luôn luôn di chuyển giữa các
điểm ảnh lân cận. Do đó, trong một tập liên thơng, bạn có thể tìm thấy một đường
liên thông giữa hai điểm ảnh bất kỳ trong tập.
BẢNG 18-1 THIẾT KẾ HỆ THỐNG NHẬN DẠNG MẪU
Bước Hàm
1. Thiết kế bộđịnh vịđối tượng Chọn thuật giải phân đoạn ảnh để phân
tách các đối tượng riêng biệt trong ảnh.
2. Lựa chọn đặc trưng Quyết định các tính chất đối tượng mà có
thể phân biệt các loại đối tượng tốt nhất
và làm thế nào đểđo lường chúng.
3. Thiết kế bộ phân loại Thiết lập cơ sở toán học cho thuật giải
phân loại, và lựa chọn kiểu cấu trúc của
bộ phân loại để sử dụng.
4. Huấn luyện bộ phân loại Cố định các tham số điều chỉnh khác
nhau (các đường biên quyết định,…)
trong bộ phân loại cho phù hợp với đối
tượng được phân loại.
5. Đánh giá hiệu suất Đánh giá tỷ số các lỗi phân loại nhầm có
thể nhận được khác nhau.
Có hai quy tắc liên thơng, và một trong số đó có thể chấp nhận. Nếu chỉ các điểm
lân cận bên (trên, dưới, trái, phải) được coi là thuộc liên kết, thì đây là liên thơng 4
và các đối tượng là liên kết 4. Vì thế, mỗi điểm ảnh chỉ có 4 lân cận để có thể liên
kết. Thêm vào đó, nếu các điểm ảnh lân cận chéo (lân cận 450) cũng được tính đến
trong liên kết thì chúng ta có liên thơng 8, và các đối tượng là liên kết 8. Mỗi điểm
ảnh có 8 lân cận để có thể liên kết. Cũng có thể sử dụng quy tắc liên thơng kia, miễn
là thích hợp. Thơng thường liên thông 8 mang lại kết quả được coi là gần với trực
giác của con người hơn cả.
Khi một người quan sát một cảnh, quá trình xử lý đặt trong hệ thống thị giác sẽ
phân đoạn cảnh đó cho người đó. Việc này được thực hiện hiệu quảđến nỗi ta trông
nó khơng như một cảnh phức tạp, nhưng đúng hơn là người ta coi điều đó như là tập
hợp cáca đối tượng. Tuy nhiên, bằng xử lý số, chúng ta phải tách các đối tượng trong
một ảnh bằng cách phân chia ảnh thành tập các điểm ảnh, mỗi tập là ảnh của một đối
tượng. Trong khi công việc phân đoạn ảnh hầu như khơng có bản sao trong kinh
nghiệm nhìn nhận của con người, thì đây là một cơng việc khơng tầm thường trong
phân tích ảnh số.
Phân đoạn ảnh có thể tiếp cận từ ba lý thuyết phối cảnh khác nhau. Trong trường
hợp chúng ta <i>tiếp cận vùng</i>, ta ấn định mỗi điểm ảnh cho một đối tượng hay vùng cụ
thể. Trong phương pháp <i>tiếp cận đường biên</i>, ta chỉ thửđịnh vị các đường biên đã có
giữa các vùng. Trong phương pháp <i>tiếp cận đỉnh</i>, ta có thể tìm cách nhận biết các
Trong chương này, chúng ta xem xét một vài kỹ thuật phân tách các đối tượng
Phân ngưỡng là một kỹ thuật phổ biến để tiếp cận vùng, hữu ích đối với những
cảnh có chứa những đối tượng đồng màu trên nền tương phản. Mục đích là để đơn
giản trong tính tốn và ln xác định được những vùng có các đường biên đóng và
liên thơng.
Khi sử dụng qui tắc phân ngưỡng để phân vùng ảnh, người ta ấn định tất cả những
điểm ảnh nằm bên trên mức xám ngưỡng thuộc về đối tượng. Còn tất cả những điểm
ảnh không nằm trên mức xám ngưỡng sẽ nằm ngoài đối tượng. Đường bao là tập tất
cả những điểm nằm bên trong và mỗi điểm có ít nhất một điểm lân cận nằm ngoài
đối tượng.
Phân ngưỡng sẽđược thực hiện hoàn hảo nếu đối tượng được xét có mức xám bên
trong đồng nhất và nằm trên nền có mức xám đồng nhất khác. Nếu một vài tính chất
(ngồi mức xám, tính kết cấu chẳng hạn) của các đối tượng khác nền của chúng, thì
đầu tiên người ta có thể chuyển đổi tính chất đó thành mức xám. Sau đó tiến hành
phân ngưỡng mức xám để có thể phân vùng ảnh.
<b>18.3.1. Phân ngưỡng tổng thể</b>
Trong quá trình xác định đường biên bằng phân ngưỡng đơn giản nhất, giá trị mức
xám ngưỡng là hằng sốđược sử dụng trong toàn bộ ảnh. Nếu mức xám nền là hằng
được chọn.
<b>18.3.2. Phân ngưỡng thích nghi </b>
Trong nhiều trường hợp mức xám nền không phải là hằng số và độ tương phản
của các đối tượng trong ảnh hoàn toàn khác nhau, thường xảy ra trường hợp một
ngưỡng áp dụng thích hợp cho một vùng ảnh này nhưng lại khơng thích hợp cho
những vùng khác. Trong những trường hợp đó, thuận tiện nhất là sử dụng mức xám
ngưỡng là một hàm biến thiên chậm theo vị trí trong ảnh.
Hình 18-4 cho thấy ảnh hiển vi của các nhiễm sắc thể từ một tế bào máu người.
Trong ảnh này, mức xám nền thay đổi do sự chiếu sáng không đồng đều và độ tương
phản thay đổi từ nhiễm sắc thể này sang nhiễm sắc thể khác. Trong hình 18-4a, một
mức xám ngưỡng không đổi được sử dụng cho toàn bộ ảnh để phân tách các nhiễm
sắc thể. Mỗi nhiễm sắc thể được bao bởi một đường và một dãy số. Trong hình
18-4b, ngưỡng được thay đổi từ nhiễm sắc thể này sang nhiễm sắc thể khác tương xứng
với nền cục bộ và độ tương phản của nhiễm sắc thể. Điều này đã tạo ra một vài sai số
phân đoạn-trong đó nhiều nhiễm sắc thể bị dính vào nhau hay các nhiễm sắc thể
riêng biệt bị phá vỡ. Một nghiên cứu tương tự cho thấy rằng độ chính xác của phép
đo diện tích các nhiễm sắc thểđã được cải tiến bằng phân ngưỡng thích nghi. Trong
hình 18-4b, ngưỡng đối với mỗi nhiễm sắc thể được đặt xấp xỉ mức trung bình giữa
mức xám trung bình của đối tượng và mức xám nền cục bộ.
<b>18.3.3. Lựa chọn ngưỡng tối ưu </b>
Trừ phi đối tượng trong ảnh có các mặt cực kỳ dốc đứng, cịn thì giá trị chính xác
của mức xám ngưỡng có thể có tác động đáng kể lên vị trí đường biên và tồn bộ
<b>Hình 18-4 </b>Phân ngưỡng tổng thể và thích nghi
<b>18.3.3.1. Kỹ thuật lược đồ mức xám </b>
Một ảnh chứa một đối tượng trên nền tương phản có lược đồ mức xám nhị thức
(bimodal) (hình 18-5). Hai đỉnh tương ứng với số lượng tương đối lớn các điểm trong
và ngoài đối tượng. Vùng lõm giữa các đỉnh tương ứng với các điểm tương đối ít
xuất hiện xung quanh biên của đối tượng. Trong các trường hợp như thế này, lược đồ
mức xám thường được dùng để thiết lập mức xám ngưỡng.
Diện tích một đối tượng xác định bởi mức xám ngưỡng <i>T</i> là
<i>T</i> <i>H</i> <i>D</i> <i>dD</i>
<i>A</i> ( ) (18.1)
Lưu ý rằng việc tăng ngưỡng <i>T</i> thêm một lượng <i>T</i> chỉ hơi làm giảm diện tích nếu
ngưỡng tương ứng với vùng lõm trong lược đồ mức xám. Bởi vậy, việc lấy ngưỡng
tại vùng lõm của lược đồ sẽ tối thiểu hố tính nhậy cảm của phép đo vùng với các sai
số nhỏ trong sự chọn ngưỡng.
<b>Hình 18-5 </b>Lược đồ mức xám nhị thức
Nếu ảnh hay vùng trong ảnh chứa đối tượng bị nhiễu và khơng lớn lắm thì chính
lược đồ mức xám sẽ bị nhiễu. Nhiễu sẽ làm mờđi vị trí của vùng lõm, trừ phi vùng
lõm rõ nét một cách khác thường. Điều này có thể khắc phục trong một phạm vi nào
đó bằng cách làm trơn lược đồ mức xám, bằng cách sử dụng tích chập hay bằng một
thủ tục điều chỉnh đường cong. Nếu hai đỉng có kích thước khơng giống nhau, thì
việc làm trơn có xu hướng dịch chuyển vị trí rất ít. Tuy nhiên, dễ dàng định vị các
đỉnh và tương đối ổn định khi làm trơn. Một phương pháp có khả năng tin cậy hơn để
đặt ngưỡng tại một vị trí cốđịnh nào đó liên quan tới hai đỉnh-có lẽ là điểm giữa. hai
đỉnh thể hiện phương thức (xuất hiện nhiều nhất) các mức xám của các điểm bên
trong và bên ngoài đối tượng. Nói chung, các tham số này có thể được đánh giá
chính xác hơn mức xám thường ít xuất hiện nhất-tức là vùng lõm trong lược đồ.
<i>T</i> <i>H</i> <i>D</i> <i>dD</i>
<i>A</i> ( )
A
)
(<i>D</i>
<i>b</i>
Người ta có thể tạo thành một lược đồ mức xám chỉ có những điểm có độ lớn
gradient tương đối cao, ví dụ 10% cao nhất. Việc này ước lượng số lượng lớn điểm
ảnh bên trong và bên ngoài dtvà có thể làm cho vùng lõm trên lược đồ dễ truy cập
hơn. Người ta cũng có thể chia lược đồ theo gradient trung bình của những điểm ảnh
tại mỗi mức xám để tăng cường vùng lõm hơn nữa hay lấy mức xám trung bình của
những điểm ảnh có gradient cao để xác phân ngưỡng.
Bộ lọc Laplace là một toán tử đạo hàm bậc hai hai chiều. Lọc Laplace theo sau
làm trơn và phân ngưỡng tại mc bằng 0 hay cao hơn một chút có xu hướng phân
vùng đối tượng tại các chéo 0 của đạo hàm bậc hai, tương ứng với những điểm uốn
trên các biên của đối tượng. Lược đồ hai chiều của mức xám và gradient cũng có thể
được dùng để thiết lập tiêu chuẩn phân đoạn.
<b>18.3.3.2. Phân ngưỡng thích nghi </b>
Kỹ thuật phân vùng thích nghi trong hình 18-4b được thực hiện bằng kỹ thuật hai
bước. Trước khi qua bước thứ nhất, ảnh được chia làm nhiều khu vực 100 100
điểm ảnh. Từ lược đồ mức xám của mỗi khu vực, một ngưỡng được xác định giữa
đỉnh nền và đỉnh dữ liệu. Các khu vực chứa các lược đồđơn thức đều bị bỏ qua.
Trong bước thứ nhất, các đường biên của đối tượng đã định nghĩa sử dụng
ngưỡng mức xám là một hằng số trong phạm vi khu vực, nhưng khác các khu vực
còn lại. Các đối tượng định nghĩa như vậy khơng được trích chọn từảnh, nhưng mức
xám bên trong trung bình của mỗi đối tượng được tính đến.
Trong bước thứ hai, mỗi đối tượng được lập ngưỡng của chính nó nằm giữa mức
mức xám bên trong và mức xám của nền của khu vực chính. Xem xét trong hình
18-4 cho thấy rằng số các chi tiết nhỏ giảm từ bảy xuống còn hai, trong khi số các tan rã
giảm từ một tới không.
<b>18.3.4. Phân tích các điểm </b>
Trong nhiều trường hợp quan trọng, đây là điều cần thiết để tìm ra các đối tượng
có hình dạng gần như tròn. Việc phát triển dưới đây chủ yếu tập trung vào các đối
tượng hình trịn. Hạn chế của chúng ta đối với các đối tượng hình tròn cho phép ta
tiếp tục lựa chọn ngưỡng tối ưu hơn là những ngỡng khác. Các khái niệm đã trình
bày dù sao cũng hữu ích đối với nhiều trường hợp tổng quát hơn.
<b>18.3.4.1. Định nghĩa </b>
Giả sử một ảnh <i>B(x,y)</i> chứa một <i>điểm</i> đơn. Theo định nghĩa, ảnh này chứa một
điểm <i>(x0,y0)</i> có mức xám cực đại. Nếu chúng ta thiết lập toạđộ cực có tâm là <i>(x0,y0)</i>,
sao cho ảnh được cho bởi <i>Bp(r,)</i>, thì
<i>Bp</i> <i>p</i> nếu <i>r2 > r1</i> (2)
với mọi . Chúng ta gọi <i>B(x,y)</i> là <i>điểm đơn điệu</i> nếu dấu đẳng thức không xảy ra
trong biểu thức (2). Nghĩa là mức xám hoàn toàn giảm theo một đường kéo dài ra
theo hướng bất kỳ từ tâm <i>(x0,y0)</i>. Đối với các điểm đơn điệu, khơng có một đỉnh bằng
phẳng, và <i>(x0,y0)</i> là duy nhất.
Một trường hợp đặc biệt quan trọng có thể xảy ra nếu tất cả các đường viền của
một điểm đơn điệu là những đường tròn tâm <i>(x0,y0)</i>. Chúng ta gọi trường hợp đặc biệt
đó là <i>điểm đường tròn đồng tâm</i> (concentric circular spot-CCS). Với ý nghĩa gần
đúng, điều này thường miêu tảảnh không nhiễu của các vì sao trong kính thiên văn,
các tế bào nào đó trong kính hiển vi và rất nhiều loại ảnh quan trọng khác. Nhiễu
thường làm cho các ảnh thực sai khác với các định nghĩa của chúng, nhưng dù sao lý
thuyết cũng có thể chứng tỏ tính hữu ích.
Đối một CCS, hàm <i>Bp(r,)</i>độc lập đối với , ta gọi nó là <i>hàm chiếu điểm</i>. Đường
chọn ngưỡng mức xám đểđặt đường biên tại điểm có độ dốc lớn nhất. Đây là sự gầm
đúng mà mắt người có thể phân biệt được đường biên khi xem một ảnh chứa cạnh
trơn, và đó là sự khá ổn định dưới tác động của việc làm trơn và thêm nhiễu. Đường
bao này có thể đánh giá khơng đúng mức kích thước thật sự của các đối tượng. Các
điểm duy nhất khác thuộc hình chiếu, ví dụ nhưđộ lớn cực đại của đạo hàm bậc hai
cũng có thểđược sử dụng.
Nếu chúng ta phân ngưỡng một điểm đơn điệu tại một mức xám <i>T</i>, chúng ta định
nghĩa một đối tượng có một diện tích và chu vi xác định. Khi chúng ta thay đổi <i>T</i>
trong bộ dải mức xám, chúng ta tạo ra hàm diện tích ngưỡng <i>A(T)</i> và hàm chu vi
ngưỡng <i>p(T)</i>. Cả hai hàm này đều là duy nhất đối với một điểm bất kỳ. Cả hai đều là
liên tục đối với các điểm đơn điệu, và mỗi một hàm đủ xác định CCS một cách đầy
đủ. Như nội dung của định nghĩa, hai điểm là tương đương <i>p</i> nếu chúng có các hàm
<b>18.3.4.2. Lược đồ và tóm tắt </b>
Giả sử một ảnh CCS <i>B(x,y)</i>được cho bởi một hàm tóm tắt <i>Bp(r)</i> của nó. Bây giờ
chúng ta tìm kiếm một biểu thức cho một lược đồđiểm dưới dạng hàm tóm tắt. Giả
sử chúng ta phân ngưỡng <i>B(x,y)</i> tại mức xám <i>D</i> và phân lại tại mức xám <i>D + D</i>.
Giả thiết này định nghĩa hai vòng tròn bao quanh có bán kính <i>r</i> và <i>r + r</i>, như trong
hình 18-6. Diện tích của hình trịn giữa các đường viền là
<i>r</i>
<i>A</i>
<i></i> 2 <i></i> 2 2<i></i> (3)
Trong đó xấp xỉ thu được bằng giả thiết <i>r</i> là rất nhỏ và bỏ qua <i>r2</i>
Biểu thức 3 có thể sắp xếp lại như sau
<i>r</i>
<i>r</i>
<i>A</i>
<i></i>
2
L0 (5)
<b>Hình 18-6 </b>Phân ngưỡng một điểm tròn đồng tâm
Chúng ta có thể chia tử số và mẫu số cho <i>r</i> và thay biểu thức (4) vào tử số ta
được
Đểđạt được đẳng thức ngoài cùng bên phải, chúng ta phải ghi nhớ rằng cả <i>r</i> và
Chúng ta chưa chấm dứt, bởi vì vế phải của biểu thức (6) là một hàm của <i>r</i> thay vì
của một hàm của <i>D</i>. Do <i>B(x,y)</i> là ảnh của điểm đơn điệu, <i>Bp(r)</i> là một hàm đơn điệu
giảm, và do đó, tồn tại hàm ngược của nó là
<i>r</i> <i><sub>p</sub></i>1 (7)
Bây giờ chúng ta có thể thay nó vào trong tử và mẫu số của biểu thức (6) để tạo
lược đồ một hàm mức xám. Chú ý rằng, vì hàm tóm tắt <i>Bp(r)</i>đơn điệu giảm với <i>r</i>,
nên mẫu số của biểu thức (6) âm. Biểu thức này bỏ dấu trừ trong tử số tạo lược đồ
dương, như mong muốn.
<b>18.3.4.3. Tóm tắt diện tích nhận được </b>
Bây giờ chúng ta tìm kiếm một biểu thức tóm tắt một CCS dưới dạng lược đồ của
nó. Bán kính của đối tượng hình trịn thu được bằng phân ngưỡng một CCS tại mức
xám <i>T</i> là
<i>T</i> <i>HB</i> <i>D</i> <i>dD</i>
<i>T</i>
<i>A</i>
<i>T</i>
<i>R</i>
<i></i> (8)
Đối với một điểm đơn điệu, lược đồ <i>HB(D)</i> khác 0 giữa giá trị mức xám lớn nhất
và nhỏ nhất của nó. Nghĩa đó là hàm diện tích <i>A(T)</i> là đơn điệu tăng, và vì vậy cũng
đúng cho hàm <i>R(T)</i>. Vì thế, tồn tại hàm nghịch đảo của biểu thức (8) và chính là tóm
tắt. Cho nên, chúng ta có thể tính tóm tắt diện tích nhận được của một CCS bằng
cách tích phân lược đồđểđược hàm diện tích, cơng việc đầu tiên là lấy căn bậc hai
và sau đó nghịch đảo hàm.
<b>18.3.4.4. Tóm tắt chu vi nhận được </b>
Phân ngưỡng một CCS tại mức xám <i>T</i> tạo ra một dy hình trong có bán kính
<i>R</i>
<i></i>
2
1
(9)
Trong đó<i>p(T)</i> là hàm chu vi. Giống như với kỹ thuật trước, tóm tắt chỉđơn thuần
là hàm nghịch đảo của biểu thức (9). Do đó nếu biết hàm chu vi thì có thể thu được
hàm tóm tắt bằng nghịch đảo biểu thức (9).
<b>18.3.4.5. Các điểm khơng trịn và các điểm nhiễu </b>
Chúng ta có thể thu được hầu như dễ dàng tóm tắt một ảnh chứa một CCS không
nhiễu đơn giản bằng cách lấy các mức xám theo dòng quét chứa đỉnh. Tuy nhiên, đối
với các điểm khơng trịn và các điểm nhiễu các kỹ thuật đã đề cập trước đây có thể
hữu ích. Ví dụ, ta có thể sử dụng lược đồ của một điểm khơng trịn để thu được tóm
tắt của CCS tương đương <i>H</i> và chọn mức xám để cực đại hoá độ dốc đường biên.
Trong các trường hợp khác, nó hữu dụng để tính hàm chu vi và xác định tóm tắt của
CCS tương đương <i>p</i>. Mỗi kỹ thuật có thể tạo ra một ngưỡng thích hợp đối với ảnh
sắp đến.
Nhiễu ngẫu nhiên trong ảnh thường tạo ra các ngưỡng đường biên bị lởm chởm.
Trong khi điều này có thểảnh hưởng đơi chút lên hàm diện tích, nó có xu hướng tạo
ra các sai lầm lớn trên các hàm chu vi. Mặc dù có thể giảm các lỗi bằng cách xây
dựng quá trình làm trơn đường biên thành thủ tục tính chu vi, đơn giản hố cơng việc
tính tốn trên khía cạnh tóm tắt diện tích nhận được.
Sieracki, Reichenback, và Webb đã so sánh chín phương pháp chọn ngưỡng, trong
đó có hai phương pháp dựa trên tóm tắt diện tích nhận được (độ lớn tối đa của đạo
hàm bậc nhất và đạo hàm bậc hai) đối với việc tính tốn đường kính của các vi hạt
huỳnh quang. Phát biểu một cách tổng qt, họ đã tìm thấy phương thức sau là chính
xác nhất trong chín phương pháp đối với các hạt có kích thước và cường độ khác
nhau. Nó cũng đã thực hiện tốt cho các tế bào trong việc cấy ghép mơ. Tìm kiếm giá
trị lớn nhất của đạo hàm bậc nhất, giống các phương pháp đã kiểm tra khác, có xu
hướng đánh giá kích thước của các vật thể không đúng mức.
<b>18.3.5. Gradient đường biên trung bình </b>
Đối với các điểm khơng trịn, các tóm tắt CCS tương đương <i>H</i> và tương đương <i>p</i>
là không thể chấp nhận cho việc lấy ngưỡng mức xám. Đối với các đối tượng có hình
dạng tuỳ ý, chúng ta có thể xem xét gradient trung bình xung quanh đường biên như
một hàm mức xám ngưỡng định nghĩa đường biên.
Giả sử mơt điểm đơn điệu khơng trịn phân ngưỡng tại các mức xám <i>D</i> và <i>D + D</i>
nhưđã cho trong hình 18-7. Tại một điểm <i>a</i> nào đó trên đường biên ngồi. <i>r</i> khoảng
cách vng góc với đường biên bên trong. Vì <i>r</i> là vng góc với một đường viền
nên nó nằm theo hướng vec tơ gradient tại điểm <i>a</i>. Độ lớn của vec tơ gradient tại
điểm <i>a</i> trên đường biên ngoài là
<i>r</i>
<i>D</i>
<i>B</i>
<i>D</i> <sub></sub>
L0 (10)
<b>Hình 18-7 </b>Phân ngưỡng một điểm khơng trịn
Vì chúng ta quan tâm đến gradient trung bình quanh đường biên, nên chúng ta có
thể tính trung bình <i>|B|</i> quanh đường biên ngồi một cách đơn giản. Nếu <i>r</i> nhỏ so
<i>A</i>
(11)
Trong đó <i>r</i> là khoảng cách vng góc trung bình từ đường biên bên ngoài tới