GIỚI THIỆU
Năng lực tri giác cung cấp các tác nhân với những thông tin về một thế giới ở đâu đó. Sự nhận
thức được bắt đầu bởi các cảm biến. Các cảm biến là bất kỳ thứ gì mà có thể thay đối trạng
thái điện toán của các tác nhân trong sự đáp ứng để thay đổi trạng thái của vũ trụ. Nó có thể
được xem đơn giản như một miếng cảm ứng mà được phát hiện bất kỳ ở đâu giống như một
nút tắt mở hay phức tạp giống như võng mạc ở mắt của con người mà chứa nhiều hơn hàng
tăm triệu thành phần cảm quang.
Có rất nhiều phương thức giác quang đó là có khả năng để thiết lập các tác nhân nhân tạo. Ở
đó nó chia sẽ với con người bao gồm ảo giác, thính giác và xúc giác. Trong chương này chúng
tôi sẽ tập trung vào ảo giác, bởi vì sâu xa nó hữu ích với các tri giác để chia sẽ với các nhà vật
lý thế giới. Thính giác trong ngữ cảnh được nhìn nhận ngắn gọn trong trong phần sau. Vị giác
hay là xúc giác được đề cập trong tiếp theo nơi mà chúng ta kiểm tra nó sử dụng trong thao tác
bằng tay bởi các ngừơi máy.
Chúng ta sẽ không làm tất cả mà phải có xem xét về thiết kế của chính các cảm biến. Điểm tập
trung chính sẽ được xử lý trên thông tin dữ liệu thô mà nó cung cấp. Với phương pháp cơ bản
được đưa ra để trước tiên chúng ta hiểu thế nào các tác nhân kích thích được tạo bởi vũ trụ và
sau đó trả lời các câu hỏi phía dưới: Nếu tác nhân kích thích các cảm ứng được đưa ra giống
như thê nào bởi vũ trụ?. Tiếp theo Vũ trụ có được giống nhau để có tác nhân kích thích đặc
trưng này làm gì không? Chúng ta có thể dùng đặc trưng của toán học để trả lời câu hỏi này.
Cho tác nhân kích thích giác quan là S và W là vũ trụ (w sẽ bao gồm chính tác nhân), nếu mô
tả cách trong vũ trụ thì ta sẽ nhận được tác nhân giác quan:
S =f(W)
Bây giờ câu hỏi của chúng ta là: Cho f và S, Chúng ta có thể nói về W như thế nào?
Chúng ta suy ra :
W = f ~’(S)
Thật không mai, f làm không đúng điều ngược lại. Do đó, một việc gì đó chúng ta không thể
nhìn nhận ở một khía cạnh mà chúng ta phải bao quát tất cả các khía cạnh trong trạng thái vũ
trụ hiện tại từ tác nhân kích thích. Cho nên, thậm chí một phần chúng ta cũng phải nhìn nhận ở
khía cạnh nhoc nhằn nhiều hơn. Chiều khóa xem xét việc học của tri thức là hiểu thêm thông
tin gì mang lại để giải quyết sự nhọc nhằn.
Vấn đề thứ 2 và có lẽ là quan trọng nhiều hơn, mặc hạn chế của phương pháp dễ hiểu nhất là
nó phải cố gắng giải quyết vấn đề khó. Trong nhiều trường hợp tác nhân không cần để biết mọi
thứ trên vũ trụ, thỉnh thoảng chỉ cần một hoặc hai dự đóan cần thiết như là “Có bất kỳ cản trở
nào phía trước chúng ta” hoặc “ Có lối ra của thiết bị không?”
Theo tuần tự để hiểu biết sắp xếp xử lý cái gì mà chúng ta sẽ cần để làm nó sự cản trở chúng ta
về một vài thứ liên quan khả năng nhìn nhận:
Sự vận dụng thủ công: Hiểu thấu vấn đề, luồn vào, .v.v cần hình tượng thông tin cục bộ và sự
phản hồi (Thu thập dữ liệu hạn chế, quá xa để cho kết quả đúng….) cho điều khiển.
Nghề hàng hải: Tìm đường rõ ràng, tránh trở ngại và tính toán vận tốc hiện tại và hướng đi.
Đối tược được công nhận: rất hữu dụng cho kỷ năng nhận ra giữa mùi vị của chuộc và sự nguy
hiểm của sâu bọ, đối tượng ăn được và không ăn được quan hệ gần và xa lạ; Xe thông thường
và xe cảnh sát.
Không là gì cho ứng dụng này đòi hỏi nguồn gốc hoàn thành mô tả về môi trường. Trong phần
này được tổ chức theo lưu đồ phía sau
THÔNG TIN HÌNH ẢNH
Công việc nhìn nhận bởi sự thu nhặc lác đác của ánh sáng từ đối tượng trong một cảnh và tạo
ra hình ảnh 2 chiều và sau đó sắp xếp để sử dụng hình ảnh này để thu được thông tin từ quan
cảnh, chúng ta có thể hiểu để xử lý về mặc hình học.
1. Máy chụp ảnh qua lỗ nhỏ:
Cách đơn giản nhất là sử dụng máy chụp ảnh qua lỗ nhỏ hình sau
Trong đó: Chọn P là một điểm trong cảnh
Tích hợp (X,Y,Z) và P’ là hình ảnh của nó trên mặt phẳng với kết hợp (x,y,z).Nếu f là mặt
phẳng từ Pinhole 0 đến mặt phẳng hình ảnh thì có góc giống nhau chúng ta có thể nhận được
cách trình bày sau:
Chú ý rằng hình ảnh đảo chiều, cả hai từ trái qua phải và từ trên xuống dưới ví cảnh như là biểu
thị trong hình ảnh bởi ký hiệu phủ định. Biểu thức này coi như bằng nhau định nghĩa thông tin
hình ảnh xử lý như là triển vọng của đề án.
Tương đương chúng ta có thể lấy mẫu xử lý khả thi của đề án với mặt phẳng của đề án được
xét ở mặt trước và sau của lỗ nhỏ. Thiết bị hình ảnh bề mặt của đề án ở mặt trước đầu tiên được
đề nghị để sơn lại trong sự phục hưng của người ý, Alberti năm 1432 như là một kỹ thuật để
xây dựng theo phương diện hình học để mô tả quang cảnh 3 chiều. Mục đích của chúng ta tìm
ra những tiện ích của mẫu này là phần đảo chiều phần trên cần tránh loại trừ các ký hiệu phủ
định trong trong sự cân bằng diễn cảnh của đề án.
Dưới triển vọng của đề án, các đường song song xuất hiện để hội tụ các điểm trên chiều ngang
của các vết trên đường. Chúng ta thấy rằng tại sau mình phải làm thế, chúng ta biết từ tính toán
của các véc tơ mà khả năng điểm P’ trên đường được bỏ qua (X0, YO,ZQ) trực tiếp (U, V, W) là cho
bởi (Xo + \U, Y0 + XV, ZQ + AW) với giá trị giữa -∞ và +∞. Đề án của hình ảnh được cho bởi
2. Hệ thống thấu kính:
Mắt của động vật có xương sống và máy ảnh thật sử dụng thấu kính. Thấu kính phải được
rộng hơn các lỗ nhỏ hiện thị nó ở ánh sáng nhiều hơn đây là một sự trả giá cho ảnh thật mà
không phải tất cả các cảnh có thể bị tập trung trong một điểm giống nhau. Hình ảnh của đối
tượng tại khoản cách Z trong cảnh là được tạo ra bởi khoản cách các điểm từ thấu kính nơi
có mối quan hệ giữa Z và Z’ cho bởi các ảnh cân bằng.
Nới mà f là chiều dài tiêu cự của thấu kính. Cho chắc chắn chọn hình ảnh Z’ giữa nút điểm
của tiêu cự và mặt phẳng ảnh điểm của ảnh với chiều sâu trong dãy bao quanh ZQ mà Z’Q
tương ứng với đối tượng khoản cách sẽ được hình ảnh trong tập hợp hình dạng hợp lý cách
sắp xếp này của chiều sâu trong cảnh dđược xem như độ sâu của dãy.
Chù ý rằng đối tượng của khoản cách Z là đặc thù phải lớn hơn khoản cách hình ảnh Z’
hoặc f chúng ta thường tính phép sấp xỉ sau:
Mặc dù, hình ảnh Z tương đương với f. chúng ta có thể từ lý do đó tiếp tuc để sử dụng viễn
cảnh cân bằng của máy ảnh pinhole để mô tả sự định dạng hình ảnh hình học trong hệ
thống thấu kính.
Theo tuần tự đối tượng tập trung tại khoản cách khác nhau của Z, thấu kính trong mắt ( các
hình sau)
3. Đo ánh sáng của sự hình thành hình ảnh
Ánh sáng của của các điểm p trong hình ảnh là sự cân xứng để hướng trực tiếp số lượng ánh
sáng của hình ảnh bởi bề mặt miếng vá S mà các dự án để tính điểm p trường hợp này phụ
thuộc vào hệ số phản xạ các thuộc tính vị trí của Sp1 và phân phối nguồn ánh sáng đó cũng
phụ thuôc vào thuộc tính hệ số phản xạ của vấn đề ngữ cảnh, bởi vì, bề mặt của ngữ cảnh
khác có thể phục vụ trực tiếp nguồn ánh sáng bởi sự phản xạ ánh sáng vì chúng nằm trong
Sp1. Phản xạ ánh sáng từ đối tượng có tính chất như là sự rườm rà và phản chiếu. Ánh sáng
phản chiếu rườm rà là ánh sáng lan khắp dưới bề mặt của đối tượng. Sự xuất hiện của bề
mặt cân bằng ánh sáng đề các nhà quan sát trực tiếp Lambert's theo luật cos là được sử
dụng để mô tả phản xạ ánh sáng từ khuyết tán bề mặt phản xạ Lambertiaii. Cường độ
phản xạ ánh sáng của E từ bộ khuyết tán hoàn hảo nó được cho bởi
Trong đó E0 là cường độ của nguồn ánh sáng; p là suất phân chiếu mà giá trị từ 0 (từ bề mặt
phản xạ ánh sáng đen) đến 1 (bề mắt phản xạ ánh sáng trắng và 0 là góc trực tiếp ánh sáng
và bề mặt bình thường
Bề mặt phản chiếu ánh được phản chiếu từ bề mặt bên ngoài của đối tượng ở đó khả năng
của phản chiếu ánh sáng được tập trung chính trong các đường liên quan trực tiếp tại nơi
mà tia phản xạ giống trong mặt phẳng bao gồm tia đang có và đáp ứng trực tiếp ở góc độ
phản xạ là bằng nhau để có phạm vi ảnh hưởng của góc. Đó là cách phản ứng hoàn hảo của
gương.
Trong cuộc sống thực, các vật trưng bài kết hợp sự khuyết tán và thuộc tính phản chiếu. Kỹ
thuật làm mẫu này trên máy tính như là miếng bánh mì và bơ của đồ hoạ máy tính. Sự biểu
diễn hình ảnh thật thường không phải là vết của tia mà là nhắm tới sự tái tạo từ ánh sáng
vật lý gốc đến ánh sáng nguồn và được phàn chiếu và phản chiếu nhiều lần.
HOẠT ĐỘNG XỬ LÝ HÌNH ẢNH
Như hình ảnh 24.5 (Hình sau) hiện thị hình ảnh trong ngữ cảnh chứa các sợi hoạt động trên
bảng tốt như là mọi cạnh được phát hiện trên hình ảnh. Các cạnh được viền trong mặt
phẳng hình ảnh mà đó là một điều hết sức quan trọng để thay đổi độ sáng hình ảnh. Mục
tiêu cuối cùng của sự phát hiện ra cạnh là sự dựng lên các đường vẽ lý tưởng như hình 2.46.
Động cơ thúc đẩy đó là đường viền bao quanh cạnh trong hình ảnh phù hợp để có đường
nét ảnh quan trọng. Trong ví dụ ta tính toán: ghi nhản 1; Bề mặt hướng xoay không liên tục;
ghi nhản 2; Hệ số phản xạ không liên tục; ghi nhản 3 và sự chiếu sáng không liên tục, ghi
nhản 4.
Như chúng ta đã thấy đó là sự khác nhau lớn giữa đầu ra của máy dò cạnh như hình 24.5b
và đường vẽ lý tưởng. Điển hình đó là mất các đường viền (như là đỉnh cạnh của sợi).
Đường viền loan truyền tốt nó không có bất kỳ điểm nào không phù hợp trong cảnh. Vòng
xử lý cơ bản cuối cùng trên góc nhọn tìm thấy lổi này trong sự tính toán.
Làm thế nào để phát hiện góc nhọn trong hình ảnh? Xem xét ơ lược sự rực rở 1-D được
chọn vuông góc với góc nhọn. Cho ví dụ: hình ảnh giữa góc nhọn trái của bảng và vách
ngăn. Nó sẽ thị mọi thứ giống như hình 24.1(a). Vị trí của góc nhọn phù hợp là x =50.
Bởi vì góc phù hợp đến vị trí trong hình ảnh mà khối nhọn rực rở thay đổi, hình dung ra có
lẽ phân biệt hình ảnh và sự nhìn nhận độ lớn phát sinh I’(x) là lớn.Trong hình 24.7(b) sẽ
thấy điều đó. Mặc dù, đầu nhọn x =50, đó là đầu nhọn khác nhau ở vị trí khác (vd:x =75).
Đó có thể là khả năng bị lổi là đúng. Chúng ta phải có nhiều kết quả tốt hơn bởi kết hợp
hoạt động khác nhau với sự làm nhẵn.
Kết quả là hình 24.7 (c), mà trung tâm đỉnh x =50 số còn lại và đỉnh phụ là phải bớt đi.
Điều này cho phép ta tìm được cạnh không ảnh hưởng bởi tiếng.
Để hiểu ý đồ quan trọng hơn, chúng ta cần khái niệm cuộn của toán học. Nhiều hoạt động
xử lý hình ảnh hữu dụng như là làm nhẳn và sự phân biệt có thể được thực hiện bởi hình
ảnh được cuộn lại với chức năng thích hợp.
1. Nếp cuộn với bộ lọc đường kẻ
Kết quả của nếp cuộn hai chức năng f và g là chức năng mới của h, chứng tỏ là h= f*g mà
nó được định nghĩa bởi
Để tiếp tục tách biệt các kĩnh vực. Đặc trưng của chức năng f và g điều đó có nghĩa là làm
việc trên các số khác 0 chỉ một thời gian hạn chế. Vì thế tính toán đễ dàng trên máy tính.
Chức năng tổng quát được định nghĩa 2 chiều ( như là hình ảnh) là thẳng đứng. Chúng ta
thay thế đầy đủ 1- D bởi 2 –D -> kết quả 2 chức năng f và g là chức năng mới h. Biểu diễn
h= f*g.
Nếu chúng ta làm 2 chức năng để mô tả thì ta có công thức sau:
2. Phán hiện các viền
Chúng ta quay lại ví dụ 1-D trong hình 24.7. Chúng ta sẽ muốn làm cho hình ảnh sắt nét
nhiều tỉ mĩ. Một chụẩn chuẩn định dạng của sự sắc nét là xoắn lại hình ảnh với chức năng
Gaussian
Bây giờ nó được hiện thị cho bất kỳ chức năng f và g với f*g’ = (f*g)’ như là sự sắc nét của
hình ảnh bởi Gaussian G và sự khác biệt là cân bằng hình ảnh xoắn lại với G’(JC):
Vì thế, chúng ta có giải thuật đơn giản cho viền 1-D:
Xoắn lại hình ảnh f với G’ để đạt được R.
Tìm giá trị tuyệt đối của R.
Đánh dấu đỉnh ||Rv||\(x,y) trên đặc trưng của ngưỡng Tn.
Tương tự ta có :
Trong đó: fV được xoay 90 độ. Ta có thuật tóan :
Xoắn lại hình ảnh I(x,y) với fv(x,y) và fh(x,y) để đạt được Rv(x,y) và Rh(x,y)
Tìm giá trị tuyệt đối của R (x,y).
Đánh dấu đỉnh ||Rv||\(x,y) trên đặc trưng của ngưỡng Tn
Chúng ta làm đánh dấu viền điểm bởi giải thuật này, bước tiếp theo là ta kết hợp các điểm.
Chúng ta cần phải trích thông tin 3 chiếu cho việc thực hiện chắc chắn công việc như là
thao tác bằng tay. Có 3 khía cạnh của vấn đề này như sau:
1. Sự phân khúc của hình ảnh trong đối tượng riêng biệt.
2. Xác định vị trí và hướng của mổi đối tượng quan hệ để quan sát.
3. Xác định hình dạng của đối tượng.
3. Sự chuyển động
Nếu máy ảnh di chuyển có liên quan tới ba chiều của cảnh, kết quả rõ ràng sự chuyển động
trong được gọi là biểu đồ quang học. Mô tả này ảnh hưởng trực đến tính chất và tốc độ trong
ảnh như là kết quả liên quan đến sự chuyển động giữa người xem và cảnh. Trong hình 24.8
chúng ta sẽ thấy hai khung từ của hình khối trên phim. Hình 24.9 cho ta biểu đồ của vec tơ
quang học của máy tính từ hình ảnh này. Sự mã hoá biểu đồ quang học này có ích cho thông tin
về cấu trúc cảnh. Cho ví dụ; khi nhìn một chiếc xe di chuyển, khoản cách đối tượng rõ rành
chậm hơn sự đối tượng đứng yên. Mặc dù, tốc độ của vật di chuyển rõ ràng có thể cho ta biết
điều gì đó về khoản cách.
Lĩnh vực của lưu đồ giác quang có thể được bởi thành phần của nó Vx(x,y) và Vy (x,y). từ sự đo
lường luồng giác quan chúng ta cần tìm các điểm tương ứng giữa khung thứ nhất và khung
tiếp
theo. Chúng ta khai thác các sự kiện mà điểm ảnh đã đóng gói tương ứng có sự giống nhau ở
mẫu cường độ. Xem xét một khối điểm trung tâm tại điểm q1 tại (Xo + Dx, Y0 +A). Tổng số
khối hìh vuông khác nhau SSD như sau:
Trong đó (x,y) sắp xếp trên các điểm trong khối trung tâm (x0, y0). Chúng ta tìm (A,A) mà giá
trị nhỏ nhất SSD. Biểu đồ giác quang tại (x,y ) là (v,v) = (A/A, A/A) như một sự lựa chọn:
hình 24:8 a) một khối rubic đặt trên một đĩa quay hình tròn. b) mẫu rubic được xem sau đó
19/30 giây (hình ảnh được cung cấp từ Richart Szelicky)
Mối tương quan chéo hoạt động tốt nhất khi có kết cấu trong bối cảnh nào đó, kết
quả trong cửa sổ chứa độ sáng biến đổi đáng kể giữa các điểm ảnh. Nếu nhìn vào một bức
tường màu trắng đồng nhất, sau đó mối tương quan chéo có được gần giống cho các điểm
khác nhau phù hợp q, và thuật toán được giảm xuống làm một điểm mù.
Giả sử người xem liên kết tịnh tiến T và quan hệ góc ω ( như mô tả các góc quay).
Người xem có thể lấy được một phương trình có liên quan với vận tốc, luồng quang học, và
vị trí của các đối tượng trong bối cảnh đó. Trong thực tế, đối chiếu / = 1,
Ở đây Z (x, y) cho phép các Z-phối hợp các điểm cảnh tương ứng với hình ảnh tại
điểm (x, y). Người xem có thể có được một trực giác tốt bằng cách xem xét các trường hợp
dịch chuyển thuần túy. Trong trường hợp đó, các dòng quét trở thành
Có thể quan sát một số tính năng thú vị. Cả hai thành phần của luồng quang học, vx
(x, y) và vy (x, y), là số không ở điểm x = Tx / T,, y = Ty / tz. Điểm này được gọi là trọng
tâm của việc mở rộng dòng quét. Giả sử chúng ta thay đổi nguồn gốc trong mặt phẳng xy
để tập trung việc mở rộng; sau đó là biểu hiện cho dòng quang đi trên một hình thức đặc
biệt là đơn giản. Hãy (X, /) là mới tọa độ được xác định bởi x1 = x - TJTZ, y 'y = - TyITz.
Sau đó
Hình 24.9: Các đường vectơ được tính bằng cách so sánh 2 ảnh trong hình 24.8
Phương trình này có một vài ứng dụng thích hợp. Giả sử bạn là một cố gắng để đưa
đất qua tường, và bạn muốn biết thời gian để kiểm tra ở vận tốc hiện thời. Thời gian này
được cho bởi Z / TZ. Lưu ý rằng mặc dù ngay luồng quang không thể cung cấp hoặc là
khoảng cách Z hay vận tốc thành phần TZ, nó có thể cung cấp tỷ lệ bằng 2, và do đó có thể
được sử dụng để kiểm soát các phương pháp tiếp cận hạ cánh máy bay. Cuộc thử nghiệm
với đường bay chỉ ra chính xác những gì họ cần sử dụng.
Để bù lại chiều sâu ảnh, một điều sẽ làm là sử dụng nhiều ảnh. Nếu máy ghi hình trông
có vẻ khắc khe với mọi người, sự sắp xếp không chuyển từ ảnh tới ảnh và vì thế chúng ta có
thể chấp nhận tốt hơn nhiễu vốn có ở đường dẫn quang. Kết quả từ phương pháp hiệu quả như
vậy được Tomasi và Kanade chỉ ra ở hình 24.10 và 24.11.
Hình 24.10; có 4 frame hình từ 1 đoạn ghi hình tại 1 camera được di chuyển và xoay quanh 1
chủ thể. Frame đầu tiên của đoạn hình, chú thích với nhiều khối sáng nhỏ được tìm thấy bằng
máy dò đặc biệt. nhờ sự giúp đỡ của Carlo Tomasi).
Hình 24.11: a/ hình 3-D được xây dựng từ xác định đặc trưng của ảnh trong hinh 24.10 được
chỉ ra bên trên. b/ một căn nhà như thật được thiết kế từ 1 mẫu xác định.
Ảnh nổi hai chiều: Ý tưởng ở đây là tương tự như thị sai chuyển động, ngoại trừ thay
vì sử dụng hình ảnh theo thời gian, chúng ta sử dụng hai (hay nhiều) hình ảnh tách biệt
trong không gian, như thế sẽ đáp ứng được hướng nhìn của mắt người. Bởi dựa vào nét đặc
trưng ở khung hình sẽ kết hợp không gian khác tới tia Z của mỗi ảnh phẳng, nếu chúng ta
chồng lên 2 ảnh, sẽ có sự khác biệt tại vị trí đặc biệt của ảnh trong 2 ảnh.
Bạn có thể thấy rõ ở hình 24.12. ở đây điểm gần của hình chóp thì thay đổi từ bên trái
đến bên phải của ảnh và ngược lại.
Hình 24.12: khái niệm của ảnh nổi: vị trí dặt khác nhau của camera tạo ánh sáng khác biệt giữa
ảnh 2-D với mẫu khung 3-D.
Chúng ta hãy kiểm tra mối quan hệ hình học giữa sự chênh lệch và chiều sâu của nó.
Trước tiên, chúng ta sẽ xem xét trường hợp khi cả 2 mắt (hoặc camera) nhìn phía trước với
phần khuyết tương ứng của ảnh song song. Sự kết hợp giữa camera bên phải với camera bên
trái là khi chuyển dịch dọc trục r bằng 1 giá trị b đó là đường cơ sở. Chúng ta có thể dùng
lượng ánh sáng bằng nhau từ chọn lựa thứ tự để tính đường ngang và dọc tương ứng với
H=vxAt;; V=vyAt, do đó rv=b/At và Ty=T- =0. Thông số chuyển đổi w v , u> v, lựa thứ tự và U>là bằng 0. kết quả thu được H=b/Z, V=0. Nhận xét, sự khác biệt giữa đường ngang là giá trị đạt
tỉ lệ đường cơ bản với chiều sâu còn giá trị đường dọc bằng 0.
Đây là điều hiển nhiên, kiểm tra về phương diện hình học một cách đơn giản (sự phối
hợp giữa 2 camera) mà chúng ta có thể thực hiện. dưới điều kiện nhìn thấy 1 cách tự nhiên, mà
con người tập trung được; đó là có 1 vài điểm trên khung hình ở phần ánh sáng bị mất đi mà 2
mắt có thể phân biệt được. Hình 24.13: chỉ ra phần 2 mắt tập trung tại 1 điểm PQ ở khoảng
cách Z từ điểm giữa của mắt. Để thuận tiện, chúng ta sẽ tính độ chênh lệch của góc được tính
bằng Radians. Giá trị ở điểm cố định PQ bằng 0. Cho 1 vài điểm P khác ở khung hình mà có
khoảng cách hơn ∂Z, chúng ta có thể tính toán giá trị góc trái và góc phải ảnh P. mà chúng ta
gọi là PL và PR. Nếu mỗi điểm có giá trị 1 góc là 60/2 tương ứng với PQ. Khi đó có sự thay
thế giữa PL và PR, mà sự chênh lệch của P chỉ là 60. Từ thuật toán đơn giản, ta có:
Ở người khoảng cách cơ bản có bán kính 6cm và khỏng cách Z chừng 100cm. phát hiện
diểm nhỏ nhất là 69 tương ứng cở 1 điểm ảnh, chừng 5 giây của 1 cung, hoặc 2.42x105 radians,
đặt ∂Z chừng 0.4cm. cho Z=30cm (1ft), ta đạt được giá trị nhỏ ∂Z=0.036cm. Điều này nói lên
khoảng cách chừng 30cm, con người có thể phân biệt chiều sâu khác nhau ít nhất 0.036mm,
cho ta độ tin cậy và thích ứng.
Hình 24,13 Các mối quan hệ giữa chênh lệch và sâu trong ảnh nổi.
Chú ý rằng không có đặc trưng từng trường hợp của sự chuyển động, chúng ta có các
giả thiết mà ta biết trong hình học, hay là mối tương quan giữa cặp mắt. đây thường là điều hợp
lý. Trong từng điều kiện của mắt, bộ não sẽ đưa ra lệnh liên quan tình trạng của cơ để chuyển
động mắt, và vì thế mắt và đầu được liên kết chặt chẽ. Tương tự trong hệ thống camera cũng
cấu taọ liên quan.
Kiến thức trong hình học được sử dụng trong kiểm tra sự khác biệt. Như trong trường
hợp đo lưu lượng quang, ta thử tìm hiểu thông tin giữa ảnh trái và phải bởi 1 vài đo đạt tương
tự. Tuy nhiên không kiểm tra 2 vùng liên kết về kích cỡ. Điểm tương ứng luôn phải nằm doc
theo đường phân cực trong ảnh (xem hình 24.14). Đây là đường tương ứng với sự cắt ngang
của 1 mặt phẳng phân cực (mặt phẳng ngang qua điểm ở khung và điểm nút của 2 mắt) với mặt
phẳng trái và phải của ảnh. Khai thác đường phân cực này làm giảm một bước hai chiều và
tìm đến một chiều một. Độ chính xác của những dòng phân cực đòi hỏi một kiến thức về
khảo sát hình học, một cách tiếp cận để tìm ra sự sai lệch nhằm tìm kiếm dọc theo các
đường phân cực để tối đa hóa sự tương quan chéo, giống như trường hợp của luồng quang.
Cho một điểm pi trong ảnh trái, tương ứng điểm qt của mình trong giao quyền là thu
được bằng cách tìm kiếm dọc theo dòng phân cực liên quan trong giao diện khác. Đối với
mỗi thể kết hợp q, tương quan chéo giữa các cửa sổ tâm tại pt và q được tính.
Các điểm tương ứng là kết quả có được các điểm ảnh g, mà qua sự tương quan là tối đa.
Kiến tạo tốt hơn bằng cách khai thác một số cơ chế bổ sung
1. Độc đáo: một điểm trong một ảnh có thể tương ứng với nhiều nhất là một điểm
trong ảnh khác. Chúng ta nói nhiều nhất là một, bởi vì có thể một điểm có thể được chứa
trong ảnh khác.
2. Điểm sáng liên tục của các bề mặt trong các cảnh: thực tế trên thế giới thường
điểm sáng liên tục đó có nghĩa là điểm gần đó trong bối cảnh đó có giá trị của độ sâu gần
đó, và do vậy có sự khác nhau, ngoại trừ trên bề nhẵn đối tượng bị biến dạng.
Một ví dụ của hệ thống khai thác những khó khăn này là việc làm của
BELHUMEUR năm 1993, kết quả của BELHUMEUR cho 1 cảnh không đối xứng (Hình
24.15 được trình bày trong hình 24.16)
Hình 24,14 Epipolar hình học.
Hình 24.15: Cho thấy một hình ảnh của một Q-mẹo hộp đứng trên kết thúc với một dọc dài
nhăn nhô ra về hướng camera. Đằng sau hộp là một mặt phẳng.
Thuật toán của ông sử dụng hạn chế với gián đoạn chiều sâu, nơi các cửa sổ tại các
điểm tương ứng trong ảnh không được lấy mẫu tương ứng trong bối cảnh đó.
Do tắc tại một trong các điểm, có một dải được thấy chỉ trong một mắt. Cũng lưu ý
việc sử dụng các phân khúc ảnh nổi cho cảnh như đã chứng minh trong hình 24.16 (c).
Hình 24.16: Kết quả từ chế biến các Q-mẹo hình nổi, (một hình ảnh) của chiều sâu, (b)
Hình của dốc trơn, (c) Đối tượng ranh giới (trắng) và làm nhẵn bề mặt (màu xám), (d) Dây
khung của chiều sâu.
Một phê chuẩn của khu vực dựa trên phương pháp tiếp cận phù hợp là dễ bị lỗi khi
các bản vá tương ứng trong hai ảnh không giống nhau.
Điều này có thể xảy ra vì nhiều lý do:
(1) chức năng phản xạ bề mặt là thành phần đáng quan tâm, do đó, độ sáng của một
điểm trong cảnh là một chức năng quan trọng;
2) có sự khác nhau trong hai lần nhìn, bởi vì các góc độ khác nhau làm cho các trục
quang trong hai lần xem lệch nhau.
Một nhóm các phương pháp tiếp cận được dựa trên khía cạnh việc tìm kiếm đầu tiên
và sau đó tìm kiếm cho phù hợp, khía cạnh được coi là tương thích nếu họ có gần đủ trong
hướng nhìn và có cùng một tương quan trên các cạnh.
Cạnh tương ứng thường được giả định tuân theo từ trái sang phải tuỳ thuộc trong
từng ảnh, cho phép để hạn chế số lượng các xung đột và có thể từ chính nó đến các thuật
toán hiệu quả dựa trên lập trình năng động.
Với bất kỳ cách tiếp cận dựa vào, tuy nhiên, các thông tin chi tiết kết quả là thưa
thớt, bởi vì nó chỉ có sẵn tại các vị trí cạnh. Vì thế, một bước xa hơn là cần thiết để tính độ
sâu trên bề mặt trong bối cảnh đó.
Kết cấu đoạn
Kết cấu trong ngôn ngữ hằng ngày là một tài sản của các bề mặt gắn liền với chất
lượng tiếp xúc cần thiết (kết cấu có gốc giống như dệt may).
Trong tầm nhìn tính toán, nó dùng để chỉ một khái niệm liên quan chặt chẽ, mà một
mô hình không gian trên một bề mặt có thể được cảm nhận trực quan.
Ví dụ như mô hình của cửa sổ trên một tòa nhà, các nốt áo len, các điểm trên da của
beo, lá cỏ trên một bãi cỏ, sỏi trên một bãi biển hoặc một đám đông người tại một sân vận
động.
Đôi khi sắp xếp là khá định kỳ, như nốt trên áo len một; trong trường hợp khác, như
trong sỏi trên một bãi biển đều đặn là chỉ trong một ý nghĩa thống kê mật độ của sỏi là
khoảng cùng một ngày tại các điểm khác nhau của bãi biển.
Những gì chúng ta vừa bàn là đúng trong bối cảnh đó.
Trong hình ảnh, kích cỡ rõ ràng, hình dáng, khoảng cách, và như vậy, các yếu tố cấu
(các texels) làm thay đổi thực sự, như minh họa trong hình 24.17.
Các gạch giống hệt nhau trong bối cảnh đó. Có hai nguyên nhân chính cho các biến
thể này ở kích thước dự kiến và hình dạng của gạch:
1. Khoảng cách khác nhau của texels khác nhau từ máy ảnh. Nhớ lại rằng chiếu theo
quan điểm, các đối tượng xuất hiện ở xa nhỏ hơn. Yếu tố rộng là 1 / Z.
2. Tập hợp khác nhau của texels khác nhau. Điều này liên quan đến việc định hướng
tương đối với các dòng nhìn từ máy ảnh. Nếu Texel là vuông góc với dòng cảnh, không có
Tập hợp. Các độ lớn của hiệu ứng foreshortening là tỉ lệ thuận với cos (7, nơi
của chiếc máy của các Texel.
Sau một số phân tích toán học, người ta có thể tính toán các biểu thức cho tỷ lệ thay
đổi các đặc tính khác nhau của hình ảnh, chẳng hạn như khu vực, và mật độ.
Những kết cấu gadient là chức năng của hình dạng cũng như bề mặt nghiêng và
nghiêng của nó đối với người xem.
Để khôi phục lại hình dáng từ kết cấu, người ta có thể sử dụng một quá trình hai
bước: (a) đo gradient kết cấu; (b) ước tính hình dạng bề mặt, nghiêng, và nghiêng cho rằng
sẽ tăng đến gradient kết cấu đo.
Chúng ta biễu diễn các kết quả của một thuật toán được phát triển bởi Malik và
Rosenholtz (1994) trong hình 24.17 và 24.18.
Sự chắn:
Chắn-dao động trong cường độ ánh sáng nhận được từ các phần khác nhau của một
bề mặt trong chuỗi hoạt động là trạm cuối bằng hình học và tính chất phản xạ của bề mặt.
Trong đồ họa máy tính, mục tiêu là để xác định độ sáng hình ảnh I (x, y) cho hình học và
tính chất phản xạ. Trong tầm nhìn máy tính, hy vọng của chúng ta có thể để đảo ngược quá
trình này, có nghĩa là, thu hồi tài sản hình học cảnh và phản xạ cho độ sáng hình ảnh I (x,
y).
Điều này đã chứng tỏ khó khăn để làm bất cứ điều gì, nhưng trong trường hợp đơn
giản: Chúng ta hãy bắt đầu với một ví dụ về tình hình một nơi mà có trong thực tế, giải
quyết cho các hình dạng từ che. Xem xét một bề mặt được chiếu sáng bởi một nguồn ánh
sáng xa điểm. Chúng tôi sẽ giả định rằng bề mặt là đủ xa từ camera để chúng tôi có thể sử
dụng chiếu orthographic như một xấp xỉ để chiếu phối cảnh.
Độ sáng hình ảnh là :
l(x,y) = kn(x,y).s
với k là một tỉ lệ không đổi, n là bề mặt bình thường véc tơ đơn vị, và s là véc tơ đơn vị
theo hướng của nguồn sáng. Bởi vì n và s là vectơ đơn vị, chấm sản phẩm của họ chỉ là
những cô sin của góc giữa chúng. Hình dạng bề mặt bị bắt trong các biến thể của bề mặt n
bình thường dọc theo bề mặt. Hãy để chúng tôi cho rằng k và s được biết đến. Vấn đề của
chúng ta sau đó là để phục hồi các bề mặt bình thường n (x, y) cho cường độ hình ảnh I (x,
y).
Hình 24.17: cảnh minh họa kết cấu gradient. Giả sử các kết cấu thực sự là đồng phục cho
phép định hướng phục hồi của bề mặt. Định hướng mặt tính được chỉ định bởi overlaying
một vòng tròn màu trắng và con trỏ, chuyển như vòng tròn được vẽ trên bề mặt tại điểm đó.
(Image courtesy of Jitendra Malik và Ruth Rosenholtz.)
Hình 24,18 Phục hồi các hình dạng từ kết cấu cho một bề mặt cong
Các quan sát đầu tiên để thực hiện là vấn đề xác định n, cho độ sáng tại một điểm
ảnh được (x, y). Chúng ta có thể tính toán rằng n làm cho góc với véc tơ nguồn sáng,
nhưng đó chỉ để nằm trên một hình nón nhất định hướng với trục s và góc đỉnh 0 = cos "1
(//£) . Để tiến hành thêm, lưu ý rằng n không có thể khác nhau tùy tiện từ các điểm ảnh đến
điểm ảnh.
Nó tương ứng với véc tơ bình thường của một bản vá bề mặt nhẵn và do vậy cũng
phải thay đổi kỹ thuật để hạn chế được integrability. Một số kỹ thuật khác nhau đã được
phát triển để khai thác cái nhìn sâu sắc này.
Một kỹ thuật đơn giản là để viết lại n trong điều khoản của các dẫn xuất một phần
ZT và zy của Z sâu (x, y). Kết quả là phương trình vi phân từng phần cho Z có thể được
giải quyết để mang lại độ sâu Z (x, y), được đưa ra điều kiện biên thích hợp.
Một phương pháp có thể khái quát một chút. Nó không phải là cần thiết cho bề mặt
được làm nhẵn cũng không cho nguồn ánh sáng được một nguồn điểm. Miễn là ai có thể
xác định bản đồ phản xạ / (n),? Mà xác định độ sáng của một bản vá bề mặt như là một
hàm của n bình thường bề mặt của nó, về cơ bản cùng một loại kỹ thuật có thể được sử
dụng.
Khó khăn thực sự trong giao dịch với phản xạ bên trong. Nếu chúng ta xem xét một
cảnh điển hình trong nhà, như là các đối tượng bên trong một văn phòng, bề mặt được
chiếu sáng không chỉ bởi các nguồn ánh sáng, mà còn bởi ánh sáng phản chiếu từ bề mặt
trong cảnh khác mà có hiệu quả phục vụ như là nguồn ánh sáng thứ cấp. Những hiệu ứng
chiếu sáng lẫn nhau khá đáng kể. Các hình thức bản đồ phản xạ hoàn toàn thất bại trong
tình huống này, độ sáng hình ảnh phụ thuộc không chỉ trên bề mặt bình thường, mà còn về
các mối quan hệ phức tạp giữa các không gian khác nhau bề mặt trong bối cảnh đó.
Con người rõ ràng nào để có được một số nhận thức về hình dạng từ tạo bong, vì thế
đây vẫn là một vấn đề thú vị mặc dù với tất cả những khó khăn.
Đường bao
Khi chúng ta xem xét một bản vẽ đường dây, như hình 24.19, chúng ta có được một
nhận thức sinh động về hình dạng 3-D và bố trí. Làm thế nào? Sau khi tất cả, chúng ta thấy
rằng có vô hạn các cảnh có thể cho tăng đến vô cùng một dòng. Lưu ý rằng chúng ta nhận
được ngay cả bề mặt nghiêng và nghiêng. Nó có thể là do một sự kết hợp của kiến thức cấp
cao về hình dạng điển hình cũng như một số chế độ thấp.
Chúng ta sẽ xem xét chất lượng kiến thức có sẳn từ một bản vẽ dòng. Như đã bàn
trước đó, vẽ một dòng có thể có nhiều ý nghĩa (xem hình 24.6 và văn bản đi kèm). Các
công việc xác định ý nghĩa thực sự của mỗi dòng trong một hình ảnh được gọi là dòng
nhãn mác, và là một trong những nhiệm vụ đầu tiên được nghiên cứu trong tầm nhìn máy
tính. Để bây giờ, chúng ta hãy đối phó với một mô hình đơn giản hóa của thế giới, nơi các
đối tượng không có dấu hiệu bề mặt và nơi những dòng do không liên tục chiếu sáng và
bóng tối như cạnh đã được loại bỏ trong một số bước tiền xử lý, cho phép chúng ta hạn chế
sự chú ý để vẽ đường nơi mà mỗi dòng tương ứng hoặc vào một chiều sâu hoặc gián đoạn
định hướng.
Mỗi dòng sau đó có thể được phân loại như chiếu của một trong hai chân tay một
(các điểm trên bề mặt nơi có mặt cắt tiếp xúc với bề mặt), hoặc là một cạnh (một bề mặt
gián đoạn bình thường). Ngoài ra, mỗi cạnh có thể được phân loại như một lồi, lõm, hoặc
occluding cạnh. Để cạnh occluding và chân tay, chúng tôi muốn etermine đó của hai bề
mặt giáp với đường cong trong các bản vẽ đường dây là gần trong cảnh. Những suy luận có
thể được biểu bằng cách cho mỗi dòng một trong những dòng có thể có 6 nhãn như minh
họa trong hình 24.20.
Hình 24.19: vẽ dòng gợi nhiều liên tưởng. (Courtesy of Isha Malik.)
1. "+" Và "-" nhãn đại diện cho các cạnh lồi lõm, tương ứng. Đây là những liên kết với bề
mặt discontinuities bình thường mà cả các bề mặt đáp ứng dọc theo cạnh là nhìn thấy được.
2. A "<-" hay một "-» • "đại diện cho một cạnh lồi. Khi nhìn từ máy ảnh, cả bề mặt các bản
vá đáp ứng dọc theo cạnh nằm trên cùng một bên, một trong những hứơng khác.
Là một trong những chiều theo hướng mũi tên, các bề mặt này là bên phải.
3. Một "^ ^" hay một "^ ^" đại diện cho một chi. Ở đây bề mặt đường cong suốt quanh
chính nó. Là một trong những di chuyển theo hướng mũi tên kép, bề mặt nằm bên phải.
Các dòng ngắm là tiếp tuyến với bề mặt cho tất cả các điểm ở cánh này. Tay chân di
chuyển trên bề mặt của đối tượng là những thay đổi quan điểm.
Trong số nhóm những dòng n trong một bản vẽ, chỉ có một số lượng nhỏ có thể
chất. Việc xác định các bài tập nhãn là dòng ghi nhãn. Lưu ý rằng vấn đề này chỉ có ý
nghĩa nếu nhãn là như nhau cả. con đường dọc theo một đường dây này không phải luôn
luôn đúng,. bởi vì các nhãn có thể thay đổi cùng một dòng có hình ảnh của các đối tượng
cong.
Trong phần này, chúng tôi sẽ chỉ đối phó với các đối tượng, do đó, đây không phải
là một mối quan tâm.
Huffman (1971) và Clowes (1971) đã cố gắng một cách độc lập các phương pháp
tiếp cận đầu tiên có hệ thống để phân tích cảnh polyhedral. Huffman và Clowes giới hạn
phân tích của họ để cảnh với chất rắn đục có ba mặt-đối tượng trong đó có chính xác ba bề
mặt phẳng gặp nhau tại mỗi đỉnh. Đối với những cảnh với nhiều đối tượng, họ còn cai trị
trên sắp xếp đối tượng đó sẽ dẫn đến một sự vi phạm của các giả định có ba mặt, như là hai
khối chia sẻ một cạnh chung. Vết nứt, có nghĩa là, "cạnh" trên đó những chiếc máy bay ốp
được liên tục, cũng không được phép. Đối với thế giới có ba mặt, Huffman và Clowes làm
một danh sách đầy đủ của tất cả các loại đỉnh khác nhau và những cách khác nhau, trong
đó họ có thể được xem theo quan điểm chung. Các điều kiện quan điểm chung về cơ bản
đảm bảo rằng nếu có một phong trào nhỏ mắt, không có các nút ký tự thay đổi. Ví dụ, tình
trạng này ngụ ý rằng nếu ba dòng cắt nhau trong hình ảnh, các cạnh tương ứng trong cảnh
cũng phải cắt nhau.
Hình 24.20: các loại hình khác nhau của các nhãn dòng.
Hình 24.21: Bốn loại đỉnh có ba mặt.
Bốn cách thức mà ba bề mặt máy bay có thể gặp nhau tại một đỉnh được hiển thị
trong hình 24.21. Các trường hợp này đã được xây dựng bằng cách lấy một hình khối và
cách chia nó thành tám cung độ. Chúng tôi muốn tạo ra sự khác nhau có thể có đỉnh có ba
mặt tại trung tâm của khối bằng cách điền vào cung độ khác nhau. Các đỉnh có nhãn 1
tương ứng với 1 chòm sao bát nhân đầy, 3-3 cung độ, vv. Đọc cần thuyết phục mình rằng
đây là những thực sự tất cả những khả năng. Ví dụ, nếu một trong hai cung độ điền vào
một khối, một trong những không thể xây dựng một đỉnh hợp lệ có ba mặt ở trung tâm.
Lưu ý cũng có bốn trường hợp tương ứng với các kết hợp khác nhau và các cạnh lồi lõm
đáp ứng ở đỉnh.
Ba cạnh hợp ở đỉnh phân vùng không gian xung quanh thành tám cung độ.
Một đỉnh có thể được xem từ bất kỳ cung độ không bị chiếm bởi các vật liệu rắn. Di
chuyển các điểm trong một chòm sao đơn lẻ không dẫn đến một hình ảnh khác nhau với
các đường giao nhau. Các đỉnh có nhãn 1 trong hình 24/21 có thể được xem bất kỳ để cung
cấp cho các nhãn đường giao nhau trong hình 24.22.
hình 24.22: xuất hiện khác nhau của các đỉnh có nhãn 1 từ Hình 24.21.
hình 24.23: Huffman-Clowes nhãn đặt.
Một danh sách đầy đủ những cách khác nhau mỗi đỉnh có thể được xem kết quả
trong hình 24.23. Chúng tôi nhận được bốn loại giao lộ khác nhau mà có thể phân biệt
trong hình ảnh: L-, Y-, mũi tên, và T-mối nối. L-mối nối tương ứng với hai cạnh nhìn thấy
được. Y-và các nút mũi tên tương ứng với ba không có đường giao nhau của các cạnh trong
Y-một trong ba góc độ lớn hơn TT. T-mối nối được liên kết. Khi gần, khối bề mặt nhìn một
cạnh xa hơn. T bốn nhãn đường giao nhau tương ứng với bốn loại khác nhau của các cạnh.
Khi sử dụng đường giao nhau từ điển để tìm một nhãn cho các bản vẽ đường, vấn đề
là diễn giải đường giao nhau để xác định được thống nhất trên toàn cầu. Thống nhất là
buộc bởi các quy tắc mà mỗi dòng trong hình phải được chỉ định một và chỉ một nhãn hiệu
toàn bộ dọc theo chiều dài của nó.
Waltz (1975) đề xuất một thuật toán cho vấn đề này (thực sự là cho một phiên bản tăng
cường với bóng, nứt, và cạnh lõm có thể phân chia) mà là một trong những ứng dụng đầu
tiên của sự hài lòng khó khăn trong AI (xem Chương 3). Trong thuật ngữ của CSP, các
biến là các nút giao thông, các giá trị được labellings cho các mối nối, và các khó khăn
được rằng mỗi dòng có một nhãn hiệu duy nhất. Mặc dù Kirousis và Parjadimitriou (1988)
đã chỉ ra rằng dòng-ghi nhãn vấn đề cho cảnh có ba mặt là NP-đầy đủ, tiêu chuẩn CSP
thuật toán thực hiện tốt trong thực hành.
Mặc dù Huffman-Clowes-Waltz Đề án ghi nhãn được giới hạn đối tượng có ba mặt, sau đó
làm việc bằng cách Mackworth (1973) và Sugihara (1984) kết quả tổng quát cho polyhedra
tùy ý và làm việc của Malik (1987) cho các đối tượng piecewise mịn cong.
24.5 Sử dụng tầm nhìn cho sự vận động và dẫn đường. Một trong những cách dùng chính
của tầm nhìn là sử dụng để cung cấp thông tin cho các đối tượng thao tác lựa chọn, cầm
nắm, xoay vòng và cân nhắc điều hướng trong một cảnh trong khi tránh chướng ngại vật.
Khả năng sử dụng tầm nhìn cho các mục đích được hiện diện trong hầu hết các động vật
nguyên thủy của hệ thống. Có thể trực quan nguồn gốc tiến hóa của ý thức tầm nhìn có
nguồn gốc từ sự hiện diện của một điểm quang trên một đầu của một sinh vật có kích hoạt
nó để định hướng chính về hướng ( hoặc xa) ánh sáng. Tầm nhìn ruồi sử dụng dựa trên các
luồng quang để kiểm soát phản ứng đích của họ.
Điện thoại di động robot di chuyển xung quanh trong một môi trường cần phải biết nơi có
những trở ngại, nơi hành lang không gian trống có sẵn, vv. Thêm chi tiết về điều này trong
Chương 25.
Hãy để chúng tôi nghiên cứu việc sử dụng tầm nhìn trong lái xe một cách chi tiết. Hãy xem
xét các nhiệm vụ cho các lái xe ở phía dưới góc trái của hình 24.24
1. Giữ chuyển động tại một VQ tốc độ hợp lý.
2. Bộ phận điều khiển bên - đảm bảo rằng xe vẫn an toàn trong làn đường của nó,
nghĩa là giữ dl = dr.
3. Kinh độ kiểm soát - đảm bảo rằng có một khoảng cách an toàn d2 giữa nó và xe
ở phía trước của nó.
4. Màn hình trong làn xe lân cận (ở khoảng cách dl và d3) và được chuẩn bị cho
thao tác cá nhân thông dụng nếu một trong số họ quyết định thay đổi làn xe.
Vấn đề cho các trình điều khiển được để tạo chỉ đạo thích hợp, sự khởi động máy hoặc
phanh hành động để thực hiện tốt nhất cho công việc này. Tập trung cụ thể về kiểm soát
bên và kinh độ, thông tin về những gì cần thiết cho những công việc này?
Để kiểm soát bên, một trong những nhu cầu để duy trì một đại diện của các vị trí và hướng
của xe tương đối với làn xe. Sự quan sát con đường từ camera đặt trên một chiếc xe được