Tải bản đầy đủ (.doc) (30 trang)

Cấu trúc dữ liệu raster và cấu trúc dữ liệu vector ppsx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (541.45 KB, 30 trang )

Các đối tượng địa lý khi được biểu diễn trên máy tính được biết đến ở 2
dạng: cấu trúc dữ liệu raster và cấu trúc dữ liệu vector
A. Cấu trúc Raster:

Mô hình raster biểu diễn không gian như là một ma trận số nguyên, mỗi giá trị số
nguyên đại diện cho một thuộc tính, vị trí của số nguyên chính là vị trí của đối
tượng.
Thí dụ:


Liên hệ với thế giới thực: mỗi pixel sẽ tương ứng với một ô nào đó trong thế giới
thực.
Trong cấu trúc raster:
- Đường được biểu diễn bằng những pixel có cùng giá trị f(x,y) liên tiếp
nhau.
- Vùng được xác định thành một mạng gồm nhiều pixel có cùng giá trị thuộc
tính f(x,y).
 !
Cấu trúc lưu trữ raster cơ bản:
- Cấu trúc lưu mã chi tiết (exhaustive enumeration)
- Cấu trúc lưu mã run length (run-length encoding).
"#$ !%&', mỗi một điểm lưới được gắn với giá trị duy nhất,
vì vậy dữ liệu không được nén gọn.
 !%&() có ý nghĩa như là một kỹ thuật nén dữ liệu nếu raster
chứa các nhóm điểm lưới có cùng một giá trị. Khi đó thay vì phải lưu trữ riêng cho
từng điểm lưới, cấu trúc này lưu trữ theo từng thành phần có một giá trị duy nhất
và số lượng điểm lưới chứa đựng giá trị đó.
*+ !&'
,+ !&-
Mô hình raster chia không gian thành những ô lưới đều hình vuông (chữ
nhật, tam giác, hoặc lục giác) gọi là điểm ảnh (pixel). (bộ môn địa tin học,ĐHQG


TP Hồ Chí Minh, ĐH Bách Khoa).
Mỗi pixel được xác định vị trí bằng cặp toạ độ (x,y) là số thứ tự của hàng
và cột của pixel.
Pixel là phần tử cơ sở của cấu trúc raster để biểu diễn một đặc trưng địa lý
f(x,y) nào đó, dữ liệu trong mỗi pixel là đồng nhất.
Trong cấu trúc raster, đường được biểu diễn bằng những pixel có cùng giá
trị f(x,y) liên tiếp nhau.
Vùng được xác định bằng một mảng gồm nhiều điểm ảnh có cùng giá trị
thuộc tính f(x,y) trải rộng ra theo nhiều phương.
Dữ liệu không gian khi lưu trữ theo mô hình raster phụ thuộc vào các yếu
tố sau:
- Độ phân giải không gian: xác định kích thước nhỏ nhất của một lớp dữ liệu
(ảnh) trong hệ thống.
- Độ phân giải pixel: xác định kích thước nhỏ nhất của một pixel và thường
được tính toán dựa trên số lượng pixel trên một đơn vị chiều dài.
- Độ phân giải mã hoá: khoảng cách nhỏ nhất tính theo đơn vị mức xám giữa
hai giá trị mức xám liền kề (fi+1 – f i ).
. !/
Cấu trúc dữ liệu raster có hai đặc điểm cần lưu ý:
- Mỗi điểm ảnh chỉ biểu diễn một thuộc tính, xác định bởi giá trị f(x,y).
- Khi thay đổi độ phân giải (kích thước điểm ảnh thay đổi), dung lượng dữ
liệu thay đổi theo. Dung lượng dữ liệu tăng theo bình phương tỉ lệ gia tăng độ
phân giải.
2.Nguồn dữ liệu raster
Ảnh chụp từ vệ tinh, ảnh chụp từ máy bay, ảnh quét, ảnh chụp. Trong đó ảnh
chụp từ vệ tinh là cách lấy dữ liệu tốn kém nhất nhưng lại có ý nghĩa to lớn trong
việc nghiên cứu tình hình biến đổi của các sự vật trên trái đất theo thời gian. Ảnh
chụp từ máy bay giúp ta vẽ bản đồ một cách chi tiết.
Ngoài ra raster còn có thể được tạo ra bằng cách chuyển đổi từ nhiều nguồn dữ
liệu khác như vector hay TIN.

3.Các thành phần dữ liệu
Raster được tạo nên bởi một mảng 2 chiều các điểm ảnh hay pixel.
Pixel :
Cell là một đơn vị đồng nhất biểu diễn một vùng xác định trên trái đất.
Các cell đều có cùng kích thước.
Gốc toạ độ của hệ được đặt tại cell nằm tại đỉnh góc trái.
Mỗi cell được xác định bởi chỉ số dòng và chỉ số cột, đồng thời nó chứa một
số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản
đồ.
Kích thước của cell trong raster phụ thuộc nhiều vào độ phân giải dữ liệu. Cell
phải có kích thước đủ nhỏ để có thể thu thập được chi tiết dữ liệu, nhưng cũng
phải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện.
Giá trị của cell sẽ định nghĩa các nhóm, lớp tại vị trí của cell. Cell tại những
điểm có cùng một giá trị xác định một vùng, miền.
Các cell trong cùng một miền không cần phải liên kết với nhau. Khi một số
nguyên được chỉ định cho một tập các cell, thì số nguyên này có thể là mã phân
biệt giữa các nhóm cell. Điều này tạo nên một quan hệ một - nhiều giữa mã và các
cell có cùng giá trị.
012: các cell có giá trị là 400 được gán mã là 4, các cell có giá trị 500 được gán
mã là 5. Mã này có thể xuất hiện nhiều lần trong raster, nhưng chỉ xuất hiện một
lần trong bảng giá trị thuộc tính (hình vẽ). Bảng này lưu các giá trị thuộc tính cho
mã, điều này giúp việc cập nhật đơn giản hơn. Một thay đổi nhỏ của giá trị thuộc
tính sẽ làm thay đổi cách thể hiện của hàng trăm đối tượng trên bản đồ.
Mỗi cell trong một raster đều có một giá trị. Giá trị này biểu diễn một trong
bốn kiểu dữ liệu sau:
• 345'67 một giá trị thuộc kiểu dữ liệu nominal sẽ xác định
một thực thể từ một thực thể khác. Những giá trị này được phân loại để tạo thành
các nhóm. Trong mỗi nhóm, thực thể địa lý sẽ liên kết với cell tại vị trí của cell đó.
Nominal được dùng trong rất nhiều kiểu mã như mã sử dụng đất, kiểu đất trồng.
• 845'9:7 một giá trị thuộc dữ liệu ordinal sẽ xác định vị trí

của một thực thể so với các thực thể khác như thực thể được đặt ở vị trí thứ nhất,
thứ hai, hoặc thứ ba. Nhưng các giá trị này không thiết lập tỷ lệ tương quan giữa
các thực thể. Chúng ta không thể suy luận được thực thể này lớn hơn, cao hơn hay
nặng hơn thực thể khác bao nhiêu
• ;45'<-7 một giá trị thuộc dữ liệu interval biểu diễn một
phép đo trên một tỷ lệ như thời gian trong ngày. Những giá trị này nằm trên một tỷ
lệ xác định và không liên hệ với một điểm thực nào.
/45'=7 một giá trị thuộc kiểu ratio có thể biểu diễn một phép đo trên
một tỷ lệ với một điểm cố định và mang ý nghĩa.
4. Hệ thống Raster
Mô hình dữ liệu dạng raster phản ánh toàn bộ vùng nghiên cứu dưới dạng một lưới
các ô vuông hay điểm ảnh (pixcel). Mô hình raster có các đặc điểm:
• Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới.
• Mỗi một điểm ảnh (pixcel) chứa một giá trị.
• Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp
(layer).
• Trong cơ sở dữ liệu có thể có nhiều lớp.
Mô hình dữ liệu raster là mô hình dữ liệu GIS được dùng tương đối phổ biến trong
các bài toán về môi trường, quản lý tài nguyên thiên nhiên.
Mô hình dữ liệu raster chủ yếu dùng để phản ánh các đối tượng dạng vùng là ứng
dụng cho các bài toán tiến hành trên các loại đối tượng dạng vùng: phân loại;
chồng xếp.
Các nguồn dữ liệu xây dựng nên dữ liệu raster có thể bao gồm:
• Quét ảnh
• Ảnh máy bay, ảnh viễn thám
• Chuyển từ dữ liệu vector sang
• Lưu trữ dữ liệu dạng raster.
• Nén theo hàng (Run lengh coding).
• Nén theo chia nhỏ thành từng phần (Quadtree).
• Nén theo ngữ cảnh (Fractal).

Trong một hệ thống dữ liệu cơ bản raster được lưu trữ trong các ô (thường hình
vuông) được sắp xếp trong một mảng hoặc các dãy hàng và cột. Nếu có thể, các
hàng và cột nên được căn cứ vào hệ thống lưới bản đổ thích hợp.
Việc sử dụng cấu trúc dữ liệu raster tất nhiên đưa đến một số chi tiết bị mất. Với lý
do này, hệ thống raster-based không được sử dụng trong các trường hợp nơi có các
chi tiết có chất lượng cao được đòi hỏi.
Hình 1.7: Sự biểu thị kết quả bản đồ dưới dạng Raster
*)>?@AB(-
Việc chọn của cấu trúc dử liệu dưới dạng vector hoặc raster tuỳ thuộc vào yêu cầu
của người sử dụng, đối với hệ thống vector, thì dữ liệu được lưu trữ sẽ chiếm diện
tích nhỏ hơn rất nhiều so với hệ thống raster, đồng thời các đường contour sẽ
chính xác hơn hệ thống raster. Ngoài ra cũng tuỳ vào phần mềm máy tính đang sử
dụng mà nó cho phép nên lưu trữ dữ liệu dưới dạng vector hay raster. Tuy nhiên
đối với việc sử dụng ảnh vệ tinh trong GIS thì nhất thiết phải sử dụng dưới dạng
raster.
Một số công cụ phân tích của GIS phụ thuộc chặt chẽ vào mô hình dữ liệu raster,
do vậy nó đòi hỏi quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster, hay
còn gọi là raster hoá. Biến đổi từ raster sang mô hình vector, hay còn gọi là vector
hoá, đặc biệt cần thiết khi tự động quét ảnh. Raster hoá là tiến trình chia đường
hay vùng thành các ô vuông (pixcel). Ngược lại, vector hoá là tập hợp các pixcel
để tạo thành đường hay vùng. Nết dữ liệu raster không có cấu trúc tốt, thí dụ ảnh
vệ tinh thì việc nhận dạng đối tượng sẽ rất phức tạp.
Nhiệm vụ biến đổi vector sang raster là tìm tập hợp các pixel trong không gian
raster trùng khớp với vị trí của điểm, đường, đường cong hay đa giác trong biểu
diễn vector. Tổng quát, tiến trình biến đổi là tiến trình xấp xỉ vì với vùng không
gian cho trước thì mô hình raster sẽ chỉ có khả năng địa chỉ hoá các vị trí toạ độ
nguyên. Trong mô hình vector, độ chính xác của điểm cuối vector được giới hạn
bởi mật độ hệ thống toạ độ bản đồ còn vị trí khác của đoạn thẳng được xác định
bởi hàm toán học.
Hình 1.8:Sự chuyển đổi dữ liệu giữa raster và vector (Nguồn : Tor Bernhardsen,

1992)
*CDEF#-AB
• Vị trí địa lý của mỗi ô được xác định bởi vị trí của nó trong ô biểu tượng,
hình ảnh có thể được lưu trữ trong một mảng tương xứng trong máy vi tính
cung cấp đủ dữ liệu bất kỳ lúc nào. Vì vậy mỗi ô có thể nhanh chóng và dễ
dàng được định địa chỉ trong máy theo vị trí địa lý của nó.
• Những vị trí kế cận được hiện diện bởi các ô kế cận, vì vậy mối liên hệ giữa
các ô có thể được phân tích một cách thuận tiện
• Quá trình tính toán đơn giản hơn và dễ dàng hơn cơ sở hệ thống dữ liệu
vector.
• Đơn vị bản đồ ranh giới thửa được trình bày một cách tự nhiên bởi giá trị ô
khác nhau, khi giá trị thay đổi, việc chỉ định ranh giới thay đổi.
*G EF#-
• Khả năng lưu trữ đòi hỏi lớn hơn nhiều so với hệ thống cơ sở dữ liệu
vector.
• Kích thước ơ định rõ sự quyết định ở phương pháp đại diện ở phương pháp
đại diện. Điều này đặc biệt khó dễ cân xứng với sự hiện diện đặc tính thuộc
về đường thẳng.
Thường hầu như hình ảnh gần thì nối tiếp nhau, điều này có nghĩa là nó phải
tiến hành một bản đồ hồn chỉnh chính xác để thay đổi 1 ơ đơn. Q trình tiến
hành của dữ liệu về kết hợp thì chống nhiều chỗ hơn với 1 hệ thống cơ sở vector.
Dữ liệu được đưa vào hầu như được số hố trong hình thức vector, vì thế nó
phải chính xác 1 vector đến sự thay đổi hoạt động raster để đổi dữ liệu hệ số hố
vào trong hình thức lưu trữ thích hợp.
Điều này thì khó hơn việc xây dựng vào trong bản đồ từ dữ liệu raster
II.Cấu trúc full Raster
• .
• Cấu trúc này khác với các cấu trúc khác ở cách tổ chức và biểu diễn dữ
liệu thuộc tính.
• Cấu trúc đơn giản và phổ biến nhất là giới hạn mỗi lớp lưới trong một

thuộc tính đơn và giới hạn trò số của giá trò thuộc tính trong khoảng từ 0 đến
255 (một byte cho mỗi Pixel)
• Sự sắp xếp chuỗi trong một cấu trúc Full raster thường theo thứ tự cột
bắt đầu từ góc trên bên bên trái và quét từ trái qua phải, từ trên xuống dưới.
Thực tế có thể có Cấu trúc full raster được sử dụng rộng rãi trong các hệ
thống xử lý ảnh nhiều thứ tự sắp xếp khác nhau và điều này liên quan đến
nhiều cấu trúc nén như mã Run-Length và cây tứ phân.
• Cấu trúc Full Raster có thể được tổ chức theo BSQ (Band Sequential).
- Các giá trò của một dải đơn hoặc một thuộc tính được sắp xếp theo
thứ tự cột như đã đề cập trong phần trên.
- Nếu có nhiều hơn một thuộc tính thì dải thứ hai bắt đầu tại vò trí
dải thứ nhất kết thúc.
• Cấu trúc BSQ (Band Sequential).
• Interleaved by Cấu trúc BSQ (Band Sequential). ùc BIL (Band
Interleaved by Line) hoặc BIP (Band Pixel).
Với cấu trúc BIL, mỗi cột
- ảnh đa giải cũng có thể được lưu theo cấu tru Những các Pixel
được lặp lại m lần với mà l số dải, trước khi di chuyển tới cột tiếp
theo.
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)
(i,j)
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)
(i,j)
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)

(i,j)
Band 1
Band 2
Band 3
Band 1
Band 2
Band 3
Đòa chỉ của Pixel:
i: chỉ số dòng
J: chỉ số pixel
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)
(i,j)
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)
(i,j)
(1,1) (1,2) (1,3)
(2,1) (2,2)
(3,1)
(i,j)
- Với cấu trúc BIP, những giá trò dải của mỗi Pixel được lưu chung
với nhau để đối với một ảnh 7 dải, 7 giá trò đầu tiên dành cho
pixel thứ nhất, được theo sau bởi 7 giá trò kế tiếp của Pixel thứ
hai,v.v…
• Cấu trúc BIL (Band Interleaved by Line)
Đòa chỉ của Pixel:
i: chỉ số dòng
J: chỉ số pixel

Band 1
Band 2
Band 3
Band 1
Band 2
Band 3
(1,1)
(2,1)
(3,1)
(1,2)
(2,2)
(1,1)
(2,1)
(3,1)
(1,2)
(2,2)
(1,1)
(1,2)
(1,3)
(1,2)
(2,2)
H. Hình cấu trúc BIL
• Các đònh dạng BIL và BIP thuận lợi trong các thao tác liên quan đến sự
kết hợp giữa các ảnh vì những đòa chỉ vật lý của các giá trò thuộc tính đối với
cùng một pixel thì rất gần nhau.
• Tuy nhiên, đối với việc hiển thò nhanh chóng một thuộc tính đơn từ một
tập dữ liệu đa dải lớn thì BSQ hiệu quả hơn.
• Những cấu trúc ảnh Raster phổ biến nhất chỉ lưu trữ những số nguyên
dương có tầm trò trong khoảng từ 0-255 (một byte).
• Dữ liệu ảnh lưới đòa lý thường yêu cầu tầm trò lớn hơn 0-255 bởi vì tần

số không gian cao.
• Thông tin tần số cao bò mất khi lượng tử vào trong một miền trò số nhỏ,
do vậy những ảnh đòa lý thường yêu cầu nhiều hơn một byte cho mỗi Pixel
** Ưu, nhược điểm của cấu trúc dữ liệu Raster
1. Ưu điểm
• Vị trí địa lý của mỗi ơ được xác định bởi vị trí của nó trong ơ biểu tượng,
hình ảnh có thể được lưu trữ trong một mảng tương xứng trong máy vi tính cung
cấp đủ dữ liệu bất kỳ lúc nào. Vì vậy mỗi ơ có thể nhanh chóng và dễ dàng được
định địa chỉ trong máy theo vị trí địa lý của nó.
• Những vị trí kế cận được hiện diện bởi các ơ kế cận, vì vậy mối liên hệ giữa
các ơ có thể được phân tích một cách thuận tiện
• Q trình tính tốn đơn giản hơn và dễ dàng hơn cơ sở hệ thống dữ liệu
vector.
• Đơn vị bản đồ ranh giới thửa được trình bày một cách tự nhiên bởi giá trị ơ
khác nhau, khi giá trị thay đổi, việc chỉ định ranh giới thay đổi.
2. Nhược điểm
• Khả năng lưu trữ đòi hỏi lớn hơn nhiều so với hệ thống cơ sở dữ liệu
vector.
• Kích thước ô định rõ sự quyết
định ở phương pháp đại diện ở
phương pháp đại diện. Điều này đặc biệt khó dễ cân xứng với sự hiện diện
đặc tính thuộc về đường thẳng.
• Thường hầu như hình ảnh gần thì nối tiếp nhau, điều này có nghĩa là nó
phải tiến hành một bản đồ hoàn chỉnh chính xác để thay đổi 1 ô đơn. Quá
trình tiến hành của dữ liệu về kết hợp thì choáng nhiều chỗ hơn với 1 hệ
thống cơ sở vector.
• Dữ liệu được đưa vào hầu như được số hoá trong hình thức vector, vì thế nó
phải chính xác 1 vector đến sự thay đổi hoạt động raster để đổi dữ liệu hệ
số hoá vào trong hình thức lưu trữ thích hợp.Điều này thì khó hơn việc xây
dựng.

III.Đặc điểm hình học của cấu trúc Vector
HHHH
Các đối tượng không gian khi biểu diễn ở cấu trúc dữ liệu vector được tổ
chức dưới dạng điểm (point), đường (line) và vùng (polygon) (xem hình 3.4), và
được biểu diễn trên một hệ thống tọa độ nào đó. Đối với các đối tượng biểu diễn
trên mặt phẳng, mỗi đối tượng điểm được biểu diễn bởi một cặp tọa độ (x, y); đối
tượng đường được xác định bởi một chuỗi liên tiếp các điểm (vertex), đoạn thẳng
được nối giữa các điểm (vertex) hay còn gọi là cạnh (segment), điểm bắt đầu và
điểm kết thúc của một đường gọi là các nút (node); đối tượng vùng được xác định
bởi các đường khép kín.
Hình 3.1: Minh họa đối tượng đường gồm có các nút, điểm, cạnh
1.Kiểu đối tượng điểm (Points)
Điểm được xác định bởi cặp giá trị đ. Các đối tượng đơn, thông tin về địa lý chỉ
gồm cơ sở vị trí sẽ được phản ánh là đối tượng điểm. Các đối tượng kiểu điểm có
đặc điểm:
• Là toạ độ đơn (x,y)
• Không cần thể hiện chiều dài và diện tích
Hình 1
Hình 3.2: Số liệu vector được biểu thị dưới dạng điểm (Point).
Tỷ lệ trên bản đồ tỷ lệ lớn, đối tượng thể hiện dưới dạng vùng. Tuy nhiên
trên bản đồ tỷ lệ nhỏ, đối tượng này có thể thể hiện dưới dạng một điểm. Vì vậy,
các đối tượng điểm và vùng có thể được dùng phản ánh lẫn nhau.
2.Kiểu đối tượng đường (Arcs)
Đường được xác định như một tập hợp dãy của các điểm. Mô tả các đối tượng địa
lý dạng tuyến, có các đặc điểm sau:
• Là một dãy các cặp toạ độ
• Một arc bắt đầu và kết thúc bởi node
• Các arc nối với nhau và cắt nhau tại node
• Hình dạng của arc được định nghĩa bởi các điểm vertices
• Độ dài chính xác bằng các cặp toạ độ

Hình 2
Hình 3.3: Số liệu vector được biểu thị dưới dạng Arc
3.Kiểu đối tượng vùng (Polygons)
Vùng được xác định bởi ranh giới các đường thẳng. Các đối tượng địa lý có diện
tích và đóng kín bởi một đường được gọi là đối tượng vùng polygons, có các đặc
điểm sau:
• Polygons được mô tả bằng tập các đường (arcs) và điểm nhãn (label points)
• Một hoặc nhiều arc định nghĩa đường bao của vùng
• Một điểm nhãn label points nằm trong vùng để mô tả, xác định cho mỗi
một vùng.

Hỡnh 3.4: S liu vector c biu th di dng vựng (Polygon)
Hỡnh 3.5: Mt s khỏi nim trong cu trỳc c s d liu bn .
***Hai loi cu trỳc c bit n trong cu trỳc d liu vector l cu trỳc
Spaghetti v cu trỳc Topology. Cu trỳc Spaghetti ra i trc v c s dng
cho n ngy nay mt s cỏc phn mm GIS nh: phn mm Arcview GIS,
ArcGIS, MapInfo, Cu trỳc Topology ra i trờn nn tng ca mụ hỡnh d liu
cung nỳt (Arc - Node).
B.CAU TRUC Dệế LIEU VECTOR
Dữ liệu ở dạng Vector đợc tổ chức ở 2 mô hình:
Mô hình Spagheti
Mô hình quan hệ không gian Topology
1.Cấu trúc Spaghetti
Trong cấu trúc dữ liệu Spaghetti, đơn vị cơ sở là các cặp tọa độ trên một không
gian địa lý xác định. Do đó, mỗi đối tượng điểm được xác định bằng một cặp tọa
độ (x, y); mỗi đối tượng đường được biểu diễn bằng một chuỗi những cặp tọa độ
(x
i
, y
i

); mỗi đối tượng vùng được biểu diễn bằng một chuỗi những cặp toạ độ (x
j
,
y
j
) với điểm đầu và điểm cuối trùng nhau.
Thí dụ:
Hình 3.6: Minh họa dữ liệu Spaghetti
Đặc trưng Vị trí
Điểm A (x
A
, y
A
)
Điểm B (x
B
, y
B
)
Cung AB (x
A
, y
A
), (x
B
, y
B
)
Vùng a (x
A

, y
A
), (x
a1
, y
a1
), …, (x
a5
, y
a5
) , (x
B
, y
B
), (x
A
, y
A
)
Vùng b (x
A
, y
A
), (x
b1
, y
b1
), (x
b2
, y

b2
), (x
b3
, y
b3
) , (x
B
, y
B
), (x
A
, y
A
)
Bảng 1: Bảng mô tả đặc trưng của cấu trúc Spaghetti
Đặc điểm: Cấu trúc Spaghetti không ghi nhận đặc trưng kề nhau của hai vùng kề
nhau, nghĩa là tại hai vùng kề nhau sẽ có hai cạnh chung kề nhau, cạnh chung của
hai vùng kề nhau là hai cạnh độc lập nhau. Ở thí dụ trên vùng a và vùng b có
chung cạnh AB.
2.Caáu truùc topology
*Giới thiệu:
Dữ liệu topology được xây dựng tu các đối tượng hình học cơ bản và chúng có mối quan
hệ với nhau.Mức độ quan hệ tùy thuộc vào cấp topology. Một vấn đề khó khăn khi
xây dựng các ứng dụng dựa trên dữ liệu topology là nguồn dữ liệu topology không
có sˆn. Muốn có dữ liệu topology chúng ta phải chuyển từ dữ liệu hình học cơ bản
thành dữ liệu topology. Và các phương pháp hay công cụ chuyển đổi còn ít được hổ
trợ. Trong nội dung đề tài, chúng ta sẽ xây dựng công cụ để chuyển đổi dữ liệu từ
dạng text thành dữ liệu topology như mong muốn.
*Các khái niệm cơ bản trong topology:
-Start node: nút bắt đầu của cạnh.

-End node: nút kết thúc của cạnh.
-Right edge: cạnh đầu tiên khi di chuyển ngược chiều kim đồng hồ quanh nút kết thúc
của cạnh hiện tại.
-Left edge: cạnh đầu tiên khi di chuyển ngược chiều kim đồng hồ quanh nút bắt đầu của
cạnh hiện tại.
-First edge: cạnh được chọn ngẫu nhiên, được xem như là cạnh đầu tiên cho việc tìm
kiếm các cạnh kề của nút.
Một số khái niệm cơ bản trong mô hình topology:
Left face: mặt ở bên trái của cạnh khi di chuyển từ nút bắt đầu đến nút kết thúc.
Right face: mặt ở bên phải của cạnh khi di chuyển từ nút bắt đầu đến nút kết thúc.
Minimun bounding rectangle (MBR): khung chữ nhật nhỏ nhất chứa toàn bộ đối tượng.
Inner ring: biên trong của mặt. Mỗi đối tượng vùng có thể không có, có một hoặc nhiều
biên trong.
Outer ring: biên bao ngoài của mặt. Mỗi đối tượng vùng có duy nhất một biên ngoài.
Đăc trưng: mơ hình của đối tượng địa lý thực. Các đối tượng này có thể là đối tượng vơ
hướng một chiều, hai chiều và ba chiều.
Mô hình topology
• Đường được chia thành nhiều cung (arc) có đònh hướng, mỗi cung được thành
lập một hoặc nhiều đoạn thẳng, giới hạn bởi các đỉnh đầu mút của cung gọi là
nút (node), mỗi cung có nút đầu và nút cuối.
• Các bảng thuộc tính topo sẽ mô tả các quan hệ không gian giữa các cung, các
nút và các vùng.
• Do chỉ có một đường biên giữa hai vùng kề nhau nên không thể có vùng trống
hoặc chồng lấn và không thể có bất kỳ một điểm nào thuộc hai vùng.
• Các thuộc tính Topology của các đối tượng không gian là các thuộc tính về sự
tiếp giáp, sự chứa đựng và sự liên kết của các đối tượng
• Các thuộc tính Topology của các đối tượng không gian không bò thay đổi bởi
các phép biến đổi như chuyển dòch, thay đổi tỉ lệ, quay.
• Tuy nhiên, các phép biến đổi này có thể ảnh hưởng đến tọa độ không gian và
một số thuộc tính hình học như diện tích, chu vi và hướng của các đối tượng.

• Các thuộc tính topology của các đối tượng không gian được đònh nghóa thêm
vào thuộc tính không gian của mô hình spaghetti.
Khi dữ liệu không gian được biểu diễn trong mô hình topology, việc thay đổi,
thêm, xóa các đường bao của vùng không chỉ ảnh hưởng đến tọa độ không
gian của các đỉnh mà còn ảnh hưởng đến các thuộc tính topology của các cung,
nút.
• Mô hình topology được thêm thông tin về sự tiếp giáp, chứa đựng và sự liên
kết của các cung và các nút. Mỗi cung gồm một hoặc nhiều đoạn thẳng được
xác đònh bằng các đỉnh

3.3. Cấu trúc topology
• Tính topology rất cần thiết trong quá trình phân tích không gian.
• Topology thể hiện mối quan hệ hoặc sự liên kết giữa các đối tượng trong
không gian.
• Topology là một phương pháp toán học dùng để xác đònh các quan hệ không
gian.
• Cấu trúc topology còn được gọi là cấu trúc cung-nút (arc-node) với phần tử cơ
bản là cung.
• Mỗi cung được mô tả như là một chuỗi những đoạn thẳng nối liền nhau, điểm
đầu và cuối cung gọi là nút (node), những điểm giữa cung gọi là đỉnh (vertex).
• Nút là điểm giao nhau của hai hay nhiều cung, đối với những cung độc lập, nút
là điểm cuối cùng của cung, không nối liền với bất kỳ cung nào khác.
• Vùng là một chuỗi những cung nối liền nhau và khép kín, những cung này
chính là đường biên của vùng.
• Một vùng có thể được giới hạn bởi hai đường cong khép kín lồng vào nhau và
không cắt nhau.
• Các đối tượng đòa lý trong cấu trúc topology được mô tả trong bốn bảng:
Ba bảng đầu lưu trữ các phần tử không gian vùng, nút, cung.
Bảng thứ tư lưu trữ tọa độ nút, nút cuối và đỉnh.
Topology vùng

Vùng Cung
A
B
C
D
E
a1, a5, a3
a2, a5, 0, a6, 0, a7
a7
a6
vùng ngoài
Topology cung
Cung Nút
đầu
Nút
cuối
Vùng trái Vùng
phải
a1
a2
a3
a4
a5
a6
a7
N1
N2
N3
N4
N3

N5
N6
N2
N3
N1
N1
N2
N5
N6
E
E
E
A
A
B
B
A
B
A
A
B
B
C
Ba
nd
1
Ba
nd
2
Ba

nd
3
Đòa
chỉ
của
Pixe
l:
i:
chỉ
số
dòn
g
J:
chỉ
số
pixe
l
Ba
nd
1
2
3
0 10
30
20
40
50
60
70
0

70
40
30
60
50
20
10
A
C
B
E
D,a6
,N5
a1
a2
a2
a3
a5
a7
a7
a7
a7
a2
Topology nút
Nút Cung
N1
N2
N3
N4
N5

N6
a1, a3, a4
a1, a2, a5
a2, a3, a5
a4
a6
a7
Dữ liệu toạ độ cung
Cung Nút đầu
(x,y)
Đỉnh (vertex)
(x,y)
Nút cuối
(x,y)
a1
a2
a3
a4
a5
a6
a7
40,60
70,50
10,25
40,60
10,25
20,25
30,20
55,27
70,60

70,10;10,10
10,60
30,50
20,27;30,30;50,3
2

55,15;40,15;45,27
70,50
10,25
40,60
30,40
70,50
20,25
30,20
55,27
• Các bảng Topology:
- Bảng topology vùng xác đònh những cung làm đường biên của vùng,
phần bên ngoài bản đồ cũng được xem như một vùng không xác đònh
cung đường biên.
- Bảng topology nút xác đònh mỗi nút thuộc những cung nào.
- Bảng topology cung xác đònh quan hệ của nút và vùng với cung.
- Bảng thứ tư lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của
các nút và đỉnh của cung, để từ đó vò trí của mỗi phần tử trên bản đồ
được liên hệ với thế giới thực.
- Các bảng cung, nút vùng cho phép phân tích các quan hệ giữa các phần
tử trên bản đồ.
- Bảng thứ tư lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của
các nút và đỉnh của cung.
- Cấu trúc topology rất thích hợp với những toán tử phân tích không gian,
nhất là những bài toán kề (contiguity) và kết nối (connectivity).

• *Các đối tượng trong topology:
• Có 4 loại hình học cơ sở là:
• +Node (nút): entitynode (nút cụ thể), connected node (nút kết nối).
• +Edge (cạnh).
• +Face (mặt).
• +Text (văn bản): chỉ làm rõ đối tượng chứ không thể được liên kết với nhau bởi
mối quan hệ topology.
• 38IJK : là các đối tượng vô hướng dùng để lưu trữ các vị trí có ý nghĩa.
• +Entity node: là các node không nằm trên cạnh, nó chỉ được liên kết về mặt
topology với mặt chứa nó. Nó dùng để thể hiện nhữn đặt trưng riêng biệt hoặc các
điểm khảo sát, hay các đối tượng thể hiện ở một tỉ lệ nào đó.
• +Connected node: là các node nằm đầu mút của cạnh,nó có thể là điểm đầu hay
điểm cuối của cạnh. Và được liên kết topology với các cạnh khác. Mỗi node con
có firstedge và có một khung bao nhỏ nhất (MBR-Minimum boundary rectangle)
chứa nó. Các node kết nối được sử dụng theo ai hướng:
• Định nghĩa các cạnh về mặt topology: lúc nào cũng co node được xem như là
điểm đầu va điểm cuối.
• Thể hiện các đặt trưng điểm được tìm thấy tại đầu và cuối cạnh đặt trưng tuyến
tính: chˆng hạn như các cây cầu, các của cống của một con kênh Tất cả các
node kết nói được chứa trong bảng node kết nối. Nếu nhiều cạnh giao nhau tại
một node, chỉ một cạnh sẽ được duy trì mỗi node trong bảng node kết nối, các
cạnh khác được liên kết bằng cách sử dung thuật toán tìm cạn kề để suy ra.
• JILJ : là đối tượng cơ sở dùng để thể hiện các đặt trưng tuyến tính như con
đường và các biên của mặt. Cạnh được cấu thành từ 2 hay nhiều cặp tọa độ 2
chiều (x:y) hay 3 chiều (x:y:z) phân biệt. Hướng của cạnh có thể được xác định
bởi trật tự các cặp tọa độ. Cạnh được định nghĩa từ các node đầu và cuối. Bên
cạnh các node đầu và cuối thì cạnh còn chứa các thông tin như First edge, Left
edge, Rightface, leftface đã dể dàng truy tìm thông tin và lấy các đặt trưng. Mỗi
cạch có một khung bao nhỏ nhất (MBR-Minimum boundary rectangle) chứa nó.
• M : được định nghĩa từ cạnh dùng thể hiện đặc trưng vùng như các quốc gia,

thành phố. Các cạnh co quan hệ topology hình thành nên biên của mặt. Mặt có thể
có biên trong hoặc biên ngoài và có thể chứa mặt nhỏ hơn trong nó. Quan hệ nay
gồm một tham chiếu đến điểm khởi đầu của một biên khép kín của các cạnh, rồi
theo chiều kim đồng hồ để khép kín biên (rings): có thể có một biên ngoài và
không có hoặc có một hoặc nhiều biên trong. Các mặt không được xếp chồng lên
nhau, và các mặt trong một lớp sử dụng toàn bộ vùng mặt phẳng. Mỗi bảng mặt
có một khung chữ nhật bao mặt kết hợp (FBR) chứa hình chữ nhật nhỏ nhất bao
mỗi mặt.
• *Các cấp của topology:
• Có 4 cấp độ topology: 0,1,2,3.
• Ở cấp 3, các kết nói về mặt topology hiện diện một cách tường minh.
• Ở cấp 0, không có thông tin topology được thể hiện một cách tương minh. Bảng
tổng kết sau tổng kết các đặc tính của 3 cấp này và cho một ví dụ về mỗi cấp.
Cấp Tên Các đối tượng
cơ sở
Mô tả Ví dụ
3 Quan hệ
topology đầy
đủ.
Node kết nối,
node thực
thể,cạnh và
măt.
Bề mặt được
phân chia bởi tập
các mặt được
chọn kỹ và phần
chung duy nhất.
Các cạnh chỉ gặp
nhau tại các

node.
2 Đồ thị phẳng Node thực thể,
node kết nối
và cạnh.
Một tập các cạnh
và các node ở đó
khi chiếu vào bề
mặt phẳng, các
cạnh chỉ gặp
nhau tại các
node.
1 Đồ thị không
phẳng
Node thực thể,
node kết nối
và cạnh.
Tập các node
thực thể và các
cạnh có thể gặp
nhau tại các
node.
0 Thể hiện hình
bao
Node thực thể
và cạnh
Tâp các node
thực thể và các
cạnh. Các cạnh
chỉ chứa các tọa
độ, không phải

là node bắt đầu
và node kết thúc.
GN- OCO-)-$O0PM
• Các cột trong các bảng cạnh và bảng node xác định tinh kết nối và tính kề cho
quan hệ topology, tùy thuộc vào cấp độ topology.
• Bảng sau chỉ ra các cột bắt buộc trong mỗi bảng cơ sở cho cấp topology được yêu
cầu. Các đặt tính của các cột này được chỉ định trong các định nghĩa.
Cấp Topology Bảng cơ sở Các cột bắt buộc
3
3
3
3-1
2-1
2-0
0
Mặt
Bảng vòng (Ring table)
Node thực thể
Node kết nối
Cạnh
Node thực thể
Cạnh
RING_PTR
FACE_ID, START_EDGE,
START_NODE,
END_NODE,
RIGHT_FACE,
LEFT_FACE,
RIGHT_EDGE,
LEFT_EDGE,

CONTAINING_FACE
FIRST_EDGE
START_NODE,
END_NODE,
RIGHT_EDGE,
LEFT_EDGE
(Khơng có)
(Khơng có)
GN-Q?%E)6R?>?S-TUVO-)-
0PM
• Dạng hình học và Topology của dữ liệu Vector

• Dạng hình học và Topology của dữ liệu Vector
i. Dạng hình học
- Dạng hình học của điểm được mô tả bằng các tọa độ 2 chiều.
a3
N2
N1
N3
N4
N6
Điểm
(Point)
Đường
(Line)
Chuỗi (String)
Vùng (Area)
Nút (Node)
Chuỗi (chain)
Vùng

(Polygon)
(x,y)
(x
1
,y
1
),
(x
2
,y
2
)
{Chỉ số nút,
(x,y)}

×