Tải bản đầy đủ (.pdf) (23 trang)

Ứng dụng cơ sở dữ liệu đồ thị để xây dựng hệ thống quản lý hạ tầng giao thông tại tỉnh quảng ngãi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (407.73 KB, 23 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
---------------------------------------

NGUYỄN QUỐC HÙNG

ỨNG DỤNG CƠ SỞ DỮ LIỆU ĐỒ THỊ ĐỂ XÂY DỰNG
HỆ THỐNG QUẢN LÝ HẠ TẦNG GIAO THÔNG TẠI
TỈNH QUẢNG NGÃI

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Đà Nẵng – Năm 2019


Công trình được hoàn thành tại
TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học : PGS.TS. Nguyễn Thanh Bình
TS. Lê Văn Minh

Phản biện 1: TS. Đặng Hoài Phương

Phản biện 2: TS. Phạm Văn Trung

Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ Khoa học máy tính họp tại Trường Đại học Bách khoa vào
ngày 02 tháng 06 năm 2019.



* Có thể tìm hiểu luận văn tại:
- Trung tâm Học liệu và Truyền thông Trường Đại học Bách
Khoa, Đại học Đà Nẵng.
- Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách
Khoa – Đại học Đà Nẵng.


Trang 1

MỞ ĐẦU
1. Lý do chọn đề tài
Tại Quảng Ngãi, phòng Quản lý kết cấu hạ tầng giao thông và
phòng Quản lý chất lượng công trình giao thông là hai phòng quản lý
trực tiếp và lưu hồ sơ các công trình hạ tầng giao thông. Hiện tại, tại
đơn vị thực hiện lưu trữ hồ sơ và quản lý trên giấy, trên máy tính và
một số dữ liệu được số hóa sử dụng công nghệ GIS. Tuy nhiên, dữ liệu
chưa được cập nhật thường xuyên cũng như chưa phát huy hiệu quả
trong việc quản lý.
Việc quản lý thông tin về hạ tầng giao thông chưa phát huy được
giá trị xứng đáng hay cung cấp hỗ trợ toàn diện cho việc quản lý, hoạch
định và ra quyết định của cơ quan chức năng. Dẫn đến hạn chế trong
việc phát huy hiệu quả quản lý cũng như dự đoán khả năng phát triển
của hạ tầng giao thông.
Bên cạnh đó, dữ liệu về hạ tầng giao thông là rất lớn và phức
tạp. Dữ liệu này liên tục biến động do công tác xây mới, duy tu, bảo
trì, sửa chữa,…
Hạ tầng giao thông vốn dĩ phức tạp từ cấu trúc lẫn thành phần.
Để quản lý tốt hạ tầng giao thông, chúng ta cần xét đến các loại dữ
liệu cần được lưu trữ. Tuy nhiên, những hướng tiếp cận khác nhau về

dữ liệu sẽ có những giải pháp riêng biệt, từ đây sẽ gây nên sự phức tạp
trong hệ thống. Một cách tổng quát, chúng ta có thể xem xét dữ liệu
theo ba hướng tiếp cận dưới đây.
• Hệ thống thông tin địa lý (GIS).
• Cơ sở dữ liệu quan hệ (Relational Database).


Trang 2
• Cơ sở dữ liệu đồ thị (Graph Database).
Bài toán đặt ra của đề tài là một giải pháp tổ chức dữ liệu hạ
tầng giao thông thành một khối có khả năng lưu trữ hay liên kết các
loại dữ liệu khác nhau cũng như khả năng mở rộng linh hoạt nhằm đáp
ứng khả năng phát triển và thay đổi từ cấu trúc đến loại dữ liệu. Trong
đó, cơ sở dữ liệu đồ thị là hướng tiếp cận mới trong việc lưu trữ dữ
liệu đã mang lại nhiều sản phẩm thành công dù vẫn còn trong giai đoạn
nghiên cứu và phát triển. Mô hình dữ liệu này phù hợp với các bài toán
kết nối dữ liệu, tương ứng với bài toán quản lý thông tin hạ tầng giao
thông. Việc tăng cường thực nghiệm cũng như đưa ra thực nghiệm
mang tính thiết thực là cần thiết.
Vì những lý do như trên, tôi chọn đề tài luận văn: “Ứng dụng
cơ sở dữ liệu đồ thị để xây dựng hệ thống quản lý hạ tầng giao
thông tại tỉnh Quảng Ngãi”.
2. Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu cụ thể là :
• Tìm hiểu về hệ thống thông tin địa lý - GIS:
o Khái niệm hệ thống thông tin địa lý.
o Hoạt động và nhiệm vụ của GIS.
o Dữ liệu và ứng dụng GIS.
• Tìm hiểu về hạ tầng giao thông và công tác quản lý:
o Các thành phần hạ tầng giao thông.

o Công tác quản lý hạ tầng giao thông tại Quảng Ngãi.
• Tìm hiểu về cơ sở dữ liệu đồ thị.
o Khái niệm cơ sở dữ liệu đồ thị.


Trang 3
o Phương pháp quản lý dữ liệu đồ thị.
o Mô hình dữ liệu đồ thị.
o Ứng dụng cơ sở dữ liệu đồ thị.
o Cơ sở dữ liệu đồ thị Neo4J.
• Ứng dụng quản lý thông tin hạ tầng giao thông:
o Phân tích thiết kế hệ thống.
o Xây dựng mô hình.
o Thực nghiệm và đánh giá.
3. Đối tượng và phạm vi nghiên cứu
Cơ sở hạ tầng giao thông đường bộ và công tác quản lý tại tỉnh
Quảng Ngãi.
Hệ thống thông tin địa lý dùng trong quản lý đối tượng địa lý
và bản đồ hạ tầng giao thông đường bộ tại tỉnh Quảng Ngãi.
Cơ sở dữ liệu quan hệ trong quản lý thông tin hạ tầng giao thông
đường bộ.
Ứng dụng cơ sở dữ liệu đồ thị trong việc trừu tượng hóa các
thành phần trong cơ sở hạ tầng giao thông.
Thiết kế cơ sở dữ liệu đồ thị và ứng dụng cơ sở dữ liệu đồ thị
để xây dựng hệ thống quản lý thông tin hạ tầng giao thông.
4. Phương pháp nghiên cứu
Nghiên cứu lý thuyết về hệ thống thông tin địa lý, cơ sở dữ liệu
quan hệ và cơ sở dữ liệu đồ thị.
Tìm hiểu thực tiễn qua việc thu thập thông tin mẫu về hiện trạng
hạ tầng giao thông và công tác quản lý hạ tầng giao thông tại tỉnh

Quảng Ngãi.


Trang 4
Thực nghiệm đánh giá hệ thống quản lý hạ tầng giao thông.
5. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học :
• Đưa ra một thực nghiệm về cơ sở dữ liệu đồ thị. Thu thập
thông tin hiệu suất về cơ sở dữ liệu đồ thị.
• Khảo sát nhằm xây dựng bản đồ thành phần hệ thống giao
thông, trừu tượng hóa mối quan hệ giữa các thành phần
nhằm bổ sung luận cứ cho các nghiên cứu liên quan trong
cùng lĩnh vực.
Ý nghĩa thực tiễn: Xây dựng mô-đun quản lý và khai thác thông
tin hạ tầng giao thông. Quản lý cập nhật thông tin công trình đường
bộ, các nút giao thông, các tuyến đường, cầu cống; quản lý dữ liệu chi
tiết về hạ tầng giao thông; tra cứu, tìm kiếm, kết xuất báo cáo dữ liệu;
6. Bố cục của luận văn
Luận văn được trình bày bao gồm các phần chính như sau:
MỤC LỤC
MỞ ĐẦU
CHƯƠNG 1: QUẢN LÝ HẠ TẦNG GIAO THÔNG
CHƯƠNG 2: HỆ THỐNG THÔNG TIN ĐỊA LÝ GIS
TRONG QUẢN LÝ HẠ TẦNG GIAO THÔNG
CHƯƠNG 3: CƠ SỞ DỮ LIỆU VÀ CƠ SỞ DỮ LIỆU ĐỒ
THỊ


Trang 5
CHƯƠNG 4: ỨNG DỤNG CƠ SỞ DỮ LIỆU ĐỒ THỊ ĐỂ

XÂY DỰNG HỆ THỐNG QUẢN LÝ HẠ TẦNG GIAO THÔNG
TẠI TỈNH QUẢNG NGÃI
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
TÀI LIỆU THAM KHẢO


Trang 6

CHƯƠNG 1.
QUẢN LÝ HẠ TẦNG GIAO THÔNG
1.1. Giới thiệu về hạ tầng giao thông
1.1.1. Khái niệm về hạ tầng giao thông
Hạ tầng giao thông là hệ thống những công trình vật chất kỹ
thuật, các công trình kiến trúc và các phương tiện về tổ chức cơ sở hạ
tầng mang tính nền móng cho sự phát triển của ngành giao thông vận
tải và nền kinh tế. Kết cấu hạ tầng giao thông bao gồm hệ thống cầu,
đường, cảng biển, nhà ga, sân bay, bến bãi và hệ thống trang thiết bị
phụ trợ: thông tin tín hiệu, biển báo, đèn đường...
1.1.2. Đặc điểm hạ tầng giao thông
Đặc trưng của kết cấu hạ tầng là có tính thống nhất và đồng bộ,
giữa các bộ phận có sự gắn kết hài hoà với nhau tạo thành một thể
vững chắc đảm bảo cho phép phát huy được sức mạnh tổng hợp của
cả hệ thống.
Đặc trưng thứ hai là các công trình kết cấu hạ tầng có quy mô
lớn và chủ yếu ở ngoài trời, bố trí rải rác trên phạm vi rộng lớn, chịu
ảnh hưởng nhiều của tự nhiên.
1.1.3. Phân loại hạ tầng giao thông
Phân loại theo tính chất các loại đường: hạ tầng đường bộ, hạ
tầng đường sắt, hạ tầng đường sông, hạ tầng đường biển và hạ tầng
hàng không.

Phân loại theo khu vực: hạ tầng giao thông đô thị, hạ tầng giao
thông nông thôn.


Trang 7
1.2. Quản lý hạ tầng giao thông
1.2.1. Khái niệm
Quản lý hạ tầng giao thông là quá trình sử dụng công cụ và
phương pháp quản lý để thực hiện các nội dung: hoạch định, tổ chức,
chỉ đạo, thanh tra, kiểm tra các quan hệ kinh tế - xã hội trong hoạt động
sử dụng hạ tầng giao thông để đạt được các mục tiêu đã định nhằm
hướng ý chí và hành động của các chủ thể quản lý vào mục tiêu chung,
kết hợp hài hòa lợi ích cá nhân, lợi ích tập thể và lợi ích Nhà nước.
1.2.2. Mục tiêu quản lý
Mục tiêu kinh tế: Đảm bảo hiệu quả sử dụng vốn của các dự án
phát triển, duy tu, bảo dưỡng hạ tầng giao thông.
Mục tiêu xã hội: Đảm bảo công bằng, công khai, minh bạch
trong công tác quản lý quy hoạch hạ tầng giao thông và hiệu quả công
tác quản lý trên địa bàn.
1.3. Hiện trạng quản lý hạ tầng giao thông tại Quảng Ngãi
Các phần mềm đang sử dụng cho mục đích quản lý thông tin hạ
tầng giao thông tại Sở Giao thông Quảng Ngãi:
• Phần mềm Microsoft Word
• Phần mềm Microsoft Excel
• Phần mềm AutoCAD
• Phần mềm ArcGis
• Phần mềm PDF Reader
• Phần mềm VBMS
• Phần mềm quản lý tài sản (DRVN)
• Phần mềm Văn phòng điện tử (eOffice)



Trang 8
1.4. Khó khăn và thách thức
Những khó khăn trong hiện trạng quản lý:
• Tính bất đồng bộ.
• Tính phân tán.
• Thao tác bán tự động.
• Không có khả năng mở rộng.
1.5. Bài toán cần giải quyết
Mục tiêu của việc thống nhất dữ liệu là phát triển một hệ thống
quản lý dễ dàng, có khả năng kết nối đến cơ sở dữ liệu từ các cơ quan
liên quan cũng như chia sẻ dữ liệu đến các sở ban ngành liên quan.
Nghiên cứu này đề xuất giải pháp sử dụng cơ sở dữ liệu đồ thị
để làm cơ sở dữ liệu tổng quát. Trong đó, đầu vào là tất cả các loại dữ
liệu có thể có, đầu ra là kết quả của một câu truy vấn.
1.6. Kết luận
Bản chất hệ thống quản lý thông tin hạ tầng giao thông cần làm
việc với nhiều loại dữ liệu khác nhau. Cần thiết có một hệ thống có
khả năng kết nối giữa các loại dữ liệu rời rạc và khác biệt trong quản
lý thông tin hạ tầng giao thông.


Trang 9

CHƯƠNG 2.
HỆ THỐNG THÔNG TIN ĐỊA LÝ GIS TRONG QUẢN
LÝ HẠ TẦNG GIAO THÔNG
2.1. Giới thiệu GIS
GIS không chỉ là phần mềm. Con người và những phương pháp

được kết hợp với phần mềm không gian địa lý và những công cụ để
cho phép phân tích không gian, quản lý các bộ dữ liệu lớn và hiển thị
thông tin dưới dạng bản đồ/đồ họa.
2.2. Các thành phần của GIS
GIS được kết hợp bởi 5 thành phần chính: Phần cứng
(Hardware), Phần mềm (Software), Dữ liệu (Data), Con người
(People), Phương pháp (Method).
2.3. Hoạt động của GIS
• Lập bản đồ ở mọi nơi
• Lập bản đồ số lượng
• Lập bản đồ mật độ
• Tìm kiếm bên trong
• Tìm kiếm những gì đang ở gần
• Lập bản đồ thay đổi
2.4. Nhiệm vụ của GIS
Năm nhiệm vụ chính của GIS: Nhập dữ liệu, Thao tác dữ liệu,
Quản lý dữ liệu, Hỏi đáp và phân tích, Hiển thị.


Trang 10
2.5. Dữ liệu GIS
Có hai kiểu dữ liệu cơ bản là raster và vector. Dữ liệu rời rạc
dạng vector được biểu diễn dưới bằng các điểm (points), các đường
(lines) hoặc các đa giác (polypons). Dữ liệu liên tục raster được xem
như là một chuỗi các ô lưới nơi mà mỗi ô là một giá trị biểu diễn tính
năng đang được quan sát.
2.6. Ứng dụng GIS
Các ứng dụng của GIS trong nhiều lĩnh vực: Môi trường, Khí
tượng thuỷ văn, Nông nghiệp và quản lý đất đai, Dịch vụ tài chính, Y
tế. Chính quyền địa phương, thị trường bán lẻ, Giao thông, các dịch

vụ điện, nước, gas, điện thoại…
2.7. Kết luận
GIS có khả năng đáp ứng tốt các nhu cầu về thông tin địa lý
cũng như các mô hình địa lý, nhưng lại không có khả năng làm việc
với các loại dữ khác ngoài GIS, cũng như khả năng tích hợp hay liên
kết các cơ sở dữ liệu khác.


Trang 11

CHƯƠNG 3.
CƠ SỞ DỮ LIỆU VÀ CƠ SỞ DỮ LIỆU ĐỒ THỊ
3.1. Giới thiệu cơ sở dữ liệu
Hệ thống quản lý cơ sở dữ liệu (Database Managemet System DBMS) là phần mềm tương tác với người dùng cuối, ứng dụng và
chính cơ sở dữ liệu để thu thập và phân tích dữ liệu. DBMS và các ứng
dụng liên quan có thể được gọi là “hệ thống cơ sở dữ liệu”. Thông
thường thuật ngữ “cơ sở dữ liệu” cũng được sử dụng để nói đến
DBMS, hệ thống cơ sở dữ liệu hoặc ứng dụng nào được liên kết với
cơ sở dữ liệu.
3.2. Các phương pháp quản lý dữ liệu
• Phân loại theo loại dữ liệu.
• Phân loại theo hình thức lưu trữ, mô hình tổ chức.
• Phân loại theo đặc tính sử dụng.
• Phân loại theo mô hình triển khai.
3.3. Cơ sở dữ liệu quan hệ
3.3.1. Khái niệm
Cơ sở dữ liệu quan hệ là một tập hợp các bảng mà dữ liệu có
thể được truy cập từ đó hoặc được tái tạo lại trong vô số cách mà không
phải sắp xếp lại các bảng dữ liệu.
3.3.2. Lược đồ quan hệ và chuẩn hóa

Lược đồ quan hệ là tập hợp tất cả các thuộc tính cần quản lý của
một đối tượng với mối liên hệ giữa chúng kèm theo một mô tả để xác


Trang 12
định ý nghĩa, nhằm mô tả cấu trúc của quan hệ, các mối liên hệ giữa
các thuộc tính trong quan hệ đó.
Các dạng chuẩn hóa mô hình cơ sở dữ liệu quan hệ: NF1, NF2,
NF3, BCNF.
3.3.3. Mô hình cơ sở dữ liệu quan hệ
Mô hình quan hệ là cách thức biểu diễn dữ liệu dưới dạng các
quan hệ (các bảng). Một quan hệ là một bảng dữ liệu 2 chiều (cột và
dòng), mô tả một thực thể. Mỗi cột tương ứng với một thuộc tính của
thực thể. Mỗi dòng chứa các giá trị dữ liệu của một đối tượng cụ thể
thuộc thực thể.
3.3.4. Kết luận
Hướng tiếp cận cở sở dữ liệu quan hệ rất tốt cho việc tổ chức
dữ liệu doanh nghiệp và hoàn toàn phù hợp với việc quản lý thông tin
về hồ sơ và về chi tiết toàn bộ quá trình xử lý sửa chữa các đối tượng
giao thông. Tuy nhiên, hướng tiếp cận này sẽ gặp vấn đề khi hệ thống
trở nên phức tạp, đặc biệt là việc xây dựng thêm các tuyến đường mới,
các cây cầu mới kèm với các chi tiết hồ sơ, xây dựng và kiểm định
kèm theo. Trong trường hợp này, sự gò bó trong các bản ghi sẽ tạo
thành rào cản cho sự linh hoạt thích nghi của hệ thống.
3.4. Cơ sở dữ liệu hướng đối tượng
3.4.1. Khái niệm
Cơ sở dữ liệu hướng đối tượng là hướng tiếp cận nắm bắt ngữ
nghĩa của các đối tượng được hỗ trợ trong lập trình hướng đối tượng.



Trang 13
3.4.2. Đối tượng và cơ sở dữ liệu đối tượng
Hệ quản trị cơ sở dữ liệu đối tượng là một hệ thống sử dụng đối
tượng làm đơn vị cơ bản để mô hình hóa và truy xuất. Đặc điểm chung
của các mô hình đối tượng là: định danh đối tượng, các đối tượng phức
hợp, sự phân cấp kiểu.
3.4.3. Kiểu dữ liệu
Đặc trưng mô tả kiểu đối tượng:
• Thành phần kết hợp: đặc trưng tiêu biểu cho phép tham
chiếu đến đối tượng.
• Lớp: nhóm các đối tượng cùng kiểu.
• Tập: nhóm các đối tượng.
3.4.4. Quản lý đối tượng
Hệ quản trị cơ sở dữ liệu hướng đối tượng quản lý đối tượng
bằng cách quản lý định danh đối tượng.
3.4.5. Kết luận
Cơ sở dữ liệu hướng đối tượng là một hướng tiếp cận mới trong
phát triển ứng dụng quản lý thông tin, tuy vậy, với ngữ cảnh đa dạng
đối tượng cần ánh xạ vào hệ thống, việc sử dụng cơ sở dữ liệu hướng
đối tượng gây ra khó khăn và cần chi phí phát triển lớn cho việc mô
hình hóa tất cả các dạng dữ liệu.


Trang 14
3.5. Cơ sở dữ liệu NoSQL
3.5.1. Giới thiệu
NoSQL có nghĩa là “Không Chỉ SQL (Not Only SQL)”, ngụ ý
rằng khi thiết kế một giải pháp phần mềm hoặc sản phẩm, có nhiều
hơn một cơ chế lưu trữ có thể được sử dụng dựa trên các nhu cầu.
3.5.2. Kỹ thuật và mô hình

Các tính chất đặc trưng: tính nhất quán, tính khả dụng và tính
phân vùng.
3.5.3. Lưu trữ Khóa-Giá trị (Key-/Value-Store)
Lưu trữ khóa-giá trị là mô hình dữ liệu đơn giản: bản đồ/từ điển,
cho phép yêu cầu đặt và truy xuất giá trị cho mỗi khóa. Mô hình khóagiá trị ưu tiên khả năng mở rộng hơn là tính nhất quán, và do đó, hầu
hết chúng bỏ qua các tính năng phân tích và truy vấn đặc biệt.
3.5.4. Cơ sở dữ liệu tài liệu (Document Store)
Cơ sở dữ liệu tài liệu được nhiều người xem là bước phát triển
của loại lưu trữ khóa-giá trị từ đơn giản đến phức tạp và ý nghĩa hơn
vì cho phép đóng gói các cặp khóa-giá trị vào tài liệu.
3.5.5. Kết luận
Với tính chất đặc trưng của cơ sở dữ liệu NoSQL, sức mạnh
cũng như sự giới hạn được thể hiện rõ trong hướng tiếp cận. Việc ứng
dụng loại cơ sở dữ liệu NoSQL vào ứng dụng cần xem xét đến các yếu
tố hiệu năng, tính khả thi cũng như tính tương thích và mở rộng.


Trang 15
3.6. Cơ sở dữ liệu đồ thị
3.6.1. Lý thuyết đồ thị
Đồ thị là khái niệm toán học cơ bản. Thành phần của đồ thị bao
gồm: đỉnh, cạnh và trọng số. Đồ thị có thể là có hướng hoặc vô hướng.
3.6.2. Định nghĩa cơ sở dữ liệu đồ thị
Dữ liệu đồ thị được lưu trữ theo khái niệm đồ thị sử dụng các
cấu trúc đồ thị với các nút, các cạnh và các thuộc tính để biểu diễn:


Đỉnh của đồ thị là một đơn vị dữ liệu.




Cạnh của đồ thị là liên kết giữa hai đơn vị dữ liệu.



Trọng số của đồ thị chính là độ quan trọng của liên kết
dữ liệu giữa hai đỉnh.

3.6.3. Mô hình dữ liệu đồ thị
Dữ liệu đồ thị sử dụng các hình khối và các mũi tên để đưa dữ
liệu vào và thể hiện mối quan hệ giữa chúng. Cơ sở dữ liệu đồ thị giảm
sự sai lệch giữa phân tích và thực thi. Mỗi thực thể (đối tượng) đều có
những đặc điểm riêng, có thể đưa hoàn toàn các đặc điểm đó thành các
nút, nhưng như vậy sẽ rất phức tạp, nhất là khi số lượng thực thể tăng
lên và các nút đó lại chỉ nối với một thực thể.
3.6.4. Kết luận
Hướng tiếp cận cơ sở dữ liệu đồ thị này đủ mềm dẻo để thích
nghi (hoặc được áp dụng) cho các bài toán quản lý khác, chẳng hạn
như: quản lý vận tải, quản lý hành chính tổng thể...


Trang 16

CHƯƠNG 4.
ỨNG DỤNG CƠ SỞ DỮ LIỆU ĐỒ THỊ ĐỂ XÂY DỰNG
HỆ THỐNG QUẢN LÝ HẠ TẦNG GIAO THÔNG TẠI
TỈNH QUẢNG NGÃI
4.1. Mô tả bài toán
Như đã biết, hệ thống quản lý hạ tầng giao thông là vô cùng
phức tạp. Phức tạp về số lượng và phức tạp về chủng loại. Ngoài ra,

theo thời gian, sẽ có những loại dữ liệu mới cần được quản lý. Mỗi
loại dữ liệu khác nhau thì có bản chất khác nhau. Từ đó việc xây dựng,
bảo trì và phát triển hệ thống quản lý giao thông sẽ vô cùng khó khăn.
Điều này đặt ra một yêu cầu là một hệ thống dữ liệu thống nhất.
4.2. Hướng tiếp cận cơ sở dữ liệu đồ thị
Đồ thị là kiến trúc có thể bổ sung linh hoạt, nghĩa là chúng ta có
thể thêm các loại quan hệ mới, các nút mới, nhãn mới, hay đồ thị con
vào cấu trúc hiện tại mà không ảnh hưởng đến truy vấn hay chức năng
hiện tại của ứng dụng.
Là kiến trúc mang đặc tính “đỉnh chứa dữ liệu, cạnh chứa liên
kết”. Kiến trúc dữ liệu đồ thị có khả năng đáp ứng việc phát triển mô
hình dữ liệu thích hợp theo sự phát triển nhu cầu quản lý. Với bản chất
phi lược đồ kết hợp tính chất khả kiểm và ngôn ngữ truy vấn, hệ thống
có khả năng thích ứng trong tương lai.
Đồ thị là khái niệm toán học cơ bản, cơ sở dữ liệu đồ thị sử dụng
khái niệm toán học này, nghĩa là các thao tác trên cơ sở dữ liệu đồ thị
thực chất là các phép toán trên đồ thị.


Trang 17
4.3. Trừu tượng hóa dữ liệu
4.3.1. Thu thập dữ liệu
Các tài liệu hồ sơ quản lý sẽ được chia thành mục nhỏ dựa trên
danh mục hồ sơ phục vụ, quản lý, vận hành và bảo trì công trình. Nhằm
mục đích tổng quan hóa dữ liệu cần quản lý, tiếp đến phục vụ cho việc
trừu tượng hóa và xây dựng mô hình quản lý thông tin.
4.3.2. Phân tích dữ liệu
Phần này trình bày về bản chất các loại dữ liệu. Những dữ liệu
trình bày trong phần này bao gồm dữ liệu GIS, dữ liệu quan hệ và dữ
liệu đa phương tiện (hình ảnh, âm thanh, video)

4.3.3. Trừu tượng hóa dữ liệu
Mô tả lại (hoặc định nghĩa) lại các dạng dữ liệu khác nhau thành
một dạng dữ liệu chung thì chúng ta phải sử dụng bản chất chung của
các loại dữ liệu đó. Ở đây, cách làm đầu tiên mà chúng ta có thể nghĩ
đến đó là biến dạng dữ liệu cụ thể khác nhau thành dạng dữ liệu trừu
tượng nhưng giống nhau.
4.4. Thiết kế cơ sở dữ liệu
Cơ sở dữ liệu đồ thị được cấu thành từ nhiều nút độc lập. Các
nút trong cơ sở dữ liệu đồ thị khá tương đồng với các bản ghi trong cơ
sở dữ liệu quan hệ truyền thống. Mỗi nút đều có những thuộc tính riêng
nhưng không bị ràng buộc về tính đồng nhất, chúng ta có thể có các
nút thuộc chung một nhãn nhưng những thuộc tính và thông tin của
chúng có thể hoàn toàn khác nhau. Việc đó dẫn đến sự linh hoạt của
dữ liệu, không bị gò bó như các bản ghi trong cơ sở dữ liệu quan hệ.


Trang 18
Phù hợp cho các loại dữ liệu phức tạp và cần nhiều chỉnh sửa trong
quá trình sử dụng.
4.5. Cơ sở dữ liệu đồ thị Neo4J
4.5.1. Giới thiệu
Neo4J là một dự án mã nguồn mở được hỗ trợ bởi Neo
Technology. Neo4j là hệ quản trị cơ sở dữ liệu đồ thị đầu tiên được
giới thiệu vào năm 2007 và công bố phiên bản 1.0 vào năm 2010. Hiện
nay Neo4j là một trong những hệ quản trị cơ sở dữ liệu đồ thị được sử
dụng nhiều nhất với cộng đồng nhà phát triển.
4.5.2. Trình duyệt (Browser)
Trình duyệt được tích hợp trong Neo4J cung cấp cho bạn khả
năng truy vấn cơ sở dữ liệu bằng ngôn ngữ truy vấn Cypher với giao
diện trực quan trong việc quản lý và làm việc với cơ sở dữ liệu đồ thị

Neo4J, và có thể xem kết quả trực tiếp bằng đồ thị hoặc kết quả dạng
danh sách.
4.5.3. Ngôn ngữ truy vấn Cypher
Cypher là ngôn ngữ truy vấn được dùng trong Neo4J, có đặc
điểm dễ đọc và dễ hiểu đối với cả các nhà phát triển, các chuyên gia
cơ sở dữ liệu… Cypher cho phép người dùng tìm kiếm thông tin trên
cơ sở dữ liệu theo một mô hình cụ thể nào đó.
4.6. Trực quan hóa dữ liệu
4.7. Nhập dữ liệu
Một số cú pháp lệnh được sử dụng để nhập dữ liệu sẽ được trình
bày nhằm trực quan hóa thao tác nhập liệu trên trình duyệt Neo4J.


Trang 19
4.8. Truy vấn
Một số ví dụ về việc sử dụng truy vấn nhằm tìm kiếm và tra cứu
thông tin trên hệ thống.
4.9. Đánh giá tốc độ truy vấn
Trước hết, chúng tôi thực hiện việc đánh giá trên một máy tính
lưu trữ cơ sở dữ liệu. Máy tính này có bộ CPU core i3 2,2Ghz, bộ nhớ
6GB RAM, ổ cứng SSD 120GB. Thực hiện việc truy vấn tất cả các
node trong cơ sở dữ liệu.
Trường hợp này chúng tôi bắt đầu đo tốc độ đối với dữ liệu bản
đồ tạm nhập của thành phố Quảng Ngãi. Dữ liệu này gồm 300 nút đại
diện cho dữ liệu địa lý thể hiện các điểm giao nhau của các tuyến
đường. Với mỗi nút, chúng tôi giả lập thêm 500 nút đại diện cho dữ
liệu quan hệ gắn với dữ liệu địa lý.
Mỗi trường hợp thực nghiệm tiếp theo, chúng tôi nhân số lượng
dữ liệu của các nút dữ liệu này lên 2 lần, 3 lần, … 10 lần. Với mỗi
trường hợp, chúng tôi thực hiện truy vấn 20 lần và lấy kết quả trung

bình. Hình trên mô tả thời gian truy vấn đối với đối với từng trương
hợp thực nghiệm.
Kết quả cho thấy rằng, chúng ta nhân bộ dữ liệu lên 8 lần thì tốc
độ truy vấn vẫn dưới 2 giây. Nghĩa là nếu thành phố được mở rộng
gấp gấp 8 lần hoặc số lượng công trình tăng lên gấp 8 lần thì thời gian
truy vấn vẫn dưới 2 giây. Đây là điều chấp nhận được. Tuy nhiên, nếu
chúng ta nhân dữ liệu lên gấp 10 lần thì thời gian truy vấn sẽ nhiều
hơn 12 giây. Điều này dẫn đến định hướng là phải nghiên cứu song
song hoá dữ liệu để có thể truy vấn kịp thời.


Trang 20

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Luận văn trình bày ý tưởng về sử dụng Cơ sở dữ liệu đồ thị và
hiện thực hóa giải pháp quản lý thông tin hạ tầng giao thông đô thị.
Đặc trưng bởi hiệu quả cao, thời gian phản hồi ngắn, khả năng
mở rộng và khả năng đáp ứng lượng dữ liệu phức tạp lớn.
Do đó, việc sử dụng Cơ sở dữ liệu đồ thị trong hệ thống quản lý
thông tin hạ tầng như đã đề cập ở trên có thể cải thiện chất lượng thông
tin quản lý, rút ngắn thời gian phải hồi và mở rộng chức năng nhất
định.
Trên mẫu thử về thông tin hạ tầng giao thông, phương pháp
chuyển đổi từ mô hình quan hệ cổ điển sang mô hình đồ thị đã được
chứng minh.
Các quy tắc cơ bản đã được thiết kế cho các thực thể và các mối
quan hệ của chúng biến thành các đối tượng và quan hệ của cơ sở dữ
liệu đồ thị.
Mô hình cơ sở dữ liệu đồ thị chung đã được phát triển và trên
cơ sở đó, lược đồ chi tiết về cơ sở dữ liệu đồ thị của hệ thống thông

tin đã được đề xuất.
Sử dụng ngôn ngữ truy vấn Cypher của cơ sở dữ liệu đồ thị, các
lệnh cơ bản đã được đưa ra để tìm kiếm thông tin về các điểm, đường.
Ý tưởng của hệ thống được trình bày trong báo cáo luận văn có
các tính năng sáng tạo như:
Công nghệ hiện đại được áp dụng dưới dạng cơ sở dữ liệu đồ
thị giải quyết các vấn đề truyền thống thuộc về cơ sở dữ liệu quan hệ.
Cấu trúc linh hoạt được sử dụng có thể dễ dàng thích ứng với
các yêu cầu quản lý phát sinh trong thực tế.


Trang 21
Mô hình hệ thống được đề xuất trong bài báo đã được thử
nghiệm bằng cách sử dụng dữ liệu dữ liệu tình hình thực tế tương ứng.
Tất cả các truy vấn đã được kiểm tra về tính chính xác của dữ
liệu trả về.
Trong một số trường hợp, nó đã chỉ ra rằng các khả năng của
ngôn ngữ truy vấn được sử dụng trong công việc của hệ thống cơ sở
dữ liệu là không đủ để thực hiện tất cả các chức năng được yêu cầu.
Giải pháp được đề xuất bởi tác giả là sử dụng các thư viện truy
cập trực tiếp vào các đối tượng cơ sở dữ liệu bằng ngôn ngữ lập trình
cấp cao, ví dụ: Java.
Tính toán độ phức tạp và thời gian thực hiện thuật toán trung
bình cũng phải được xác minh thực tế cùng với việc so sánh các kết
quả thu được cho cơ sở dữ liệu quan hệ và đồ thị.



×