BỘ GIÁO DỤC VÀ ðÀO TẠO
TRƯỜNG ðẠI HỌC CẦN THƠ
LÊ VĂN TỐN
T Ố I Ư U H Ĩ A T RU Y VẤ N
T R O NG H Ệ C Ơ S Ở D Ữ L I Ệ U P H Â N T Á N
QUẢN LÝ DÂN CƯ MỘT TỈNH
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Cần Thơ – 2010
BỘ GIÁO DỤC VÀ ðÀO TẠO
TRƯỜNG ðẠI HỌC CẦN THƠ
LÊ VĂN TỐN
T Ố I Ư U H Ĩ A T RU Y VẤ N
T R O NG H Ệ C Ơ S Ở D Ữ L I Ệ U P H Â N T Á N
QUẢN LÝ DÂN CƯ MỘT TỈNH
Chuyên ngành: HỆ THỐNG THÔNG TIN
Mã số: 60 48 05
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Người hướng dẫn khoa học
TS. PHẠM THỊ XUÂN LỘC
Cần Thơ - 2010
LỜI CAM ðOAN
Tơi xin cam đoan luận văn này được hồn thành trên kết quả nghiên cứu của tơi.
Các cơng việc nghiên cứu và nội dung thực hiện trong luận văn chưa từng ñược nộp
ñể lấy bằng cấp từ một trường nào; ngoại trừ lý thuyết và các kết quả từ các cơng
trình khác được ghi rõ trong phần tài liệu tham khảo của luận văn.
Cần Thơ, ngày 06 tháng 10 năm 2010
Ký tên,
Lê Văn Toán
Trang i
LỜI CẢM ƠN
ðề đài “Tối ưu hóa truy vấn trong hệ cơ sở dữ liệu phân tán Quản lý dân cư
một tỉnh” đến nay đã được hồn thành sau một thời gian nghiên cứu và thực hiện.
ðể ñạt ñược kết quả như hôm nay, tôi xin chân thành cảm ơn:
Ts. Phạm Thị Xuân Lộc, Giảng viên Khoa Công Nghệ Thông Tin và Truyền
Thơng đã tận tình hướng dẫn tơi trong suốt thời gian thực hiện luận văn này. Cơ đã
cung cấp cho tơi khơng những tài liệu, kiến thức, đọc góp ý, chỉnh sửa báo cáo mà
cịn truyền kinh nghiệm q báu, cho lời khun và động viên tơi trong suốt q
trình thực hiện luận văn.
Xin chân thành nói lời cảm ơn đến các Thầy cơ trường ðại Học Cần Thơ đã cung
cấp cho tơi nhiều kiến thức q báu trong những năm qua. Cũng như Ban Chủ
Nhiệm Khoa Kỹ Thuật – Công Nghệ - Môi Trường, Trường ðại Học An Giang ñã
tạo mọi ñiều kiện về kiến thức, tài liệu, thời gian và kinh phí cho tơi trong suốt hai
năm học.
Và cuối cùng, xin cám ơn cha, mẹ, các anh em trong gia đình đã hỗ trợ, lo lắng
và ñộng viên. ðồng thời xin chân thành cảm ơn các anh, chị trong lớp Cao học K15
ñã ñộng viên, giúp ñỡ trong quá trình thực hiện luận văn.
Học viên Lê Văn Tốn, MSHV 250817
Lớp Cao học Hệ thống thơng tin K15
Trang ii
MỤC LỤC
LỜI CAM ðOAN .................................................................................................... i
LỜI CẢM ƠN ........................................................................................................ ii
MỤC LỤC............................................................................................................. iii
DANH MỤC HÌNH................................................................................................vi
DANH MỤC TỪ VIẾT TẮT............................................................................... viii
TĨM TẮT ..............................................................................................................ix
ABSTRACT ............................................................................................................x
CHƯƠNG 1: GIỚI THIỆU ...................................................................................1
1.1 Mở ñầu .........................................................................................................1
1.1.1 ðặt vấn đề ............................................................................................1
1.1.2 Hướng giải quyết..................................................................................2
1.1.3 Mục đích nghiên cứu của ñề tài ............................................................3
1.1.4 ðối tượng và phạm vi nghiên cứu.........................................................4
1.1.5 Ý nghĩa thực tiễn của ñề tài ..................................................................4
1.2 Các vấn đề liên quan ....................................................................................5
1.2.1 Trong nước ..........................................................................................5
1.2.2 Ngồi nước...........................................................................................6
1.3 Các nội dung chính .......................................................................................6
CHƯƠNG 2: TỔNG QUAN HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN....7
2.1 Các khái niệm cơ bản về hệ cơ sở dữ liệu phân tán .......................................7
2.1.1 ðịnh nghĩa cơ sở dữ liệu phân tán ........................................................7
2.1.2 Phân loại cơ sở dữ liệu phân tán ...........................................................8
2.1.2.1 Cơ sở dữ liệu phân tán thuần nhất ................................................8
2.1.2.2 Cơ sở dữ liệu phân tán không thuần nhất......................................8
2.1.3 Các mức trong suốt trong CSDLPT .....................................................9
2.2 Các khái niệm cơ bản về hệ quản trị cơ sở dữ liệu phân tán ........................10
2.2.1 Khái niệm...........................................................................................10
2.2.2 Tập các phần mềm trong hệ quản trị CSDLPT ...................................10
2.2.3 Các phương thức truy cập dữ liệu từ xa ..............................................11
2.3 Các hệ quản trị cơ sở dữ liệu phân tán thường gặp......................................14
2.3.1 Hệ quản trị cơ sở dữ liệu phân tán kiểu Client/Server .........................14
2.3.2 Hệ quản trị cơ sở dữ liệu phân tán ngang hàng ...................................15
2.4 Thiết kế các hệ cơ sở dữ liệu phân tán ........................................................16
Trang iii
2.4.1 Các chiến lược thiết kế .......................................................................16
2.4.1.1 Thiết kế phân tán dữ liệu theo mơ hình từ trên xuống.................16
2.4.1.2 Thiết kế phân tán dữ liệu theo mơ hình từ dưới lên.....................17
2.4.2 Các qui tắc phân mảnh .......................................................................17
2.4.3 Các yêu cầu thông tin .........................................................................18
2.4.4 Các kiểu nhân bản ..............................................................................18
2.4.5 Các kiểu phân mảnh ...........................................................................19
2.4.5.1 Phân mảnh theo chiều ngang......................................................19
2.4.5.2 Phân mảnh theo chiều dọc..........................................................22
2.4.5.3 Phân mảnh hỗn hợp....................................................................23
CHƯƠNG 3: TỐI ƯU HỐ CÂU TRUY VẤN PHÂN TÁN ............................25
3.1 Q trình tối ưu hố truy vấn ......................................................................25
3.2 Khơng gian tìm kiếm ..................................................................................26
3.3. Chiến lược tìm kiếm ..................................................................................27
3.4 Mơ hình chi phí phân tán ............................................................................29
3.4.1 Hàm chi phí........................................................................................29
3.4.1.1 Cơng thức tính tổng chi phí ........................................................29
3.4.1.2 Cơng thức tính thời gian đáp ứng ...............................................30
3.4.2 Số liệu thống kê cơ sở dữ liệu.............................................................31
3.4.3 Lực lượng của kết quả trung gian .......................................................33
3.5 Xếp thứ tự nối và nối nửa trong câu truy vấn. ............................................38
3.5.1 Xếp thứ tự dựa trên phép nối ..............................................................38
3.5.2 Xếp thứ tự dựa trên nối nửa................................................................42
3.5.3 So sánh nối và nối nửa........................................................................45
3.6 Giải thuật tối ưu hoá truy vấn phân tán SDD-1 ...........................................46
3.6.1 Ý tưởng giải thuật leo ñồi...................................................................47
3.6.2 Giải thuật SDD-1................................................................................49
3.6.2.1 Lý thuyết giải thuật ....................................................................49
3.6.2.2 Giải thuật SDD-1 .......................................................................50
3.6.2.3 Minh hoạ giải thuật qua thí dụ 3.6 ..............................................51
3.7 Giải quyết những câu truy vấn phức tạp .....................................................57
3.7.1 ðặt vấn ñề ..........................................................................................57
3.7.2 Hướng giải quyết................................................................................58
Trang iv
CHƯƠNG 4: THIẾT KẾ VÀ CÀI ðẶT ðẶT CƠ SỞ DỮ LIỆU VÀ MƠ HÌNH
TỐI ƯU HỐ TRUY VẤN CHO HỆ PHÂN TÁN QUẢN LÝ DÂN CƯ TỈNH
AN GIANG...........................................................................................................60
4.1 Các cơng việc cho giai đoạn chuẩn bị cài đặt thực nghiệm ........................60
4.1.1 Mơi trường cài đặt..............................................................................60
4.1.2 Các cấu hình cần thiết cho hệ thống....................................................61
4.1.3 Linked Servers ..................................................................................62
4.1.4 Trong suốt phân mảnh ........................................................................64
4.1.5 Trong suốt nhân bản ...........................................................................66
4.2 Thiết kế và cài ñặt CSDL phân tán cho quản lý dân cư tỉnh An Giang ........68
4.2.1 Giới thiệu chung.................................................................................68
4.2.2 Một số nghiệp vụ quản lý dân cư........................................................69
4.2.2.1 Các nghiệp vụ cơ bản .................................................................69
4.2.2.2 Mơ tả các nghiệp vụ cơ bản........................................................69
4.2.2.3 Quy trình, phương pháp, thời gian thu nhập thông tin và lập phiếu
báo.........................................................................................................71
4.2.3 Thiết kế và cài ñặt chi tiết cơ sở dữ liệu trên từng site ........................72
4.2.3.1 Tại site trung tâm (lvtoanhp) ......................................................74
4.2.3.2 Tại site xã Vĩnh Hưng (lvtoan1) .................................................77
4.2.3.3 Tại site xã Mỹ Hội ðơng (lvtoan2).............................................79
4.3 Cài đặt tối ưu hố truy vấn phân tán qua chi phí truyền thơng.....................81
4.3.1 Các hàm hỗ trợ ...................................................................................81
4.3.1.1 Các hàm hệ thống.......................................................................81
4.3.1.2 Các hàm tạo quan hệ từ xa .........................................................84
4.3.2 Giải thuật SDD-1................................................................................84
4.3.3 Mơ hình chi phí cho phép tốn hai ngơi..............................................89
4.3.3.1 Xét câu truy vấn .........................................................................89
4.3.3.2 Xét câu truy vấn .........................................................................93
4.3.3.3 Nhận xét chung cho phép nối và nối nửa....................................98
4.3.4 Mơ hình chi phí cho phép tốn một ngơi .......................................99
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ..................................102
5.1 Kết quả ñạt ñược.......................................................................................101
5.2 Hướng phát triển.......................................................................................102
PHỤ LỤC ...........................................................................................................103
TÀI LIỆU THAM KHẢO .................................................................................122
Trang v
DANH MỤC HÌNH
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
Tên chú thích
Hình 2.1: Mơ hình CSDL phân tán
Hình 2.2: Thiết kế CSDLPT thuần nhất
Hình 2.3: Thiết kế CSDLPT khơng thuần nhất
Hình 2.4.a: Trong suốt phân mảnh
Hình 2.4.b: Trong suốt vị trí
Hình 2.4.c: Trong suốt ánh xạ cục bộ
Hình 2.5: Mơ hình các thành phần của HQTCSDLPT
Hình 2.6: Phương thức truy cập từ xa trực tiếp
Hình 2.7: Phương thức truy cập từ xa gián tiếp
Hình 2.8: Phương thức truy cập từ xa trực tiếp của hệ thống
Hình 2.9: HQT CSDL PT kiểu Client/Server
Hình 2.10: HQT CSDL PT kiểu ngang hàng
Hình 2.11: Quá trình thiết kế từ trên xuống
Hình 2.12: Nhân bản một bản chính và nhiều bản phụ
Hình 3.1 Quá trình xử lý truy vấn tối ưu
Hình 3.2: Các cây tốn tử (cây nối) tương đương
Hình 3.3: Cây tuyến tính và cây xum xê
Hình 3.4: Tính chất đơn ñịnh trong chiến lược quy hoạch ñộng
Hình 3.5: Chiến lược ngẫu nhiên hố
Hình 3.6: Ví dụ truyền dữ liệu trong một câu truy vấn
Hình 3.7: Sự truyền các tốn hạng trong phép tốn hai ngơi
Hình 3.8: ðồ thị kết nối của truy vấn phân tán có 2 qua hệ
Hình 3.9: ðồ thị kết nối của truy vấn phân tán
Hình 3.10: Sự biến đổi của truy vấn vịng
Hình 3.11: So sánh việc tiếp cận giữa phép nối và nối nữa
Hình 3.12: ðồ thị của câu truy vấn
Hình 3.13: Cây đại số quan hệ cho hướng giải quyết cách 1
Hình 3.14: Cây ñại số quan hệ cho hướng giải quyết cách 2
Hình 4.1: Mơ hình truy cập dữ liệu của Linked Servers
Hình 4.2: Mã lệnh và kết quả khi thực thi lệnh sp_addlinkedserver
Hình 4.3: Trong suốt phân mảnh
Hình 4.4: ðặt điều kiện chọn phân mảnh ngang
Hình 4.5: Nơi đặt điều kiện chọn phân mảnh
Hình 4.6: Mơ hình nhân bản giáo tác
Hình 4.7: Mơ hình thực thể liên kết
Hình 4.8: Mơ hình dữ liệu vật lý cho site trung tâm (lvtoanhp)
Hình 4.9: Mơ hình dữ liệu vật lý cho site xã Vĩnh Hưng (lvtoan1)
Hình 4.10: Mơ hình dữ liệu vật lý cho site xã Mỹ Hội ðơng (lvtoan2)
Hình 4.11: Kết quả khi tạo khung nhìn RelationSys
Hình 4.12: Tạo quan hệ từ xa
Hình 4.13: Quy trình thực hiện SDD-1
Hình 4.14: Dữ liệu đầu vào giải thuật SDD-1
Hình 4.15: Bước khởi tạo giải thuật
Hình 4.16: Bước tìm các nối nửa có lợi
Hình 4.17: Bước 3 của giải thuật
Hình 4.18: Bước 4 của giải thuật
Trang vi
Trang
7
8
8
9
10
10
11
12
12
13
14
15
16
18
25
26
27
28
28
30
39
39
40
45
46
52
58
59
62
63
64
65
65
67
73
76
78
80
83
84
84
87
87
88
88
89
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
Hình 4.19: Mơ hình chi phí cho phép nối
Hình 4.20: Kết quả thực thi câu truy vấn
Hình 4.21: Mơ hình chi phí cho phép nối nửa
Hình 4.22: Kết quả thực thi câu truy vấn
Hình 4.23: Xác định hệ số chọn nối nửa
Hình 4.24: Chọn các trường có trong quan hệ NK_X1_Daihoc
Hình 4.25: Tạo quan hệ NK_X1_Daihoc
Hình 4.26: Tính các thơng số của quan hệ NK_X1_Daihoc
Hình 4.27: Mơ hình chi phí cho phép nối
Hình 4.28: Kết quả thực thi truy vấn
Hình 4.29: Xác định hệ số chọn của nối nửa
Hình 4.30: Mơ hình chi phí cho phép nối nửa (SDD-1)
Hinh 4.31: Kết quả phải truyền qua site thực thi (site 1)
Hình 4.32: Tạo câu truy vấn với phép tốn một ngơi
Hình 4.33: Mơ hình tính chi phí cho phép tốn một ngôi
Trang vii
90
90
91
92
93
94
94
95
95
96
97
97
98
99
100
DANH MỤC TỪ VIẾT TẮT
AS
Assembly
BS
Benefit Semijoin
ES
Execution Strategy
ERD
Entity Relationship Diagram
DDBMS
Distributed Database Management System
DDB
Distributed Database
DC
Data Communication
DB
Database Management
DD
Data Dictionary
DDBS
Distributed Database System
MLD
Model of Logical Data
MSDTC
Microsoft Distributed Transaction Coordinator
OP
Operation
SF
Selectivity Factor
SFOP
Selectivity Factor of Operation
SFS
Selectivity Factor of Selection
SFSJ
Selectivity Factor of Semijoin
SFJ
Selectivity Factor of Join
SJ
Semijoin
SQL
Structured Query Language
QEP
Query Execution Plan
QG
Query Graph
CNTT
Công nghệ thông tin
CSDL
Cơ sở dữ liệu
CSDLPT
Cơ sở dữ liệu phân tán
CSDLQG
Cơ sở dữ liệu quốc gia
HQTCSDLPT
Hệ quản trị cơ sở dữ liệu phân tán
Trang viii
TÓM TẮT
Trong luận văn, những lý thuyết tổng quan về hệ quản trị cơ sở dữ liệu phân tán
ñã ñược giới thiệu. Hơn nữa, những mơ hình chi phí, cơng thức thống kê cơ sở dữ
liệu, công thức ước lượng kích thước kết quả trung gian và giải thuật cũng ñược làm
rõ.
Kế ñến, ñể chuẩn bị cho giai ñoạn cài ñặt thực nghiệm, tác giả phải nghiên cứu
thêm các vấn đề chính sau: Cài đặt hệ thống; Cấu hình hệ thống như: Firewall,
MSDTC trên Windows và kết nối dữ liệu từ xa trên SQL Server 2005; Công cụ
Linked Servers, Distributed Partitioned Views, Transactional Replication, và các
hàm hệ thống (sysobjects, sysindexes, sys.tables, sys.columns ) trong SQL Server
2005; Những quy trình chung về quản lý dân cư của Bộ công an ban hành cho các
ñịa phương trong nước.
ðề tài áp dụng tất cả những kiến thức trên ñể tiến hành thực nghiệm và ñạt ñược
những kết quả như: Thiết kế CSDL cho hệ phân tán quản lý dân tỉnh An Giang bằng
công cụ nhân bản giao tác (Transactional Replication); Xây dựng ñược giải thuật
SDD-1 tối ưu hoá truy vấn phân tán dựa trên phép nối nửa; Chương trình so sánh
được chi phí truyền thơng của phép nối và nối nửa. Từ đó rút ra ñược những quy
luật chung về sự chọn lựa phương pháp ñể ứng dụng.
Trang ix
ABSTRACT
In this thesis, the general theories of distributed database management system
were introduced. In addition, the cost model, the formulas for database statistics, the
formulas for estimating the size of the intermediate results and the algorithms were
also clearly made.
Next, to prepare for the experimental phase, the author must research some
domains: installing system; configuring system such as Firewall, MSDTC on
Windows and accessing to remote database on SQL Server 2005; Linked Severs,
Distributed Partitioned Views, Transactional Replication Tools and system
functions (sysobjects, sysindexes, sys.tables, sys.columns ) on SQL Server 2005;
Processes for population management of Ministry of police promulgate in localities
across the country.
The thesis applies all of knowledge above to do the experiment and bring results
such as Designing distributed database for An Giang population management by the
“Transactional Replication” tool; Building the query optimization algorithm of
SDD-1 bases on the semijoin operation; The program compares the communication
costs between the join operation and semijoin operation. We learned from this
comparison which was the general rules of the method choice to apply.
Trang x
CHƯƠNG 1: GIỚI THIỆU
1.1 Mở ñầu
1.1.1 ðặt vấn ñề
Ngày 18/8/2010, Chính phủ vừa ban hành Nghị định số 90/2010/Nð-CP quy
định Cơ sở dữ liệu quốc gia (CSDLQG) về dân cư. Mục tiêu của việc xây dựng cơ
sở dữ liệu là ñể dùng chung cho các cơ quan, tổ chức, cá nhân nhằm cung cấp chính
xác, kịp thời thơng tin cơ bản về dân cư phục vụ công tác quản lý nhà nước, ñáp
ứng yêu cầu phát triển kinh tế - xã hội và u cầu chính đáng của cơng dân.
CSDLQG về dân cư ñược xây dựng và quản lý tại Trung tâm CSDLQG về dân
cư thuộc Bộ Công an, Công an các tỉnh, thành phố trực thuộc Trung ương và Công
an các quận, huyện, thị xã, thành phố thuộc tỉnh. Thơng tin của cơng dân được thu
thập, cập nhật trong CSDLQG về dân cư bao gồm: họ và tên, số ñịnh danh cá nhân,
ảnh cá nhân, quê quán, giới tính, dân tộc, chứng minh nhân dân, hộ chiếu, thẻ bảo
hiểm y tế, mã số thuế cá nhân, trình độ học vấn, nghề nghiệp, nơi làm việc, nơi ở.
Các cơ quan tham gia xây dựng và duy trì CSDLQG về dân cư ñược quyền khai
thác dữ liệu dân cư thuộc phạm vi quản lý của cơ quan mình, nhưng việc khai thác
dữ liệu dân cư ngoài phạm vi quản lý phải ñược cơ quan quản lý CSDLQG về dân
cư có thẩm quyền phê duyệt. [12]
Hơn nữa, theo Tổng cục thống kê đã chính thức cơng bố kết quả cuộc điều tra
dân số Việt Nam hiện là 85.789.573 người, tăng 9,5 triệu người so với mười năm
trước ñây. Tỷ lệ sinh ở Việt Nam vẫn tiếp tục ở dưới mức sinh thay thế, đạt 2,03
trên một phụ nữ, số giới tính khi sinh ñạt 111 bé trai trên 100 bé gái, ñất nước ñang
trong thời kỳ “cơ cấu dân số vàng” và nhóm dân số già đang tiếp tục tăng. Kết quả
điều tra cũng cho thấy, ñời sống của người dân Việt Nam đã có sự cải thiện. Hiện
nay, trong 10.000 hộ gia đình Việt Nam thì chỉ có năm hộ khơng có nhà (hoặc có
nhà nhưng khơng có đủ điều kiện tối thiểu), tỷ trọng nhà riêng của hộ chiếm 93%.
Với tình hình dân số phát triển như vậy. Ngược lại, mỗi tỉnh trong nước ta có
chung đặc thù là mật ñộ dân số ở thành phố hoặc thị xã thì khá cao hơn ở huyện.
Nên việc quản lý nhân khẩu ở thành phố hay thị xã gặp nhiều khó khăn hơn. Bên
cạnh đó, cách quản lý nhân khẩu theo lối hiện trạng gây nhiều phiền toái (theo hồ sơ
nhân khẩu, khơng gian lưu trữ ngày càng lớn, truy tìm mất nhiều thời gian …), chưa
khắc phục được khó khăn trên và khơng phát huy được tính khoa học trong quản lý.
Tuy nhiên, sự phát triển nhanh chóng cơng nghệ thơng tin trên nhiều lĩnh vực: công
Trang 1
nghệ phần mềm, phần cứng, internet, ñội ngũ chuyên viên IT…. Chính vì vậy làm
sao khai thác hết chức năng của các cơng nghệ này một cách có hiệu quả nhất? ðể
trả lời câu hỏi trên, Ban lãnh ñạo các tỉnh đã tiến hành Tin học hóa trên nhiều lĩnh
vực y tế, giáo dục, kinh tế… Bên cạnh đó khơng thể khơng nhắc đến dự án “Tin học
hóa Quản lý dân cư”.
Với tiêu chí đặt ra làm sao xây dựng hệ thống mang lại nhiều thuận lợi cho người
quản lý và người dân theo tuyến (tỉnh, huyện, xã và ấp). Cụ thể, với nhà quản lý ở
các tuyến làm sao dể theo dõi và xử lý kịp thời mọi yêu cầu cho người dân nhanh và
hiệu quả nhất. Cịn phía nhân dân, nếu mọi vấn ñề chúng ta ñều bắt họ lên tỉnh giải
quyết thì sẽ gây nhiều khó khăn. Ví dụ như: ở tuyến tỉnh sẽ bị ùn tắc (không xử lý
kịp hồ sơ), nhân dân mất nhiều thời gian trong việc ñi lại…
Mặt khác, hệ thống ñược quản lý theo tuyến nên có nhiều vấn đề cần phải nan
giải như đồng bộ, tích hợp, tốc độ truyền dữ liệu. Trong đó, tốc độ xử lý truy vấn
phải đảm bảo trên dữ liệu ngày càng lớn ở các tuyến. Hơn nữa, ñể tăng tốc ñộ
truyền dữ liệu giữa các tuyến thì trước tiên vấn đề tối ưu hố truy vấn phân tán cần
ñược quan tâm trước tiên.
1.1.2 Hướng giải quyết
Với yêu cầu thực trạng ñã miêu tả như mục 1.1.1, hướng giải quyết hiệu quả cho
hệ thống là xây dựng “Hệ cơ sở dữ liệu phân tán – Distributed Database System”.
Với hệ thống này ta tiến hành thiết kế phân tán:
- Thiết kế hạ tầng mạng: Cấu trúc vật lý (phần cứng) và cấu trúc phần mềm
quản lý (hệ ñiều hành mạng).
- Thiết kế cơ cấu dịch vụ: Xây dựng các dịch vụ của hệ thống như Web, email,
FTP, CSDL…, và các ứng dụng khai thác các dịch vụ dựa trên hạ tầng mạng,
có khả năng kết nối mạng LAN,WAN.
- Thiết kế cơ cấu nhân sự: Tổ chức và huấn luyện nhân viên quản lý hệ thống và
khai thác hệ thống dựa trên các chiến lược tổ chức nhân sự.
Bên cạnh đó, khi nghiên cứu hệ cơ sở dữ liệu (CSDL) phân tán, chúng ta không
thể bỏ qua phần xử lý truy vấn phân tán. Phần này lẽ ñương nhiên là phức tạp hơn
nhiều so với xử lý truy vấn tập trung vì ngồi những vấn đề vốn có trong các hệ tập
trung, ñịnh vị ñịa ñiểm (sites) chứa dữ liệu và truyền dữ liệu giữa các ñịa ñiểm là
những cơng việc có chi phí rất cao và dễ bị sự cố. Vì vậy quá trình xử lý truy vấn
trong mơi trường phân tán, qua đó xác định được những điểm có thể thực hiện tối
ưu hóa và gợi mở một số giải pháp là một vấn ñề rất quan trọng.
Trang 2
Cụ thể hơn, hệ quản trị CSDL phân tán chịu trách nhiệm tìm một thứ tự thực hiện
câu truy vấn sao cho chi phí xử lý của nó là thấp nhất hoặc gần như thế.
Chi phí xử lý truy vấn:
Chi phí CPU + chi phí xuất nhập + chi phí truyền thơng
trong đó:
Chi phí CPU (CPU cost): thời gian cần ñể xử lý dữ liệu ñã có trong bộ nhớ.
Chi phí xuất nhập (I/O cost): thời gian đọc ghi dữ liệu từ đĩa vào bộ nhớ và
ngược lại.
Chi phí truyền thông (communication cost): thời gian gửi nhận thông báo và dữ
liệu trên mạng.
Xuất phát từ thực tế đó, nghiên cứu hệ CSDL phân tán cho quản lý dân cư một
tỉnh nhằm tạo tiền ñể ñáp ứng cho triển khai CSDLQG sắp tới của Chính phủ ban
hành là cấp bách. Mặt khác, vấn đề tối ưu hố truy vấn phân tán cũng góp phần cải
thiện thời gian truyền dữ liệu trong hệ CSDL phân tán. Với hai lý do chính này ñã
thúc ñẩy tác giả thực hiện ñề tài “Tối ưu hóa truy vấn trong hệ cơ sở dữ liệu phân
tán Quản lý dân cư một tỉnh”.
1.1.3 Mục đích nghiên cứu của ñề tài
ðề tài nghiên cứu hai mảng lớn:
(1) Về hệ quản trị CSDL phân tán
ðề tài trước tiên nghiên cứu các khái niệm tổng quan cần thiết về hệ quản trị
CSDL phân tán, ñể ñi ñến thiết kế hệ CSDL phân tán cho quản lý dân cư một tỉnh
nói chung và đặc biệt là tỉnh An Giang nói riêng.
Sau đó, nghiên cứu cách cài đặt và cấu hình hệ thống cho hệ quản trị CSDL phân
tán, ñể hỗ trợ cho giai đoạn thực nghiệm tối ưu hố truy vấn phân tán.
(2) Về tối ưu hoá truy vấn phân tán
Lần lượt nghiên cứu các khái niệm, công thức và các kỹ thuật để nhằm hỗ trợ cho
tối ưu hố truy vấn phân tán. Kế ñến, nghiên cứu các giải thuật nhằm thực hiện tối
ưu hóa câu truy vấn với chi phí xử lý chấp nhận được.
Nghĩa là:
Giảm chi phí CPU.
Giảm chi phí xuất nhập.
Trang 3
Giảm chi phí truyền thơng.
Vì thời gian hạn chế và phạm vi của đề tài nên việc tối ưu hố truy vấn ñược tác
giả nghiên cứu chỉ dựa vào chi phí truyền thơng. Nghĩa là, chi phí CPU và chi phí
xuất nhập được xem như một hằng số.
Cuối cùng, vận dụng tối ưu hóa truy vấn để xử lý các yêu cầu hệ thống.
1.1.4 ðối tượng và phạm vi nghiên cứu
ðề tài nghiên cứu lý thuyết chung về hệ quản trị CSDL phân tán, các kỹ thuật và
các công thức nhằm hỗ trợ cho việc tính chi phí truyền thơng. ðồng thời, phải
nghiên cứu các giải thuật tối ưu hoá câu truy vấn phân tán nói chung và giải thuật
SDD-1 nói riêng.
Hơn nữa, đề tài cũng nghiên cứu các thơng tin liên quan ñến quản lý dân cư tỉnh
An Giang. Tuy nhiên, hệ thống quản lý dân cư trên tỉnh An Giang vẫn có thể áp
dụng chung cho các tỉnh hay thành phố trực thuộc trung ương, bởi vì họ cùng có
chung cách quản lý theo chủ trương của Bộ cơng an ban hành. CSDL được thiết kế
dựa trên việc phân tích những quy trình và tập các phiếu mẫu do Bộ cơng an quy
định và đang ban hành cho mọi cơ quan chức năng trên cả nước.
MS SQL Server 2005 là hệ quản trị CSDL giúp xây dựng ñược hệ thống quản lý
dân cư trên môi trường phân tán. Do vậy, ngồi tìm hiểu các chức năng của MS
SQL Server 2005 hỗ trợ cho CSDL tập trung, còn nghiên cứu các chức năng hỗ trợ
cho môi trường phân tán như: Linked Server, Distributed Partitioned Views,
Transactional Replication...
1.1.5 Ý nghĩa thực tiễn của đề tài
Sự thành cơng của đề tài có thể cung cấp cho chúng ta những kiến thức thật quý
báu trên cả lý thuyết, lẫn thực hành cho môi trường phân tán. Thêm vào đó nó có
thể giúp phần nào cho việc quản lý dữ liệu dân cư trên tỉnh An Giang nói riêng và
các tỉnh hay thành phố trực thuộc trung ương trên cả nước nói chung.
Hơn nữa, đề tài góp phần vào việc giảm chi phí truyền thơng cũng như tăng tốc
độ truyền dữ liệu trên mạng thơng qua phần tối ưu hố truy vấn phân tán. Tác giả
cũng hướng ñến nghiên cứu giải thuật nhằm xử lý chung cho tối ưu hoá truy vấn.
ðể xây dựng một hệ quản trị CSDL phân tán hoàn thiện, bao trùm hết tất cả các
chức năng: trong suốt, cạnh tranh giao tác, bảo mật.. thì rất mất nhiều thời gian, đơi
khi khơng thành cơng vì địi hỏi kinh nghiệm rất nhiều. Ngược lại, điều mà tác tác
giả muốn nói ở ñây là, khi hoàn thành ñể tài tạo cho chúng ta một bệ phóng để
nghiên cứu thêm các lĩnh vực nóng bỏng hiện nay như: lập trình đồng bộ hố dữ
Trang 4
liệu và cạnh tranh giao tác mà các hệ thống ngân hàng, hệ thống bán vé máy bay
ñang áp dụng.
1.2 Các vấn ñề liên quan
1.2.1 Trong nước
- Hệ CSDL phân tán Quản lý dân cư
Như nghị ñịnh số 90/2010/Nð-CP quy ñịnh về Cơ sở dữ liệu quốc gia
(CSDLQG) về dân cư đã nói ở mục 1.1.1. Hơn nữa, nghị định này có hiệu lực từ
ngày kể từ ngày 01 tháng 01 năm 2011. [12]
Từ nghị ñịnh trên, một số quận (huyện), tỉnh thành đã tiến hành thí điểm hay tổ
chức hội thảo như:
Sau thời gian thí điểm thành cơng tại Công an quận Thanh Xuân, dự kiến trong
năm nay lực lượng Công an Hà Nội sẽ triển khai quản lý dân sự bằng công nghệ
thông tin (CNTT) tại 4 quận nội thành cũ. [10]
Ngoài ra, ngày 30/06/2010 vừa qua tại Công viên phần mềm ðà Nẵng, Sở Thông
tin và Truyền thông, Công ty Cổ phần công nghệ phần mềm ðà Nẵng ñã phối hợp
với các cơ quan liên quan tổ chức hội thảo dự án xây dựng cơ sở dữ liệu dân cư TP
ðà Nẵng.
Sau khi ICT ðà Nẵng ñưa nội dung này lên mạng thơng tin điện tử, nhiều bạn
ñọc cho rằng ñây là vấn ñề khá thú vị và mới mẻ ở Việt Nam chúng ta (ví dụ mã
định danh cơng dân), bạn đọc cũng đề nghị giới thiệu cập nhật lại và minh họa dễ
hiểu hơn cấu trúc tích hợp - chia sẻ - ứng dụng khai thác dữ liệu. [13]
Không chỉ ứng dụng trong quản lý dân cư mà còn ứng dụng trên nhiều lĩnh vực
khác như: ngân hàng, bán vé máy bay, ATM...
- Tối ưu hố truy vấn phân tán
Qua tìm hiểu, vấn đề này trong nước chỉ dừng lại một số bài seminar của sinh
viên. Bên cạnh đó, cũng có một số trao đổi trên forum về cách giải quyết vấn ñề
truy xuất rất chậm cho một câu truy vấn trên dữ liệu thực tế hàng GB mà họ ñang
quản lý.
Ngược lại, tối ưu hoá truy vấn trong CSDL tập trung và trong CSDL song song
đã có các sinh viên nghiên cứu rất thành công.
Trang 5
1.2.2 Ngoài nước
- Hệ CSDL phân tán Quản lý dân cư
Một số cán bộ cấp cao của Bộ công an ñã nhận ñịnh và thí dụ rất thiết thực
những tiện ích ñem lại thực sự là hiệu quả, khi ñất nước có hệ thống quản lý dân cư
tốt.
Thí dụ: Ở Hoa Kỳ, hệ thống 911 ñược kết nối với hệ thống quản lý dân cư. Một
công dân bị tai nạn, khi cảnh sát ñến hiện trường sẽ lấy số thẻ của cơng dân đó
thơng qua hệ thống truyền số liệu trên xe cảnh sát về trung tâm để lấy thơng tin của
cá nhân đó thơng báo về trung tâm thơng tin cấp cứu. Khi trung tâm này ñiều xe cấp
cứu ñến thì nhân viên cấp cứu ñã nhận ñược ñầy ñủ thông tin về nạn nhân như tiền
sử bệnh, chuẩn máu phù hợp với nhóm, điều kiện cứu chữa… đảm bảo điều kiện tốt
nhất. [10]
Quản lý dân cư trong mơi trường phân tán ñã ñược thực nghiệm rất lâu ở các
nước phát triển.
- Tối ưu hoá truy vấn phân tán
Ngược lại trong nước, vấn đề tối ưu hố truy vấn phân tán đã được nghiên cứu
rất sâu. Có nhiều nhà nghiên cứu ñã ñưa ra các hàm heuristic nhằm cải tiến các giải
thuật tối ưu hoá truy vấn phân tán R*, SDD-1, AHY... Hơn nữa, hầu như tất cả hệ
quản trị CSDL hiện nay như SQL Server, DB2... đều có xử lý tầng tối ưu hố truy
vấn và đã tích hợp sẵn trong hệ quản trị CSDL của họ.
1.3 Các nội dung chính
Chương 1: Giới thiệu
Chương 2: Tổng quan hệ quản trị cơ sở dữ liệu phân tán
Chương 3: Tối ưu hoá câu truy vấn phân tán
Chương 4: Thiết kế và cài đặt cơ sở dữ liệu và mơ hình tối ưu hoá truy vấn cho
hệ phân tán quản lý dân cư tỉnh An Giang
Chương 5: Kết luận và hướng phát triển
Trang 6
CHƯƠNG 2: TỔNG QUAN HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN
TÁN
2.1 Các khái niệm cơ bản về hệ cơ sở dữ liệu phân tán
2.1.1 ðịnh nghĩa cơ sở dữ liệu phân tán
Cơ sở dữ liệu (CSDL) phân tán nói riêng và các hệ phân tán nói chung là một
lĩnh vực ñược nghiên cứu từ lâu nhưng gần ñây do sự phát triển nhanh chóng của
cơng nghệ truyền tin và sự bành trướng của internet. Cơ sở dữ liệu phân tán ñã trở
thành một lĩnh vực thu hút nhiều sự quan tâm của các nhà nghiên cứu.
Về mặt trực quan theo nghĩa ñen của cụm từ cơ sở dữ liệu phân tán (CSDLPT)
chứa hai cụm từ: Cơ sở dữ liệu và phân tán.
Tuy nhiên, việc phân tán ở ñây chúng ta hiểu là phân tán thông tin và các thông
tin đó được lưu trữ trên mạng máy tính. Do vậy:
Cơ sở dữ liệu phân tán = Cơ sở dữ liệu + Mạng máy tính
Một CSDL phân tán là một tập hợp nhiều CSDL có có liên quan logic với nhau
và ñược phân bố trên mạng máy tính.
Cơ sở
dữ liệu
Cơ sở
dữ liệu
Site trung tâm (TP
Long Xuyên,
lvtoanhp)
Mạng
Site xã Vĩnh
Hưng (lvtoan1)
Cơ sở
dữ liệu
Site xã Mỹ Hội
ðơng (lvtoan2)
Hình 2.1: Mơ hình CSDL phân tán
Trang 7
- Tính chất phân tán: Tồn bộ dữ liệu của CSDL phân tán khơng được cư trú ở
một nơi mà cư trú ra trên nhiều site thuộc mạng máy tính, ñiều này giúp chúng ta
phân biệt CSDL phân tán với CSDL tập trung đơn lẻ.
- Tương quan logic: Tồn bộ dữ liệu của CSDL phân tán có một số các thuộc tính
ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL
phân tán với một tập hợp CSDL cục bộ hoặc các tập cư trú tại các site khác nhau
trong một mạng máy tính.
Trong hệ thống cơ sở dữ liệu phân tán gồm nhiều site, mỗi site có thể khai thác
các giao tác truy nhập dữ liệu trên nhiều site khác. [1,4]
2.1.2 Phân loại cơ sở dữ liệu phân tán
2.1.2.1 Cơ sở dữ liệu phân tán thuần nhất
Cơ sở dữ liệu phân tán thuần nhất là loại cơ sở dữ liệu ñược thiết kế bằng cách
chia nhỏ cơ sở dữ liệu phân tán đó thành nhiều cơ sở dữ liệu ñịa phương. Các cơ sở
dữ liệu ñịa phương ñược ñịnh vị tại một site, ñều ñược quản trị bằng một hệ quản
trị, thực hiện trên cùng một hệ ñiều hành. [1]
CSDLPT thuần nhất
Thiết kế
CSDL ñịa phương 1
CSDL địa phương 2
...
CSDL địa phương n
Hình 2.2: Thiết kế CSDLPT thuần nhất
2.1.2.2 Cơ sở dữ liệu phân tán không thuần nhất
Cơ sở dữ liệu phân tán không thuần nhất là loại cơ sở dữ liệu ñược thiết kế bằng
cách hợp nhất nhiều cơ sở dữ liệu ñịa phương hiện đã có và đang hoạt động thành
một cơ sở dữ liệu phân tán duy nhất. Các cơ sở dữ liệu địa phương có thể được quản
trị bằng các hệ quản trị cơ sở dữ liệu khác nhau và hệ ñiều hành khác nhau. [1]
Thiết kế
CSDLPT không thuần nhất
CSDL ñịa phương 1
CSDL địa phương 2
...
CSDL địa phương n
Hình 2.3: Thiết kế CSDLPT không thuần nhất
Trang 8
Ứng dụng vào ñề tài:
- Do hệ thống sắp ñược thiết kế trong phần 4.2 được thiết kế theo mơ hình Topdown tức hệ thống khơng thuộc vào hệ thống trước đó, nên đã chọn loại
CSDLPT thuần nhất tạo cho hệ thống. Cụ thể như sau:
- Cả ba site (lvtoanhp, lvtoan1 và lvtoan2) trong hệ thống cùng dùng một hệ quản
trị CSDL “MicroSoft SQL Server 2005 Developer”.
- Hệ ñiều hành dùng cho site lvtoanhp MS Windows 7, hai site còn lại lvtoan1 và
lvtoan2 ñều là MS Windows XP.
2.1.3 Các mức trong suốt (trasparency) trong CSDLPT
Khi nghiên cứu hay xây dựng hệ CSDLPT, vấn ñề trong suốt phân tán là lĩnh vực
rất quan trọng. Bởi vì nó làm cho người dùng tiếp xúc dễ dàng, vì sử dụng như một
hệ CSDL tập trung. Do vậy thường các hệ quản trị CSDL cũng ñưa ra cách giải
quyết vấn ñề trong suốt trong mơi trường phân tán. Dưới đây là ba mức trong suốt
rất cần cho ứng dụng phân tán.
Thí dụ có câu truy vấn:
SELECT Name into $Name
FROM Supplier
WHERE Snum = $Snum
Trong đó biến $Snum là một tham số ñầu vào của thủ tục read bên dưới và nó
dùng để so sánh với trường Snum của quan hệ Supplier(Snum, Name). Ngồi ra, thí
dụ 2.4.b và 2.4.c cịn sử dụng biến #FOUND, nó có giá trị true chỉ khi kết quả trả về
của câu truy vấn là khơng rỗng.
Ba mức trong suốt được minh hoạ như sau [9]:
Mức 1: Trong suốt phân mảnh (Fragmentation transparency)
Hệ quản trị
CSDLPT
Read(terminal, $SNUM);
SELECT Name into $Name
FROM Supplier
WHERE Snum = $Snum;
Write(terminal, $Name);
SUPPLIER1
Site 1
SUPPLIER2
Site 2
SUPPLIER2
Site 3
Hình 2.4.a: Trong suốt phân mảnh
Trang 9
Mức 2: Trong suốt vị trí (Location transparency)
Read(terminal, $SNUM);
SELECT Name into $Name
FROM Supplier1
WHERE Snum = $Snum;
If not #FOUND then
SELECT Name into $Name
FROM Supplier2
WHERE Snum = $Snum;
Write(terminal, $Name);
Hệ quản trị
CSDLPT
SUPPLIER1
Site 1
có thể
SUPPLIER2
Site 2
SUPPLIER2
Site 3
hoặc
Hình 2.4.b: Trong suốt vị trí
Mức 3: Trong suốt ánh xạ cục bộ (Local mapping transparency)
Read(terminal, $SNUM);
SELECT Name into $Name
FROM Supplier1 AT SITE1
WHERE Snum = $Snum;
If not #FOUND then
SELECT Name into $Name
FROM Supplier2 AT SITE3
WHERE Snum = $Snum;
Write(terminal, $Name);
Hệ quản trị
CSDLPT
SUPPLIER1
Site 1
SUPPLIER2
Site 3
Hình 2.4.c: : Trong suốt ánh xạ cục bộ
Nhận xét:
Trật tự trong suốt ñược sắp thứ tự như sau: mức 1 > mức 2 > mức 3. Bởi vì dễ
dàng nhìn ra rằng: đối với mức 1 người dùng hồn tồn khơng biết quan hệ
SUPPLIER bị phân thành hai mảnh trong CSDLPT, cịn mức 2 thì người dùng biết
bị phân mảnh nhưng khơng rõ vị trí phân bố cụ thể từng mảnh, và ngược lại hoàn
toàn thì mức 3 người dùng khơng những biết quan hệ SUPPLIER bị phân mảnh mà
còn biết cụ thể các mảnh nằm ở site nào.
Từ nhận xét trên, nảy sinh vấn ñề ñối với người xây dựng hệ CSDLPT phải tìm
ra cách cấu hình cho hệ quản trị CSDL đang sử dụng ñáp ứng việc trong suốt cho hệ
thống. Vấn ñề này ñược ñược làm rõ ở hệ quản trị CSDL MS SQL Server 2005
Developer qua mục 4.1.3, 4.1.4 của chương 4.
2.2 Các khái niệm cơ bản về hệ quản trị cơ sở dữ liệu phân tán
2.2.1 Khái niệm
Hệ quản trị CSDL phân tán ñược ñịnh nghĩa là một hệ thống phần mềm cho phép
quản lý các hệ CSDL và làm cho việc phân tán trở nên trong suốt với người sử
dụng.
2.2.2 Tập các phần mềm trong hệ quản trị CSDLPT
ðặc tính vơ hình muốn nói đến sự tách biệt về ngữ nghĩa ở cấp ñộ cao của một
hệ thống với các vấn ñề cài ñặt ở cấp ñộ thấp. Sự phân tán dữ liệu ñược che dấu với
Trang 10
người sử dụng, làm cho người sử dụng truy nhập vào CSDL phân tán như hệ CSDL
tập trung. Sự thay ñổi việc quản trị không ảnh hưởng tới người sử dụng.
Hệ quản trị CSDL phân tán gồm 1 tập các phần mềm (chương trình) sau đây:
- Các chương trình quản trị các dữ liệu phân tán (Distributed Database - DDB).
- Chứa các chương trình để quản trị việc truyền thơng dữ liệu (Data
Communication - DC).
- Các chương trình để quản trị các CSDL ñịa phương (Database Management DB).
- Các chương trình quản trị từ điển dữ liệu (Data Dictionary - DD).
ðể tạo ra một hệ CSDL phân tán (Distributed Database System-DDBS) các tập
tin khơng chỉ có liên quan logic, chúng cịn phải có cấu trúc và được truy xuất qua
một giao diện chung.
Môi trường hệ CSDL phân tán là môi trường trong đó dữ liệu được phân tán trên
một số vị trí. [1]
DB
CSDL địa
phương 1
DC
DD
DB
CSDL địa
phương 2
DC
DD
DDB
DDB
Hình 2.5: Mơ hình các thành phần của HQTCSDLPT
2.2.3 Các phương thức truy cập dữ liệu từ xa:
Cách thức truy cập cơ sở dữ liệu từ xa qua chương trình ứng dụng theo hai
phương thức cơ bản: truy cập từ xa trực tiếp và gián tiếp.
- Truy cập từ xa trực tiếp
Theo mơ hình trực tiếp dưới (hình 2.6), chương trình ứng dụng đưa ra yêu cầu
truy cập ñến cơ sở dữ liệu từ xa, yêu cầu này ñược hệ quản trị cơ sở dữ liệu tự động
tìm nơi đặt dữ liệu và thực hiện u cầu tại điểm đó. Kết quả được trả lại cho
chương trình ứng dụng. ðơn vị chuyển đổi giữa hai hệ quản trị cơ sở dữ liệu là
phương thức truy cập cơ sở dữ liệu và kết quả nhận ñược ( thông qua việc thực hiện
phương thức truy cập này ). Với cách thức truy cập từ xa như vậy cấp ñộ trong suốt
Trang 11
phân tán ñược xây dựng bằng cách tạo ra tên file chung (global) để đánh địa chỉ
thích hợp cho những ñiểm lưu trữ dữ liệu ở xa.[9]
Chương trình
ứng dụng
Yêu cầu
1
Hệ quản trị
CSDL
6
Site 1
5
Site 2
2
3
Hệ quản trị
CSDL
CSDL
Kết quả
4
Hình 2.6: Phương thức truy cập từ xa trực tiếp
- Truy cập từ xa gián tiếp
Mơ hình dưới (hình 2.7) mơ tả cách thức truy cập phức tạp hơn. Theo mơ hình
truy cập này, chương trình ứng dụng thực hiện yêu cầu qua chương trình trung gian
ở site khác. Chương trình trung gian này ñược người lập trình ứng dụng viết ñể truy
cập từ xa ñến cơ sở dữ liệu và trả về kết quả của chương trình ứng dụng yêu cầu.[9]
Chương trình
ứng dụng
Yêu cầu 1
10
Hệ quản trị
CSDL
Site 1
9
8
Site 2
2
3
Chương trình
trung gian
5
4
Hệ quản trị
CSDL
6
CSDL
7
Hình 2.7: Phương thức truy cập từ xa gián tiếp
Ứng dụng vào ñề tài:
- Hệ quản trị CSDLPT cung cấp cả hai phương thức truy cập bởi vì mỗi phương
thức đều có ưu điểm riêng.
- Qua nghiên cứu lý thuyết về hai phương thức truy cập trên, phương thức truy
cập từ xa trực tiếp phù hợp với hệ thống và ñáp ứng mọi u cầu mà chương
trình ứng dụng đưa ra.
- Phương thức truy cập từ xa trực tiếp của hệ thống (đề tài) được minh hoạ qua mơ
hình ở hình 2.8.
Trang 12
Chương trình
ứng dụng
(VB.NET)
Yêu cầu
1
MS SQL Server
2005
6
Site 1 (lvtoanhp)
2
MS SQL Server
2005
3
4
5
CSDL
Kết quả
Site 1 (lvtoan1)
Site 1 (lvtoan2)
MS SQL Server
2005
3’
CSDL
4’
Kết quả
Hình 2.8: Phương thức truy cập từ xa trực tiếp của hệ thống
- Cách tiếp cận này được thể hiện qua cơng cụ Linked Server trong hệ quản trị
CSDL MS SQL Server 2005. Cụ thể ở từng site như sau:
Ở Site 1 (lvtoanhp-192.168.186.1):
Tạo hai Linked Server (LinkLvtoan1, LinkLvtoan2) lần lượt liên kết ñến site
lvtoan1 và site lvtoan2.
EXEC master.dbo.sp_addlinkedserver @server='LinkLvtoan1', @provider=
'SQLNCLI', @datasrc='192.168.186.128', @srvproduct='SQLNCLI.1'
Và
EXEC master.dbo.sp_addlinkedserver @server='LinkLvtoan2', @provider=
'SQLNCLI', @datasrc='192.168.186.129', @srvproduct='SQLNCLI.1'
Ở Site 2 (lvtoan1-192.168.186.128):
Tạo hai Linked Server (LinkLvtoanhp, LinkLvtoan2) lần lượt liên kết ñến site
lvtoanhp và site lvtoan2.
EXEC master.dbo.sp_addlinkedserver @server='LinkLvtoanhp', @provider=
'SQLNCLI', @datasrc='192.168.186.1', @srvproduct='SQLNCLI.1'
Và
EXEC master.dbo.sp_addlinkedserver @server='LinkLvtoan2', @provider=
'SQLNCLI', @datasrc='192.168.186.129', @srvproduct='SQLNCLI.1'
Ở Site 3 (lvtoan2-192.168.186.129):
Tạo hai Linked Server (LinkLvtoanhp, LinkLvtoan1) lần lượt liên kết ñến site
lvtoanhp và site lvtoan1.
Trang 13