Tải bản đầy đủ (.pdf) (87 trang)

GIẢI PHÁP KỸ THUẬT ĐỒNG BỘ HÓA DỮ LIỆU CHO BÀI TOÁN ĐĂNG KÝ TUOR DU LỊCH TỪ XA TRONG MÔI TRƯỜNG INTERNET OF THING - Full 10 điểm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.37 MB, 87 trang )

UBND TỈNH QUẢNG NAM
TRƯỜNG ĐẠI HỌC QUẢNG NAM
KHOA: CÔNG NGHỆ THÔNG TIN

---------

TRẦN DƯƠNG NGỌC TUẤN

GIẢI PHÁP KỸ THUẬT ĐỒNG BỘ HÓA DỮ LIỆU
CHO BÀI TOÁN ĐĂNG KÝ TUOR DU LỊCH TỪ XA

TRONG MÔI TRƯỜNG INTERNET OF THING

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Quảng Nam, tháng 04 năm 2017

LỜI CẢM ƠN

Lời đầu tiên, em xin chân thành cảm ơn các Thầy Cơ giáo đã tận tình
hướng dẫn, giảng dạy trong suốt quá trình học tập, nghiên cứu và rèn luyện ở
trường Đại học Quảng Nam.

Mặc dù đã có nhiều cố gắng để thực hiện đề tài một cách tốt nhất. Song
do buổi đầu mới làm quen với công tác nghiên cứu cũng như hạn chế về kiến
thức và kinh nghiệm nên không thể tránh khỏi những thiếu sót nhất định của bản
thân. Em rất mong được sự góp ý của quý Thầy, Cơ giáo để khố luận được
hồn chỉnh hơn.

Em xin chân thành cảm ơn!


Quảng Nam, ngày 27 tháng 4 năm 2017
Sinh viên

Trần Dương Ngọc Tuấn

MỤC LỤC

I. NỘI DUNG ........................................................................................................ 1
Phần 1. MỞ ĐẦU.................................................................................................. 1
1.1. Lý do chọn đề tài ............................................................................................ 1
1.2. Tính mới của đề tài......................................................................................... 1
1.3. Mục tiêu của đề tài ......................................................................................... 2
1.4. Đối tượng và phạm vi nghiên cứu.................................................................. 2
1.5. Phương pháp nghiên cứu................................................................................ 2
Phần 2. NỘI DUNG NGHIÊN CỨU .................................................................... 3
Chương I: TỔNG QUAN HỆ TIN HỌC PHÂN TÁN ......................................... 3
1.1. Hệ phân tán..................................................................................................... 3
1.1.1 Khái niệm ..................................................................................................... 3
1.1.2. Ưu điểm và hạn chế của hệ thống phân tán ................................................ 4
1.1.3 Nguyên tắc xây dựng hệ phân tán ................................................................ 5
1.1.4 Hệ cơ sở dữ liệu phân tán............................................................................. 6
1.1.5. Ưu điểm và nhược điểm của hệ quản trị cơ sở dữ liệu phân tán ................ 7
1.2. Mô hình hệ cơ sở dữ liệu phân tán ................................................................. 8
1.3. Đồng bộ hóa dữ liệu ..................................................................................... 10
1.3.1. Đồng bộ hóa cơ sở dữ liệu ........................................................................ 10
1.3.2. Bản sao dữ liệu .......................................................................................... 12
1.4. Giao dịch và quản lý giao dịch..................................................................... 14
1.4.1. Khái niệm .................................................................................................. 14
1.4.2 Đặc tính ...................................................................................................... 15
1.5. Internet of Things ......................................................................................... 16

1.5.1. Khái niệm .................................................................................................. 16
1.5.2. Tác động .................................................................................................... 17
1.6. Mạch vi xử lý Arduino ................................................................................. 18
1.6.1. Phần cứng .................................................................................................. 19
1.6.2. Phần mềm .................................................................................................. 20
1.7. Hệ quản trị cơ sở dữ liệu MYSQL ............................................................... 23
1.7.1. Khái niệm .................................................................................................. 23

1.7.2 Một số đặc điểm của MySQL .................................................................... 24
1.8. Giới thiệu về tỉnh Quảng Nam và bài toán ứng dụng công nghệ thông tin xử
lý trên môi trường Internet of Thing ................................................................... 25
1.9. Kết luận ........................................................................................................ 26
Chương II: MƠ HÌNH BÀI TOÁN DU LỊCH ĐĂNG KÝ TỪ XA VÀ GIẢI
PHÁP KỸ THUẬT ĐỒNG BỘ .......................................................................... 27
2.1. Giới thiệu bài toán ........................................................................................ 27
2.2. Các thuật tốn kỹ thuật gắn bó ..................................................................... 29
2.2.1. Kỹ thuật nhân bản cơ sở dữ liệu................................................................ 29
2.2.2. Kỹ thuật cập nhật dữ liệu .......................................................................... 31
2.2.3. Giải thuật ................................................................................................... 34
2.3. Đề xuất thuật toán ........................................................................................ 42
2.4 Kết luận ......................................................................................................... 45
Chương III: GIẢI PHÁP KỸ THUẬT GẮN BÓ ............................................... 46
3.1. Lưu đồ giải thuật .......................................................................................... 46
3.2. Demo chương trình ...................................................................................... 47
3.2.1. Khởi tạo thực thể MySQL......................................................................... 47
3.2.2. Cơ sở dữ liệu của bài toán ......................................................................... 49
3.2.3. Cài đặt Server ............................................................................................ 50
3.3. Kết luận ........................................................................................................ 57
Qua chương này em đã làm được các việc sau: .................................................. 57
KẾT LUẬN ......................................................................................................... 57

1.1. Kết quả đạt được .......................................................................................... 57
1.2. Hạn chế......................................................................................................... 58
1.3. Hướng phát triển của đề tài .......................................................................... 58
Phần 3: DANH MỤC CÁC TÀI LIỆU THAM KHẢO ..................................... 58
PHỤ LỤC A ........................................................................................................ 60
PHỤ LỤC B ........................................................................................................ 66

DANH MỤC CÁC BẢNG

Bảng 1: Những nguyên tắc xây dựng hệ tin học phân tán .................................... 6
Bảng 2: Cơ chế cho phép duy trì sự gắn bó. ....................................................... 15
Bảng 3: Các đặc tính tồn vẹn............................................................................. 15
Bảng 4: Các hàm nguyên thủy thực hiện trên đối tượng .................................... 34

DANH MỤC CÁC HÌNH VẼ

Hı̀nh 1: Hệ tin học phân tán .................................................................................. 3
Hı̀nh 2: Các thực thể của hệ tin học phân tán ....................................................... 5
Hı̀nh 3: Môi trường của hệ CSDL tập trung ......................................................... 9
Hı̀nh 4: Môi trường của hệ CSDL phân tán .......................................................... 9
Hı̀nh 5: Ba giai đoạn của một giao dịch .............................................................. 15
Hı̀nh 6: Các loại mạch Arduino .......................................................................... 20
Hı̀nh 7: Mơ hình hoạt động của Nodejs .............................................................. 22
Hı̀nh 8: Mơ hình cơ sở dữ liệu phân tán của tỉnh Quảng Nam ........................... 26
Hı̀nh 9: Giao thức cam kết hai pha...................................................................... 36
Hı̀nh 10: Giao thức cam kết ba pha..................................................................... 38
Hı̀nh 11: Mơ hình đa Server ................................................................................ 44
Hı̀nh 12: Lưu đồ giải thuật .................................................................................. 46
Hı̀nh 13: Các thực thể của MySQL ..................................................................... 49
Hı̀nh 14: Cơ sở dữ liệu ........................................................................................ 50

Hı̀nh 15: Server 1 ................................................................................................ 50
Hı̀nh 16: Server 2 ................................................................................................ 51
Hı̀nh 17: Server 3 ................................................................................................ 51
Hı̀nh 18: Trang đăng nhập................................................................................... 52
Hı̀nh 19: Danh sách đăng ký tour du lịch............................................................ 52
Hı̀nh 20: Đăng ký tour......................................................................................... 53
Hı̀nh 21: Giao diện kiểm tra đồng bộ dữ liệu...................................................... 53
Hı̀nh 22: Mô hình thơng báo sự cố bằng mạch Arduino..................................... 54
Hı̀nh 23: Thông báo sự cố ................................................................................... 54

Hı̀nh 24: Trang xem danh sách nhà hàng đang gặp sự cố................................... 55
Hı̀nh 25: Mạch Arduino và module bluetooth HC06.......................................... 55
Hı̀nh 26: Thông báo kết nối qua bluetooth ......................................................... 56
Hı̀nh 27: Giao diện của người dùng chọn tour.................................................... 56
Hı̀nh 28: Giao diện đăng ký của người dùng ...................................................... 57

I. NỘI DUNG

Phần 1. MỞ ĐẦU

1.1. Lý do chọn đề tài
Trong thời đại phát triển thông tin số, các giải pháp về kỹ thuật “Internet of

Thing” dựa trên nền tảng hạ tầng như là dịch vụ (IaaS) ngày càng trở nên quan
trọng hơn bao giờ hết. Thông qua hạ tầng này, các ứng dụng chạy dịch vụ IoT
trở nên hiệu quả hơn và đáng tin cậy hơn. Các ứng dụng liên quan tới cơ sở dữ
liệu của IoT ngày càng được chú trọng tại lớp nền tảng như là dịch vụ.

Cơ sở dữ liệu phân tán nói riêng và các hệ tin học phân tán nói chung là
một lĩnh vực khơng thể thiếu trong các hệ thống mạng, đặc biệt là Internet. Ngày

nay Internet được áp dụng vào mọi lĩnh vực công nghiệp, nông nghiệp, đời sống
và xã hội, trong giới nghiên cứu và nhà sản xuất.

Trong khóa luận này, tập trung nghiên cứu giải pháp kỹ thuật trên hệ thống
hạ tầng gồm đa Server phân tán kết qua mạng truyền thơng, mà mỗi máy trạm
có thể thực hiện các dịch vụ đăng ký thông tin tour du lịch từ xa. Vấn đề đặt ra
là phải xây dựng một hệ thống cho phép thực thi bài toán đăng ký thơng tin từ xa
theo mơ hình phân tán. Sau đó xử lý để đảm bảo gắn bó dữ liệu khi hệ thống có
sự cố xảy ra.
1.2. Tính mới của đề tài

Với sự bùng nỗ của Internet of Thing và thiết bị thông minh, được rất
nhiều nhà nghiên cứu phát triển tập trung vào các ngành du lịch, sức khỏe...
Việc sử dụng công nghệ mới này vào ngành công nghiệp du lịch đã tác động rất
lớn tới các doanh nghiệp và khách du lịch. Ngày nay việc đặt mua vé du lịch cho
một kỳ nghỉ thật dễ, trong đó có các loại hình dịch vụ được cung cấp như khách
sạn, vé máy bay… tất cả đều được thanh toán trực tuyến. Internet đã thay đổi
triệt để mơ hình, mối quan hệ trong kinh doanh

1

Nghiên cứu dựa trên việc kết hợp các giải pháp kỹ thuật “Internet of
Thing” cho hệ thống mơ hình gắn bó dữ liệu là rất mới.
1.3. Mục tiêu của đề tài

Tiều hiểu hệ thống phân tán.
Các vấn đề tính tốn trong hệ phân tán.
Các giải pháp kỹ thuật đảm bảo gắn bó dữ liệu.
Mô phỏng quá trình đồng bộ và cập nhật trên các Server.
1.4. Đối tượng và phạm vi nghiên cứu

1.4.1. Đối tượng nghiên cứu
Giới thiệu về các khái niệm cơ bản về hệ phân tán, nguyên lý xây dựng hệ
phân tán và cơ sở dữ liệu phân tán.
Để tài này tôi tập trung nghiên cứu về phần giải pháp kỹ thuật đồng bộ
hóa dữ liệu để làm rõ những ưu điểm của mơ hình trên IoT.
Sử dụng chương trình mơ phỏng bằng ngơn ngữ Java, công cụ
WindowBuilder để mô phỏng quá đồng bộ dữ liệu trong mạng đa Server.
1.4.2. Phạm vi nghiên cứu
Thu thập thông tin, nghiên cứu tài liệu liên quan đến đề tài.
Tham khảo tài liệu, sách, báo và từ Internet.
1.5. Phương pháp nghiên cứu
Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài.
Thảo luận, lựa chọn phương hướng giải quyết vấn đề.
Triển khai xây dựng chương trình mơ phỏng

Phần 2. NỘI DUNG NGHIÊN CỨU

Chương I: TỔNG QUAN HỆ TIN HỌC PHÂN TÁN

1.1. Hệ phân tán
1.1.1 Khái niệm
Hệ tin học phân tán hay gọi tắt là hệ phân tán là một hệ thống xử lý thông tin
bao gồm nhiều bộ xử lý hoặc các bộ vi xử lý được đặt ở xa tại các vị trí khác
nhau và được liên kết với nhau thông qua các phương tiện viễn thông dưới sự
thống nhất của hệ điều hành.

Server Servers
Server Server

Hı̀nh 1: Hệ tin học phân tán


Hệ tin học phân tán là một hệ thống không chia sẻ bộ nhớ và đồng hồ.
Các tính tốn học phân tán có thể được thực hiện trên nhiều bộ xử lý hay vi xử
lý khác nhau. Do đó hệ thống tin học phân tán địi hỏi hệ thống của mình phải
trang bị bộ nhớ cục bộ. Các bộ xử lý trao đổi thông tin thông qua các đường

truyền khác nhau như cáp mạng chuyên dụng, bus trao đổi, đường điện thoại,
cáp quang hoặc có thể là sóng...

Không như các máy tính đơn lẻ, mạng máy tính là tập hợp các thiết bị đầu
cuối được nối với nhau bởi hệ thống đường truyền, những đường truyền nối với
các trạm rất xa nhau có thể là một mạng viễn thơng. Các thiết bị đầu cuối của
mạng máy tính rất đa dạng, bao gồm tập hợp các máy tính, các thiết bị chuyên
dụng, các thiết bị truyền tin, các thiết bị nhận và hiển thị thơng tin…Hệ thống
mạng máy tính được điều khiển bằng hệ điều hành mạng. Hệ tin học này có thể
là hệ tập trung hay là hệ phân tán.

1.1.2. Ưu điểm và hạn chế của hệ thống phân tán

1.1.2.1 Ưu điểm

Chia sẻ tài nguyên: Chia sẻ tài nguyên trong hệ thống phân tán cung cấp
một cơ chế để chia sẻ tập tin ở vị trí xa, xử lý thơng tin trong một cơ sở dữ liệu
phân tán, in ấn tại một vị trí xa, sử dụng những thiết bị ở xa để thực hiện các
thao tác…

Tăng tốc độ tính tốn: Hệ thống phân tán cho phép phân chia việc tính
tốn trên nhiều vị trí khác nhau để tính tốn song song.

An tồn: Nếu một vị trí trong hệ thống phân tán bị hỏng, các vị trí khác

vẫn tiếp tục làm việc mà khơng ảnh hưởng đến tồn bộ hệ thống.

Thông tin liên lạc với nhau: Có nhiều lúc, chương trình cần chuyển đổi dữ
liệu từ vị trí này sang vị trí khác. Khi các vị trí được nối kết với nhau trong một
hệ thống mạng, việc trao đổi dữ liệu diễn ra rất dễ.

1.1.2.2 Hạn chế

Giá phát triển phần mềm cao: Do các khó khăn khi cài đặt một hệ thống
phân tán, giá thành sẽ tăng lên.

Dễ mắc lỗi hơn: Vì các trạm trong hệ phân tán làm việc song song, khó có
thể đảm bảo thuật tốn được thực hiện đúng trên tất cả các trạm. Do vậy mà số
lỗi sẽ tăng lên.

Khối lượng các xử lý tăng: Hệ thống phân tán cần truyền nhiều thơng báo,
nhiều tính tốn phụ. Do vậy khối lượng xử lý tăng lên so với hệ thống tập trung.
1.1.3 Nguyên tắc xây dựng hệ phân tán

Căn cứ vào thành phần của hệ tin học, ta nhận thấy hệ tin học phân tán có
thể bao gồm bốn thực thể như hình bên dưới.

Hı̀nh 2: Các thực thể của hệ tin học phân tán
Phần mềm phân tán cung cấp cơng cụ thích hợp cho phép các máy tính
phối hợp các hoạt động với nhau, cùng chia sẻ tài nguyên phần cứng.
Cấu hình phần cứng của mạng có thể bao gồm các bộ xử lý có cấu tạo
hồn tồn khác nhau về khả năng, tốc độ và được thiết kế cho các chức năng
khơng giống nhau. Chúng có thể là các bộ xử lý, các trạm làm việc, các máy tính
trung và các máy tính điện tử vạn năng lớn.


Bên cạnh hệ thống phần cứng, phần mềm, dữ liệu, hệ phân tán cịn
có hệ thống truyền thơng. Nhưng điều cơ bản để phân biệt hệ tin học phân tán
với mạng máy tính và hệ điều hành mạng chính là nguyên tắc xây dựng hệ tin
học phân tán được liệt kê như bảng dưới đây:

Bảng 1: Những nguyên tắc xây dựng hệ tin học phân tán

STT Tên gọi Thuyết minh

1 Chia sẻ tài Thực tế phát triển mạng máy tính đặt ra một vấn

nguyên đề lớn là cần phải dùng chung tài nguyên. Một tiến

trình trên một trạm nào đó có thể cung cấp tài

nguyên dùng chung ở một trạm khác.

2 Liên lạc Khi các hệ thống đã được mắc nối với nhau, các
3 Tin cậy thực thể trong hệ có thể trao đổi thơng tin với
nhau.
4 Tăng tốc
Một trạm trong hệ bị sự cố khơng làm cho tồn hệ
ảnh hưởng, mà ngược lại, cơng việc đó được phân
cho các trạm khác đảm nhận. Ngoài ra, trạm bị sự
cố có thể tự động phục hồi lại trạng thái ban đầu
trước khi có sự cố hay trạng thái ban đầu của nó.

Đây là khái niệm mới về phân tán tải. Một tính
toán lớn nào đó, nếu chỉ sử dụng một trạm thì thời
gian cho kết quả lâu. Tính tốn này được chia nhỏ

và thực hiện song song trên các trạm. Điều này
cũng cần thiết đối với các trạm quá tải.

1.1.4 Hệ cơ sở dữ liệu phân tán

Chúng ta có thể định nghĩa một cơ sở dữ liệu phân tán gồm nhiều cơ sở
dữ liệu tích hợp lại với nhau thơng qua mạng máy tính để trao đổi dữ liệu, thông
tin… Cơ sở dữ liệu được tổ chức và lưu trữ ở những vị trí khác nhau trong mạng

máy tính và chương trình ứng dụng truy cập vào dữ liệu ở những điểm khác
nhau đó.

Một hệ cơ sở dữ liệu phân tán (distributed database system, viết tắt là
DDBS) không phải là một “tập các tập tin” lưu riêng lẻ tại mỗi nút của một
mạng máy tính. Để tạo ra một hệ cơ sở dữ liệu phân tán, các tập tin không
những có liên đới logic mà chúng cịn phải có cấu trúc và được truy xuất qua
một giao diện chung.

1.1.5. Ưu điểm và nhược điểm của hệ quản trị cơ sở dữ liệu phân tán

1.1.5.1. Ưu điểm

Có nhiều nguyên nhân dẫn đến sử dụng cơ sở dữ liệu phân tán nhưng
về cơ bản cơ sở dữ liệu phân tán có những ưu điểm sau:

- Lợi điểm về tổ chức và tính kinh tế là tổ chức phân tán nhiều chi nhánh
và dùng cơ sở dữ liệu phân tán phù hợp với các tổ chức kiểu này.

- Tận dụng những cơ sở dữ liệu sẵn có là hình thành cơ sở dữ liệu phân
tán từ các cơ sở dữ liệu tập trung có sẵn ở địa phương.


- Thuận lợi cho nhu cầu phát triển là xu hướng dùng cơ sở dữ liệu phân
tán sẽ cung cấp khả năng phát triển thuận lợi hơn và giảm được xung đột về
chức năng giữa các đơn vị đã tồn tại và giảm được xung đột giữa các chương
trình ứng dụng khi truy cập đến cơ sở dữ liệu.

- Giảm chi phí truyền thơng, trong cơ sở dữ liệu phân tán chương
trình ứng dụng đặt ở địa phương có thể giảm bớt được chi phí truyền thơng khi
thực hiện bằng các khai thác dữ liệu tại chỗ.

- Tăng số công việc thực hiện giúp cơ sở dữ liệu phân tán có nhiều thuận
lợi trong việc phân tán dữ liệu như tạo ra các chương trình ứng dụng phụ thuộc
vào tiêu chuẩn mở rộng vị trí làm cho các nơi có thể hỗ trợ lẫn nhau. Do đó
tránh được hiện tượng tắc nghẽn cổ chai trong mạng truyền thông hoặc trong các
dịch vụ thông thường của toàn bộ hệ thống.

1.1.5.2 Nhược điểm.

Kinh nghiệm thiết kế và ứng dụng chưa nhiều, còn tồn tại nhiều vấn
đề cần giải quyết.

Các vấn đề của cơ sở dữ liệu phân tán thì phức tạp hơn nhiều so với cơ sở
dữ liệu tập trung, đặc biệt là vấn đề khi cập nhật dữ liệu cũng như xử lý khi gặp
lỗi.

Vấn đề truyền thông phải bảo đảm an tồn thơng tin cũng như chọn cấu
hình mạng cho phù hợp.

Vấn đề an tồn dữ liệu nếu khơng có cơ chế bảo vệ hợp lý thì có khả năng
những dữ liệu khơng mong muốn vẫn được truy xuất ra ngồi.


1.2. Mơ hình hệ cơ sở dữ liệu phân tán

Một hệ cơ sở dữ liệu phân tán khơng phải là hệ thống trong đó dù có sự
hiện diện của một mạng máy tính, cơ sở dữ liệu chỉ nằm tại một nút của mạng.
Trong trường hợp này, vấn đề quản trị cơ sở dữ liệu không khác với việc quản
trị cơ sở dữ liệu trong hệ tập trung. Cơ sở dữ liệu này được quản lý tập trung tại
một hệ thống máy tính (trạm 2 trong hình dưới) và tất cả mọi yêu cầu đều
chuyển đến vị trí đó. Điều cần xem xét là độ chậm trễ khi truyền dữ liệu. Hiển
nhiên là sự tồn tại của một mạng máy tính hoặc một tập các tập tin không đủ để
tạo ra một hệ cơ sở dữ liệu phân tán. Điều chúng ta quan tâm là một môi trường
trong đó dữ liệu được phân tán trên một số vị trí.

Server 3 Server 2

Internet

Data

Data

Data

Servers 1

Hı̀nh 3: Môi trường của hệ CSDL tập trung

Data Data
Server 3 Server 2


Data

Internet

Data

Servers 1

Hı̀nh 4: Môi trường của hệ CSDL phân tán

Trong hệ thống cơ sở dữ liệu phân tán, cơ sở dữ liệu lưu trữ ở các máy
tính khác nhau. Các máy tính liên lạc với nhau qua nhiều phương tiện truyền
thông, như bus tốc độ cao hay đường điện thoại. Chúng không chia sẻ bộ nhớ
chính, cũng khơng dùng chung đồng hồ.

Các bộ xử lý trong hệ thống phân tán có kích cỡ và chức năng khác nhau.
Chúng có thể gồm các bộ vi xử lý, trạm làm việc, máy tính mini, hay các máy
tính lớn vạn năng. Những bộ xử lý được đặt tại các trạm, nút, máy tính.

Trong hệ thống cơ sở dữ liệu phân tán gồm nhiều trạm, mỗi trạm có thể
khai thác các giao thức truy nhập dữ liệu trên nhiều trạm khác. Sự khác nhau
chính giữa hệ thống cơ sở dữ liệu phân tán và tập trung là: trong hệ thống tập
trung, dữ liệu lưu trữ tại chỗ, cịn phân tán thì khơng.

1.3. Đồng bộ hóa dữ liệu

1.3.1. Đồng bộ hóa cơ sở dữ liệu

Đồng bộ (Synchronous) là khái niệm nói lên tính ngun tắc, nó địi hỏi
các dữ liệu, tiến trình có liên quan phải được kết nối, liên hệ theo một trình tự

thực hiện, một định dạng, cách thức cố định, không bao giờ thay đổi. Trong một
chuỗi các hàm của một quy trình có n tác vụ, nếu nó được bảo là đồng bộ thì
trình tự thực hiện các hàm đó sẽ khơng bao giờ thay đổi. Hàm A đã được thiết
lập để được gọi và chạy trước hàm B thì hàm B phải chờ hàm A kết thúc mới
được phép bắt đầu. Một dây chuyền sản xuất công nghiệp của một nhà máy có
thể coi là một q trình đồng bộ.

Cơng nghệ đồng bộ hóa dữ liệu được thiết kế để đồng bộ hóa một tập hợp
dữ liệu giữa hai hoặc nhiều thiết bị, tự động sao chép thay đổi qua lại. Ví dụ:
danh sách liên hệ của người dùng trên một thiết bị di động có thể được đồng bộ
hóa với các thiết bị di động hoặc máy tính khác. Đồng bộ hóa dữ liệu có thể
được đồng bộ hóa cục bộ, nơi thiết bị và máy tính được song song và dữ liệu
được chuyển hoặc đồng bộ hóa từ xa khi người dùng di động và dữ liệu được
đồng bộ qua mạng di động.

Đồng bộ hóa dữ liệu (data synchronization) là một quá trình thiết lập sự
thống nhất giữa các hệ thống và các cập nhật liên tục liên tục để duy trì sự nhất
quán. Từ 'liên tục' cần được nhấn mạnh ở đây vì việc đồng bộ hóa dữ liệu khơng
nên được coi là một nhiệm vụ một lần. Đây thực sự là một quá trình cần được
lên kế hoạch, sở hữu, quản lý, lập kế hoạch và kiểm sốt. Quy trình đồng bộ hóa
dữ liệu:

- Kế hoạch những nhu cầu, yêu cầu, mục tiêu về đồng bộ hóa dữ liệu nên
được tập hợp trong giai đoạn lập kế hoạch. Điều này cần phải bao gồm nội dung
về dữ liệu, định dạng dữ liệu, truyền tài và tần suất cập nhật. Các yêu cầu phi
chức năng như hiệu suất, thời gian và bảo mật cũng nên được đề cập đến.

- Lập lịch và tần suất cập nhật là một trong những mục tiêu được nghiên
cứu trong giai đoạn đầu. Việc tạo một lịch rõ ràng và càng chi tiết cho quá trình
cập nhật, đồng bộ hóa được thực hiện một cách hợp lý và tối ưu nhất là một yếu

tố vô cùng quan trọng.

- Giám sát q trình đồng bộ hóa cần được theo dõi để đánh giá xem lịch
biểu và tần suất cập nhật có đáp ứng được nhu cầu của khách hàng hay của
doanh nghiệp không.

Việc xây dựng cơ sở dữ liệu phân tán có khả năng đồng bộ hóa cao cũng
gặp khơng ít khó khăn như:

- Độ phức tạp của định dạng dữ liệu sự phức tạp của dữ liệu trong quá
trình vận hành và phát triển ln thay đổi theo thời gian sự thay đổi đó dù ít hay
nhiều cũng tác động khơng nhỏ đến quả trình đồng bộ hóa dữ liệu. Việc chuẩn
hóa dữ liệu và quy định các kiểu dữ liệu là điều đầu tiên mà hệ thống dữ liệu cần
phải làm. Giảm thiểu đi các nguy cơ khơng thể kiểm sốt, quản lý chặt chẽ được
dữ liệu.

- Thời gian thực là yêu cầu quan trọng trong hệ phân tán. Một hế thống
phân tán ngày nay luôn phải hoạt động theo thời gian thực nhằm dáp ứng được
yêu cầu thời gian thực, trong khoảng thời gian ngắn nhất, có thể chấp nhận được

các nhu cầu của khách hàng, các doanh nghiệp, giúp cho việc cập nhật, thay đổi
diễn ra nhanh nhất có thể không gây sự chậm trễ trong thông tin dữ liệu.

- Đồng bộ hóa dữ liệu cho phép chia sẻ dữ liệu giữa các cơ sở dữ liệu
(CSDL) tại nhiều điểm khác nhau theo thời gian. Với một dữ liệu gốc, ta có thể
tạo nhiều bản sao và sử dụng tại nhiều nơi. Dữ liệu gốc thay đổi, các dữ liệu bản
sao cũng sẽ thay đổi và ngược lại.

- Bảo mật các hệ thống khác nhau có thể có các chính sách khác nhau để
thực thi bảo mật dữ liệu và cấp độ truy cập. Mặc dù bảo mật được duy trì chính

xác trong hệ thống nguồn chứa dữ liệu, đặc quyền truy cập thông tin và bảo mật
cũng phải được thực thi trên các hệ thống cũng như ngăn chặn bất kỳ sự tấn
công đối với thông tin. Bất kỳ dữ liệu thông qua trung gian của việc truyền dữ
liệu cũng như chuyển dữ liệu của chính trung gian đó cũng phải được mã hóa.

- Chất lượng của dữ liệu việc truyền di những dữ liệu cần thiết, quan trọng
qua các Server các điểm kết nối thông tin là một điều không thể thiếu trong
truyền tải dữ liệu. Dữ liệu có thể được chia ra sao cho hợp lý để có truyền tải
nhanh nhất, ít bị sự cố nhất Điều này ngăn ngừa sự không nhất quán trong dữ
liệu do việc cập nhật cùng một lúc nhiều dữ liệu trong một hệ thống.

- Bảo trì như bất kỳ các hệ thống khác, trong q trình đồng bộ hố cần
phải được giám sát để đảm bảo rằng nó chạy đúng lịch và kịp thời xử lý lỗi,
khắc phục sự cố xảy ra trong q trình đồng bộ hố chẳng hạn như dữ liệu cập
nhật bị từ chối hoặc dữ liệu không đúng định dạng.

1.3.2. Bản sao dữ liệu

Một lựa chọn phổ biến cho việc phân bổ dữ liệu cũng như có khả năng
chịu lỗi tốt của cơ sở dữ liệu là lưu trữ một bản sao riêng của cơ sở dữ liệu tại
hai hoặc nhiều điểm lưu trữ khác nhau. Nhân rộng có thể diễn ra trên một mạng
lưu trữ, mạng cục bộ hoặc mạng cục bộ diện rộng, cũng như với đám mây. Việc
nhân rộng dữ liệu cho phép chuyển dư liệu tập trung trên một Server ra nhiều
Server khác gần với người dùng cuối hơn tránh sự truyền tải dữ liệu chỉ tập
trung trên Server. Nhân bản dữ liệu sữ dụng kỹ thuật dồng bộ hoặc không đồng

độ trên cơ sở dữ liệu phân tán, nhưng được ứng dụng rộng rãi hơn trên môi
trường đồng bộ.

1.3.2.1 Ưu điểm


Có năm ưu điểm của việc sử dụng bản sao dữ liệu:

- Độ tin cậy, nếu một điểm lưu trữ cơ sở dữ liệu bị hỏng thì có thể tìm
thấy một bản sao dữ liệu tại điểm Server khác mà không gây ra sự nghẽn mạch
trong việc truy cập dữ liệu. Việc đồng bộ diễn ra ngay trong lúc thực hiện giao
dịch hoặc sau khi kết thúc giao dịch.

- Đáp ứng nhanh mỗi địa điểm lưu trữ đầy đủ dữ liệu có thể xử lý các truy
vấn cục bộ, do đó các truy vấn có thể được xử lý nhanh chóng.

- Có khả năng tránh các sự cố giao dịch, việc nhân bản thường được làm
mới theo khoảng thời gian đã định trước để có tính nhất qn trong cơ sở dữ liệu,
vì vậy hầu hết các dạng sao chép được sử dụng khi thực hiện q trình đồng bộ
hóa dữ liệu qua các bản sao cơ sở dữ liệu là cần thiết.

- Các điểm độc lập các giao dịch với dữ liệu vẫn thực hiện mà khơng có
sự kết nối với mạng. Như vậy các điểm kết nối bị dừng, treo hoặc ngắt kết nối
(ví dụ: thiết bị di động điện thoại, laptop...) nhưng vẫn có thể thực hiện giao dịch
xử lý dữ liệu trên bộ nhớ cục bộ.

- Giảm lưu lượng mạng vào giờ cao điểm việc nhân bản dữ liệu để lưu trữ
dữ liệu trên các Server khác nhau nhằm giảm lượng truy cập vào dữ liệu trên
một Server nhất định tránh trường hợp quá tải, giúp tăng tốc độ truy cập, truyền
tải dữ liệu cho người dùng.

1.3.2.2 Nhược điểm

Có ba nhược điểm:


- Yêu cầu lưu trữ một bản sao đều có dữ liệu giống như bản gốc nên việc
tăng lên các bản sao dữ liệu được lưu trữ trên các Server dẫn tới việc sử dụng
không gian lưu trữ lớn u cầu chí phí cao. Bên cạnh đó thời gian cập nhật lại
dữ liệu cũng tăng lên.


×