Tải bản đầy đủ (.pdf) (33 trang)

phân tích hệ thống dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (624.07 KB, 33 trang )

HỆ THỐNG THÔNG TIN QUẢN LÝ
CHƢƠNG 5
PHÂN TÍCH HỆ THỐNG VỀ DỮ LIỆU
CHƢƠNG 5: PHÂN TÍCH HỆ THỐNG
VỀ DỮ LIỆU
29 December 2009
Hệ thống thông tin quản lý
2
 Bài 1: Đại cƣơng.
 Bài 2: Mã hoá dữ liệu.
 Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD) theo mô
hình thực thể liên kết.
 Bài 4: Lập biểu đồ cấu trúc dữ liệu (BCD) theo mô
hình quan hệ.
Bài 1: Đại cƣơng.
29 December 2009
Hệ thống thông tin quản lý
3
 Nội dung bài học
 Một hệ thống trong trạng thái vận động bao gồm hai yếu tố là các chức
năng xử lý và dữ liệu.
 Trong XLTT có nhiều công cụ để mô tả dữ liệu.
 Trong phần này chúng ta đề cập tới 4 công cụ chủ yếu:
 Mã hóa dữ liệu (Coding).
 Từ điển dữ liệu (Data Dictionary).
 Mô hình thực thể liên kết ER (Entity Relationship).
 Mô hình quan hệ (Relational Data Base Modeling).
 Mục đích của giai đoạn phân tích hệ thống về dữ liệu là: Lập lƣợc đồ
dữ liệu hay gọi là biểu đồ cấu trúc dữ liệu (BCD)
 Phƣơng pháp thực hiện: Thể hiện theo hai cách tiếp cận:
 Mô hình thực thể liên kết: phƣơng pháp này trực quan đi từ trên xuống


dưới.
 Mô hình quan hệ: Xuất phát từ danh sách các thuộc tính rồi đến các lƣợc
đồ quan hệ. Phƣơng pháp này đi từ dưới lên
Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
4
 Nội dung bài học
 Khái niệm mã hóa.
 Chất lƣợng và yêu cầu đối với mã hóa.
 Các kiểu mã hóa.
 Cách lựa chọn mã hoá
Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
5
 Khái niệm mã hóa.
 Mã là tên viết tắt gán cho một đối tƣợng nào đó hay nói cách
khác gán cho các đối tƣợng một tên ngắn gọn nhƣng lại phản
ánh đầy đủ nội dung.
 Ngoài ra mã hóa còn là hình thức chuẩn hóa dữ liệu.
 Khi xây dựng CSDL rất cần thiết phải biết cách mã hóa dữ
liệu.
 Mã hóa đƣợc xem là việc xây dựng một tập hợp những mã
hiệu - một biểu diễn theo quy ƣớc, thông thƣờng là ngắn gọn
về mặt thuộc tính của một thực thể hoặc tập hợp thực thể.
Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
6

 Chất lƣợng và yêu cầu đối với mã hóa.
 Có nhiều phƣơng pháp mã hóa khác nhau. Do vậy cần xác
định một số tiêu chí để đánh giá chất lƣợng của việc mã
hóa.
 Mã không đƣợc nhập nhằng: Thể hiện ánh xạ 1-1 giữa mã
hóa và giải mã, mỗi đối tƣợng đƣợc xác định rõ ràng và duy
nhất với một mã nhất định.
 Thích ứng với phƣơng thức sử dụng: Việc mã hóa có thể tiến
hành thủ công nên cần phải dễ hiểu, dễ giải mã, và việc mã
hóa bằng máy đòi hỏi cú pháp chặt chẽ.
 Mã có khả năng mở rộng.
 Mã phải ngắn gọn, dễ nhớ.
 Mã có tính gợi ý.
Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
7
 Các kiểu mã hóa.
 Mã hóa liên tiếp (Serial Coding): Ta dùng các số nguyên
liên tiếp từ 0 trở đi để mã hóa. Phƣơng pháp này thƣờng để
đánh số thứ tự trong danh sách các đối tƣợng.
 Ƣu điểm: Không nhập nhằng, đơn giản, dễ bổ sung vào sau.
 Nhƣợc điểm: Không xen đƣợc, thiếu tính gợi ý vì cần phải có
bảng tƣơng ứng và không phân theo nhóm.
 Mã hóa theo vùng (Range Coding): Sử dụng các số
nguyên nhƣ mã hóa liên tiếp nhƣng phân ra từng lớp (vùng)
cho từng loại đối tƣợng, trong mỗi lớp dùng mã liên tiếp.
 Ƣu điểm: Không nhập nhằng, đơn giản, có thể mở rộng, xen
thêm đƣợc.
 Nhƣợc điểm: Thiếu gợi ý

Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
8
 Các kiểu mã hóa.
 Mã phân đoạn: Bản thân mã đƣợc phân thành nhiều đoạn, mỗi đoạn
mang một ý nghĩa riêng.
 Ƣu điểm: Không nhập nhằng, mở rộng, xen thêm đƣợc và dùng khá phổ
biến.
 Nhƣợc điểm: Mã quá dài nên thủ tục nặng nề, không cố định và vẫn có thể bị
bảo hòa mã.
 Mã phân cấp: Các đối tƣợng đƣợc mã hoá theo chế độ phân cấp các
chi tiết nhỏ dần
 Ƣu điểm: Các ƣu điểm tƣơng tự nhƣ mã phân đoạn. Ngoài ra việc tìm kiếm
mã dễ dàng.
 Nhƣợc điểm: Tƣơng tự các nhƣợc điểm của mã kiểu phân đoạn.
 Mã diễn nghĩa: Bằng cách gán một tên ngắn gọn nhƣng hiểu đƣợc
cho mọi đối tƣợng.
 Ƣu điểm: Tiện dùng cho xử lý bằng thủ công và số lƣợng đối tƣợng đƣợc mã
ít
 Nhƣợc điểm: Không giải mã đƣợc bằng MTĐT
Bài 2: Mã hoá dữ liệu.
29 December 2009
Hệ thống thông tin quản lý
9
 Cách lựa chọn mã hoá
 Việc lựa chọn mã hoá cần dựa vào các yếu tố sau
 Nghiên cứu việc sử dụng mã sau này.
 Nghiên cứu số lƣợng các đối tƣợng đƣợc mã hoá để lƣờng trƣớc
đƣợc sự phát triển.

 Nghiên cứu sự phân bố thống kê các đối tƣợng để phân bổ theo
lớp.
 Tìm xem đã có những mã hoá nào đƣợc dùng trƣớc đó cho các
đối tƣợng này để kế thừa.
 Thoả thuận ngƣời dùng cách mã hoá.
 Thử nghiệm trƣớc khi dùng chính thức để chỉnh lý kịp thời.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
10
 Nội dung bài học
 Khái niệm
 Thực thể và kiểu thực thể
 Các thuộc tính
 Quan hệ và kiểu quan hệ
 Xây dựng mô hình dữ liệu- Lƣợc đồ khái niệm
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
11
 Khái niệm
 Trong phần này chúng ta xem xét một cách tiếp cận phân tích thông tin thứ
hai hoàn toàn khác. Cách tiếp cận này mang nhiều tên gọi khác nhau, trong
đó phổ biến nhất là Mô hình hoá thực thể, Mô hình hoá dữ liệu và Phân tích
dữ liệu logic.
 Mô hình hoá dữ liệu là chủ đề quan trọng và phức tạp, có thể tiếp cận đƣợc
theo nhiều cách và mức độ khác nhau trong tiến trình phát triển hệ thống.
 Việc phân tích dữ liệu logic nói chung đƣợc định nghĩa là một cách tiếp cận

bao gồm việc xem xét dữ liệu hoặc thông tin đƣợc sử dụng trong công tác
theo quan điểm trừu tƣợng.
 Phân tích dữ liệu là một phƣơng pháp xác định các đơn vị thông tin cơ sở có
ích cho hệ thống đƣợc gọi là các thực thể, và định rõ mối quan hệ bên trong
hoặc các tham trỏ chéo với nhau giữa chúng
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
12
 Khái niệm
 Mô hình thực thể liên kết là công cụ thành lập lƣợc đồ dòng dữ liệu
hay gọi là biểu đồ cấu trúc dữ liệu (BCD), nhằm xác định các khái
niệm về các thực thể, thuộc tính, và mối liên hệ ràng buộc giữa
chúng.
 Mục đích của mô hình là xác định các yếu tố:
 Dữ liệu nào cần xử lý.
 Mối liên quan nội tại (cấu trúc) giữa các dữ liệu.
 Để xây dựng biểu đồ BCD trƣớc tiên ta phải thu nhập thông tin theo
ba yếu tố sau:
 Kiểu thực thể (Entities Type).
 Kiểu liên kết (Entities Relationship Type).
 Các thuộc tính (Attributes).
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
13
 Thực thể và kiểu thực thể.
 Thực thể là một vật thể, một chủ điểm, một nhiệm vụ, một đối tƣợng, hay

một sự kiện đáng quan tâm đối với tổ chức (và cả bên trong lĩnh vực hệ
thống), kể cả những thông tin mà nó giữ, mà ta muốn phản ánh nó trong
HTTT.
 Thực thể là một đối tƣợng đƣợc quan tâm đến trong một tổ chức, một hệ
thống, nó có thể là đối tƣợng cụ thể hay trừu tƣợng. Thực thể phải tồn tại,
cần lựa chọn có lợi cho quản lý và phân biệt đƣợc.
 Các kiểu thực thể thƣờng đƣợc tìm thấy từ ba nguồn:
 Các tài nguyên: vật tƣ, tài chính, con ngƣời, môi trƣờng
 Các giao dịch: đó là các thông tin đến từ môi trƣờng bên ngoài nhằm kích
động một chuỗi các hoạt động nào đó của hệ thống chẳng hạn nhƣ đơn đặt
hàng, hóa đơn, điểm thi,
 Các thông tin đã cấu trúc hóa: sổ sách, hồ sơ, các bảng biểu quy định.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
14
 Thực thể và kiểu thực thể.
 Kiểu thực thể là tập hợp các thực thể hoặc một lớp các thực thể có cùng đặc
trƣng, cùng bản chất. Thể hiện thực thể là một thực thể cụ thể, nó là một phần tử
trong tập hợp hay lớp của kiểu thực thể.
 Kiểu thực thể là việc nhóm tự nhiên một số thực thể lại, mô tả cho một loại
thông tin chứ không phải là bản thân thông tin.
 Kiểu thực thể tƣơng đƣơng với bảng logic và có dạng hộp trong sơ đồ mô hình
thực thể (trong thực tế, đôi khi ngƣời ta còn coi kiểu thực thể nhƣ các bảng thực
thể).
 Kiểu thực thể quan trọng nhất thƣờng rơi vào một trong ba phạm trù sau:
 Thông tin liên quan tới một trong giao dịch chủ yếu của hệ thống (chẳng hạn: hoá đơn
bán hàng, hoá đơn mua hàng).
 Thông tin liên quan tới các thuộc tính hoặc tài nguyên của hệ thống (chẳng hạn kho

tàng, khách hàng, nhà cung cấp, đội ngũ cán bộ, nguyên vật liệu,…).
 Thông tin đã khái quát, thƣờng dƣới dạng thống kê, liên quan tới vạch kế hoạch hoặc
kiểm soát (chẳng hạn nhƣ dự đoán, ngân sách, tính lƣơng, lịch điều xe, ).
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
15
 Các thuộc tính
 Khái niệm:
 Thuộc tính là giá trị thể hiện một đặc điểm nào đó của một thực thể hay một
liên kết.
 Mỗi một thực thể bao gồm một số thuộc tính, và phân thành 4 loại thuộc tính
phổ biến:
 Thuộc tính tên gọi (định danh)
 Thuộc tính mô tả.
 Thuộc tính kết nối.
 Thuộc tính khóa
 Thuộc tính định danh
 Mỗi thực thể trong bảng đều phải đƣợc xác định duy nhất
 Thuộc tính định danh là một hoặc nhiều thuộc tính trong kiểu thực thể đƣợc
dùng để gán cho mỗi thực thể một cách tham trỏ duy nhất.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
16
 Các thuộc tính
 Thuộc tính mô tả:
 Hầu hết các thuộc tính trong một kiểu thực thể đều có thể là mô tả.

 Thông tin này làm tăng hiểu biết của chúng ta về thực thể và sẽ phục vụ cho
các mục đích có ích bên trong hệ thống.
 Thí dụ về các mô tả trong một hoá đơn:
 Thuộc tính kết nối:
 Mục đích của thuộc tính kết nối là chỉ ra mối quan hệ giữa một thực thể đã có
và một thực thể khác trong một bảng khác.
 Kiểu thuộc tính kết nối còn có tên khác là khóa ngoài.
 Thuộc tính khoá:
 Đối với mô hình thực thể liên kết, ta cần phải chỉ rõ khóa cho mỗi kiểu thực
thể. Khóa đó có thể là khóa đơn (chỉ gồm một kiểu thuộc tính), hoặc là khóa
kép (gồm nhiều kiểu thuộc tính).
 Một kiểu thuộc tính khóa của một kiểu thực thể là một kiểu thuộc tính mà giá
trị của nó tƣơng ứng với mỗi thực thể là riêng biệt cho thực thể đó.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
17
 Quan hệ và kiểu quan hệ
 Khái niệm
 Quan hệ (liên kết) là sự kết nối có ý nghĩa giữa hai hay nhiều
thực thể phản ánh một sự ràng buộc về quản lý
 Kiểu quan hệ (liên kết) là tập các liên kết cùng bản chất. Giữa
các kiểu thực thể có thể tồn tại nhiều mối quan hệ (liên kết), mỗi
mối quan hệ liên kết xác định một tên duy nhất.
 Biểu diễn các quan hệ bằng đoạn thẳng nối giữa hai kiểu thực
thể.
 Các dạng kiểu quan hệ (liên kết):xác định có bao nhiêu thể
hiện của kiểu thực thể này có thể kết hợp với bao nhiêu thể hiện
của thực thể kia.

Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
18
 Quan hệ và kiểu quan hệ
 Mối quan hệ liên kết giữa thực thể:
 Bản chất của mối quan hệ này tổ chức và tạo nên cách sử dụng trong việc
điều khiển hoạt động công tác
 Những mối quan hệ này đƣợc biểu diễn trên mô hình thực thể bằng các
đƣờng có mũi tên hoặc dấu tam giác
 Có ba kiểu quan hệ chính đƣợc sử dụng dƣới các dạng đơn giản nhất của mô
hình thực thể:
 Một - Một: Giữa hai kiểu thực thể A, B là ứng với một thực thể trong A
có một thực thể trong B và ngược lại
 Một - Nhiều: Giữa hai kiểu thực thể A, B là ứng với một thực thể
trong A có nhiều thực thể trong B, nhưng ngược lại ứng với một
thực thể trong B chỉ có một thực thể trong A
 Nhiều - Nhiều: Giữa hai kiểu thực thể A, B là ứng với một thực thể trong
A có nhiều thực thể trong B và ngược lại ứng với một thực thể trong B có
nhiều thực thể trong A.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
19
 Quan hệ và kiểu quan hệ
 Ví dụ về kiểu quan hệ:
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.

29 December 2009
Hệ thống thông tin quản lý
20
 Xây dựng mô hình dữ liệu- Lƣợc đồ khái niệm
 Có hai giai đoạn của quá trình xây dựng mô hình:
 Xác định các thực thể
 Xác định các mối quan hệ
 Xác định các thực thể là giai đoạn khó nhất trong việc xây dựng mô
hình dữ liệu. Để thực hiện đƣợc việc này có thể sử dụng các cách
tiếp cận sau:
 Duyệt lại quá trình hoạt động của đơn vị cơ sở và ghi chép lại toàn bộ
các thông tin (các danh từ) có liên quan
 Duyệt theo mô hình chức năng và cố gắng trả lời câu hỏi “Khi thực hiện
mỗi chức năng cần sử dụng thông tin gì?”
 Sau khi đã có danh sách các danh từ, tiến hành phân loại xem danh từ
gì thể hiện các thuộc tính của thực thể.
Bài 3: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình thực thể liên kết.
29 December 2009
Hệ thống thông tin quản lý
21
 Xây dựng mô hình dữ liệu- Lƣợc đồ khái niệm
 Xác định các mối quan hệ thực thể
 Xác định các mối quan hệ giữa các thực thể đƣợc thực hiện sau khi đã xác
định đƣợc các thực thể quan trọng nhất trong các thông tin mà hệ thống
phải quản lý
 Một số quy định cần chú ý trong việc xác định các mối quan hệ:
 Trong sơ đồ quan hệ thực thể chỉ đƣa vào các thực thể thông tin gốc của
toàn bộ hệ thống.
 Phần chuẩn hóa thông tin thông thƣờng đƣợc thực hiện ở giai đoạn thiết

kế hoặc phân tích chi tiết trên mô hình quan hệ dữ liệu.
 Việc chuẩn hóa đƣợc thực hiện theo nguyên tắc sau:
• Hai thực thể có quan hệ một- một thông thƣờng đƣợc nhập lại làm một thực
thể.
• Hai thực thể có quan hệ nhiều- nhiều cần phân tách thành hai quan hệ một-
nhiều với sự trợ giúp của một thực thể phụ (thực thể trung gian)
 Bài tập tình huống
Bài 4: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình quan hệ.
29 December 2009
Hệ thống thông tin quản lý
22
 Nội dung bài học
 Chuẩn hoá dữ liệu.
 Mô hình quan hệ.
 Khái niệm và định nghĩa phụ thuộc hàm.
 Các dạng chuẩn.
 Chuẩn hóa
 Thành lập BCD dựa vào lý thuyết mô hình quan hệ.
Bài 4: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình quan hệ.
29 December 2009
Hệ thống thông tin quản lý
23
 Chuẩn hoá dữ liệu.
 Chuẩn hoá là quá trình khảo sát các danh sách thuộc tính, và áp
dụng một tập các quy tắc phân tích vào các danh sách đó, chuyển
chúng thành một dạng mà:
 Tối thiểu việc lặp lại.
 Tránh dƣ thừa.

 Xác định và giải quyết sự nhập nhằng.
Bài 4: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình quan hệ.
29 December 2009
Hệ thống thông tin quản lý
24
 Mô hình quan hệ.
 Khái niệm toán học về mô hình quan hệ.
 Mô hình quan hệ do Codd đề xuất năm 1970 với các ƣu điểm nhƣ sau:
 Đơn giản: các dữ liệu đƣợc biểu diễn dƣới một dạng duy nhất, là quan hệ, tức là các
bảng giá trị, khá tự nhiên và dễ hiểu đối với ngƣời dùng không chuyên tin học.
 Chặt chẽ: các khái niệm đƣợc hình thức hoá cao, cho phép áp dụng các công cụ toán
học, các thuật toán.
 Trừu tƣợng hoá cao: mô hình chỉ dừng ở mức quan niệm, nghĩa là độc lập với mức vật
lý, với sự cài đặt, với các thiết bị. Nhờ đó làm cho tính độc lập giữa dữ liệu và chƣơng
trình cao.
 Cung cấp các ngôn ngữ truy nhập dữ liệu ở mức cao, dễ sử dụng và trở thành chuẩn.
 Mô hình quan hệ là tập con của tích đề các của các miền R= {A
1
,A
2
, ,A
n
} với
A
i
(i=1,…, n) là tập hữu hạn các thuộc tính. r(R) hay r(A
1
, A
2

, , A
n
).Biểu
diễn một quan hệ bảng trong đó cột là các thuộc tính, dòng là các bộ có
thứ tự, n là bậc của R hay R là quan hệ n ngôi.
 Bộ là tập hợp các giá trị thể hiện của một đối tƣợng
 Khóa (key) quan hệ R là tập con sao cho với t
1
, t
2
R sẽ
tồn tại A thuộc K sao cho t
1
(A) # t
2
(A) có nghĩa là không tồn tại 2 bộ mà
có giá trị bằng nhau trên mọi thuộc tính. Các bộ của K là duy nhất.
Bài 4: Lập biểu đồ cấu trúc dữ liệu (BCD)
theo mô hình quan hệ.
29 December 2009
Hệ thống thông tin quản lý
25
 Mô hình quan hệ.
 Kết nối hai quan hệ
 Mục đích của phép kết nối là ghép nối mọi bộ của quan hệ R với
mọi bộ của quan hệ S, nếu hai bộ đó có cùng giá trị trên các
thuộc tính chung của R và S, có loại bỏ sự trùng lặp đối với các
thuộc tính chung.
 Phân rã một quan hệ
 Mục đích là tách một quan hệ R thành hai quan hệ S và T nhỏ

hơn mà không mất thông tin
 S và T là phép chiếu của R.
 2. Kết nối của S và T lại là R.

×