Tải bản đầy đủ (.ppt) (33 trang)

Tiểu luận điện toán đám mây Quản lý dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (587.88 KB, 33 trang )

Điện Toán Đám Mây
Quản lý dữ liệu
Nhóm:
08520368 Phạm Minh Thịnh
08520530 Trương Thị Thùy Duyên
08520260 Nguyễn Thọ Nguyên
08520047 Trịnh Xuân Công

Tầm quan trọng của dữ liệu

Dữ liệu là nguồn sống của một tổ chức. Do đó, dù
dữ liệu được đặt ở đâu đi nữa thì việc quản lý nó
vẫn quyết định sự sống còn của doanh nghiệp.

Vòng đời của một dữ liệu có thể được tóm gọn như
sau: được tạo ra, được thay đổi, bảo mật, lưu trữ
(hay hủy), và được kiểm soát.

Các vấn đề liên quan tới dữ liệu trong môi trường
đám mây là một chủ đề lớn và phức tạp.
2
Nội dung chính

Tính chất của dữ liệu

Bảo mật dữ liệu trong môi trường đám mây

Looking at…

Sorting…


Talking…
3
Tính chất của dữ liệu

Dữ liệu ngày một đa dạng: ngoài các dữ liệu truyền
thống (doanh thu, tên, …), còn có thêm địa chỉ
email, hợp đồng, ảnh, blog, …

Lượng dữ liệu ngày càng tăng

Yêu cầu về độ trễ ngày một khắt khe: Các công ty
ngày càng yêu cầu độ trễ thấp nhất có thể cho các
ứng dụng (thời gian để dữ liệu truyền từ một điểm
đến một điểm khác…). Dữ liệu thời gian thực cho
Radio Frequency ID là một ví dụ.
4
Khả năng xử lý của đám mây

Cung cấp tài nguyên để truy cập dữ liệu theo yêu
cầu với giá cả nằm trong khả năng của công ty

Hỗ trợ kết hợp, xử lý dữ liệu giữa nhân viên, khách
hàng, và các đối tác kinh doanh.
 Chi phí?
5
Bảo mật dữ liệu trong đám mây

Dữ liệu của công ty được chuyển ra ngoài để phục
vụ các ứng dụng cũng như công việc kinh doanh.


Nhà cung cấp đám mây phải đảm bảo sự bảo mật và
tính riêng tư cho dữ liệu của bạn, tuy nhiên bạn mới
là người chịu trách nhiệm sau cùng đối với dữ liệu
của công ty.

Sự bảo mật và tính riêng tư của dữ liệu là điều các
công ty đặt ra đầu tiên khi đưa ra quyết định sử
dụng dịch vụ đám mây.
6
Bảo mật dữ liệu trong đám mây(tt)

Có 3 điểm chính trong việc bảo mật dữ liệu và tính
riêng tư của dữ liệu

Vị trí của dữ liệu

Kiểm soát dữ liệu

Bảo đảm việc truyền dữ liệu
7
Vị trí của dữ liệu – Các vấn đề cần quan tâm

Luật riêng của mỗi nước: Luật về quản lý dữ liệu ở
mỗi nơi thường khác nhau. Chính phủ nước đó có
thể truy cập dữ liệu của bạn hoặc không cho phép
bạn toàn quyền điều khiển dữ liệu khi cần.

Dữ liệu truyền xuyên biên giới:

Trộn lẫn dữ liệu: dữ liệu được lưu trữ chung với các

công ty khác làm tăng những lo ngại cho an toàn dữ
liệu công ty khi xảy ra các cuộc tấn công.

Dữ liệu được sử dụng với mục đích khác:
8
Kiểm soát dữ liệu trong đám mây

Bao gồm các chính sách:

Quản lý thiết lập

Tính toàn vẹn, độ tin cậy và bảo mật dữ liệu
9
Kiểm soát dữ liệu trong đám mây(tt)
Ví dụ: bạn đang sử dụng dịch vụ đám mây cho xử
lý văn bản.

Các tài liệu tạo ra được lưu trữ tại nhà cung
cấp dịch vụ

Những tài liệu này thuộc về công ty của bạn do
đó bạn muốn kiểm soát sự truy cập vào những
tài liệu này  Không ai có được tài liệu đó khi
không có sự cho phép của bạn

Một số trường hợp (lỗi phần mềm chẳng hạn)
có thể khiến cho người khác truy cập vào tài
liệu của bạn  vi phạm bản quyền riêng tư
10
Kiểm soát dữ liệu trong đám mây(tt)

Các chức năng kiểm soát khác nhau được thiết kế để
đảm bảo tính đầy đủ và chính xác của dữ liệu đầu vào,
đầu ra, và khả năng xử lý:

Điều khiển đầu vào: để đảm bảo tất cả các dữ liệu vào bất
kỳ hệ thống hoặc ứng dụng là đầy đủ, chính xác và hợp


Xử lý điều khiển để đảm bảo rằng dữ liệu được xử lý
hoàn toàn và chính xác trong một ứng dụng

Điều khiển tập tin để đảm bảo rằng dữ liệu được thao tác
chính xác trong bất kỳ loại tập tin(có cấu trúc và phi cấu
trúc)
11
Kiểm soát dữ liệu trong đám mây(tt)

Điều khiển đầu ra phù hợp đảm bảo dữ liệu có thể được
thống nhất từ đầu vào đến đầu ra

Điều khiển truy cập đảm bảo những người được ủy
quyền truy cập vào dữ liệu mới có thể thao tác. Dữ liệu
mật phải được bảo vệ trong lưu trữ và truyền tải

Thiết lập sự kiểm soát phù hợp để đảm bảo rằng dữ liệu
không thể thay đổi mà không có quyền thích hợp

Điều khiển sao lưu và phục hồi: nhiều lổ hổng bảo mật
bắt nguồn từ việc sao lưu dữ liệu.


Kiểm soát việc tiêu hủy dữ liệu để đảm bảo khi dữ liệu
được xóa bỏ nó sẽ được xóa từ khắp mọi nơi – bao gồm
tất cả các bản sao lưu và các nơi lưu trữ dự phòng khác.
12
Bảo mật dữ liệu truyền tải trong đám mây

Một số vấn đề cần quan tâm khi vận chuyển dữ liệu
từ điểm A đến điểm B:

Chắc chắn rằng không ai đánh chặn các dữ liệu của bạn
khi nó di chuyển.

Chắc chắn dữ liệu không bị rò rỉ từ bất kì điểm nào trong
đám mây
Không có khái niệm nào gọi là an toàn trong việc vận
chuyển dữ liệu an toàn trong môi trường Internet
13
Bảo mật dữ liệu truyền tải trong đám mây

Thất thoát dữ liệu khi truyền giữa 2 điểm A và B có
thể xảy ra trong ba trường hợp sau:

Trong cùng môi trường đám mây

Qua Internet công cộng giữa doanh nghiệp và nhà cung
cấp đám mây

Giữa các đám mây
Quá trình bảo mật có thể bao gồm cách ly dữ liệu của bạn
khỏi dữ liệu của các công ty khác, sau đó mã hóa nó bằng

cách sử dụng một phương pháp an toàn.
14
Bảo mật dữ liệu truyền tải trong đám mây
Một số phương pháp bảo mật truyền dữ liệu:

Mạng riêng ảo (VPN) là một cách bảo mật dữ liệu
khi truyền nó trong một môi trường đám mây.

Tường lửa hoạt động như lá chắn giữa Internet công
cộng và mạng riêng

Mã hóa để bảo vệ dữ liệu của bạn khỏi hacker (chỉ
có máy tính mà bạn gửi tới mới có khóa để giải mã
dữ liệu)
15
Bảo mật dữ liệu truyền tải trong đám mây

Trong môi trường thử nghiệm, mức độ an ninh của
bạn có thể khác, tùy thuộc vào yêu cầu quản trị đối
với dữ liệu của bạn.

Cần phải xác định làm thế nào để đảm bảo rằng dữ
liệu của bạn an toàn.

Lo ngại về tính riêng tư và bảo mật của dữ liệu
khiến cho nhiều công ty quan tâm đến việc phát
triển một môi trường đám mây riêng.
16
Truy vấn dữ liệu, khả năng mở rộng, và
những dịch vụ Cloud


Sự cần thiết phải liên tục xử lý số lượng ngày càng
tăng của dữ liệu là một trong những yếu tố chủ chốt
thúc đẩy nhu cầu cho các dịch vụ Cloud.

Ví dụ, trước khi có Youtube, hầu như tất cả các
video được lưu trữ trên mạng TV. Sự bùng nổ số
lượng của các video ( một loại dữ liệu ) gần đây trên
Youtube là không thể tưởng tượng được.
17
Một số công nghệ mới để quản lí những
khối lượng ngày càng tăng của dữ liệu

Phương thức hỗ trợ xử lí co giãn lớn và khai phá dữ
liệu trong Cloud: Một ví dụ của loại ứng dụng tính
toán mạnh mẽ này là nghiên cứu tính toán lưới.

Cơ sở dữ liệu và về việc lưu trữ dữ liệu trên Cloud:
cơ sở dữ liệu mới đang được tạo ra trên môi trường
điện toán đám mây.

Lưu trữ dữ liệu trên đám mây: lưu trữ dữ liệu ngoại
tuyến đã trở nên phổ biến trong nhiều năm.
18
Xử lý co giãn dữ liệu

Ưu điểm nổi bật của điện toán đám mây là khả năng
co giản của nó: bạn có thể thêm bao nhiêu dung
lượng mà bạn cần để xử lí hay phân tích dữ liệu của
bạn. Dữ liệu có thể được xử lí trên một cụm nhiều

máy tính.

Nhiều công ty đang xem xét tới phương pháp này để
giúp họ quản lý dây chuyền cung ứng và điều khiển
hàng tồn kho
19
Một số nền tảng

MapReduce - Bản đồ thu nhỏ

Một chương trình nền tảng được giới thiệu bởi Google

Khai thác tài nguyên đám mây

Được thực hiện trên rất nhiều máy tính, gọi là clusters.
Mỗi cluster được xem như là một nút

Bản đồ thu nhỏ có thể làm việc với dữ liệu có cấu trúc và
dữ liệu không có cấu trúc
20
Một số nền tảng

Apache Hadoop

Được viết trên nền Java và được lấy cảm hứng từ
MapReduce

Nó tạo ra một máy tính chung, với mỗi hệ thống file
Hadoop


Sau đó, nó dùng một giải thuật băm để gom nhóm các dữ
liệu giống nhau

Hadoop có thể tạo một bản đồ phương thức tạo ra những
cặp khóa – giá trị có thể xuất ra một bảng, ra bộ nhớ hay
một tập tin tạm để phân tích.
21
Cơ sở dữ liệu và lưu trữ dữ liệu trên đám
mây

Với sự co giãn của một số các ứng dụng, không phải
ngạc nhiên rằng các công nghệ cơ sở dữ liệu mới
đang được phát triển để hỗ trợ loại tính toán này.

Một số nhà cung cấp dịch vụ điện toán đám mây lớn
đã phát triển cơ sở dữ liệu riêng của họ.
22
Những cơ sở dữ liệu mẫu

Google Bigtable: Đây là loại giống như một bảng
lớn. Bởi vì những bảng có thể lớn hơn, họ chia
những đường biên thành những bảng nhỏ hơn, có
thể là 100 Mb.

Amazon SimpleDB: dịch vụ web này để đánh dấu
và truy vấn dữ liệu. Nó được sử dụng với cả những
sản phẩm của Amazon để lưu trữ, xử lí và truy vấn
dữ liệu trên đám mây.

Cloud-based SQL: Microsoft đã giới thiệu một cơ sở

dữ liệu quan hệ SQL dựa trên nền tảng đám mây
được gọi là SQL Database (SDS).
23
Nhiều cơ sở dữ liệu mã nguồn mở đang
được phát triển

MongoDB ()

CouchDB (cơ sở dữ liệu mà nguồn mở Apache)

LucidDB (kho dữ liệu mã nguồn mở Java/C++)
24
Lưu trữ dữ liệu
o
Hầu hết các công ty sử
dụng cách lưu trữ dữ liệu
tĩnh (local) vì cách lưu trữ
này phù hợp với quy định
lưu trữ hồ sơ trong một vài
năm.
o
Lưu trữ ngoại vi hiếm khi
được sử dụng
o
Đám mây có nhiều mô hình lưu
trữ dữ liệu khác nhau, trong số
đó có một vài mô hình phù hợp
với nhu cầu (có tính sẵn sàng
theo nhu cầu)
25

×