BỘ CÔNG THƢƠNG
TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
BÙI QUỐC BẢO
PHÂN TÍCH VÀ ĐÁNH GIÁ MỘT SỐ GIẢI
PHÁP CHO HỆ THỐNG ENTERPRISE
CONTENT MANAGEMENT (ECM)
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã chuyên ngành: 60480101
LUẬN VĂN THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2019
Cơng trình đƣợc hồn thành tại Trƣờng Đại học Cơng nghiệp TP. Hồ Chí Minh.
Ngƣời hƣớng dẫn khoa học: TS. Ngô Hữu Dũng
Ngƣời phản iện 1: TS. Huỳnh Khả Tú
Ngƣời phản iện 2: TS. Tạ Duy Công Chiến
Luận văn thạc sĩ đƣợc bảo vệ tại Hội đồng chấm ảo vệ Luận văn thạc sĩ Trƣờng Đại
học Công nghiệp thành phố Hồ Chí Minh ngày 04 tháng 03 năm 2020
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. PGS.TS. Phạm Thế Bảo - Chủ tịch Hội đồng
2. TS. Huỳnh Khả Tú - Phản biện 1
3. TS. Tạ Duy Công Chiến - Phản biện 2
4. PGS.TS. Nguyễn Hòa - Ủy viên
5. TS. Lê Nhật Duy - Thƣ ký
CHỦ TỊCH HỘI ĐỒNG
TRƢỞNG KHOA CNTT
PGS.TS. Phạm Thế Bảo
PGS.TS. Huỳnh Trung Hiếu
BỘ CƠNG THƢƠNG
TRƢỜNG ĐẠI HỌC CƠNG NGHIỆP
THÀNH PHỐ HỒ CHÍ MINH
CỘNG HÕA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Bùi Quốc Bảo
MSHV: 15118571
Ngày, tháng, năm sinh: 01/01/1983
Nơi sinh: Ninh Thuận
Chuyên ngành: Khoa học máy tính
Mã chuyên ngành: 60480101
I. TÊN ĐỀ TÀI:
Phân tích và đánh giá một số giải pháp cho hệ thống Enterprise Content Management
(ECM)
NHIỆM VỤ VÀ NỘI DUNG:
Nghiên cứu các kiến thức về công nghệ ảo hóa, lƣu trữ, bảo mật, và các giải pháp tối
ƣu về mơ hình, hiệu suất, tính năng sẵn sàng cao (HA) cho hệ thống. Nghiên cứu về
các thành phần cấu tạo nên hệ thống ECM. Từ đó phân tích đánh giá và mô phỏng các
công nghệ cấu thành nên hệ thống ECM cũng nhƣ ứng dụng vào thực tế của giải pháp.
II. NGÀY GIAO NHIỆM VỤ: Theo Quyết định số 1486/QĐ-ĐHCN 25/06/2018
III. NGÀY HOÀN THÀNH NHIỆM VỤ: 15/10/2019
IV. NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Ngơ Hữu Dũng
Tp. Hồ Chí Minh, ngày … tháng … năm 20 …
NGƢỜI HƢỚNG DẪN
CHỦ NHIỆM BỘ MƠN ĐÀO TẠO
TS. Ngơ Hữu Dũng
TRƢỞNG KHOA CNTT
PGS.TS. Huỳnh Trung Hiếu
LỜI CẢM ƠN
Sau thời gian học tập tại trƣờng đại học Công Nghiệp TP. HCM, tôi xin gửi lời cảm
ơn chân thành đến Ban Giám Hiệu, quý Thầy Cô đã nhiệt tình hƣớng dẫn, giảng ạy
và tạo mọi điều kiện thuận lợi giúp đỡ tơi trong suốt q trình học tập, nghiên cứu
hoàn thành đề tài nghiên cứu khoa học này.
Đặc biệt, tôi xin cảm ơn sâu sắc tới TS. Ngô Hữu Dũng, ngƣời Thầy đã trực tiếp
hƣớng dẫn và giúp đỡ tơi trong q trình thực hiện đề tài này và tơi cũng xin cảm ơn
đến Lãnh đạo phịng CNTT tại cơ quan đang công tác đã tạo mọi điều kiện thuận lợi
trong việc hoàn thành đề tài này. Trong quá trình thực hiện nghiên cứu đề tài chắc
chắn khơng tránh khỏi những thiếu sót. Kính mong nhận đƣợc sự đóng góp ý kiến của
q Thầy Cơ, ạn è và đồng nghiệp đề đề tài nghiên cứu của tôi đƣợc hồn thiện
hơn.
Tơi xin trân trọng cảm ơn.
i
TÓM TẮT LUẬN VĂN THẠC SĨ
ECM là hệ thống phần mềm giúp quản lý thông tin phi cấu trúc (không có cấu trúc)
trong tổ chức, doanh nghiệp. Những dữ liệu có cấu trúc nhƣ kế tốn, khách hàng, nhân
sự..., có thể đƣợc quản lý
ằng những hệ thống phổ biến nhƣ ERP (Enterprise
Resource Planning). Trong khi đó, lƣợng dữ liệu phi cấu trúc vẫn còn chiếm một tỉ lệ
lớn từ 70% đến 90%, trong kho thông tin của các tổ chức, doanh nghiệp. Chính vì vậy
các hệ thống ECM ở các nƣớc phát triển đƣợc đánh giá rất cao giúp quản lý đƣợc
phần lớn thông tin, đáp ứng nhu cầu phát triển. Phần mềm ECM đƣợc coi nhƣ là một
trong những giải pháp cần thiết nhất của doanh nghiệp, sau phần mềm kế toán, phần
mềm quản lý án hàng.
Tuy nhiên, hệ thống ECM cần đƣợc triển khai trên một hạ tầng công nghệ thông tin
tƣơng xứng nhằm đảm bảo các yêu cầu về ung lƣợng lƣu trữ, bảo mật an toàn thơng
tin, tốc độ tìm kiếm và truy xuất dữ liệu. Hơn nữa, các yêu cầu cần đảm bảo cân ằng
giữa các khía cạnh về điều kiện kinh tế và kỹ thuật ở hiện tại và tính phát triển theo
tiềm năng của mỗi tổ chức, doanh nghiệp trong tƣơng lai.
Đề tài này phân tích các yêu cầu thiết yếu nhằm xây ựng hạ tầng công nghệ thông tin
cho hệ thống ECM, chúng tôi tập trung nghiên cứu đánh giá các giải pháp tối ƣu, hiệu
suất, tính năng ự phịng sẵn sàng cao (HA) và thực nghiệm mô phỏng cài đặt các
thành phần tạo nên hệ thống ECM.
ii
ABSTRACT
ECM is a software system that helps manage unstructured (unstructured) information
in an organization or business. Structured data such as accounting, customers,
personnel, etc., can be managed by popular systems such as ERP (Enterprise Resource
Planning). Meanwhile, the amount of unstructured data still accounts for a large
proportion from 70% to 90%, in the information warehouse of organizations and
businesses. Therefore, ECM systems in developed countries are highly appreciated to
help manage most of information to meet development needs. ECM software is
considered as one of the most necessary solutions of the enterprise, after accounting
software, sales management software.
However, the ECM system needs to be deployed on an adequate IT infrastructure to
ensure the requirements of storage capacity, information security, speed of searching
and retrieving data. Moreover, the requirements need to ensure a balance between the
current economic and technical conditions and the potential development of each
organization or business in the future.
This project analyzes the essential requirements to build information technology
infrastructure for the ECM system, we focus on the evaluation and evaluation of
optimal solutions, performance, and high availability (HA) and experimentally
simulate the installation of components that make up the ECM system.
iii
LỜI CAM ĐOAN
Trong đề tài này, tôi xin cam đoan đây là q trình nghiên cứu của ản thân tơi ƣới
sự hƣớng dẫn của Thầy TS. Ngô Hữu Dũng ao gồm các kết luận, hình ảnh trong đề
tài là trung thực, không sao chép từ ất kỳ một nguồn nào và ƣới ất kỳ hình thức
nào. Việc tham khảo các nguồn tài liệu (nếu có) đã đƣợc thực hiện trích ẫn và ghi
nguồn tài liệu tham khảo đúng quy định.
Học viên
Bùi Quốc Bảo
iv
MỤC LỤC
MỤC LỤC ...................................................................................................................... v
DANH MỤC HÌNH ẢNH ...........................................................................................viii
DANH MỤC BẢNG BIỂU ............................................................................................ x
DANH MỤC TỪ VIẾT TẮT ........................................................................................ xi
MỞ ĐẦU ........................................................................................................................ 1
1. Đặt vấn đề ................................................................................................................... 1
2. Mục tiêu nghiên cứu ................................................................................................... 2
3. Đối tƣợng và phạm vi nghiên cứu .............................................................................. 2
4. Cách tiếp cận và phƣơng pháp nghiên cứu ................................................................. 2
5. Ý nghĩa thực tiễn của đề tài ........................................................................................ 2
CHƢƠNG 1
TỔNG QUAN ..................................................................................... 3
1.1 Tổng quát về hệ thống ECM .................................................................................... 3
1.1.1 Giới thiệu về hệ thống ECM.................................................................................. 3
1.1.2 Các thành phần cấu thành nên hệ thống ECM ...................................................... 4
1.2 Mơ hình kiến trúc ứng dụng ..................................................................................... 6
1.3 Mơ hình hệ thống ECM ............................................................................................ 8
1.3.1 Sơ đồ kết nối .......................................................................................................... 8
1.3.2 Mô tả chức năng từng Server trong hệ thống ECM .............................................. 9
CHƢƠNG 2
CƠ SỞ HẠ TẦNG HỆ THỐNG ECM ............................................. 10
2.1 Cơng nghệ hệ thống điện tốn hợp nhất Cisco UCS .............................................. 10
2.2 Công nghệ lƣu trữ dữ liệu của hệ thống Netapp..................................................... 14
2.3 Công nghệ chuyển mạch Cisco Nexus trong hạ tầng Datacenter........................... 18
2.4 Công nghệ ảo hóa máy chủ Vmware Vsphere ....................................................... 21
2.4.1 Giới thiệu về cơng nghệ ảo hóa ........................................................................... 21
2.4.2 Các thành phần và chức năng của vSphere ......................................................... 25
2.4.3 VMware vCenter Server ...................................................................................... 26
2.4.4 VMware vSphere Client ...................................................................................... 27
2.4.5 VMware VMotion và Storage VMotion.............................................................. 27
2.4.6 VMware Distributed Resource Scheduler ........................................................... 28
v
2.4.7 VMware High Availability .................................................................................. 29
2.4.8 VMware Fault Tolerance ..................................................................................... 30
2.4.9 vStorage ............................................................................................................... 31
2.5 Cơng nghệ phân tích ảo mật IBM InfoSphere Guardium .................................... 33
CHƢƠNG 3
PHÂN TÍCH CÁC GIẢI PHÁP CHO HỆ THỐNG ECM ............... 36
3.1 Giải pháp cơ sở ành cho Doanh nghiệp ................................................................ 36
3.1.1 Sơ đồ khối kết nối các thiết bị ............................................................................. 36
3.1.2 Giải thích các kết nối thiết bị trong mơ hình cơ sở ............................................. 38
3.1.3 Phân tích các đặc điểm mơ hình cơ sở ................................................................ 38
3.1.4 Phân tích các ƣu nhƣợc điểm mơ hình cơ sở ....................................................... 39
3.2 Giải pháp tiêu chuẩn ành cho Doanh nghiệp ........................................................ 42
3.2.1 Sơ đồ khối kết nối các thiết bị ............................................................................. 42
3.2.3 Giải thích các kết nối thiết bị trong mơ hình tiêu chuẩn ..................................... 43
3.2.4 Phân tích các đặc điểm mơ hình tiêu chuẩn ........................................................ 43
3.2.5 Phân tích các ƣu nhƣợc điểm mơ hình tiêu chuẩn ............................................... 43
3.3 Giải pháp tối ƣu ành cho Doanh nghiệp ............................................................... 45
3.3.1 Sơ đồ khối kết nối các thiết bị ............................................................................. 45
3.3.2 Giải thích các kết nối thiết bị trong mơ hình tối ƣu............................................. 47
3.3.3 Phân tích các đặc điểm mơ hình tối ƣu................................................................ 48
3.3.4 Phân tích các ƣu nhƣợc điểm mơ hình tối ƣu ...................................................... 48
CHƢƠNG 4
THIẾT KẾ VÀ QUY HOẠCH CƠ SỞ HẠ TẦNG .......................... 50
4.1 Thiết kế mơ hình hệ thống ...................................................................................... 50
4.1.1 Sơ đồ kết nối ........................................................................................................ 50
4.1.2 Thiết kế hệ thống UCS ........................................................................................ 51
4.2 Thiết kế hệ thống ECM .......................................................................................... 55
4.2.1 Thơng tin cấu hình các máy chủ .......................................................................... 55
4.2.2 Thơng tin cấu hình Netapp .................................................................................. 55
4.2.3 Thơng tin cấu hình các máy chủ quản trị hệ thống ............................................. 56
4.2.4 Thông tin các máy chủ ECM ............................................................................... 56
4.3 Thiết kế hệ thống ECM Production ........................................................................ 58
4.3.1 Mô hình thiết kế ECM Production ...................................................................... 58
vi
4.3.2 Thiết kế tài nguyên máy chủ ECM Production ................................................... 58
CHƢƠNG 5
MƠ PHỎNG VÀ PHÂN TÍCH HIỆU SUẤT HỆ THỐNG ............. 60
5.1 Cài đặt và cấu hình hệ thống ECM ......................................................................... 60
5.1.1 Cài đặt và cấu hình các hệ thống nền tảng .......................................................... 60
5.1.2 Một số hệ thống khác .......................................................................................... 62
5.2 Phân tích hiệu suất hoạt động của hệ thống ECM .................................................. 62
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................................... 70
1. Kết luận .................................................................................................................. 70
1.1 Ƣu điểm: ................................................................................................................. 70
1.2 Nhƣợc điểm: ........................................................................................................... 70
2. Kiến nghị................................................................................................................ 71
TÀI LIỆU THAM KHẢO ............................................................................................ 72
PHỤ LỤC ..................................................................................................................... 74
LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN............................................................. 99
vii
DANH MỤC HÌNH ẢNH
Hình 1.1 Sơ đồ kiến trúc ứng dụng ECM ....................................................................... 6
Hình 1.2 Sơ đồ kết nối hệ thống ECM ........................................................................... 8
Hình 2.1 Hệ thống trang thiết bị Cisco UCS ................................................................ 10
Hình 2.2 Hệ thống thiết bị lƣu trữ Netapp .................................................................... 15
Hình 2.3 Các giao thức mạng hỗ trợ kết nối ................................................................ 17
Hình 2.4 Kiến trúc trung tâm ữ liệu Cisco Nexus ...................................................... 18
Hình 2.5 Kiến trúc chuyển mạch trung tâm ữ liệu Cisco Nexus ................................ 19
Hình 2.6 Kiến trúc cơng nghệ vPC ............................................................................... 21
Hình 2.7 Mơ hình ảo hóa VMware ............................................................................... 22
Hình 2.8 Kiến trúc ứng dụng cơng nghệ ảo hóa ........................................................... 24
Hình 2.9 Hệ thống vCenter ........................................................................................... 26
Hình 2.10 Cơng nghệ vMotion ..................................................................................... 28
Hình 2.11 Cơng nghệ DRS ........................................................................................... 29
Hình 2.12 Mơ tả tính năng HA ..................................................................................... 30
Hình 2.13 Hệ thống định dạng lƣu trữ VMFS .............................................................. 32
Hình 2.14 Mơ hình vận hành của IBM InfoSphere Guardium ..................................... 33
Hình 3.1 Mơ hình kết nối cơ sở .................................................................................... 37
Hình 3.2 Mơ hình kết nối tiêu chuẩn ............................................................................ 42
Hình 3.3 Mơ hình kết nối tối ƣu ................................................................................... 46
Hình 4.1 Mơ hình tối ƣu kết nối chi tiết ....................................................................... 50
Hình 4.2 Sơ đồ kết nối hệ thống UCS .......................................................................... 51
Hình 4.3 Sơ đồ kết nối thiết bị Nexus với FI 6248 ...................................................... 52
Hình 4.4 Mơ hình chi tiết kết nối hệ thống ECM ......................................................... 58
Hình 5.1 Hệ thống ECM 01 và ECM 02 ...................................................................... 61
Hình 5.2 Hoạt động CPU của UCS 01 ......................................................................... 63
Hình 5.3 Hoạt động CPU của UCS 02 ......................................................................... 63
Hình 5.4 Hoạt động CPU của UCS 03 ......................................................................... 64
Hình 5.5 Hoạt động CPU của UCS 04 ......................................................................... 64
viii
Hình 5.6 Hoạt động CPU của UCS 05 ......................................................................... 65
Hình 5.7 Hoạt động CPU của UCS 06 ......................................................................... 65
Hình 5.8 Hoạt động Network của UCS 01 ................................................................... 67
Hình 5.9 Hoạt động Network của UCS 04 ................................................................... 67
Hình 5.10 Hoạt động Network của UCS 06 ................................................................. 68
Hình 5.11 Hoạt động Disk của UCS 01 ....................................................................... 69
Hình 5.12 Hoạt động Disk của UCS 04 ....................................................................... 69
ix
DANH MỤC BẢNG BIỂU
Bảng 4.1 Thông tin kết nối giữa FI 6248A đến Controller 01 UCS 5108 ................... 51
Bảng 4.2 Thông tin kết nối giữa FI 6248B đến Controller 02 UCS 5108.................... 52
Bảng 4.3 Thông tin kết nối Port từ Nexus 01 đến FI 6248-01 ..................................... 53
Bảng 4.4 Thông tin kết nối Port từ Nexus 01 đến FI 6248-02 ..................................... 53
Bảng 4.5 Thông tin kết nối Port từ Nexus 01 đến FI 6248-03 ..................................... 53
Bảng 4.6 Thông tin kết nối Port từ Nexus 01 đến FI 6248-04 ..................................... 53
Bảng 4.7 Thông tin kết nối Port từ Nexus 02 đến FI 6248-01 ..................................... 54
Bảng 4.8 Thông tin kết nối Port từ Nexus 02 đến FI 6248-02 ..................................... 54
Bảng 4.9 Thông tin kết nối Port từ Nexus 02 đến FI 6248-03 ..................................... 54
Bảng 4.10 Thông tin kết nối Port từ Nexus 02 đến FI 6248-04 ................................... 55
Bảng 4.11 Thông tin địa chỉ IP các máy chủ ESXi host .............................................. 55
Bảng 4.12 Thông tin địa chỉ IP các Storage ................................................................. 55
Bảng 4.13 Thông tin địa chỉ IP các máy chủ quản trị .................................................. 56
Bảng 4.14 Thông tin địa chỉ IP các máy chủ ECM ...................................................... 56
Bảng 4.15 Thông tin phân ổ tài nguyên các máy chủ ECM ....................................... 58
x
DANH MỤC TỪ VIẾT TẮT
ECM
Enterprise Content Management
FC
Fibre Channel
FCoE
Fibre Channel over Ethernet
FI
Fabric Interconnects
FT
Fault Tolerance
HA
High Availability
HSRP
Host Standby Router Protocol
iSCSI
Small Computer System Interface
UCS
Cisco Unified Computing System
VLAN
Virtual Local Area Network
xi
MỞ ĐẦU
1. Đặt vấn đề
Ngày nay, việc tổ chức, quản lý và lƣu trữ các văn ản, hồ sơ, tài liệu của tổ chức,
doanh nghiệp theo cách thức truyền thống đang trở nên khó khăn và kém hiệu quả
trong tiến trình hội nhập. Trong khi đó theo thống kê từ Bộ Cơng Thƣơng năm 2015,
Việt Nam có khoảng 3,1 triệu tấn giấy đƣợc tiêu thụ mỗi năm, 90% thông tin quan
trọng đƣợc thể hiện trên giấy. Hầu hết các ữ liệu của tổ chức, doanh nghiệp đều ở
dạng phi cấu trúc và khơng thể tìm kiếm, khai thác cũng nhƣ tái sử dụng dễ àng khi
cần thiết.
ECM là một công cụ chính thức để tổ chức và lƣu trữ các tài liệu, cũng nhƣ các nội
ung khác có liên quan đến các quy trình nghiệp vụ trong doanh nghiệp là những
chiến lƣợc, phƣơng pháp và công cụ đƣợc sử dụng để nắm bắt, quản lý và cung cấp
nội ung và các tài liệu liên quan đến quy trình trong oanh nghiệp. ECM bao gồm
quản lý thông tin trong phạm vi tồn ộ một doanh nghiệp, cho ù thơng tin đó đƣợc
thể hiện ƣới bất kỳ hình thức nào: tài liệu giấy, tập tin điện tử, bản in dữ liệu, hoặc
thậm chí cả E-mail.
ECM nhằm mục đích làm cho việc quản lý thông tin oanh nghiệp dễ àng hơn thông
qua cách đơn giản hóa việc lƣu trữ, đảm bảo an ninh, quản lý phiên ản, định tuyến
quy trình nghiệp vụ, và hỗ trợ sử dụng sau này. Các lợi ích rõ rệt của ECM ành cho
doanh nghiệp bao gồm: nâng cao hiệu quả, khả năng kiểm sốt và giảm chi phí. Ví ụ,
nhiều ngân hàng đã chuyển đổi các giấy tờ lƣu trữ bằng giấy trong kho vật lý vào hệ
thống ECM. Theo hệ thống cũ, có thể mất vài tuần để đáp ứng một yêu cầu của khách
hàng cần cung cấp một bản sao kê để kiểm tra: các nhân viên ngân hàng có liên hệ với
kho và xác định vị trí hộp đựng tài liệu, tìm tập tin và kiểm tra, tạo một bản sao và sau
đó gửi E-mail tới bộ phận giao dịch và ngân hàng cuối cùng sẽ gửi E-mail cho khách
hàng. Với một hệ thống ECM hiện đại, nhân viên ngân hàng chỉ đơn giản là tìm kiếm
các hệ thống theo số tài khoản của khách hàng và kiểm tra các thơng tin u cầu. Khi
hình ảnh của kiểm tra xuất hiện trên màn hình, họ có thể ngay lập tức gửi E-mail trả
lời ngay trong khi khách hàng vẫn còn chờ trên điện thoại.
1
2. Mục tiêu nghiên cứu
Nghiên cứu 3 giải pháp về hạ tầng công nghệ thông tin và các giải pháp tối ƣu hóa mơ
hình ứng dụng hệ thống ECM nhằm đáp ứng các tính năng sẵn sàng cao (HA) và ảo
mật.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu là các giải pháp về hạ tầng công nghệ thông tin.
Phạm vi nghiên cứu là các giải pháp tối ƣu hóa hạ tầng cơng nghệ thơng tin. Nghiên
cứu các thiết kế mơ hình từ cơ sở đến các mơ hình tối ƣu nhằm đáp ứng hệ thống
ECM hoạt động trơn tru và hiệu quả.
4. Cách tiếp cận và phƣơng pháp nghiên cứu
Nghiên cứu tài liệu, các mơ hình ứng dụng tƣơng tự bằng thực nghiệm.
Nghiên cứu các tài liệu, hƣớng dẫn về trang thiết bị hạ tầng công nghệ thông tin.
Nghiên cứu các tài liệu về các phƣơng pháp tối ƣu hóa hệ thống.
5. Ý nghĩa thực tiễn của đề tài
Đề tài sau khi nghiên cứu có thể ứng dụng vào thực tế để triển khai một hệ thống
ECM tƣơng tự tại doanh nghiệp hay một số hệ thống khác mà mọi ngƣời có thể sử
dụng các mơ phỏng thực nghiệm để nghiên cứu và phát triển dựa trên các kết quả đã
nghiên cứu.
2
CHƢƠNG 1
1.1
TỔNG QUAN
Tổng quát về hệ thống ECM
1.1.1 Giới thiệu về hệ thống ECM
ECM là một thuật ngữ chung bao gồm quản lý tài liệu, quản lý nội ung We , tìm
kiếm, cộng tác, quản lý hồ sơ, quản lý tài sản kỹ thuật số (DAM), quản lý các luồng
công việc, chụp và quét ảnh. ECM là chủ yếu nhằm quản lý vịng đời thơng tin từ lúc
cơng ố an đầu hoặc đƣợc tạo ra bằng các cách thức thông qua xử lý lƣu trữ và sử
dụng. Ứng dụng ECM đƣợc cung cấp theo 3 cách: phần mềm để cài đặt trên mạng cục
bộ của doanh nghiệp, phần mềm nhƣ một dịch vụ (SaaS) (truy cập qua We các thông
tin qua đƣợc lƣu trữ trên hệ thống của các nhà cung cấp), hoặc giải pháp hỗn hợp bao
gồm phần mềm cục bộ và các thành phần SaaS.
ECM là những chiến lƣợc, phƣơng pháp và công cụ đƣợc sử dụng để nắm bắt, quản
lý, lƣu trữ, bảo quản, và cung cấp nội ung và các tài liệu liên quan đến quy trình
trong doanh nghiệp. ECM bao gồm quản lý thơng tin trong phạm vi tồn ộ một
doanh nghiệp, cho ù thơng tin đó đƣợc thể hiện ƣới bất kỳ hình thức nào: tài liệu
giấy, tập tin điện tử, bản in dữ liệu, hoặc thậm chí cả E-mail.
Tuy nhiên, hệ thống ECM cần đƣợc triển khai trên một hạ tầng công nghệ thông tin
tƣơng xứng nhằm đảm bảo các yêu cầu về ung lƣợng lƣu trữ, bảo mật an tồn thơng
tin, tốc độ tìm kiếm và truy xuất dữ liệu. Hơn nữa, các yêu cầu cần đảm bảo cân ằng
giữa các khía cạnh về điều kiện kinh tế và kỹ thuật ở hiện tại và tính phát triển theo
tiềm năng của mỗi tổ chức, doanh nghiệp trong tƣơng lai. Đề tài này phân tích các yêu
cầu thiết yếu nhằm xây ựng hạ tầng công nghệ thông tin cho hệ thống ECM.
Đồng thời, đề tài cũng đƣa ra một số đánh giá về những giải pháp khả ĩ trong việc
triển khai hệ thống ECM ở các điều kiện khác nhau có tính đến tính cân ằng giữa các
yếu tố kinh tế và kỹ thuật.
Tuy nhiên, tại Việt Nam, mặc ù các oanh nghiệp đã ắt đầu ý thức đƣợc rằng,
chúng ta đang trong thời đại cạnh tranh về thông tin, nhƣng việc quản lý các thông tin
nội bộ chƣa đƣợc đánh giá cao. Điều này ẫn đến các vấn đề nhƣ rò rỉ thông tin, thông
3
tin khơng đƣợc khai thác hiệu quả để có thể ứng dụng thực tiễn vào hoạt động sản
xuất kinh doanh. Hệ thống ECM có thể đƣợc ứng dụng nhằm giải quyết các vấn đề về
quản lý thông tin của doanh nghiệp khi cung cấp các giải pháp nhƣ quản lý tài liệu
(Document Managerment), quản lý luồng công việc (Workflow), quản lý nội dung
web (Web content Managerment), quản lý hồ sơ (Recor s Management).
Những doanh nghiệp đang đi đầu trong ứng dụng ECM là các ngân hàng, tổ chức tín
dụng, giao dịch chứng khốn, cơng ty ảo hiểm. Tại Việt Nam, cũng đi theo quy luật
này. Do tính chất cơng việc, những tổ chức này nhanh chóng nhận ra tính cấp thiết của
một hệ thống quản lý số lƣợng đồ sộ các hồ sơ, giấy tờ, thơng tin oanh nghiệp. Do
đó, các giải pháp số hóa, quản lý và lƣu trữ tài liệu, nhƣ hệ thống ECM, đang ngày
càng trở nên quan trọng và đáp ứng đƣợc sự phát triển nhanh chóng về lƣợng thơng
tin, tần suất giao dịch của các tổ chức, doanh nghiệp. Ngồi ra, hệ thống ECM cịn
nhằm quản lý luồng cơng việc, qui trình nghiệp vụ, vịng đời của thông tin hay nội
dung web một cách chi tiết và khoa học.
1.1.2 Các thành phần cấu thành nên hệ thống ECM
1.1.2.1
Hệ thống
om t
iệ
n o ph
i m
Phát hiện và Phân loại cơ sở dữ liệu: quét các cơ sở dữ liệu trên hệ thống, phát hiện và
phân loại các ữ liệu mang tính chất quan trọng, nhạy cảm.
Đánh giá và Kiện toàn: kiểm tra đánh giá những cơ sở dữ liệu đã phát hiện, so sánh
với những chuẩn kiện toàn trên thế giới và đƣa ra cảnh áo, yêu cầu cập nhật, điều
chỉnh, nâng cấp.
Theo õi và thiết lập chính sách: theo õi những hoạt động truy cập, chỉnh sửa thông
tin trong cơ sở dữ liệu. Áp ụng những chính sách kiểm sốt, ảo vệ, ngăn chặn ngay
cả những ngƣời ùng có tồn quyền trên các cơ sở dữ liệu.
Kiểm tra và áo cáo tập trung: kiểm tra và lập áo cáo toàn ộ các hoạt động trên cơ
sở dữ liệu theo nhu cầu áo cáo riêng hoặc theo các chuẩn áo cáo.
4
1.1.2.2
ệ thống
o
à phục hồi d liệu
Hệ thống ECM đƣợc sao lƣu và phục hồi ữ liệu bằng giải pháp Commvault Simpana
Dữ liệu văn ản scan, tài liệu đƣợc nhập vào hệ thống ECM sẽ đƣợc sao lƣu ở mức
filesystem
1.1.2.3
Hệ thống điện toán hợp nhất của Cisco UCS
Hệ thống Điện toán hợp nhất của Cisco (UCS) đƣợc xây ựng dựa trên nền tảng kết
hợp điện toán, mạng, truy cập lƣu trữ, ảo hóa vào một hệ thống tích hợp
Hệ thống này tích hợp một thiết bị chuyển mạch 10 Giga it Ethernet có độ trễ thấp,
khơng gây mất gói ữ liệu, hợp với các máy chủ của Doanh nghiệp lớn với cấu trúc
x86
1.1.2.4
Hệ thống
t
của Netapp
Với nền tảng hệ điều hành lƣu trữ dữ liệu NetApp Data ONTAP cho phép hoạt động
liên tục, hiệu quả trong lƣu trữ và khả năng mở rộng liên tục theo cụm
1.1.2.5
Hệ thống Ảo hó VMw
V ph
Ảo hóa là một cơng nghệ đƣợc thiết kế để tạo ra một tầng trung gian giữa hệ thống
phần cứng máy tính và phần mềm chạy trên nó.
Ảo hóa cho phép ạn vận hành nhiều máy chủ ảo trên cùng một máy chủ vật lý, ùng
chung các tài nguyên của một máy chủ vật lý qua nhiều môi trƣờng khác nhau.
1.1.2.6
Hệ thống phòng hống virus McAfee MOVE AntiVirus
Cung cấp khả năng quét anti-malware đối với luồng dữ liệu vào và ra của tất cả các
máy chủ ảo hóa.
Chƣơng trình đƣợc quản trị, update qua phần mềm quản lý tập trung McAfee ePolicy.
5
1.2
Mơ hình kiến trúc ứng dụng
Hình 1.1 Sơ đồ kiến trúc ứng dụng ECM
6
Hệ thống ECM trong đề tài này đƣợc nghiên cứu dựa trên nền tảng Filenet P8 của
IBM với khả năng quản lý tài liệu mạnh mẽ và sẵn sàng để sử dụng công việc giúp
bạn nắm bắt, quản lý và chia sẻ nội dung.
Nền tảng FileNet P8 cung cấp các thành phần cơ ản cho các giải pháp quản lý nội
dung doanh nghiệp. Các thành phần này giải quyết quản lý doanh nghiệp nội dung
(ECM) và yêu cầu quản lý quá trình kinh oanh.
Kiến trúc ứng dụng cơ ản của ECM gồm các lớp:
Presentation Layer: Lớp này là lớp tƣơng tác với ngƣời ùng cuối để thu thập
dữ liệu và hiển thị kết quả/dữ liệu thông qua các thành phần trong giao diện
ngƣời sử dụng là IBM Content Navigator & Custom Applications. Lớp này sẽ
sử dụng các ịch vụ do lớp Business Logic cung cấp.
Business Logic Layer: Là lớp thực hiện chính các nghiệp vụ của hệ thống
ECM, bao gồm IBM Content Navigator (xử lý chính các quy trình hồ sơ, cơng
văn ECM), IBM We sphere Portal, Component Intergator (bao gồm các
componance đƣợc tích hợp vào Filenet nhƣ Case Manager, Application Engine,
Workplace XT để xử lý 1 số chức năng trong ECM). Lớp này đƣợc tích hợp
trên nền tảng Java & một số API .NET.
Service layer: là lớp dịch vụ xử lý các kết nối giữa lớp Business logic & Data
layer. Phần quan trong ở lớp này trong hệ thống ECM là Content Platform
Engine đƣợc tích hợp từ Content Engine & Process Engine từ những phiển bản
Filenet trƣớc đây. Tiếp theo là IBM Content Search Service, chịu trách nhiệm
việc đánh chỉ mục & tìm kiếm nội ung văn ản trong hệ thống ECM. Ngồi ra
cịn có IBM Image Service & hệ thống chữ ký số CAG360.
Data layer: là lớp thực hiện các nghiệp vụ liên qua đến lƣu trữ & truy xuất dữ
liệu nhƣ đọc, ghi, cập nhật dữ liệu, bao gồm database hệ thống Filenet, các File
văn ản, hệ thống chỉ mục, thông tin account LDAP, hệ thống OLAP & report.
7
1.3
Mơ hình hệ thống ECM
1.3.1 Sơ đồ kết nối
Hình 1.2 Sơ đồ kết nối hệ thống ECM
Cơ sở dữ liệu (Database) của hệ thống ECM trên máy chủ Database Server sẽ đƣợc
cấu hình replicate giữa 2 datastore.
Các file hồ sơ văn ản trên máy chủ Image Services & CFS-IS sẽ lƣu trữ hình thức
share file.
Các ữ liệu phục vụ làm áo cáo trên máy chủ Reporting DB Server/OLAP/BI Server
sẽ lƣu trữ theo hình thức share volume.
8
Các Server We Portal phục vụ cho ngƣời ùng truy cập từ ên ngoài vào hệ thống
ECM qua đƣờng Internet sẽ thuộc vùng DMZ.
Các Server còn lại của hệ thống ECM sẽ thuộc vùng Internal.
1.3.2 Mô tả chức năng từng Server trong hệ thống ECM
IBM HTTP Server: là máy chủ web hoạt động nhƣ 1 Apache IBM Server.
Application Engine: là 1 máy chủ ứng dụng, layer của hệ thống IBM Filenet, nơi làm
việc của ứng dụng web, java-based applets, các tool phát triển ứng dụng.
Content Engine/Process Engine: gọi chung là Content Platform Engine là thành phần
chính của IBM Filenet đƣợc thiết kế để xử lý các nhu cầu của 1 doanh nghiệp lớn. Nó
cũng cung cấp một bộ các cơng cụ cho phép ạn khởi tạo, chỉnh sửa, quản lý, phân
tích và mơ phỏng các quy trình nghiệp vụ riêng của doanh nghiệp(ECM). Nó ao gồm
2 thành phần chính là Máy nội ung (Content Engine) & Máy quy trình (Process
Engine).
Content Search Engine: là máy chủ Tìm kiếm, phụ trách việc đánh các chỉ mục & xử
lý tìm kiếm trong hệ thống ECM.
Image Services & CFS-IS: là server tổ chức lƣu trữ & quản lý khối lƣợng thông tin cố
định với tính sẵn sàng cao, giúp ngƣời ùng có thể truy cập nhanh các thông tin quan
trọng với tốc độ nhanh hơn.
IBM Case Manager: là cơng cụ chính để phát triển hệ thống ECM. Nó connect đến
Content Platform Engine để truy cập nội ung lƣu trữ & phát triển các quy trình
nghiệp vụ. Giao diện của hệ thống ECM kế thừa giao diện chuẩn của ICM.
Data ase Server: lƣu trữ dữ liệu hệ thống & dữ liệu ngƣời ùng.
Reporting DB Server/OLAP/BI Server: lƣu trữ dữ liệu đƣợc chiết xuất các ữ liệu cần
thiết từ Data ase Server để xây ựng các áo cáo phân tích số liệu cần thiết.
We Portal: là nơi phát triển các ứng dụng mở rộng kết nối với hệ thống ECM.
9
CHƢƠNG 2
2.1
CƠ SỞ HẠ TẦNG HỆ THỐNG ECM
Công nghệ hệ thống điện toán hợp nhất Cisco UCS
Hệ thống Điện toán Hợp nhất của Cisco là một nền tảng trung tâm ữ liệu thế hệ mới
trong đó hợp nhất các chức năng điện toán, mạng, truy cập lƣu trữ và ảo hóa vào trong
một hệ thống tích hợp, đƣợc thiết kế để giúp hạ thấp tổng chi phí sở hữu (TCO) và
nâng cao mức độ uyển chuyển trong hoạt động kinh doanh. Hệ thống này tích hợp một
chuyển mạch mạng hợp nhất 10 Giga it Ethernet có độ trễ thấp, khơng gây mất gói ữ
liệu với các máy chủ ở cấp độ doanh nghiệp dựa trên kiến trúc x86. Hệ thống này là
một nền tảng đa khung máy (multichassis), tích hợp, có khả năng mở rộng trong đó
mọi tài nguyên đều thuộc về một miền quản lý hợp nhất
Đƣợc quản lý ƣới dạng một hệ thống duy nhất ù có chứa một máy chủ hay hàng
trăm máy chủ với hàng nghìn máy ảo, Hệ thống Điện toán Hợp nhất của Cisco tách
biệt giữa quy mô và độ phức tạp. Hệ thống Điện toán Hợp nhất của Cisco tăng tốc độ
cung cấp dịch vụ mới một cách đơn giản, tin cậy và an tồn thơng qua năng lực hỗ trợ
cung cấp và chuyển đổi toàn iện ành cho cả hệ thống đƣợc ảo hóa và hệ thống
khơng đƣợc ảo hóa.
Hình 2.1 Hệ thống trang thiết bị Cisco UCS
10
Hệ thống Điện toán Hợp nhất của Cisco đƣợc thiết kế để đảm bảo:
Giảm chi phí sở hữu thấp hơn ở các cấp độ nền tảng, địa điểm và tổ chức.
Năng suất làm việc của nhân viên và mức độ uyển chuyển trong hoạt động kinh
oanh đều đƣợc nâng cao thông qua năng lực hỗ trợ cung cấp theo nhu cầu và hoạt
động i động ành cho cả môi trƣờng ảo hóa và mơi trƣờng khơng ảo hóa
Một hệ thống tích hợp, đồng nhất đƣợc quản lý, sửa chữa và kiểm thử nhƣ một
thực thể thống nhất
Khả năng mở rộng thông qua một thiết kế ành cho hàng trăm máy chủ phân
tán và hàng nghìn máy ảo, cùng với khả năng mở rộng ăng thông I/O để đáp ứng nhu
cầu
Quản lý Hệ thống tích hợp: Chức năng quản lý đƣợc tích hợp một cách độc đáo vào
trong tất cả các thành phần của hệ thống, cho phép toàn ộ giải pháp đƣợc quản lý
ƣới dạng một thực thể duy nhất thông qua ứng dụng quản lý Cisco UCS
Manager. Cisco UCS Manager cung cấp một giao diện quản lý đồ họa (GUI) trực
quan, một giao diện òng lệnh (CLI) và một giao diện lập trình mở (API) để quản lý
tất cả các cấu hình và hoạt động của hệ thống. Cisco UCS Manager cho phép các nhà
quản trị thiết bị lƣu trữ, quản trị mạng và quản trị máy chủ một cách ễ àng.
Cung cấp theo nhu cầu với các hồ sơ ịch vụ: Cisco UCS Manager triển khai quản lý
dựa trên vai trị và chính sách sử dụng các hồ sơ và khn mẫu dịch vụ.
Các chính sách cơ sở hạ tầng – nhƣ là cấp nguồn và làm mát, an ninh, anh tính, trạng
thái phần cứng, kết nối mạng Ethernet và lƣu trữ – cần thiết cho việc triển khai ứng
dụng đều đƣợc đóng gói trong các hồ sơ ịch vụ. Kiến trúc này giúp nâng cao năng
suất CNTT và mức độ linh hoạt của hoạt động kinh doanh. Giờ đây cơ sở hạ tầng có
thể đƣợc cung cấp trong vịng vài phút thay vì vài ngày, chuyển trọng tâm của CNTT
từ bảo ƣỡng bảo trì sang các chƣơng trình chiến lƣợc.
Chuyển mạch hợp nhất: Cơng nghệ chuyển mạch hợp nhất của Cisco hạ thấp chi phí
thơng qua loại bỏ yêu cầu phải sử dụng nhiều bộ a apter, cáp và chuyển mạch ành
cho các mạng LAN, SAN và mạng điện toán hiệu năng cao. Thiết bị mở
11