ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Cao Việt Hùng
PHÁT TRIỂN CỔNG GIAO TIẾP ĐIỆN TỬ PHỤC VỤ TRA CỨU THÔNG TIN
CÁ NHÂN
LUẬN VĂN THẠC SỸ
Hà nội, 2006
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Cao Việt Hùng
PHÁT TRIỂN CỔNG GIAO TIẾP ĐIỆN TỬ PHỤC VỤ TRA CỨU THÔNG
TIN CÁ NHÂN
Ngành: Công nghệ thông tin
Mã số: 1.01.10
LUẬN VĂN THẠC SỸ
Người hướng dẫn khoa học :
PGS. TS. Đoàn Văn Ban
Hà nội, 2006
1
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, các số liệu và kết
quả nghiên cứu nêu trong luận văn là trung thực.
Cao Việt Hùng
2
LỜI CẢM ƠN
Lời đầu tiên cho phép tôi bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS.
Đoàn Văn Ban, Viện Công nghệ thông tin đã gợi mở đề tài, hƣớng dẫn và giúp đỡ
tận tình cho tôi trong suốt thời gian nghiên cứu thực hiện luận văn này.
Xin chân thành cám ơn quý thầy cô giáo trƣờng Đại học Công nghệ, quý thầy
cô giáo Khoa Công nghệ thông tin đã trang bị cho tôi những kiến thức khoa học để
hoàn thành luận văn này.
Xin chân thành cảm ơn Lãnh đạo cục C27, Lãnh đạo P4/C27 và các đồng
nghiệp công tác tại Cục C27 - Bộ Công an đã tạo điều kiện và giúp đỡ tận tình để
tôi hoàn thành luận văn.
Lời cảm ơn cuối cùng xin dành cho gia đình, và bạn bè, những ngƣời đã góp
nhiều công lao thầm lặng trong suốt thời gian qua.
Xin chân thành cảm ơn!
Hà Nội, tháng năm 2006
3
MỤC LỤC
LỜI CAM ĐOAN…………………………………………………………………………..1
LỜI CAM ƠN………………………………………………………………………………2
DANH MỤC CÁC KÝ HIỆU CÁC CHỮ VIẾT TẮT……………………………………..6
DANH MỤC CÁC KÝ HIỆU CÁC THUẬT NGỮ………………………………………..7
MỞ ĐẦU…………………………………………………………………………………..10
CHƢƠNG 1.
TỔNG QUAN VỀ CỔNG THÔNG TIN ĐIỆN TỬ(PORTAL) ............. 13
1.1.
Website truyền thống ........................................................................................... 13
1.2.
Giới thiệu về Portal .............................................................................................. 14
1.2.1.
Định nghĩa khái niệm Portal ........................................................................ 14
1.2.2.
Lịch sử phát triển của Portal ........................................................................ 15
1.2.3.
Phân loại Portal ............................................................................................ 17
1.2.3.1.
Phân loại dựa trên cấu trúc nội dung thông tin .................................... 17
1.2.3.1.1. Vertical Portal (Portal theo chiều đứng) ........................................... 17
1.2.3.1.2. Horizontal Portal (Portal theo chiều ngang) ..................................... 18
1.2.3.2.
Phân loại dựa trên mục đích cung cấp thông tin .................................. 19
1.2.3.2.1. Portal công cộng (Public Portal) ....................................................... 19
1.2.3.2.2. Portal doanh nghiệp .......................................................................... 20
1.2.3.2.3. Portal thƣơng mại ............................................................................. 20
1.2.3.2.4. Portal cá nhân.................................................................................... 21
1.2.4.
So sánh Portal và website truyền thống ....................................................... 21
1.3.
Kết luận ................................................................................................................ 23
CHƢƠNG 2.
KIẾN TRÚC PORTAL VÀ NHỮNG THÀNH PHẦN CƠ BẢN .......... 24
2.1.
Các thành phần cơ bản của Portal ........................................................................ 24
2.1.1.
Portlet ........................................................................................................... 24
2.1.2.
Phân loại Portlet và các dịch vụ Web .......................................................... 26
2.1.2.1.
Các Portlet địa phƣơng ........................................................................ 26
2.1.2.2.
Portlet từ xa .......................................................................................... 27
2.1.2.3.
WebService cho các Portal từ xa (WSRP)........................................... 28
2.1.2.4.
Portlet Container .................................................................................. 30
2.1.2.5.
Portal Service ....................................................................................... 30
2.1.2.6.
Portal Server ........................................................................................ 31
2.1.3.
Khung làm việc của hệ thống Portal ............................................................ 33
2.2.
Các dịch vụ cơ bản của Portal.............................................................................. 34
2.2.1.
Cá nhân hoá ................................................................................................. 34
2.2.2.
Tích hợp và liên kết nhiều loại thông tin ..................................................... 35
2.2.3.
Xuất bản nội dung ........................................................................................ 35
2.2.4.
Hỗ trợ nhiều loại thiết bị .............................................................................. 36
2.2.5.
Đăng nhập một lần ....................................................................................... 36
2.2.6.
Quản trị Portal .............................................................................................. 36
2.2.7.
Quản trị ngƣời dùng ..................................................................................... 37
2.2.8.
Vấn đề bảo mật trong Portal ........................................................................ 37
2.2.8.1.
Chứng thực........................................................................................... 37
2.2.8.2.
Cấp quyền ............................................................................................ 38
2.2.8.3.
Hỗ trợ SSO ........................................................................................... 38
2.2.8.4.
Uỷ nhiệm.............................................................................................. 38
4
2.3.
Các bƣớc xây dựng Portal .................................................................................... 39
2.3.1.
Lập kế hoạch ................................................................................................ 39
2.3.2.
Thiết kế tổng thể .......................................................................................... 39
2.3.3.
Phát triển Portal ........................................................................................... 39
2.4.
Các giải pháp xây dựng Portal ............................................................................. 40
2.4.1.
Dựa trên các công cụ phát triển thƣơng mại ................................................ 40
2.4.1.1.
Bea Weblogic Platform 8.0 [7] ............................................................ 41
2.4.1.2.
Microsoft Sharepoint Portal Server [7] ................................................ 42
2.4.1.3.
OracleAs Portal10g [7] ........................................................................ 44
2.4.1.4.
Sun Java System Portal Server 6.2 (JSPS 6.2) [7] ............................... 46
2.4.1.5.
Vignette Aplication Portal 7.0 (VAP 7.0) [7] ...................................... 48
2.4.2.
Dựa trên các công cụ phát triển mã nguồn mở ............................................ 50
2.4.2.1.
Metadot ................................................................................................ 50
2.4.2.2.
Gluecode Advanced Server ................................................................. 51
2.4.2.3.
UPortal ................................................................................................. 51
2.5.
Kết luận ................................................................................................................ 53
CHƢƠNG 3.
CỔNG THÔNG TIN PHỤC VỤ TÌM KIẾM, KHAI THÁC DỮ LIỆU 54
3.1.
Tổ chức dữ liệu trong hệ thống thông tin ............................................................ 54
3.1.1.
Một số mô hình tổ chức CSDL trong hệ thống Client/Server ..................... 54
3.1.1.1.
Mô hình CSDL tập trung ..................................................................... 54
3.1.1.2.
Mô hình CSDL theo kiểu file - server ................................................. 54
3.1.1.3.
Mô hình xử lý từng phần CSDL .......................................................... 55
3.1.1.4.
Mô hình CSDL Client/Server .............................................................. 56
3.1.1.5.
Mô hình CSDL phân tán ...................................................................... 57
3.1.2.
Mô hình tổ chức dữ liệu trong Portal .......................................................... 57
3.1.2.1.
Dữ liệu có cấu trúc ............................................................................... 57
3.1.2.2.
Dữ liệu phi cấu trúc.............................................................................. 58
3.2.
Cơ chế chuyển đổi thông tin giữa các Sever trong Portal .................................... 58
3.2.1.
XML (eXtensible Markup Language) ......................................................... 58
3.2.2.
Công nghệ XSLT (eXtensible Stylesheet Language Transformations) ....... 59
3.3.
Các mô hình khai thác và tìm kiếm thông tin ...................................................... 61
3.3.1.
Mô hình xử lý Master/Slave ........................................................................ 61
3.3.2.
Mô hình xử lý Client /Server ....................................................................... 61
3.3.3.
Mô hình xử lý Server/Server ....................................................................... 62
3.4.
Một số thuật toán tìm kiếm dữ liệu trong hệ thống thông tin phân tán................ 63
3.4.1.
Cấu trúc cơ bản của máy tìm kiếm: ............................................................. 63
3.4.1.1.
Bộ tìm duyệt (Crawler) ........................................................................ 63
3.4.1.2.
Bộ tạo chỉ mục (Indexer module) ........................................................ 64
3.4.1.3.
Bộ phân tích tập (Collection analysis module) .................................... 65
3.4.1.4.
Bộ truy vấn (Query Engine)................................................................. 65
3.4.2.
Phƣơng pháp biểu diễn dữ liệu trong máy tìm kiếm.................................... 65
3.4.2.1.
Biểu diễn chỉ mục nội dung ................................................................. 65
3.4.2.2.
Biểu diễn chỉ mục cấu trúc .................................................................. 65
3.4.2.3.
Xếp hạng và phân tích các liên kết ...................................................... 66
3.4.3.
Hoạt động của máy tìm kiếm Google .......................................................... 67
3.4.3.1.
Bộ phân tích URL (URL resolver) ...................................................... 68
3.4.3.2.
Cấu trúc dữ liệu của Google ................................................................ 68
5
3.4.4.
Mô hình tìm kiếm thông tin trong CSDL phân tán ...................................... 70
3.5.
Kết luận ................................................................................................................ 71
CHƢƠNG 4.
PHÁT TRIỂN CỔNG GIAO TIẾP ĐIỆN TỬ PHỤC VỤ TRA CỨU
THÔNG TIN CÁ NHÂN ..................................................................................................... 73
4.1.
Yêu cầu khai thác, tìm kiếm thông tin của đơn vị ............................................... 73
4.1.1.
Yêu cầu khai thác thông tin ......................................................................... 73
4.1.1.1.
Yêu cầu khai thác thông tin của các đơn vị nghiệp vụ trong ngành .... 73
4.1.1.2.
Yêu cầu khai thác thông tin của các đơn vị nghiệp vụ ngoài ngành .... 74
4.1.1.3.
Yêu cầu khai thác thông tin của các ngƣời dân ................................... 75
4.1.2.
Mô hình hoá các yêu cầu ............................................................................. 76
4.1.3.
Mô hình thực tế tại đơn vị............................................................................ 78
4.2.
Tối ƣu hoá hệ thống CSDL .................................................................................. 85
4.3.
Xây dựng chƣơng trình ........................................................................................ 88
4.3.1.
Các modul chƣơng trình .............................................................................. 88
4.3.2.
Giao diện cổng thông tin .............................................................................. 90
KẾT LUẬN………………………………………………………………………………..97
TÀI LIỆU THAM KHẢO…………………………………………………………………99
6
DANH MỤC CÁC KÝ HIỆU CÁC CHỮ VIẾT TẮT
Stt
Từ viết tắt
Nội dung ý nghĩa
1
HTTT
Hệ thống thông tin
2
TTTHDL
Trung tâm tích hợp dữ liệu
3
CPNET
Mạng diện rộng của chính phủ
4
CNTT
Công nghệ thông tin
5
CSDL
Cơ sở dữ liệu
6
Server
Máy chủ
7
Client
Máy trạm
9
User
Ngƣời sử dụng chƣơng trình
10
LAN
Mạng nội bộ
11
WAN
Mạng diện rộng
12
DB
Database
13
PK
Primary Key
14
FK
Foreign Key
15
SSO
Single Sign On
7
DANH MỤC CÁC KÝ HIỆU CÁC THUẬT NGỮ
Stt
1
Thuật ngữ
Portal
Giải thích thuật ngữ
Định nghĩa một cách tƣơng đối, Portal là một phần
mềm ứng dụng web (web-based application) cung cấp
một giao diện mang tính cá nhân hoá cho ngƣời sử
dụng. Thông qua giao diện này, ngƣời sử dụng có thể
khai thác, tìm kiếm, giao tiếp với các ứng dụng, với
các thông tin, và với những ngƣời dùng khác.
Đứng trên khía cạnh công nghệ, Portal ngày nay đƣợc
coi nhƣ là một giải pháp (frame work) mà thông qua
đó chúng ta có thể quy tụ nhiều nguồn thông tin (
thông tin hoặc ứng dụng phần mềm) khác nhau vào
trong một thực thể phần mềm khung (frame work) duy
nhất - phần mềm Portal.
2
Kênh thông tin
Kênh thông tin trên Portal đƣợc hiểu nhƣ là một nguồn
( Channel)
cung cấp thông tin cho Portal. Về mặt hiển thị, kênh
thông tin là một cửa sổ nhỏ chứa thông tin và ứng
dụng. Kênh thông tin là nơi hiển thị thông tin dạng
Web và có các tính năng sau:
Cơ chế tự tải về.
Cơ chế tự động cập nhật.
Cá nhân hoá.
Mỗi kênh thông tin thường sẽ bao gồm các thành phần
sau:
Khung bao (border): có các thuộc tính kiểu,
màu sắc, kích cỡ, vị trí.
8
Nền (background): có các thuộc tính mầu sắc,
kiểu, ảnh nền.
Tiêu đề ( caption): có các thuộc tính tên, kiểu,
mầu sắc, biểu tƣợng, nền, chứa các nút thu nhỏ,
đóng, about.
Nội dung (content): bao gồm các nội dung
thông tin chính của kênh theo mục đích thiết
kế, sử dụng. Ví dụ: tin tức, sự kiện; liên kết;
thông báo; văn bản; danh bạ; diễn đàn; tìm
kiếm;…
3
Tham số kênh
Tham số kênh là các tham số cần truyền cho dịch vụ
(Channel
kênh trƣớc khi kích hoạt dịch vụ kênh.
parameters)
Ví dụ kênh dịch vụ WebMail cần 3 tham số:
Username, Password và MailBox. Ngƣời dùng không
thể sử dụng dịch vụ mail nếu nhƣ không có các tham
số này.
4
Cá nhân hoá
Các thành viên đã đăng ký có thể xây dựng riêng một
(Personlization)
khu vực cá nhân hoá trên cộng đồng Portal nhờ vào
các chức năng hệ thống để lọc hoặc thay đổi các thông
tin cần đƣợc hiển thị tuỳ thuộc vào vai trò của cá nhân
hoặc quyền hạn của nhóm, cộng đồng hoặc hiệp hội
mà cá nhân đó tham gia.
Tính cá nhân hoá thể hiện trên các khía cạnh chủ yếu
sau:
Hình thức hiển thị (layout): Ngƣời sử dụng
đƣợc quyền sắp xếp, tổ chức lại cách thức hiển
thị thông tin trên Portal theo ý muốn của mình.
9
Nội dung thông tin và dịch vụ: Ngƣời sử dụng
đƣợc quyền lựa chọn chỉ để hiển thị những
thông tin và dịch vụ mà họ thực sự quan tâm.
5
Tuỳ biến
Ngƣời sử dụng có thể thay đổi màu sắc, giao diện nền,
(Customization)
tính chất phông chữ hoặc chọn một mẫu hiển thị có
sẵn (skin, theme, template). Việc tuỳ biến giao diện
nằm hoàn toàn về phía ngƣời sử dụng, trong khi cá
nhân hoá chủ yếu dựa vào các chức năng hệ thống.
6
Đăng nhập một
Là một đặc điểm rất quan trọng của Portal, đăng nhập
lần
một lần giúp ngƣời dùng có thể thâm nhập các dịch vụ
(Single Sign On) mà không cần đòi hỏi đăng nhập từng dịch vụ cụ thể.
Ví dụ với một account duy nhất ngƣời dùng có thể
truy cập các dịch vụ Hỏi đáp, Diễn đàn, nhắn tin,…
mà không có bất cứ một yêu cầu đăng nhập mặc định
của các dịch vụ đó.
10
MỞ ĐẦU
Cùng với sự phát triển mạnh mẽ của Internet, công nghệ Web đã và đang đóng
góp rất lớn vào việc phổ cập thông tin (nhƣ giới thiệu tin tức, tra cứu dữ liệu), thực
hiện các giao dịch và một số chƣơng trình ứng dụng trên mạng. Các website đã làm
thay đổi cả thế giới từ khi xuất hiện vào đầu những năm 1990 của thế kỷ trƣớc.
Ngày nay mọi giao tiếp thông qua website đã trở thành phổ biến.
Tuy nhiên, những năm gần đây, lƣợng khổng lồ website (trang thông tin điện
tử) của các tổ chức, công ty và cá nhân ra đời dẫn đến hệ quả quá tải thông tin.
Ngƣời sử dụng phải xử lý khối lƣợng rất lớn thông tin không cần thiết, với hàng loạt
thao tác trùng lặp trƣớc khi tìm thấy thông tin hữu ích. Theo thống kê, khối lƣợng
thông tin trên Internet đang tăng gấp đôi mỗi năm, và ngƣời dùng Internet sử dụng
trung bình 60% thời gian để tìm kiếm thông tin, 20% thời gian tìm hiểu thông tin có
cần thiết không và chỉ 10% thời gian xử lý thông tin.
Không đáp ứng đƣợc nhu cầu tích hợp ứng dụng và tích hợp hệ thống là hạn
chế lớn nhất của các website. Ngƣời dùng khó khăn trong việc tìm kiếm thông tin
và dịch vụ trực tuyến. Chủ nhân của các website cũng gặp rất nhiều khó khẳn trong
vấn đề quản lý và bảo trì các website của mình, do sự tăng trƣởng đến chóng mặt
của thông tin và mong muốn đƣa nhiều dịch vụ trên các website của họ. Các thông
tin dữ liệu cung cấp qua Internet (hoặc intranet) cần phải đƣợc phân loại sắp xếp
phù hợp với nhu cầu tìm thông tin của ngƣời dùng, theo hƣớng ngày càng gần với
nhu cầu của đời thƣờng, mà không phải là những thông tin khô cứng đƣợc sắp xếp
theo ngôn ngữ hoặc cách hiểu biết của những nhà kỹ thuật. Bên cạnh đó, mỗi
website cung cấp những dịch vụ và ứng dụng khác nhau gây ra những phiền hà, bối
rối cho ngƣời dùng khi họ phải nhớ quá nhiều tên và mật khẩu để có thể truy xuất
thông tin hoặc sử dụng dịch vụ của các hệ thống khác nhau.
Những bất cập trên cùng hàng loạt yêu cầu cấp thiết khác nảy sinh từ thực tế
phát triển của mạng Internet cũng nhƣ từ cộng đồng ngƣời sử dụng đã khai sinh một
11
khái niệm mới, đồng thời cũng là một xu hƣớng công nghệ mới: Portal (thƣờng
đƣợc gọi là cổng giao tiếp điện tử).
Có thể hình dung, Portal nhƣ là một cổng tới các trang Web, cho phép một
khối lƣợng lớn các thông tin sẵn có trên Internet và các ứng dụng đƣợc tích hợp,
đƣợc tuỳ biến, đƣợc cá nhân hoá theo mục đích của ngƣời sử dụng. Khi một tổ chức
cần tập hợp thông tin hƣớng tới ngƣời sử dụng riêng biệt, phân tích cách sử dụng
thông tin, tập hợp và quản lý thông tin, ta có thể sử dụng Portal để đạt đƣợc các yêu
cầu này. Portal tạo khả năng chăm sóc ngƣời dùng tốt hơn, đồng thời tạo ra mối
quan hệ giữa các nhà cung cấp, các tổ chức thƣơng mại, dịch vụ và các cơ quan
quản lý, công quyền với nhau. Chẳng hạn www.yahoo.com là một ví dụ về Portal
trong đó ngƣời dùng có thể cá nhân hoá các thông tin, khai báo các dịch vụ mà
ngƣời sử dụng quan tâm nhƣ: email, chat, chứng khoán, thông tin kinh tế, thời sự,
giải trí, thời tiết…v.v; đặc biệt nó còn chứa các tiện ích tìm kiếm, các ứng dụng
thƣơng mại điện tử.
Portal ngày nay đang đƣợc ứng dụng phổ biến trong các lĩnh vực nhƣ chính
phủ điện tử, thƣơng mại điện tử, đào tạo trực tuyến…Ngày càng có nhiều hãng sản
xuất cung cấp các sản phẩm Portal. Theo thống kê thị trƣờng Portal trong năm 2000
là 4,5 tỷ USD và đạt 14,8 tỷ USD vào năm 2002. Một nền công nghiệp Portal đang
thực sự bắt đầu. Tuy vậy hiện vẫn chƣa có một chuẩn công nghệ hay một hãng sản
xuất cũng nhƣ sản phẩm nào thực sự chiếm ƣu thế.
Xuất phát từ nhu cầu thực tế tại đơn vị công tác, tôi hƣớng nghiên cứu của
mình vào các vấn đề liên quan tới thiết kế, xây dựng các cổng thông tin điện tử, đặc
biệt là lĩnh vực tổ chức dữ liệu và các giải pháp kỹ thuật hỗ trợ khai thác và tìm
kiếm dữ liệu trên cổng thông tin điện tử. Trên cơ sở các kết quả nghiên cứu sẽ xây
dựng cổng thông tin phục vụ tác nghiệp tại đơn vị.
Với lý do nhƣ vậy, trong khuôn khổ luận văn này, định hƣớng nghiên cứu của
tôi đƣợc xác định với những nội dung sau:
12
Chƣơng 1: Tổng quan về Cổng thông tin điện tử (Portal).
Nêu những vấn đề tổng quan nhất về công nghệ Portal gồm: các khái niệm,
định nghĩa, đặc trƣng, phân loại Portal.
Chƣơng 2: Kiến trúc của Portal và những thành phần cơ bản.
Phân tích các thành phần cơ bản của một Portal và cách thức vận hành của
chúng để cung cấp các dịch vụ đặc trƣng; Các giải pháp phát triển Portal.
Chƣơng 3: Cổng thông tin phục vụ tìm kiếm, khai thác dữ liệu.
Tìm hiểu tổ chức CSDL trong hệ thống thông tin phân tán; Thiết lập cơ chế
chuyển đổi thông tin tự động giữa các sever; Một số giải thuật tìm kiếm thông tin
trên hệ thống thông tin phân tán.
Chƣơng 4: Phát triển Cổng giao tiếp điện tử, phục vụ tra cứu thông tin cá
nhân.
Phân tích các yêu cầu và tình hình tực tế tại đơn vị; từ đó đề xuất giải pháp xây
dựng khả năng tìm kiếm thông tin cá nhân trên tập hợp các cơ sở dữ liệu tại đơn vị.
13
CHƢƠNG 1. TỔNG QUAN VỀ CỔNG THÔNG TIN ĐIỆN
TỬ(PORTAL)
1.1. Website truyền thống
Website đã và đang đóng góp rất lớn vào việc phổ cập thông tin, nhƣ giới thiệu
tin tức, các cơ sở dữ liệu, và một số chƣơng trình ứng dụng trên mạng. Website đã
làm thay đổi cả thế giới từ khi xuất hiện vào đầu những năm 90 của thế kỷ trƣớc.
Ngày nay mọi giao tiếp thông qua website đã trở thành phổ biến. Tuy nhiên, chúng
ta có thể mạnh dạn gọi một số lớn các website là “website truyền thống” bởi những
mặt tồn tại do công nghệ cũ để lại.
Ngƣời dùng đã và đang phải chấp nhận với “sự quá tải thông tin” có nghĩa là
ngƣời dùng thƣờng phải duyệt qua rất nhiều các website khác nhau, phải xử lý một
khối lƣợng khổng lồ các thông tin để tìm ra thông tin mà mình cần.
Ngƣời dùng phải chấp nhận là các thông tin thƣờng đứng độc lập, không thể
phân loại đƣợc (taxonomy), dẫn đến rất khó chia sẻ thông tin cho nhau. Lý do của
vấn đề trên là cách trình diễn thông tin (format) trên các website thƣờng là rất khác
nhau.
Việc quản lý, bảo trì và phát triển các website thƣờng gặp nhiều khó khăn do
sự tăng trƣởng đến chóng mặt của thông tin trên các website.
Khó có thể tích hợp các thông tin, dịch vụ từ nhiều nơi nhƣ từ các trung tâm
một cửa, từ các đơn vị trực thuộc,… lên một nơi để từ đó ngƣời dân có thể tìm thấy
các thông tin, dịch vụ cho mình.
Là điểm xuất phát trong lộ trình mà ngƣời dùng đi tìm thông tin (departure), và
đƣợc dẫn trên mạng qua các link.
Không tạo đƣợc quan hệ, ngƣời dùng không gắn bó với chủ nhân của Website
(không có tính cá nhân hoá).
14
Thích hợp cho phổ biến thông tin hơn là cung cấp môi trƣờng cộng tác cho
ngƣời dùng.
Qui mô dịch vụ nhỏ, không bảo toàn đầu tƣ. Khi yêu cầu thay đổi về nội dung
thông tin, loại hình dịch vụ,.v.v… thƣờng phải xây dựng lại Website mới.
Không có khả năng cung cấp một nền tảng để từ đó có thể luôn luôn phát triển
và mở rộng.
Tóm lại, website đã đƣợc phát triển bằng các công nghệ cũ và mới, trong đó có
nhiều công nghệ đã lỗi thời. Điều căn bản là website KHÔNG có nền tảng công
nghệ tích hợp để hỗ trợ tính chất phát triển kế thừa và khả năng ghép nối để mở
rộng.
1.2. Giới thiệu về Portal
1.2.1.
Định nghĩa khái niệm Portal
Hiện nay có rất nhiều cách hiểu và định nghĩa khái niệm Portal. Mỗi một tổ
chức hay hãng phát triển phần mềm lại có những định nghĩa riêng về Portal và chƣa
có định nghĩa nào đƣợc coi là chuẩn xác.
Theo định nghĩa của IBM [12]: Portal là giao diện dựa trên nền web được tích
hợp và cá nhân hoá nhằm cung cấp cho người dùng một khối lượng lớn các dữ liệu,
tri thức và các dịch vụ thông qua một điểm truy cập duy nhất trong mọi thời điểm
và vị trí với sự hỗ trợ của các thiết bị có khả năng kết nối Web.
Khái niệm về Portal do Sun đƣa ra trong tài liệu về JSR 168 [13] nhƣ sau:
Portal là một ứng dụng nền web cung cấp các tính năng: cá nhân hoá, đăng nhập
một lần, tích hợp thông tin từ nhiều nguồn khác nhau và đưa vào tầng trình diễn
của hệ thống thông tin. Tích hợp thông tin có nghĩa là hợp nhất nội dung từ nhiều
nguồn thông tin khác nhau vào trong một trang web. Tính năng cá nhân hoá tinh vi
được xây dựng trong Portal nhằm cung cấp khả năng cá nhân hoá nội dung cho
người dùng. Các trang Portal có thể có nhiều Portlet khác nhau tạo nội dung cho
những người dùng khác nhau.
15
Theo một định nghĩa tƣơng đối phổ biến (tại Việt Nam) [8] thì khái niệm
Portal, hay Vortal (Vertical Portal - cổng thông tin cho riêng một ngành, một lĩnh
vực nào đó), hoặc Hortal (Horizontal Portal - cổng thông tin nhiều chủ đề, nhiều
lĩnh vực, phục vụ cho nhiều đối tượng khách hàng khác nhau) là một điểm truy cập
với giao diện web, cho phép người dùng khai thác hiệu quả một khối lượng lớn tài
nguyên thông tinvà dịch vụ. Đó không đơn giản chỉ là một trang HTML chứa liên
kết đến các tài nguyên, mà là một nền tảng công nghệ cho phép tích hợp toàn bộ
thông tin và các ứng dụng chạy trên web, đồng thời cung cấp khả năng tuỳ biến cho
từng đối tượng sử dụng, cho phép khai thác thông tin hiệu quả nhất, nhanh nhất và
thân thiện nhất.
Trong các định nghĩa đều nêu ra đặc trƣng cơ bản của mọi Portal là cung cấp
thông tin chính xác cho ngƣời dùng (có thẩm quyền) vào thời điểm thích hợp. Portal
phải lấy đƣợc dữ liệu từ các hệ thống tích hợp, truyền tải dữ liệu này vào các giao
diện đã đƣợc cá nhân hoá và cho phép ngƣời dùng tƣơng tác với dữ liệu từ bất kỳ
nơi đâu, vào bất kỳ thời điểm nào. Một Portal nói chung phải cung cấp đƣợc các
dịch vụ (nhƣ tin tức, tìm kiếm, thƣ mục phân loại tin, mail, diễn đàn, hội thoại, hội
thảo, lịch làm việc, …) và đáp ứng đƣợc các yêu cầu: tuỳ biến hoá; tạo khả năng
tƣơng tác tối đa giữa ngƣời dùng và các nguồn thông tin, giữa ngƣời dùng với các
ứng dụng tác nghiệp và giữa các ứng dụng với nhau; tích hợp nhiều công nghệ ứng
dụng; đảm bảo tính mở về công nghệ; quản trị nội dung; bảo mật; hỗ trợ các cộng
đồng ảo; …
1.2.2.
Lịch sử phát triển của Portal
Từ khi xuất hiện, công nghệ Portal đã và đang phát triển qua ba thế hệ:
Thế hệ thứ nhất: Giai đoạn này Portal tập trung vào cung cấp nội dung, tài
liệu web. Ví dụ về thế hệ đầu tiên là Yahoo, Lycos và Excite. Trong môi trƣờng hợp
tác chúng tƣơng tự nhƣ một đối tƣợng cung cấp giao diện đơn tới các thông tin hợp
tác chẳng hạn nhƣ: tin tức về công ty, địa chỉ liên lạc của ngƣời lao động, các tài
liệu chính sách khác.
16
Thế hệ thứ hai: Tập trung vào các ứng dụng, thông tin cụ thể. Nếu nhƣ ở thế
hệ thứ nhất chỉ nói đến cung cấp nội dung thì ở thế hệ thứ hai đã xuất hiện khái
niệm cung cấp dịch vụ. Và một tính năng đặc biệt quan trọng trong thế hệ này đó là
sự hợp tác. Portal hợp tác (Corporate Portal) tạo khả năng các đội ngũ làm việc
trong một văn phòng ảo. Văn phòng ảo ở đây nghĩa là Portal cung cấp khả năng
giao tiếp, tƣơng tác giữa các nhóm làm việc từ xa qua mạng mà không cần phải trực
tiếp làm việc với nhau. Chúng còn cung cấp các dịch vụ quản trị nội dung đi cùng
với các dịch vụ hợp tác nhƣ: chat, email, chia sẻ thời gian biểu, định nghĩa các mối
liên hệ ngƣời sử dụng.
Thế hệ thứ ba: Đáp ứng hầu hết các chức năng, tiến tới một Portal tích hợp dữ
liệu, âm thanh, hình ảnh qua mạng không dây. Portal thế hệ này hƣớng tới tích hợp
máy chủ ứng dụng. Nó tích hợp nội dung, các ứng dụng và cả các dịch vụ hợp tác
vào một điểm cá nhân. Trong đó các dịch vụ hợp tác đƣợc hiểu nhƣ là các dịch vụ
tạo khả năng giao tiếp liên lạc, chia sẻ thông tin giữa cá nhân với nhau, giữa cá nhân
với tổ chức, giữa các tổ chức với nhau. Ví dụ nhƣ dịch vụ e-mail, chat, tài liệu
nhóm hội thảo, báo cáo, thƣ báo,…Ngoài ra chúng còn cung cấp truy cập tới nhiều
kiểu thiết bị khác nhau và thông báo với cộng đồng ngƣời sử dụng khác nhau những
gì dịch vụ cần. Chúng trợ giúp đầy đủ đối với các nội dung và ứng dụng đã đƣợc
lựa chọn trong giao diện ngƣời dùng cá nhân. Chúng cũng cung cấp sự cá nhân hoá
một cách tự động thông qua các phƣơng tiện, các quy tắc. Chìa khoá để tiến tới sự
phát triển xa hơn đó là môi trƣờng làm việc mở cho các ứng dụng công cộng.
Xu hƣớng “tiến hoá” chung của website theo hƣớng tiến đến Portal đƣợc trình
bày trong hình:
17
Platform cộng tác điều hành
Tích hợp nội dung và dịch vụ
Ngƣời dùng và
Nạp, thu thập các ứng dụng
Thu tập nội dung
Thêm ứng dụng
dần dần
Web truyền
thống và dịch vụ
Tập trung vào
nội dung
Cá nhân hoá
Rất nhiều
Vendor ra đời
1998 - 1999
Nỗ lực E-Gov,
Quan tâm đến
một vài hãng về
Portal
Bắt đầu tổng hợp
kết quả và nâng
cấp
2000 - 2001
quy trình
Tích hợp
Nhiều loại User
Tập trung vào
nền công
nghệ(Platform)
và Workflow
Portal front-end
với qui trình tác
nghiệp chính
Cộng tác xuyên
suốt các áp dụng
và địa bàn
Sử dụng tối đa
các áp dụng
trong cơ quan
Chuẩn và tƣơng
tác đƣợc
Dùng
Webservice
2002 - 2003
2003 +
Hình 1.1: Minh hoạ Xu hướng “tiến hoá” chung của website theo hướng
tiến đến Portal
1.2.3.
Phân loại Portal
1.2.3.1. Phân loại dựa trên cấu trúc nội dung thông tin
1.2.3.1.1.
Vertical Portal (Portal theo chiều đứng)
Portal theo chiều đứng cung cấp truy cập tới rất nhiều thông tin và dịch vụ
khác nhau về một lĩnh vực riêng.
Ví dụ nhƣ Portal của một bộ, ngành cung cấp các thông tin và dịch vụ chuyên
ngành riêng; các Portal cung cấp các thông tin và các dịch vụ liên quan đến một
chủng loại hàng. chẳng hạn nhƣ www.wine.com cung cấp thông tin về các loại
rƣợu, các dịch vụ đóng gói và gửi quà là rƣợu, mua bán rƣợu v.v…
18
Hình 1.2: Minh hoạ Portal theo chiều đứng với website www.wine.com
1.2.3.1.2.
Horizontal Portal (Portal theo chiều ngang)
Portal theo chiều ngang cung cấp các thông tin và dịch vụ đa dạng, rộng khắp,
kết nối nhiều nguồn tài nguyên khác nhau, ví dụ nhƣ các Portal của một địa phƣơng
sẽ cung cấp mọi thông tin và dịch vụ trên địa bàn nhƣ tin tức, thông tin giới thiệu,
thông tin hƣớng dẫn, dịch vụ trực tuyến, …
Portal loại này cũng có thể là các MegaPortal, nhằm vào các đối tƣợng ngƣời
dùng khác nhau trên Internet, có khả năng đáp ứng rất nhiều các dịch vụ thông
thƣờng tạo khả năng tích hợp các Portal theo chiều đứng. Chẳng hạn nhƣ
www.yahoo.com, www.lycos.com và www.nestcape.com là các MegaPortal.
Những site này thƣờng chứa các tiện ích tìm kiếm và tạo khả năng cho ngƣời sử
dụng cá nhân hoá trang web bằng việc đáp ứng rất nhiều kênh (ví dụ nhƣ truy cập
tới các lĩnh vực thời tiết, chứng khoán, tin tức cập nhật). Những nhà cung cấp các
MegaPortal hy vọng những ngƣời sử dụng riêng biệt tới website của họ, trƣớc tiên
là truy cập tới những thông tin giải trí trên Internet.
19
Portal khách
hàng
Portal B2B
Portal cho
ngƣời lao
động
Portal cho
các nhà đầu
tƣ
Cơ sở hạ tầng Portal theo chiều ngang
Hình 1.3: Portal theo chiều ngang dùng làm cơ sở hạ tầng cho các
Portal chiều đứng
Hình 1.3: Ví dụ về một mô hình mà Portal theo chiều ngang đóng vai trò làm
cơ sở hạ tầng trong đó chứa các Portal theo chiều đứng, chuyên về một lĩnh vực cụ
thể.
1.2.3.2. Phân loại dựa trên mục đích cung cấp thông tin
Về mặt thực tế, một Portal đƣợc tích hợp rất nhiều thông tin, dịch vụ, tính
năng. Tuy vậy ta có thể tạm chia Portal ra thành các dạng sau:
1.2.3.2.1.
Portal công cộng (Public Portal)
Chia thành hai loại công cộng chính:
Các Portal công cộng nói chung hoặc “siêu” Portal nhắm đến toàn bộ những
ngƣời có khả năng sử dụng Internet ví dụ nhƣ Yahoo, Google, Overture, Altavista,
AOL, MSN, Excite,… Đặc trƣng cơ bản của các Portal này là cung cấp mọi dịch vụ
thông thƣờng mà ngƣời dùng Internet có nhu cầu nhƣ: thƣ điện tử, chat, lịch cá
nhân,…
Portal công nghiệp (có mô hình Portal theo chiều dọc): là cổng tập trung vào
một lƣợng ngƣời dùng có quan tâm đặc biệt đến một lĩnh vực nhất định nào đó nhƣ
hàng tiêu dùng, máy tính, bảo hiểm, ngân hàng,…Đặc trƣng của cổng ngành dọc là
20
cung cấp các thông tin và dịch vụ cụ thể theo các yêu cầu của một ngành hoặc một
lĩnh vực nào đó.
1.2.3.2.2.
Portal doanh nghiệp
Portal EIP (Corporate/Enterprise (Intranet) Portal – EIP) là các Portal đƣợc
thiết kế dành cho các doanh nghiệp mong muốn xây dựng đƣợc mối quan hệ chặt
chẽ với cả nhân viên, khách hàng và đối tác của doanh nghiệp. Quan hệ ở đây
không chỉ gói gọn trong quan hệ hai chiều giữa hai bên mà còn bao gồm cả tiến
trình xử lý và các hoạt động quản lý của doanh nghiệp. EIP cũng hợp nhất các quá
trình, các tiến trình công việc, sự cộng tác, quản lý nội dụng, sƣu tập và lƣu trữ dữ
liệu, các ứng dụng của công ty và các giải pháp doanh nghiệp thông minh (Business
intelligence). EIP cho phép nhân viên có thể truy cập vào nhiều Portal khác nhau
nhƣ Portal thƣơng mại điện tử (Ebusiness Portal), Portal cá nhân (Personal Portal)
và Portal công cộng (Public Portal). Sự kết hợp giữa các Portal độc lập hoặc nhóm
thành một giải pháp Portal cố kết (Cohensive Portal Solution) đƣợc gọi là Federated
Portal. EIP cũng cho phép truy cập đến các nội dung đƣợc cung cấp từ bên ngoài
bởi những ngƣời không phải là nhân viên của công ty. Ví dụ nhƣ các thông tin phản
hồi.
1.2.3.2.3.
Portal thương mại
Portal thƣơng mại mở rộng quan hệ của doanh nghiệp tới khách hàng cũng nhƣ
các đối tác và nhà cung cấp. Cổng thƣơng mại điện tử thiết lập các chợ ảo cung cấp
các dịch vụ thƣơng mại liên quan đến cộng đồng ngƣời mua, ngƣời bán và cả ngƣời
tạo thị trƣờng trên mạng. Nó cho phép liên kết trực tuyến ngƣời mua với ngƣời bán
bằng việc cung cấp các tin kinh doanh đặc biệt Service Port của Portera vừa là
Portal ứng dụng cho ngành công nghiệp dịch vụ. Saleforce.com của SAP quản lý
các quá trình bán hàng và báo cáo cho một đội bán hàng phân tán. MySap.com của
SAP và oraclesmallbusiness.com của Oracle là các ví dụ của các hệ thống kinh
doanh hoàn chỉnh sử dụng Portal.
21
1.2.3.2.4.
Portal cá nhân
Đây vẫn là một xu hƣớng mới ở Việt Nam và trên thế giới.
Portal di động (Mobility Portals): các Portal này phục vụ việc truy cập web
thông qua các thiết bị điện thoại di động, PDA không dây, máy nhắn tin…Loại
Portal này đang ngày càng trở lên phổ biến và rất quan trọng cho khách hàng cũng
nhƣ nhân viên để có thể lấy đƣợc các thông tin về dịch vụ, sản phẩm, giá cả; tình
trạng đặt hàng, thƣởng phạt, vận chuyển; những thông tin lập kế hoạch và cài đặt.
Portal cho đồ dùng: những Portal này đƣợc truy cập thông qua thiết bị ti vi
(WebTV), thiết bị gắn trên ô tô (Onstart), …
1.2.4.
So sánh Portal và website truyền thống
Dƣới đây là các đặc điểm dể phân biệt Portal với Website truyền thống.
Portal
Website thông
thƣờng
- Hỗ trợ khả năng khả năng đăng nhập một lần tới tất cả
- Một website thông
các tài nguyên liên kết trong Portal
thường không có
Ví dụ: Trong phạm vi một tổ chức doanh nghiệp, các ứng
được khả năng này.
dụng quản lý nhân sự, quản lý tài chính, quản lý khách
Mỗi lần ngƣời dùng
hàng,…đƣợc tích hợp trong môi trƣờng Portal.
vào một ứng dụng
Để tƣơng tác với các ứng dụng này, ngƣời dùng chỉ cần
đều phải đăng nhập
một lần đăng nhập duy nhất cho mỗi phiên làm việc và có
để vào ứng dụng đó.
thể vào tất cả các ứng dụng mà ngƣời dùng đƣợc cấp
Khi chuyển sang ứng
quyền.
dụng khác, ngƣời
dùng sẽ phải đăng
nhập lại.
- Hỗ trợ khả năng cá nhân hoá theo vai trò và nhu cầu
- Thường không hỗ
của người sử dụng.
trợ, nếu có chỉ ở mức
22
Đây là một khả năng quan trọng của Portal để phân biệt
độ rất nhỏ, không
với một website thông thƣờng. Nó cá nhân hoá nội dung
phải là đặc điểm nổi
hiển thị, thƣờng là thực hiện tự động dựa trên các quy tắc
bật.
tác nghiệp của tổ chức; chẳng hạn nhƣ vai trò của ngƣời
sử dụng. Ví dụ khi một ngƣời mua hàng đăng nhập vào hệ
thống nó sẽ chỉ hiện ra những thông tin liên quan đến việc
mua hàng nhƣ danh sách sản phẩm, các form phục vụ
giao dịch… Hoặc ví dụ nếu bạn là nhà khảo cổ học, sau
khi khai báo lĩnh vực quan tâm của mình, Portal sẽ cung
cấp các thông tin về khảo cổ cho bạn.
- Có khả năng tuỳ biến. Đây là một khả năng tiêu biểu
- Một vài website có
của một Portal.
nhưng chỉ dừng lại ở
Ví dụ một Portal có mục thông tin thời tiết, bạn có thể bỏ
mức độ dựng sẵn,
phần thông tin này trên giao diện nếu bạn không quan tâm người dùg chỉ có thể
lựa chọn một vài giao
đến nó; bạn cũng có thể thay đổi cách hiển thị của Portal
nhƣ thay vì hiển thị bằng font chữ màu mặc định bạn có
diện đã có, mà không
thể thay nó bằng chữ màu đỏ, hay có thể tự thay đổi thứ
tự mình thay đổi từng
tự hiển thị các mục, các chức năng. Đặc tính này tƣơng tự
mục một cách tuỳ ý.
nhƣ màn hình desktop của bạn.
- Có khả năng liên kết tới tài nguyên dữ liệu rộng lớn gồm - Mặc dù có các liên
nhiều kiểu dữ liệu, từ dữ liệu thông thường đến siêu dữ
kết để tới các site
liệu.Thông qua các chuẩn giao tiếp, từng thành phần
khác nhưng dữ liệu
hoặc các Portal có thể trao đổi dữ liệu với nhau.
giữa các site đó là rời
rạc, không trao đổi
được với nhau.
- Hỗ trợ rất tốt khả năng liên kết và hợp tác người dùng.
Portal không chỉ liên kết chúng ta với những gì chúng ta
- Không hỗ trợ
23
cần mà còn liên kết với những ngƣời mà chúng ta cần.
Khả năng liên kết này đƣợc thực hiện bởi các dịch vụ hợp
tác.
- Tích hợp các ứng dụng vào hệ thống làm việc:
- Không có
Portal có khả năng tích hợp các ứng dụng để tạo nên một
môi trƣờng làm việc. Chẳng hạn một hệ thống Portal có
thể tích hợp các ứng dụng văn phòng, hội thảo, thƣơng
mại điện tử.v.v…
1.3. Kết luận
Nhiều ngƣời trong chúng ta còn băn khoăn câu hỏi nhƣ “tại sao phải là Portal”,
“tại sao không phải là web site”,... Để hiểu rõ khái niệm Portal luận văn đã nêu
những vấn đề sau:
Giới thiệu các khái niệm Portal: Nêu các định nghĩa về Portal của các hãng
sản xuất Portal trên thế giới cũng nhƣ ở tại Việt Nam, từ đó nhận thức rõ thế nào là
một Portal thực sự mà không phải là một sản phẩm web site đƣợc ngụy trang.
Phân loại Portal: Nhiều ngƣời sử dụng với nhiều mục đích khác nhau thì các
Portal hiện có trên thị trƣờng chỉ có thể đáp ứng theo một khía cạnh, giải quyết theo
một lớp bài toán cụ thể, để từ những căn cứ đó lựa chọn sản phẩm phù hợp với đơn
vị mình.
Tóm lại, triết lý của Portal là “siêu web site” để phục vụ tốt hơn thông qua
quan hệ bình đẳng và tình cảm gắn bó với “siêu web site”, là định hƣớng phục vụ
(user-centric), khác với sự phát triển tự nhiên của web site truyền thống là định
hƣớng trình bày thông tin (data-centric).