Lời nói đầu
Ngày nay với sự phát triển không ngừng của nền tin học thế giới, đã thúc
đẩy quá trình tin học hoá ngày càng được ứng dụng rộng rãi trên mọi lĩnh vực.
Công nghệ thông tin đóng vai trị quan trọng, là nhân tố quyết định sự tồn tại và
phát triển của xã hội. Tin học làm giảm lao động bằng sức lực, tiết kiệm thời
gian, thuận tiện hơn cho công việc của con người. đặc biệt là thu hẹp khoảng
cách không gian giữa con người với con người và môi trường xung quanh.
Từ hàng ngàn năm nay, thư viện luôn là nơi lưu trữ tri thức của nhân loại.
Với nhu cầu học tập ngày càng cao trong khi khả năng cung cấp tài liệu của thư
viện có một số hạn chế. Việc áp dụng công nghệ thông tin vào lĩnh vực thư viện
đem lại nhiều lợi ích cho người đọc,cung cấp tài nguyên tri thức dưới dạng các
văn bản điện tử giúp người đọc dễ dàng tra cứu và sử dụng.Việc xây dựng thư
viện số đòi hỏi rất nhiều công sức do yêu cầu khắt khe trong nghiệp vụ thư viện,
do đó nhiều thư viện đã tận dụng các phần mềm mã nguồn mở và điều chỉnh cho
phù hợp với mục đích của mình.
Do còn nhiều hạn chế về mặt thời gian cũng như kiến thức và kinh nghiệm
nên không thể tránh khỏi nhiều sai sót, em rất mong được sự đóng góp ý kiến
của thầy cô để em hoàn thành đề tài này.
Sinh viên thực hiện: Trần Văn Hiếu
1
Mục lục
Lời nói đầu 1
Mục lục 2
Bảng các từ viết tắt 4
Danh mục hình vẽ 5
CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ 6
1.1. Giới thiệu 6
1.2. Các chuẩn trong thư viện số 6
1.2.1 Biên mục Analog 6
1.2.2 Biên mục digital 7
1.2.2.1 Vai trò c a MARCủ 7
1.2.2.2 Dublin Core 8
1.2.2.3 Nhóm Dublin Core Metadata 9
1.2.2.4 So sánh 2 chu n biên m c MARC v Dublin Coreẩ ụ à 13
1.2.2.5 Chuy n i hai chu n biên m cể đổ ẩ ụ 14
1.3.Sự phát triển của thư viện số hiện nay trên thế giới và ở ViệtNam 16
1.3.1 Giới thiệu chung 16
1.3.2 Loại hình tài liệu 19
1.3.3 Dạng lưu trữ tài liệu 22
CHƯƠNG 2: XÂY DỰNG THƯ VIỆN SỐ 26
2.1. Sơ lược về phần mềm thư viện số 26
2.1.1 Triển vọng 27
2.1.2 Công nghệ và cơ sở hạ tầng 31
2.1.3 Dự án thư viện số 34
2.1.4 Phạm vi của Hệ thống Thư viện Số 35
2.1.5 Hướng dẫn hệ thốn 37
2.2. Các thành phần yêu cầu đối với một hệ thống thư viện số 38
2.2.1 Các máy chủ nhập liệu và xuất bản 39
2.2.2 Các máy chủ đăng ký 40
2.2.3 Các máy chủ tham chiếu, đánh danh mục và biên mục 41
2.2.4 Các máy chủ dữ liệu 42
2.2.5 Máy chủ tính toán và thống kê 43
2.2.6 Máy chủ tính phí 44
2.2.7 Máy chủ chuyển đổi mô tả 44
2.2.8 Hệ thống thư viện cá nhân 47
2.3. Một số phần mềm nguồn mở thư viện số tiêu biểu 47
2.3.1 Phần mềm xây dựng bộ sưu tập Greenstone 47
2.3.2 Phần mềm gặt hái metadata: dlbox 48
2.3.3 Phần mềm truy hồi và quản lý thông tin: SiteSearch 48
2.3.4 Phần mềm chuyển đối MARCDublin Core và Dublin Core-MARC: MarcEdit 49
2.3.5 Biên mục Phần mềm thư viện số DSpace (DSpace Cataloguing) 49
CHƯƠNG 3: XÂY DỰNG BỘ SƯU TẬP THƯ VIỆN SỐ VỚI GREENSTON 51
3.1. Giới thiệu về Greenston 51
3.2 Cách cài đặt Greenstone: 54
3.2.1 Trên Window 54
3.2.2 Trên Linux 55
3.3 Sử dụng phần mềm thư viện số Greenstone để tạo một bộ sưu tậ 56
2
3.3.1 Bộ sưu tập thông ti 56
p 58
3.3.2 Nguyên tắc chọn tài liệu để số 58
bản 63
3.3.3 Tạ và x uất bản bộ s 63
3
Bảng các từ viết tắt
STT Từ viết tắt Diễn giải
1 ANSI American National Standard Institute
2 CANMARC Canada MARC
3 CNTT Công nghệ thông tin
4 DC Dublin Core
5 DLS Digital Library System
6 HTTP Hyper Text Transfer Protocol
7 IE Internet Explorer
8 IFLA International Federation of Library Associations
9 ISO International Standard Organization
10 JRE Java Runtime Environment
11 JSE Java Standard Edition
12 MARC MAchine-Readable Cataloging
13 NGO Non-Governmental Organization
14 OAI Open Archives Initative
15 OAI Open Archives Initative
16 OCR Optical Character Recognition
17 SGML GreenStone Markup Language
18 TV Thư viện
19 UNESCO United Nation Educational Scientific and Cultural
Organization
20 UNIMARC Chuẩn MARC được công nhận bởi IFLA
21 USMARC MARC oF United States
22 WRLC Washington Research Library Consortium
23 WRLC Washington Research Library Consortium
24 XML Extensible Markup Language
4
Danh mục hình vẽ
Hình 1 : Trang giới thiệu bộ sư tập của trường đại học Waitak 18
Hình2 19
Hình 3 : Danh mục tạp chí của nhà xuất bản IIS 20
Hình 4 : Bộ sưu tập Argu 21
Hình5 22
Hình 6 : Thư viện nhạ 23
Hình7 25
Hình 8 : Hệ thống thư viện s 36
Hình9 38
Hình10 55
Hình 11 : Quá trình xây dựng bộ sưu 58
H12 : Cửa sổ ứng dụn 64
Hình13 65
Hình 14 : Chọn chuẩn biên mụ 65
Hình15 67
Hình 16 : Xác định phân loạ 67
Hình17 68
Hình 18 : Xây bộ sưu tậ 69
Hình19 69
Hình 20 : Trang chủ bộ sưu tập được hiển th 70
Hình21 71
Hình 22 : Duyệt bộ sưu tập theo tác gi 71
Hình23 72
Hình 24 : Tìm kiếm trong bộ sưu tậ 72
Hình 25 : Xuất bản bộ sưu tập ra CD-RO 73
5
CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ
1.1. Giới thiệu
Một thư viện số là Một thư viện trong đó những tập hợp được cất giữ trong
những khuôn dạng số (ngược với bản in, dạng thu nhỏ hay phương tiện truyền
thông khác) và có thể tiếp cận bởi những máy tính.Nội dung số được có thể cất
giữ địa phương, hay được truy nhập từ xa qua những mạng máy tính. Một thư
viện số là Một hệ thống tìm tin kiểu thông tin
Thư viện số là tập hợp những bộ sưu tập thông tin của các đối tượng số hoặc
đã được số hóa có tổ chức và tập trung. Tập trung theo đề tài hay chủ đề và có tổ
chức để thông tin dễ truy cập và lưu trữ theo những tiêu chuẩn chuyên biệt cung
cấp hai khả năng chính:
• Phương thức truy cập, chọn lọc, hiển thị tài nguyên số (dành cho người
sử dụng);
• Phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện).
1.2. Các chuẩn trong thư viện số
Giới thiệu về chuẩn biên mục analog,digital.Vai trò của các chuẩn
MARC,Dublin Core và việc chuyển đổi MARC-Dublin Core và Dublin Core
MARC:
1.2.1 Biên mục Analog
• Trong thư viện truyền thống, người ta biên mục để tạo nên những biểu
ghi thư tịch nhằm xây dựng hệ thống tra cứu qua mục lục phiếu. Biểu ghi
thư tịch hay mục lục phiếu miêu tả lý lịch của tài liệu: nhan đề, tác giả, đề
mục, xuất bản, vv… Khi sử dụng máy tính, biểu ghi thư tịch này được biểu
thị bằng một dạng thức máy đọc được (MARC). Cách biên mục này chỉ thể
hiện được dạng thư tịch tức lý lịch chứ không có toàn văn và đa phương
tiện, được gọi là biên mục theo dạng liên liến (analog).
• Phiếu mục lục và kho sách tách rời nhau.
6
• Biểu ghi thư tịch MARC nhằm trao đổi dữ liệu qua máy tính hay trên
mạng máy tính .
1.2.2 Biên mục digital
• Trong môi trường số, dữ liệu được đóng gói bằng ngôn ngữ XML. Cách
biên mục phải thay đổi qua môi trường Web, nghĩa là các dữ liệu thư tịch
phải được đóng gói, người ta gọi là biên mục theo dạng kỹ thuật số (digital).
Các biểu ghi thư tịch trở thành siêu dữ liệu thư tịch – metadata. Vậy
Metadata chính là phiếu mục lục miêu tả lý lịch tài liệu được phát sinh tự
động trong môi trường số.
• Metadata gắn liền với nội dung văn bản
• MARC chuyển đổi thành MARC-XML
• Chuẩn Dublin Core đáp ứng yêu cầu tổ chức tài nguyên số
1.2.2.1 Vai trò của MARC
Việc sử dụng máy tính trong hoạt động thư viện đã làm thay đổi rộng lớn
công tác biên mục. Ban đầu thay vì Thư viện Quốc hội Hoa Kỳ cung cấp phiếu
mục lục cho các thư viện thì khi sử dụng máy tính họ chỉ cung cấp các biểu ghi
trên băng từ, các thư viện nhận băng từ, download dữ liệu, và tự in thành phiếu
mục lục. Việc sử dụng máy tính như thế đòi hỏi phát sinh ra một chuẩn thư tịch
mà máy tính đọc được, chuẩn này ban đầu được gọi là MARC I về sau cải tiến
thành MARC II, rồi USMARC. Công việc trao đổi biểu ghi như thế này thật là
thuận tiện cho việc in phiếu mục lục và về sau khi việc ứng dụng tin học phát
triển, hệ thống mục lục trực tuyến thay thế hệ thống phiếu mục lục, chuẩn
MARC tỏ ra rất phù hợp. Các quốc gia trên thế giới theo chân Hoa Kỳ phát minh
ra hàng loạt MARC quốc gia. Về sau khi vấn đề xuất bản mang tính toàn cầu, có
yêu cầu cần thống nhất chuẩn MARC cho nên UNIMARC của IFLA ra đời, tuy
nhiên Hoa Kỳ, quốc gia có nguồn tài nguyên thông tin đồ sộ và hệ thống xuất
bản bao trùm thế giới đã không chấp nhận UNIMARC do đó các quốc gia nói
7
tiếng Anh khác dần dần bỏ MARC quốc gia để sử dụng USMARC. Để mang
tính toàn cầu, USMARC kết hợp với CANMARC của Canada tạo nên MARC
21.
1.2.2.2 Dublin Core
• Dublin Core là một tập hợp những thành phần metadata được thiết kế
đặc biệt cho việc sử dụng không chuyên. Được dựng chủ yếu cho việc mô
tả tài liệu điện tử. Đây là kết quả của một sự hợp tác nhiều người căng xây
dựng. Dublin là tên của thành phố ở Bang Ohio, Hoa Kỳ, nơi cuộc họp
đầu tiên được tổ chức vào năm 1995. Từ đó đến nay đã có 12 lần hội nghị
quốc tế tổ chức tại Anh, Úc, Phần Lan, Đức, Canađa, Nhật, Trung Quốc
và Hoa Kỳ để hoàn thiện. Dublin Core được Tổ chức Chuẩn Quốc gia Hoa
Kỳ - ANSI phê chuẩn vào năm 2001.
• Dublin Core chỉ bao gồm 15 thành phần. Như cái tên "core - nòng
cốt" đã hàm ý rằng Dublin Core là một tập hợp những thành phần nòng
cốt, ngoài ra còn có thể tăng thêm những thành phần phụ cho mục đích
riêng. Hơn nữa, những thành phần hiện hữu có thể được cải tiến xuyên qua
việc sử dụng. Tất cả thành phần này đều có thể lập lại khi cần thíết.
• Dublin Core dựng thuật ngữ tài nguyên để bao gồm tranh ảnh, hình
ảnh động, hoạt hình, đồ hoạ, ngay cả sản phẩm thực tế ảo cũng như tài liệu
toàn văn.
15 thành phần của Dublin Core
Nhan đề: Tên được đặt cho tài nguyên của tác giả hay nhà xuất bản
Tác giả: Người hay tổ chức có trách nhiệm đầu tiên về nội dung trí tuệ của
tài nguyên
Chủ đề:Đề tài của tài nguyên
Mô tả :Mô tả nguyên văn nội dung của tài nguyên
Xuất bản:Thực thể có trách nhiệm làm cho tài nguyên có hiệu lực sử dụng
8
Cộng tác viên:Người hay tổ chức (khác tác giả) có trách nhiệm đóng góp
có ý nghĩa vào nội dung trí tuệ của tài nguyên
Năm: Năm tài nguyên được sáng tác hay có hiệu lực sử dụng
Loại: Bản chất hay thể loại của nội dung tài nguyên
Dạng thức: Hình thức vật lý hay kỷ thuật số của tài nguyên
Xác nhận: Tham chiếu rõ ràng xác nhận tính duy nhất của tài nguyên trong
phạm vi ngữ cảnh đã cho
Nguồn: Tham chiếu một tài nguyên thứ hai mà từ đó tài nguyên trình bày
đã trích dẫn
Ngôn ngữ: Ngôn ngữ của nội dung tài nguyên
Quan hệ: Tham chiếu một tài nguyên có liên quan, và bản chất của mối
quan hệ
Sự kiện: Đặc tính nơi chốn và thời gian liên quan đến nội dung tài nguyên
Bản quyền: Thông tin về tình trạng bản quyền
1.2.2.3 Nhóm Dublin Core Metadata
Những thành phần của Dublin Core chia làm 3 nhóm:
1. Nội dung: Nhan đề, Chủ đề, Mô tả, Nguồn, Ngôn ngữ, Quan hệ (với tài
nguyên khác), Sự kiện;
2. Sở hữu trí tuệ: Tác giả, Xuất bản, Cộng tác viên, Bản quyền;
3. Thuyết minh: Năm, Loại, Dạng thức, Xác nhận
Minh họa Dublin Core Metadata (cho 15 thành phần của Dublin Core)
Thành phần: Nhan đề - Title
Tên: Title
Định nghĩa: Tên được đặt cho tài nguyên
Ví dụ: <meta name = “DC.Title”
content = “Tổng quan khoa học thông tin và thư viện”>
9
<meta name = “DC.Title”
content = “Bản tin Thư viện Cao học, Số 2, 2003”>
Thành phần: Chủ đề - Subject
Tên: Đề mục và từ khóa
Định nghĩa: Đề tài của nội dung tài nguyên
Ví dụ: <meta name = “DC. Subject”
content = “Thư viện học”>
<meta name = “DC.Subject”
scheme = “DDC”
content = “020”>
Thành phần: Mô tả - Description
Tên: Description
Định nghĩa: Bản mô tả nội dung tài nguyên
Ví dụ: <meta name = “DC.Description”
lang = “en”
content = “Our database management system is
SQL”>
Thành phần: Nguồn - Source
Tên: Source
Định nghĩa: Tham khảo đến một tài nguyên từ đó tài liệu được trình bày
dẫn xuất
Ví dụ: <meta name = “DC. Source”
content =
“ />10
Thành phần: Ngôn ngữ - Language
Tên: Language
Định nghĩa: Ngôn ngữ của nội dung trí tuệ tài nguyên
Ví dụ: <meta name = “DC.Language”
content = “en”>
<meta name = “DC.Language”
scheme = “rfc 1766”
content = “en,US”>
Thành phần: Quan hệ - Relation
Tên: Relation
Định nghĩa: Tham khảo đến một tài nguyên có liên quan
Ví dụ: <meta name = “DC. Relation”
content = “ />04.pdf”>
Thành phần: Sự kiện - Coverage
Tên: Coverage
Định nghĩa: Qui mô hay phạm vi tài nguyên
Ví dụ: <meta name = “DC.Coverage”
content = “Kháng chiến chống Mỹ, 1954-1975”>
Thành phần: Tác giả - Creator
Tên: Creator
Định nghĩa: Thực thể có trách nhiệm đầu tiên về việc tạo nên nội dung của
tài nguyên
Ví dụ: <meta name = “DC. Creator”
11
content = “Nguyễn Minh Hiệp”>
Thành phần: Xuất bản - Publisher
Tên: Publisher
Định nghĩa: Thực thể có trách nhiệm về sự hiện hữu của tài nguyên
Ví dụ: <meta name = “DC.Publisher”
content = “Đại học Quốc gia TP. HCM”>
Thành phần: Cộng tác viên - Contributor
Tên: Contributor
Định nghĩa: Thực thể có trách nhiệm đóng góp vào nội dung của tài nguyên
Ví dụ: <meta name = “DC. Contributor”
content = “Lê Ngọc Oánh”>
Thành phần: Loại - Type
Tên: Resource Type
Định nghĩa: Loại hình hay thể loại của nội dung tài nguyên
Ví dụ: <meta name = “DC.Type”
content = “phần mềm”>
<meta name = “DC.Type”
content = “tranh”>
Thành phần: Dạng thức - Format
Tên: Format
Định nghĩa: Hình thức vật lý hay kỹ thuật số của tài nguyên
Ví dụ: <meta name = “DC. Format”
content = “văn bản/html”>
12
<meta name = “DC. Format”
content = “hình ảnh/jpeg”>
Thành phần: Xác nhận - Identifier
Tên: Identifier
Định nghĩa: Xác định rõ nguồn gốc tài nguyên về mặc định chuẩn hoặc
trong ngữ cảnh đã cho
Ví dụ: <meta name = “DC.Identifier”
scheme = “ISBN”
content = “81-7366-347-5”>
<meta name = “DC. Identifier ”
content = “nload/”>
1.2.2.4 So sánh 2 chuẩn biên mục MARC và Dublin Core
Đã từng có hai phương pháp chuẩn đối nghịch nhau về trình bày siêu dữ
liệu tài liệu: Dạng biên mục máy đọc được MARC và Dublin Core. Dạng
MARC được phát triển công phu, kiểm soát chặt chẽ, chi ly và bao hàm
đến độ khá phức tạp, được tạo nên bởi những nhà biên mục học chuyên
nghiệp chủ yếu để sử dụng trong thư viện truyền thống. Chuẩn Dublin
Core chủ trương đơn giản hóa để có thể áp dụng rộng rãi cho tài liệu thư
viện số đối với những người không cần được huấn luyện biên mục thư
viện. Hai chuẩn này không những chú ý đến giá trị đặc thù của mình mà
còn lưu tâm đến những triết lý căn bản đối nghịch nhau một cách tuyệt
đối.
13
Chuẩn MARC được Thư viện Quốc hội Hoa Kỳ phát triển vào cuối thập
niên 1960 để phục vụ việc trao đổi biểu ghi mục lục giữa các thư viện.
MARC được giảng dạy khá kỹ lưỡng trong những chương trình đào tạo
thư viện học trên thế giới. Chúng ta khá quen thuộc với biểu ghi MARC
khi tiếp xúc với mục lục trực tuyến ở thư viện đại học.
Chuẩn Dublin Core là một tập hợp những thành phần metadata được thiết
kế đặc biệt cho việc sử dụng không chuyên. Được dựng chủ yếu cho việc
mô tả tài liệu điện tử. Đây là kết quả của một sự hợp tác nhiều người căng
xây dựng.
So với dạng MARC, Dublin Core đơn giản một cách dễ chịu. Dublin Core chỉ
bao gồm 15 thành phần so với hàng trăm của MARC. Như cái tên "core – nòng
cốt" đã hàm ý rằng Dublin Core là một tập hợp những thành phần nòng cốt,
ngoài ra còn có thể tăng thêm những thành phần phụ cho mục đích riêng. Hơn
nữa, những thành phần hiện hữu có thể được cải tiến xuyên qua việc sử dụng.
Tất cả những thành phần này đều có thể lập lại khi cần thiết.
1.2.2.5 Chuyển đổi hai chuẩn biên mục
Kể từ khi Viện Tiêu chuẩn Hoa Kỳ (ANSI) chính thức công nhận Dublin Core là
một Chuẩn biên mục và phê chuẩn vào năm 2001, sự đối nghịch giữa hai chuẩn
không còn tồn tại mà ngày càng nhiều chuyên gia tìm những giải pháp để chuyển
đổi nhau: MARC sang Dublin Core và Dublin Core sang MARC, chẳng hạn như
tại website của Văn phòng Chuẩn MARC và phát triển mạng lưới của Thư viện
Quốc hội Hoa Kỳ có hướng dẫn các phương thức chuyển đổi. Thậm chí còn có
nhiều phần mềm nguồn mở chuyển đổi được phổ biến rộng rãi, chẳng hạn như
những phần mềm MarcEdit của Đại học Bang Oregon, Hoa Kỳ.
Chuyển đổi Dublin Core sang MARC:
Việc chuyển đổi 15 thành phần của Bộ thành phần Dublin Core sang Những
Thành phần dữ liệu thư tịch của MARC khiến nhiều trường của MARC 21 được
14
ghép chung vào một thành phần Dublin Core riêng lẻ. Điều này không thành vấn
đề đối Dublin Core. Bởi vì cách cấu tạo của Dublin Core khiến mỗi thành phần
mang tính cối lõi (core) nên có thể chứa nhiều giá trị. Chẳng hạn như thành thần
Chủ đề (Subject) có thể chứa tiêu đề đề mục, từ khóa, và số phân loại. Ví dụ:
<meta name=“DC. Subject”
content=“Thư viện học”>
< meta name=“DC. Subject”
scheme=“DDC”
content=“020”>
Trong việc chuyển đổi sang MARC, chẳng hạn như thành phần Chủ đề (Subject)
được chuyển đổi như sau:
Scheme=LCSH: 650 #0$a (Subject added entry Topical term)
Scheme=MeSH: 650 #2$a (Subject added entry Topical term)
Scheme=LCC: 050 ##$a (Library of Congress Call Number/
Classification number)
Scheme=DDC: 082 ##$a (Dewey Decimal Call Number/
Classification number)
Scheme=UDC: 080 ##$a (Universal Decimal Classification
Number)
Scheme=(other): 650 #7$a with $2=code from MARC Code List
for Relators, Sources, Description Conventions
Chuyển đổi MARC sang Dublin Core
Vì dữ liệu của MARC phong phú hơn Dublin Core nhiều nên trong việc chuyển
đổi MARC sang Dublin Core, một trường riêng lẽ của MARC được ghép với
một thành phần của Dublin Core, tuy nhiên thành phần Dublin Core có thể được
lặp lại. Ví dụ đối với những trường liên quan đến chủ đề.
15
Thành phần DC Từ hạn định DC Trường MARC
Chủ để (Subject) LCSH 600,610,611,630,650
Chủ để (Subject) MeSH 600,610,611,630,650
Chủ để (Subject) LCC 052
Chủ để (Subject) DDC 082
Chủ để (Subject) UDC 080
• Lưu ý:
o Việc chuyển đổi MARC sang Dublin Core và Dublin Core sang
MARC được thực hiện bằng những phần mềm chuyển đổi.
o Trong những cảnh thông tin điện tử,các siêu dữ liệu thư tịch chuyển
đổi đều có giá trị như nhau.
o Một phần mềm quản lý thư viện trong tương lai sẽ xuất ra cả 2 dạng
thức MARC và Dublin Core.Việc nhập vào MARC hay Dublin
Core không gây trở ngại gì cho kết xuất đó;cho dù việc nhập vào là
do bản thân thư viện hay trao đổi dữ liệu với các thư viện khác.
1.3.Sự phát triển của thư viện số hiện nay trên thế giới và ở ViệtNam
1.3.1 Giới thiệu chung
Phần mềm mã nguồn mở thư viện số Greenstone được phát triển và phân
phối với sự tham gia của UNESCO và Human Info NGO. Phần mềm nguồn mở
này được cung cấp trên Vào đầu năm 2004 Thư viện ĐH
Khoa học Tự Nhiên cùng với Integrated e-Solutions, Ltd., Việt Nam phát triển
phiên bản tiếng Việt và đưa vào sử dụng cũng như giới thiệu rộng rãi đến các thư
viện tại Việt Nam. Đây là một công nghệ mới không những đối với Cán bộ Thư
viện Việt Nam mà ngay cả các thư viện trong khu vực. Hiện nay giao diện tiếng
Việt được cập nhật vào hệ thống Greenstone thế giới bên cạnh những ngôn ngữ
khác như: Anh, Pháp, Đức, Nga, Tây Ban Nha, Bồ Đào Nha, Italia, Hà Lan
(Dutch), Ả-rập, Thổ Nhĩ Kỳ, Hebrew, Bosnia, Armenia, Ukraina, Farsi, Croatia,
Serbia, Hindi, Trung Hoa, Nhật Bản, Thái Lan, Indonesia, vv…
16
Trên thế giới Greenstone được sử dựng rộng rãi ở nhiều nước trên thế giới như:
Anh, Hoa Kỳ, Trung Quốc, Ðức, Ấn Độ, Nga …mà đặc biệt là các thư viện
trong dự án The New Zealand Digital Library, The University of Waikato và
ngay cả một số quốc gia Châu Phi. Từ những loại hình thư viện: lịch sử, giáo
dục, văn hóa, và nghiên cứu khác nhau; Với những loại vật chất nguồn: văn bản,
những hình ảnh tài liệu, tranh, phim và âm thanh điều này cho thấy Greenstone
đã có những ưu điểm trong việc xây dựng các sưu tập số hóa mở ra khả năng tổ
chức tốt các nguồn thông tin điện tử trên Internet.
Hiện nay, với các công cụ tìm kiếm (Search Engines) trên Internet chúng ta dễ
dàng tìm đến các địa chỉ của các thư viện sử dụng Greenstone, hay các tài liệu
nói về Greenstone. Khả năng của Greenstone hơn hẳn các phần mềm khác về
quản lý các tài liệu đa phương tiện… mà các phần mềm khác của thư viện còn
thiếu sót. Nếu chúng ta biết sử dụng tích hợp một số các modul khác của phần
mềm thư viện với Greenstone thì sẽ mở ra một khả năng quản lý tốt các loại hình
tài liệu của thư viện. Greenstone là một phần mềm mã nguồn mở, nên nhiều thư
viện đã phát triển và sử dụng Greentone theo nhiều cách thức khác nhau cả về
giao diện lẫn nội dung quản lý tài liệu thư viện: The Lehigh University
Librararies, Pennsylvania, The University of Chicago Library, The University
of Illinois at Urbana-Champaign, ở Hoa Kỳ.Chúng ta điểm qua một số thư
viện trên thế giới có sử dụng Greenstone sau đây để xem xét mức độ ứng dụng
và những thay đổi trong việc mở rộng Greenstone.Trong trang The New
Zealand Digital Library, The University of Waikado hiện nay giới thiệu 64 sưu
tập về các chủ đề khác nhau từ khoa học xã hội nhân văn đến các ngành kỹ thuật,
các sưu tập sử dụng các dạng tài liệu HTML đến PDF, DOC,… đến các sưu tập
các dạng tài liệu âm thanh (Music Library), Vidéo (Music Videos) và hình
ảnh(OAI Plugin Demo Conference Photos 2001, Kiwi Aircraft Images). Ngoài
17
ra cũng có sưu tập chỉ là các tạp chí toàn văn (Journal of Artificial Intelligence
Research, TidBITS) hay sách điện tử (How to build a digital library).
Hình 1 : Trang giới thiệu bộ sư tập của trường đại học Waitak
Khả năng đa ngôn ng
Các sưu tập không chỉ sưu tập sử dụng tiếng Anh mà còn cả ngôn ngữ của Ả rập
Ấn Độ Arabic Collectio ), Trung Quốc Chinese Demo Collectio ), Việt Na
Information and Library Scienc )… cho thấy khả năng hỗ trợ đa ngôn ngữ củ
Greenstone trong việc sử dụng sưu tập bất kỳ loại ngôn ngữ nào. Trong các sưu
tập này không phải đơn thuần như các ngôn ngữ theo hệ La tinh nên việc sưu tập
18
và sắp xếp tài liệu đòi hỏi kỹ thuật khác hơn là sắp xếp theo A-Z, phải dựng xắp
xếp theo trật tự riêng ủa từng ngôn ngữ như xếp theo Bộ của ngôn ngữ tượng
hình
Trên đây chỉ là các sưu tập trong The New Zealand Digital Library, University o
Waikado. Ngoài ra các sưu tập các ngôn ngữ này còn có sưu tập của Trường Đại
học Bắc Kinh về các tài liệu cổ khắc trên tre gỗ và đá, Sưu tập tiếng Nga :
Internet Mediacom The Mari El Republic of the Russian Federation, Russia
Hình2
: Trang ngôn ngữ Ả R
1.3.2 Loại hình tài liệu
Greensstone còn có thể giúp chúng ta tạo các sưu tập số theo từng loại hình xuất
bản :
19
Hình 3 : Danh mục tạp chí của nhà xuất bản IIS
• Tạp chí điện tử: Với Greenstone ta có thể tạo ra các sưu tập về tạp chí điện t
theo từng số xuất bản mà không phá vở cấu trúc mục lục nguyên gốc của tạp ch
điện tử đó, làm cho người sử dụng không thấy có sự khác biệt của tạp chí khi đư
vào quản lý bởi phần mền Greenstone và tạp chí điện tử nguyên gốc xuất bản trê
mạng của nhà xuất bản như: TidBIT , Journal of Artificial Intelligence Researc
(The New Zealand Digital Library). Ngoài ra cũng có thể sưu tập hoàn toàn
danh mục tạp chí (chỉ biên mục quản lý nguồn mà không quản lý dữ liệu toàn v
20
của từng bài tạp chí) mà người sử dụng khi kết nối nội dung sẽ kết nối trực tiếp
đến tạp chí gốc của nhà xuất bản : IISc Publication (Indian Institute of Science,
India)
• Sưu tập về báo: có hai sưu tập mà chúng ta cần xem qua The Argus
Collections
(Illinois Wesleyan University. USA) từ 1894 -2003, và The Silent Worker
(Washington Research Library Consortium (WRLC), USA. Hai sưu tập này sử
dụng dạng tài liệu toàn văn File format PDF của nguyên dạng hình ảnh scan báo
không dùng File chuyển đổi sang HTML
Hình 4 : Bộ sưu tập Argu
• Sưu tập eBook
Books From the Past Culturenet Cymru and the Welsh Books Council) sưu tậ
21
sách toàn văn xuất bản từ đầu thế kỷ 19 đến giữa thế kỷ 20, của 2 ngôn ngữ
English và Welsh. Người sử dụng có thể tra cứu nhan đề, tác giả và thời gian
xuất bản
Hình5
: Bộ sưu tập sá
1.3.3 Dạng lưu trữ tài liệu
Hiện nay Web là một giao diện có khả năng tích hợp đa phương tiện với các
dạng lưu trữ khác nhau, thì chúng ta cũng có thể thấy Greenstone muốn quản lý
tốt các sưu tập đó cũng phải có khả năng tích hợp được các tài liệu đa phương
tiện. Sơ lược các thư viện sử dụng Greenstone hiện nay chúng ta sẽ thấy mức độ
đáp ứng của Greenstone trong khía cạnh này.
• Tài liệu sưu tập là âm thanh và Video
o Sưu tập Music Library (The New Zealand Digital Library ) tập hợp gần
10.000 giai điệu nhạc người sử dụng có thể nghe nhạc trực tiếp từ sưu tập
22
này với sự hỗ trợ của các phần mềm Media: Media Player, Windows
MPEC… kích hoạt tự động từ máy tính hay có thể sao lưu vào máy tính của
mình.
o Sưu tập Music Video (The New Zealand Digital Library) là sưu tập Video
ca nhạc từ MTV mà người sử dụng tìm kiếm theo tên bài, thể loại nhạc hay
tên các ca sĩ trình diễn : Eric Clapton, George Michael và Elton John…
Hình 6 : Thư viện nhạ
• Tài liệu sưu tập là hình ản
Việc sử dụng Greenstone để xây dựng các sưu tập hình ảnh của các thư việ
được giới thiệu rất nhiều trên Internet rất đa dạng cách thể hiện cấu trúc và hiể
23
thị, có 2 sưu tập được đánh giá là sưu tập lớn và chất lượng. Trong hai sưu tập nà
thể hiện sự kết hợp chặt chẽ của biên mục truyền thống với dữ liệu M tadata v
hiển thị biểu ghi này cùng với chế độ Thumbnail hình ảnh, và khi người sử dụn
Click chọn vào đó mới hiển thị chế độ View hình ảnh ở cỡ lớn
o The Virginia Civil War Archive của Washington Research Librar
Consortium (WRLC), USA. Là sưu tập có hơn 400 hình minh họa từ tạ
chí Harper's Weekly từ 1861-186
o American University History Photograph and Print Collection củ
Washington Research Library Consortium (WRLC), USA. Sưu tập này ba
gồm các ảnh chụp về lịch sử, sinh hoạt, những sự kiện liên quan trong lịc
sử nước Mỹ. Từ tòa nhà đầu tiên của trường vào năm 1896 đến 196
24
Hình7
: Thư viện ảnh và sá
25