Tải bản đầy đủ (.pdf) (43 trang)

Đề xuất giải pháp đa ngữ hóa website ứng dụng tại bảo tàng đà nẵng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.82 MB, 43 trang )

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRẦN THỊ HỒNG ÁNH

ĐỀ XUẤT GIẢI PHÁP ĐA NGỮ HOÁ WEBSITE
ỨNG DỤNG TẠI BẢO TÀNG ĐÀ NẴNG

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH

Đà Nẵng – Năm 2017


TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: PGS. TS. Võ Trung Hùng

Phản biện 1: TS. Huỳnh Hữu Hưng
Phản biện 2: TS. Trần Thiên Thành

Luận văn sẽ được bảo vệ trước hội đồng chấm Luận văn
tốt nghiệp thạc sĩ Khoa học máy tính họp tại Trường Đại
học Bách khoa vào ngày 06 tháng 01 năm 2018.

Có thể tìm hiểu luận văn tại:
-



Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại
học Bách khoa
Thư viện Khoa Công nghệ thông tin, Trường Đại học
Bách khoa - ĐHĐN


I
LỜI CAM ĐOAN
Tôi xin cam đoan:





Những nội dung trong luận văn này là do tôi thực hiện dƣới
sự hƣớng dẫn trực tiếp của PGS.TS Võ Trung Hùng.
Mọi tham khảo dùng trong luận văn đều đƣợc trích dẫn rõ
ràng và trung thực tên tác giả, tên công trình, thời gian, địa
điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay
gian trá, tôi xin chịu hoàn toàn trách nhiệm.

Tác giả

Trần Thị Hồng Ánh


II
MỤC LỤC

LỜI CAM ĐOAN ............................................................................. I
MỤC LỤC ........................................................................................ II
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ............. VII
DANH MỤC CÁC BẢNG BIỂU .................................................. IX
DANH MỤC CÁC HÌNH ẢNH...................................................... X
MỞ ĐẦU............................................................................................ 1
1. LÝ DO CHỌN ĐỀ TÀI ................................................................... 1
2. MỤC ĐÍCH NGHIÊN CỨU ............................................................. 1
3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU ....................................... 2
4. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI ........................ 2
5. CẤU TRÚC LUẬN VĂN ................................................................ 3
CHƢƠNG 1: NGHIÊN CỨU TỔNG QUAN ................................. 4
1.1. BẢO TÀNG ĐÀ NẴNG .............................................................. 4
1.2. ỨNG DỤNG CNTT TẠI BẢO TÀNG ĐÀ NẴNG .......................... 4
1.3. ĐA NGỮ HOÁ WEBSITE ............................................................ 5
1.3.1. Giới thiệu về website đa ngữ .......................................... 5
1.3.2. Các phương pháp xây dựng website đa ngữ .................. 5
1.3.2.1. Phƣơng pháp nhân bản các website đơn ngữ ......... 5
1.3.2.2. Phƣơng pháp xử lý đa ngữ trong cơ sở dữ liệu ...... 6
1.3.2.3. Phƣơng pháp sử dụng hệ thống dịch tự động ......... 8
1.4. DỊCH TỰ ĐỘNG ........................................................................ 9
CHƢƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG .......... 10
2.1. MÔ TẢ HIỆN TRẠNG .............................................................. 10
2.1.1. Cấu trúc website hiện tại .............................................. 11
2.1.2. Tổ chức và hiển thị dữ liệu ........................................... 11
2.2. MÔ TẢ ỨNG DỤNG ................................................................. 11
2.2.1. Website đa ngữ của Bảo tàng Đà Nẵng ....................... 11
2.2.1.1. Mục đích của hệ thống ......................................... 11
2.2.1.2. Đối tượng sử dụng................................................ 11
2.2.2. Phần mềm dịch tự động ................................................ 12

2.2.2.1. Mục đích của hệ thống ......................................... 12


III
2.2.2.2. Đối tượng sử dụng................................................ 12
2.3. GIẢI PHÁP ĐỀ XUẤT .............................................................. 12
2.3.1. Giải pháp đa ngữ hoá................................................... 12
2.3.2. Phạm vi đa ngữ ............................................................ 13
2.3.2.1. Tài nguyên tĩnh..................................................... 13
2.3.2.2. Tài nguyên động ................................................... 13
2.3.3. Đa ngữ cho website ...................................................... 13
2.3.4. Dịch tự động ................................................................. 15
2.3.4.1. Sử dụng dịch vụ từ Google .................................. 15
2.3.4.2. Phương thức hoạt động ........................................ 15
2.4. MÔ HÌNH TỔNG QUÁT ........................................................... 15
2.4.1. Website đa ngữ của Bảo tàng Đà Nẵng ....................... 15
2.4.2. Phần mềm dịch tự động ................................................ 16
2.5. PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG ...................................... 17
2.5.1. Biểu đ Use Case ......................................................... 17
2.5.2. Biểu đ lớp ................................................................... 17
2.5.3. Biểu đ hoạt động ........................................................ 18
2.5.3.1. Quản lý tài khoản ................................................. 18
2.5.3.2. Đăng nhập, đăng xuất .......................................... 19
2.5.3.3. Cập nhật dữ liệu ................................................... 19
2.5.3.4. Xem thông tin ....................................................... 20
2.5.3.5. Tìm kiếm ............................................................... 21
2.5.4. Biểu đ triển khai ......................................................... 21
CHƢƠNG 3: ĐA NGỮ HOÁ WEBSITE BẢO TÀNG ĐÀ
NẴNG .............................................................................................. 22
3.1. MO HÌNH TRIỂN KHAI ............................................................ 22

3.2. PHÁT TRIỂN ỨNG DỤNG ........................................................ 23
3.3. CÁC CÔNG NGHỆ SỬ DỤNG.................................................... 24
3.3.1. Các ngôn ngữ lập trình ................................................ 24
3.3.2. Các công cụ hỗ trợ ....................................................... 24
3.3.3. Cơ sở dữ liệu ................................................................ 24
3.4. MỌT SỐ GIAO DI N CHÍNH..................................................... 24


IV
3.4.1. Website Bảo tàng Đà Nẵng .......................................... 24
3.4.1.1. Trang chủ ............................................................. 24
3.4.1.2. Thư viện hiện vật .................................................. 25
2.4.1.3. Thông tin chi tiết hiện vật .................................... 26
3.4.2. Phần mềm dịch tự động ................................................ 27
KẾT LUẬN ..................................................................................... 28
TÀI LIỆU THAM KHẢO.............................................................. 29


V
ĐỀ XUẤT GIẢI PHÁP ĐA NGỮ HOÁ WEBSITE
ỨNG DỤNG TẠI BẢO TÀNG ĐÀ NẴNG
Học viên: Trần Thị Hồng Ánh
Khoa học máy tính

Chuyên

Mã số:
Bách khoa - ĐHĐN

Trƣờng


Khoá: 32

nghành:
Đại

học

Tóm tắt - Một trong những thách thức lớn nhất làm cho ngƣời sử
dụng không thể khai thác hết các nội dung trên Web là trở ngại về
ngôn ngữ. Nhằm giải quyết vấn đề này, ngƣời ta có thể chọn các giải
pháp nhƣ dịch tự động một trang Web sang ngôn ngữ mong muốn
hoặc xây dựng một trang Web đa ngữ để ngƣời sử dụng lựa chọn. Đa
ngữ hoá các Website là một giải pháp đƣợc ƣa chuộng hiện nay. Đa
ngữ hoá Website cho phép ngƣời sử dụng lựa chọn ngôn ngữ để xem
thông tin mà không tốn thời gian để dịch nội dung. Đề tài luận văn
này tập trung nghiên cứu và đề xuất giải pháp để đa ngữ hoá Website
và thử nghiệm giải pháp đề xuất trên Website của Bảo tàng Đà Nẵng.
Giải pháp chúng tôi đề xuất là xây dựng một cơ sở dữ liệu nội dung
đa ngữ và máy tính sẽ hiển thị nội dung tƣơng ứng với ngôn ngữ
đƣợc ngƣời dùng lựa chọn.
Từ khoá - Đa ngữ hoá; website đa ngữ; giải pháp đa ngữ; dịch tự
động; phần mềm dịch tự động; Bảo tàng Đà Nẵng.


VI
PROPOSAL FOR MULTILANGUAGE WEBSITE
CASE STUDY: DA NANG MUSEUM
Abstract - The difference in language is one of biggest challenges
that user faces when using the Internet. To solve this problem, one

can choose solutions such as automatically translating a Web page
into the desired language or building a multilingual Web site for the
user to choose. Multilingual Websites are a popular solution today.
Multilingual Website allows users to select language to view
information without wasting time translating content. This research
topic of this thesis is to study and propose solutions to develop a
multilingual Website and test solutions proposed on the website of
the Museum Danang. Our solution is to build a multilingual content
database and the computer will display the content corresponding to
the language selected by the user.
Key words – Multilingualization; Multilingual website; Multilingual
solution; Automatic translation; Automatic translation software;
Danang Museum.


VII
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
CNTT

Công nghệ thông tin

CSDL

Cơ sở dữ liệu

API

Viết tắt của Application Programming Interface là
một giao diện mà một hệ thống máy tính hay ứng
dụng cung cấp để cho phép các yêu cầu dịch vụ có

thể đƣợc tạo ra từ các chƣơng trình máy tính khác,
và/hoặc cho phép dữ liệu có thể đƣợc trao đổi qua
lại giữa chúng.

We Are Social

Là một công ty toàn cầu có văn phòng tại London,
New York, Paris, Milan, Munich, Singapore,
Sydney và Sao Pauo chuyên hỗ trợ các công ty,
lắng nghe, thấu hiểu và tham gia vào các thông
điệp của những công ty này thông qua truyền
thông xã hội.

Google
Translate

Gọi là Google Dịch là dịch vụ dịch máy đa ngôn
ngữ miễn phí đƣợc phát triển bởi Google

Frontend

Là một phần của hệ thống phần mềm, tƣơng tác
trực tiếp với ngƣời sử dụng.

Backend

Gồm có các thành phần để xử lý các thông tin từ
Frontend.

Framework


Là một thƣ viện mã lệnh đƣợc xây dựng sẵn để
chúng ta sử dụng.

HTML

Viết tắt của HyperText Markup Language là Ngôn
ngữ Đánh dấu Siêu văn bản là một ngôn ngữ đánh
dấu đƣợc thiết kế ra để tạo nên các trang web với


VIII
các mẩu thông tin đƣợc trình bày trên World Wide
Web.
CSS

Viết tắt của Cascading Style Sheets đƣợc dùng để
miêu tả cách trình bày các tài liệu viết bằng ngôn
ngữ HTML và XHTML.

JavaScript

Ngôn ngữ lập trình JavaScript

AngularJS

Đây là một mã nguồn mở, một framework của
JavaScript cho các ứng dụng web.

Python


Python là một ngôn ngữ lập trình thông dịch do
Guido van Rossum tạo ra năm 1990.

Django

Django là một mã nguồn mở, framework của
Python

PostgreSQL

Là hệ quản trị cơ sở dữ liệu

Server

Server (máy chủ) là một hệ thống (phần mềm và
phần cứng máy tính phù hợp) đáp ứng yêu cầu trên
một mạng máy tính để cung cấp, hoặc hỗ trợ cung
cấp một dịch vụ mạng.

SEO

Viết tắt của Search Engine Optimization là một
quá trình tối ƣu để website trở nên thân thiện với
các công cụ tìm kiếm


IX
DANH MỤC CÁC BẢNG BIỂU
Số hiệu

bảng

Tên bảng

Trang

2.1

Truy vấn dữ liệu

14

2.2

Định dạng yêu cầu khi gọi đến server

14


X
DANH MỤC CÁC HÌNH ẢNH
Số hiệu hình
ảnh

Tên hình ảnh

Trang

1.2


Cấu trúc của mô hình nhiều website đơn
ngữ

5

1.3

Cấu trúc cơ sỡ dữ liệu đa ngữ

7

1.4

Mô hình website đa ngữ sử dụng hệ thống
dịch tự động

8

2.1

Website Bảo tàng Đà Nẵng

10

2.2

Cấu trúc của website Bảo tàng Đà Nẵng

11


2.5

Sơ đồ hoạt động của website đa ngữ

13

2.6

Tổ chức cơ sở dữ liệu đa ngữ

14

2.7

Mô hình hoạt động của phần mềm dịch tự
động

15

2.8

Mô hình tổng quát website đa ngữ của
Bảo tàng Đà Nẵng

16

2.9

Mô hình tổng quát của phần mềm dịch tự
động


16

2.10

Biểu đồ Use Case

17

2.11

Biểu đồ lớp

18

2.12

Biểu đồ hoạt động quản lý tài khoản

18


XI
2.13

Biểu đồ hoạt động đăng nhập, đăng xuất

19

2.14


Biểu đồ hoạt động cập nhật dữ liệu

19

2.15

Biểu đồ hoạt động xem thông tin

20

2.16

Biểu đồ hoạt động tìm kiếm

21

2.17

Mô hình triển khai hệ thống

21

3.1

Sơ đồ triển khai ứng dụng trong thực tế

22

3.2


Cơ sở dữ liệu của hệ thống

23

3.12

Giao diện trang chủ bằng tiếng Việt

24

3.13

Giao diện trang chủ bằng tiếng Anh

25

3.14

Trang thƣ viện hiện vật bằng tiếng Việt

25

3.15

Trang thƣ viện hiện vật bằng tiếng Anh

26

3.18


Trang thông tin chi tiết hiện vật bằng
tiếng Việt

26

3.19

Trang thông tin chi tiết hiện vật bằng
tiếng Anh

27

3.20

Giao diện trang dịch từ nội dung tiếng
Việt sang tiếng Anh

27


1
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay, CNTT (Công nghệ thông tin) đang phát triển và trở
thành một thành phần thiết yếu của toàn xã hội. Do sự toàn cầu hóa
về thông tin và việc sử dụng phổ biến Internet nên các hệ thống
thông tin đang có xu hƣớng đa ngữ. Một hệ thống thông tin là đa ngữ
nếu hệ thống đó cho phép ngƣời sử dụng lựa chọn các ngôn ngữ khác
để làm việc. Nhu cầu đa ngữ hóa các website là rất lớn và trở thành

một yêu cầu bắt buộc khi thiết kế website. Một số website đa ngữ
phổ biến rộng rãi hiện nay nhƣ: website giới thiệu Kinh Thánh (53
thứ tiếng), website của Liên hợp quốc (6 thứ tiếng), website của
Cộng đồng Châu Âu (20 thứ tiếng), [1]
Bảo tàng Đà Nẵng là một công trình, thiết chế văn hóa tiêu
biểu, quan trọng của thành phố Đà Năng và là một trong những bảo
tàng khang trang, hiện đại của miền Trung Việt Nam.
Website của Bảo tàng Đà Nẵng đã đi vào hoạt động trong
nhiều năm nay, tuy nhiên nó chỉ là một website đơn ngữ chỉ hiển thị
một ngôn ngữ tiếng Việt. Vì thế việc quảng bá hình ảnh, hiện vật của
Bảo tàng đến các bạn bè quốc tế còn gặp rất nhiều khó khăn, trở
ngại. Vậy để giải quyết khó khăn đó không còn cách nào hợp lý hơn
việc xây dựng website của Bảo tàng thành một website đa ngữ để
phục vụ nhiều nhu cầu ngƣời dùng trên khắp thế giới. Vì thế tôi
quyết định chọn đề tài “Đề xuất giải pháp đa ngữ hoá website ứng
dụng tại Bảo tàng Đà Nẵng” làm đề tài tốt nghiệp luận văn cao học.
2. Mục đích nghiên cứu
Mục đích nghiên cứu của đề tài này chính là đề xuất đƣợc giải
pháp đa ngữ hoá website. Ứng dụng giải pháp đa ngữ hoá vào
website của Bảo tàng Đà Nẵng nhằm nâng cao chất lƣợng của
website, quảng bá và đƣa hình ảnh của Bảo tàng đến các bạn bè khắp
thế giới.


2
3. Đối tƣợng và phạm vi nghiên cứu
Đề tài hƣớng đến nghiên cứu các đối tƣợng liên quan đến đa
ngữ hoá nhƣ: công cụ phát triển đa ngữ, các giải pháp xây dựng
website đa ngữ, các hệ thống đa ngữ hoá website hiện nay. Tìm hiểu
nghiên cứu các phần mềm dịch tự động. Nghiên cứu các vấn đề liên

quan đến phát triển ứng dụng website, tìm hiểu về các ngôn ngữ lập
trình website nhƣ: HTML, CSS, JavaScript, Python, Hệ quản trị
CSDL (Cơ sở dữ liệu) nhƣ: PostgreSQL và các framework hỗ trợ lập
trình website nhƣ: AngularJS, Django,
Bên cạnh đó, tôi tiến hành
nghiên cứu và tìm hiểu các vấn đề liên quan đến Bảo tàng, ứng dụng
CNTT trong Bảo tàng và website hiện tại của Bảo tàng Đà Nẵng.
Phạm vi nghiên cứu của đề tài này là toàn bộ những thông tin
liên quan đến website Bảo tàng Đà Nẵng, các tin tức, sự kiện, các
hiện vật hiện tại đƣợc trƣng bày ở Bảo tàng Đà Nẵng. Trong khuôn
khổ đề tài này, tôi tiến hành tìm hiểu và xây dựng website cho Bảo
tàng với 2 ngôn ngữ đó là tiếng Việt và tiếng Anh.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Đề tài có ý nghĩa khoa học vô cùng to lớn, giúp chúng ta tiếp
cận với công nghệ xử lý đa ngữ, nghiên cứu và đề xuất đƣợc các giải
pháp đa ngữ hoá website, chọn lựa giải pháp phù hợp để áp dụng vào
thực tế. Đề tài cũng tạo tiền đề phát triển các website đa ngữ trong
tƣơng lai.
Về ý nghĩa thực tiễn, đề tài áp dụng đƣợc phƣơng pháp đa
ngữ và tiến hành xây dựng đƣợc website đa ngữ cho Bảo tàng Đà
Nẵng. Mở rộng phạm vi và đối tƣợng sử dụng website của Bảo tàng,
không chỉ giới hạn ngƣời sử dụng trong nƣớc mà bạn bè trên quốc tế
có thể sử dụng và hiểu.


3
5. Cấu trúc luận văn
Luận văn gồm có 07 phần cụ thể nhƣ sau:
MỞ ĐẦU
Trong phần mở đầu tôi trình bày về lý do chọn đề tài, mục

tiêu, đối tƣợng và phạm vi nghiên cứu, ý nghĩa khoa học và thực tiễn
của đề tài nghiên cứu.
CHƢƠNG 1: NGHIÊN CỨU TỔNG QUAN
Trong chƣơng này, tôi trình bày kết quả nghiên cứu về các đối
tƣợng liên quan trực tiếp đến đề tài đó là Bảo tàng Đà Nẵng quá trình
hình thành và phát triển, cấu trúc và các hiện vật tại Bảo tàng, hiện
trạng và các vấn đề liên quan đến ứng dụng CNTT trong việc phục
vụ hoạt động của Bảo tàng. Trình bày tổng quan về đa ngữ hoá
website, đƣa ra các phƣơng pháp đa ngữ thƣờng đƣợc sử dụng và nêu
ra những ƣu, nhƣợc điểm của từng giải pháp. Bên cạnh đó còn trình
bày các vấn đề về dịch tự động để phục vụ cho quá trình đa ngữ hoá
website.
CHƢƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG
Trong chƣơng này tôi tiến hành nghiên cứu, tìm hiểu hiện
trạng website hiện tại của Bảo tàng Đà Nẵng, phân tích những điểm
tốt và những vấn đề còn thiếu sót. Tiến hành lựa chọn giải pháp đa
ngữ phù hợp để áp dụng cho website của Bảo tàng. Và tìm hiểu,
phân tích để xây dựng phần mềm dịch tự động. Sau đó tập trung vào
việc phân tích và thiết kế hệ thống để tiến hành xây dựng website
cho Bảo tàng.
CHƢƠNG 3: ĐA NGỮ HOÁ WEBSITE BẢO TÀNG ĐÀ NẴNG
Sau khi thực hiện xong phân tích và thiết kế hệ thống, chƣơng
này tôi tiến hành xây dựng website cho Bảo tàng, sử dụng những
phƣơng pháp và mô hình phân tích từ những chƣơng trƣớc. Lựa chọn
những ngôn ngữ lập trình, những công nghệ và công cụ phục vụ cho
quá trình xây dựng website. Và trình bày kết quả thực hiện đƣợc.


4
CHƢƠNG 1: NGHIÊN CỨU TỔNG QUAN

Trong chƣơng này, tôi trình bày kết quả nghiên cứu về các đối
tƣợng liên quan trực tiếp đến đề tài đó là Bảo tàng Đà Nẵng quá trình
hình thành và phát triển, cấu trúc và các hiện vật tại Bảo tàng, hiện
trạng và các vấn đề liên quan đến ứng dụng CNTT trong việc phục
vụ hoạt động của Bảo tàng. Trình bày tổng quan về đa ngữ hoá
website, đƣa ra các phƣơng pháp đa ngữ thƣờng đƣợc sử dụng và nêu
ra những ƣu, nhƣợc điểm của từng giải pháp. Bên cạnh đó còn trình
bày các vấn đề về dịch tự động để phục vụ cho quá trình đa ngữ hoá
website.
1.1. Bảo tàng Đà Nẵng
Bảo tàng Đà Nẵng thành lập từ năm 1989, đƣợc xây dựng mới
tại địa điểm số 24 Trần Phú (phƣờng Thạch Thang, quận Hải Châu),
trong khuôn viên Di tích Quốc gia Thành Điện Hải. Bảo tàng Đà
Nẵng đƣợc đầu tƣ phƣơng tiện trƣng bày, thiết bị nghe nhìn và hệ
thống chiếu sáng hiện đại. Đội ngũ thuyết minh, hƣớng dẫn khách
tham quan đƣợc đào tạo khá bài bản. Bảo tàng Đà Nẵng chính thức
khánh thành, mở cửa đón khách tham quan vào ngày 26 tháng 4 năm
2011.
1.2. Ứng dụng CNTT tại Bảo tàng Đà Nẵng
Trong thời gian qua, lãnh đạo của Bảo tàng Đà Nẵng đã chú
trọng đến việc tăng cƣờng ứng dụng CNTT trong công tác quản lý,
số hoá dữ liệu, tuyên truyền và đã mang lại một số kết quả bƣớc đầu.
Hiện tại, website của Bảo tàng đã giới thiệu nhiều thông tin bổ ích về
hoạt động và các hiện vật hiện có ở Bảo tàng. Tuy nhiên, website
hiện tại chỉ đƣợc thể hiện bằng ngôn ngữ tiếng Việt, vì vậy việc
truyền bá thông tin, hoạt động của Bảo tàng đến các du khách, bạn bè
quốc tế còn rất nhiều trở ngại.


5

1.3. Đa ngữ hoá website
1.3.1. Giới thiệu về website đa ngữ
Internet cung cấp một nguồn thông tin vô tận nhƣng chƣa
đƣợc khai thác triệt để. Một trong những nguyên nhân quan trọng
nhất dẫn đến việc hạn chế khai thác những thông tin trên là rào cản
về ngôn ngữ.
Website đa ngôn ngữ ra đời giải quyết vấn đề này bằng cách
địa phƣơng hóa nội dung. Làm cho nội dung phù hợp với đa số
ngƣời sử dụng ở các vùng miền khác nhau. Tuy nhiên, một website
đa ngôn ngữ không thể có hết tất cả các ngôn ngữ trên thế giới mà
chỉ hiển thị những ngôn ngữ chính ở các thị trƣờng website đó hƣớng
đến.
1.3.2. Các phƣơng pháp xây dựng website đa ngữ
1.3.2.1. Phương pháp nhân bản các website đơn ngữ
Giải pháp đơn giản thƣờng dùng đó là nhân bản các website
đơn ngữ. Tức là xây dựng các website đơn ngữ riêng biệt, mỗi
website một ngôn ngữ khác nhau khi ngƣời dùng có nhu cầu sử dụng
ngôn ngữ nào, sẽ chọn vào loại ngôn ngữ đó, trang web sẽ trỏ đến
trang ngôn ngữ tƣơng ứng. Thƣờng khi xây dựng ngƣời ta sẽ bắt đầu
xây dựng website gốc bằng ngôn ngữ thông dụng nhất thƣờng là
ngôn ngữ bản địa, sau đó sao chép và dịch sang một ngôn ngữ khác
tuỳ thuộc vào nhu cầu.
Cấu trúc website của phƣơng pháp này nhƣ sau:

Hình 1.2: Cấu trúc của mô hình nhiều website đơn ngữ


6
Ƣu điểm của phƣơng pháp này:





Dễ dàng triển khai và thực hiện nhanh chóng. Chúng ta lƣu
trữ sẵn các website tƣơng ứng với các ngôn ngữ cần dùng và
mỗi khi ngƣời sử dụng chọn ngôn ngữ nào thì máy sẽ mở
trang tƣơng ứng mà không cần phải tính toán, xử lý gì thêm.
Chỉ việc xây dựng một cấu trúc giao diện và nội dung chung
sau đó tiến hành dịch website sang thứ tiếng mà mình cần.

Tuy nhiên, phƣơng pháp này dẫn đến một số hạn chế về mặt k thuật
nhƣ sau:









Tốn bộ nhớ để lƣu trữ. Chúng ta cần phải lƣu nhiều lần,
tƣơng ứng với mỗi bản sao của từng ngôn ngữ.
Khó nâng cấp. Khi cần sửa đổi website (nội dung, hình
thức), ta cần phải thực hiện cùng một thay đổi trên nhiều
trang.
Việc phối hợp giữa ngƣời phát triển web và ngƣời dịch là
khó thực hiện. Những đoạn văn bản là nằm rải rác trong tập
tin HTML và ngƣời dịch sẽ rất khó khăn khi tìm và dịch
chúng.

Ngoài chi phí thiết kế và xây dựng bản website gốc thì mỗi
ngôn ngữ khác sẽ đƣợc cộng thêm từ 10 – 30% chi phí tùy
thuộc vào bản thiết kế đòi hỏi thay đổi nhiều hay ít. Ngoài
ra, chúng ta cần phải đầu tƣ thời gian và chi phí cho phần nội
dung tƣơng ứng với các ngôn ngữ.
Quản lý phức tạp

1.3.2.2. Phương pháp xử lý đa ngữ trong cơ sở dữ liệu
Nội dung của phƣơng pháp này chính là sử dụng chung một
mã nguồn để xây dựng website hiển thị thông tin cho ngƣời dùng.
Ngôn ngữ hiển thị sẽ phụ thuộc vào loại ngôn ngữ mà ngƣời dùng
chọn. Phƣơng pháp này đòi hỏi phải xây dựng CSDL nhƣ thế nào để
đáp ứng đƣợc nhu cầu của ngƣời sử dụng khi họ chọn ngôn ngữ


7
muốn xem. Để đảm bảo đƣợc dữ liệu thể hiện đúng chính xác, truy
vấn nhanh chóng đòi hỏi ta phải thiết kế và xây dựng một CSDL thật
hợp lý.
Các công việc cần tiến hành để xây dựng một website đa ngữ theo
phƣơng pháp này nhƣ sau:
1. Xây dựng giao diện website để hiển thị thông tin.
2. Xây dựng dịch vụ web liên lạc với server (Máy chủ).
3. Xây dựng web server để truy cập dữ liệu cung cấp và xử lý
yêu cầu từ ngƣời sử dụng.
4. Xây dựng hệ CSDL đa ngữ sao cho có thể dễ dàng truy xuất
dữ liệu một các nhanh chóng.
Để có đƣợc hệ CSDL đa ngữ ta phải:
1. Tiến hành dịch đoạn nội dung dữ liệu ra thành nhiều ngôn
ngữ khác nhau.

2. Sử dụng phần mềm dịch tự động
3. Chỉnh sửa nội dung sau khi dịch
4. Xây dựng CSDL đáp ứng đƣợc điều kiện lƣu trữ nhiều loại
ngôn ngữ cho một nội dung trình bày.
Yêu cầu:
1. CSDL dễ truy vấn và dễ mở rộng.
2. Thao tác truy vấn dễ dàng và nhanh chóng.
Để đáp ứng đƣợc những yêu cầu trên, ta phải tiến hành xây
dựng CSDL làm sao cho hợp lý nhất. Mô hình sau mô ta cấu trúc của
CSDL đa ngữ:

Hình 1.3: Cấu trúc cơ sỡ dữ liệu đa ngữ
Ƣu điểm của phƣơng pháp này là:
 Dễ dàng thực hiện, dễ xây dựng và cập nhật dữ liệu.


8
 Đảm bảo tốc độ truy vấn và tìm kiếm nội dung dữ liệu đƣợc
nhanh chóng.
 Khả năng phối hợp tốt giữa ngƣời dịch và nhà phát triển
web.
 Hạn chế tốn bộ nhớ cho trình duyệt web.
 Dễ bảo trì, nâng cấp, sửa lỗi.
 Tiết kiệm chi phí, chỉ xây dựng một website chung cho tất cả
các ngôn ngữ.
Song bên cạnh đó còn tồn đọng một số vấn đề nhƣ sau:
 Trùng lặp một loại dữ liệu với nhiều ngôn ngữ khác nhau.
 Tốn dung lƣợng lƣu trữ cho CSDL.
1.3.2.3. Phương pháp sử dụng hệ th ng d ch t đ ng
Chúng ta có thể xây dựng một website trong một ngôn ngữ xác

định (tiếng Anh, tiếng Việt, hoặc một ngôn ngữ khác...) và sử dụng
những hệ thống dịch tự động trên mạng để dịch sang một ngôn ngữ
mong muốn. Mô hình hoạt động của website sử dụng hệ thống dịch
tự động đƣợc mô tả nhƣ sau:

Hình 1.4: Mô hình website đa ngữ sử dụng hệ thống dịch tự
động
Hiện tại có rất nhiều phần mềm dịch tự động trên mạng với
chất lƣợng khá tốt nhƣ Systran, FreeTranslation, Reverso
Ƣu điểm của phƣơng pháp này là:
 Với các hệ thống dịch tự động này chúng ta có thể nhận
đƣợc ngay lập tức một bản dịch trong một ngôn ngữ nào đó
và có thể hiểu đƣợc ít nhất nội dung mà nó muốn nói. Chúng
ta cũng có thể sử dụng bản dịch này để trên cơ sở đó ngƣời
dịch có thể sửa đổi lại để cho ra một bản dịch với kết quả tốt
hơn.
 Tiết kiệm chi phí, chỉ chi trả chi phí cho việc xây dựng bản
gốc của website.


9
 Không tốn chi phí và công sức để dịch thuật nội dung.
 Không cần phải thay đổi hình ảnh, bảng hiệu.
Bên cạnh đó cũng tồn đọng một số nhƣợc điểm nhƣ sau:
 Các phần mềm dịch tự động khó có thể đáp ứng đƣợc chất
lƣợng dịch và không thể tạo ra các bản dịch nhƣ những dịch
giả chuyên nghiệp và không thể làm hài lòng những ngƣời
sử dụng qua các bản dịch máy trong ngôn ngữ m đ của họ.
Đặc biệt, những hệ thống dịch tự động không thể diễn tả
hoặc biển đổi bản dịch theo các ngữ cảnh đặc biệt để bản

dịch phù hợp về văn chƣơng, khoa học, tôn giáo, lịch sử...
 Tính chính xác của bản dịch có thể không đảm bảo.
1.4. Dịch tự động
Để hỗ trợ cho việc đa ngữ hoá website, đòi hỏi việc dịch nội
dung từ ngôn ngữ nguồn sang ngôn ngữ đích phải đƣợc thực hiện dễ
dàng, nhanh chóng và độ chính xác cao. Những nghiên cứu về dịch
tự động đã cho ra đời nhiều công cụ dịch hiệu quả và có thể sử dụng
nhƣ Google, AltaVisa,
[2] Nhiều hệ thống đã đƣợc đƣa vào
thƣơng mại hoá nhƣ Systran, Reverso, Babylon,
Những hệ thống
này cho phép tạo ra “bản dịch nghĩa” - một bản dịch chƣa đƣợc hoàn
chỉnh nhƣng giúp chúng ta có thể hiểu đƣợc ý nghĩa của văn bản gốc
và cần phải chỉnh sửa nhiều để đạt đến một văn bản hoàn chỉnh. Các
hệ thống dịch tự động cho phép dịch rất nhanh và chi phí thấp hơn
nhiều so với dịch bằng con ngƣời. Tuy nhiên, những hệ thống này
đang phải đối mặt với rất nhiều vấn đề nhƣ sự đa nghĩa của từ, sự
nhập nhằng về ngữ nghĩa, sự phụ thuộc về ngữ cảnh và rất nhiều khó
khăn trong sự khác biệt về giải thích các khái niệm.


10
CHƢƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG
Trong chƣơng này tôi tiến hành nghiên cứu, tìm hiểu hiện
trạng website hiện tại của Bảo tàng Đà Nẵng, phân tích những điểm
tốt và những vấn đề còn thiếu sót. Tiến hành lựa chọn giải pháp đa
ngữ phù hợp để áp dụng cho website của Bảo tàng, và tìm hiểu, phân
tích để xây dựng phần mềm dịch tự động. Sau đó tập trung vào việc
phân tích và thiết kế hệ thống để tiến hành xây dựng website cho Bảo
tàng.

2.1. Mô tả hiện trạng
Website Bảo tàng Đà Nẵng hiện tại chỉ thể hiện nội dung bằng
ngôn ngữ tiếng Việt, website đƣợc đặt tại địa chỉ
đƣợc thiết kế bởi đội ngũ lập trình
viên của Trung tâm Phát triển Phần mềm – Đại học Đà Nẵng.

Hình 2.1: Website Bảo tàng Đà Nẵng


11
2.1.1. Cấu trúc website hiện tại
Website Bảo tàng Đà Nẵng gồm có 07 phần chính cụ thể nhƣ
hình sau:

Hình 2.2: Cấu trúc của website Bảo tàng Đà Nẵng
2.1.2. Tổ chức và hiển thị dữ liệu
Toàn bộ dữ liệu của website Bảo tàng Đà Nẵng đều đƣợc xây
dựng và hiển thị bằng tiếng Việt. Về cơ bản các trang web của Bảo
tàng đƣợc chia thành 2 loại: trang web tĩnh và trang web động.
2.2. Mô tả ứng dụng
Phần này chủ yếu trình bày các vấn đề về ứng dụng website đa
ngữ và phần mềm dịch tự động, các thức hoạt động và mô tả chi tiết.
2.2.1. Website đa ngữ của Bảo tàng Đà Nẵng
2.2.1.1. Mục đích của hệ th ng
Mục đích của hệ thống là ứng dụng CNTT để hỗ trợ đa ngữ
hoá cho website Bảo tàng Đà Nẵng. Hệ thống website đa ngữ tại Bảo
tàng Đà Nẵng với các thành phần và chức năng chính nhƣ sau:
 Website đa ngữ hiện thị thông tin của Bảo tàng.
 Hệ CSDL đa ngữ về thông tin, nội dung và các hiện vật của
Bảo tàng.

 Các hình ảnh liên quan đến Bảo tàng.
 Trang dành riêng cho ngƣời quản trị, có thể cập nhật thay đổi
và chỉnh sửa thông tin.
2.2.1.2. Đ i tượng sử dụng
Đối với hệ thống đề xuất, có các loại đối tƣợng sử dụng nhƣ sau:
 Ngƣời quản trị (Administrator): là nhân viên quản trị hệ
thống, có nhiệm vụ quản trị toàn bộ hệ thống, dịch và cập


12
nhật thông tin liên quan đến nội dung và các hiện vật ở Bảo
tàng, phát hiện các vấn đề phát sinh/lỗi để khắc phục.
 Nhân viên bảo tàng (Museum Staff): là những ngƣời có
quyền truy cập hệ thống để xem, sửa, xoá thông tin trên hệ
thống.
 Ngƣời sử dụng website (Visitor): là những ngƣời sử dụng
truy cập vào hệ thống nhằm xem thông tin, hình ảnh,... về
Bảo tàng.
2.2.2. Phần mềm dịch tự động
2.2.2.1. Mục đích của hệ th ng
Mục đích của phần mềm dịch tự động là giúp cho ngƣời dịch
và cập nhật thông tin của Bảo tàng dịch thông tin một cách nhanh
chóng và chính xác. Gồm có các thành phần và chức năng chính nhƣ
sau:
 Dịch nội dung đoạn văn bản
 Chỉnh sửa nội dung đã dịch
 Lƣu nội dung về hiện vật đã dịch
 Dịch và chèn tệp dữ liệu vào CSDL.
2.2.2.2. Đ i tượng sử dụng
Đối tƣợng sử dụng phần mềm dịch tự động gồm những thành phần

sau:
 Ngƣời quản trị hệ thống
 Nhân viên của Bảo tàng
 Nhân viên dịch dữ liệu
2.3. Giải pháp đề xuất
2.3.1. Giải pháp đa ngữ hoá
Nhƣ đã trình bày ở phần nghiên cứu tổng quan về một số giải
pháp đa ngữ hoá website. Trong khuôn khổ luận văn này tôi sẽ đề
xuất và áp dụng phƣơng pháp đa ngữ thứ 2 để xây dựng website đa
ngữ cho Bảo tàng Đà Nẵng đó là phƣơng pháp “Xử lý đa ngữ trong
cơ sở dữ liệu”. Lý do chính tôi chọn phƣơng pháp này để áp dụng là
ngoài những ƣu và nhƣợc điểm đã nêu trong chƣơng trƣớc, thì tôi
nhận thấy rằng, đây là một giải pháp có tính khả thi cao, dễ dàng


×