Tải bản đầy đủ (.doc) (27 trang)

QUẢN LÝ CÔNG VĂN VỚI CÔNG NGHỆ SỐ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (350.2 KB, 27 trang )

SỞ GIÁO DỤC VÀ ĐÀO TẠO HÀ NỘI
TRƯỜNG THPT NGUYỄN TRÃI - BA ĐÌNH - HÀ NỘI
**************
ĐỀ TÀI DỰ THI KHOA HỌC, KỸ THUẬT
DÀNH CHO HỌC SINH TRUNG HỌC CẤP THÀNH PHỐ
LẦN THỨ TƯ (NĂM HỌC 2014 - 2015).
Tên đề tài: QUẢN LÝ CÔNG VĂN VỚI CÔNG NGHỆ SỐ
Lĩnh vực: Khoa học máy tính
NGƯỜI HƯỚNG DẪN
1. Hướng dẫn 1: ThS.Phạm Kim Oanh
- Đơn vị công tác Trường THPT Nguyễn Trãi -
Ba Đình - Hà Nội.
2. Hướng dẫn 2: HT Phạm Vương Tấn
- Đơn vị công tác Trường THPT Nguyễn Trãi -
Ba Đình - Hà Nội.
3. Hướng dẫn 3: PGS.TS Đỗ Trung Tuấn
- Đơn vị công tác Trường ĐH Quốc Gia - Hà
Nội.
TÁC GIẢ:
1.Nguyễn Ngọc Thắng
Lớp: 11A11
Trường: THPT Nguyễn Trãi - Ba Đình -Hà Nội
2.Nguyễn Trung
Lớp: 11A3
Trường: THPT Nguyễn Trãi - Ba Đình -Hà Nội
MỤC LỤC
1
PHẦN 1 - LÍ DO CHỌN ĐỀ TÀI 2
PHẦN 2 - TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU VÀ ĐIỂM MỚI, SÁNG TẠO CỦA ĐỀ TÀI 3
1.Tổng quan vấn đề cần nghiên cứu 3
2. Tính sáng tạo của đề tài 4


3. Điểm mới của đề tài 4
PHẦN 3 - QUÁ TRÌNH NGHIÊN CỨU VÀ KẾT QUẢ 4
1. Tìm hiểu về văn bản và phân loại văn bản 4
2. Tìm hiểu quy trình công văn đi - công văn đến 10
3. Tìm hiểu về tổ chức cơ cấu Phòng - Ban ở trường THPT Nguyễn Trãi - Ba Đình - Hà Nội 12
4. Tìm hiểu về Công nghệ số biểu diễn tài liệu văn bản 13
4.1 Siêu dữ liệu (metadata) 13
4.2 Tài liệu số 14
4.3 Tài liệu số - XML 14
4.4 Chuẩn mô tả dữ liệu 16
4.5 Công nghệ nhận dạng ký tự quang học OCR (Optical Character Recognition) 19
5. Tìm hiểu về ngôn ngữ lập trình ASP.NET ứng dụng cho bài toán “Quản lí công văn với công nghệ số”
20
6. Đánh giá những vấn đề đã đạt được 23
7. Mục tiêu phát triển đề tài thi cấp Quốc gia - tháng 3/2015 24
KẾT LUẬN 25
TÀI LIỆU THAM KHẢO 26
PHỤ LỤC 27
PHẦN 1 - LÍ DO CHỌN ĐỀ TÀI
Hàng ngày, tại các trường phổ thông luôn nhận được các công văn từ các nơi
ngoài nhà trường gửi tới như: Sở Giáo dục & Đào tạo Hà Nội, UBND thành phố,
Bộ Tài chính, Kho bạc, Ngân hàng, Đảng ủy thành phố Hà Nội, Hoặc có thể từ
chính các bộ phận, các phòng ban chức năng, tổ chuyên môn gửi đến Ban giám
hiệu. Hoặc ngược lại, Ban giám hiệu cũng có các quyết định, các thông báo quan
2
trọng gửi đến các thành viên là học sinh, phụ huynh, giáo viên, các phòng ban chức
năng.
Công văn có tiêu chí phân loại như: nghị định, nghị quyết liên tịch, quyết
định, chỉ thị, thông tư, thông báo, thông cáo, kế hoạch, đề án, báo cáo, biên bản, tờ
trình, hợp đồng, công điện, …

Công văn là một thể thức văn bản đã được nhà nước công nhận và ban hành
các quyết định về các mẫu công văn như: quyết định đình chỉ công tác, quyết định
thành lập ban tuyển sinh, quyết định tốt nghiệp, báo cáo thống kê tài chính, thông
báo nghỉ học tất cả đều có mẫu chuẩn.
Công văn thuộc quyền quản lí của các đơn vị hành chính sự nghiệp như:Bộ
Giáo Dục, Sở Giáo dục & Đào tạo Hà Nội, Các trường trực thuộc Sở (ví dụ: trường
THPT Nguyễn Trãi - Ba Đình - Hà Nội,…), UBND Thành phố Hà Nội, Sở Tài
Chính, Công An phường, Công an Quận Ba Đình,…
Tùy thuộc phân loại đơn vị hành chính của các trường mà có sơ đồ luồng
hướng dẫn bố trí nơi gửi công văn đi và nơi tiếp nhận công văn đến: Hiệu trưởng,
Hiệu phó, văn phòng, kế toán, đảng bộ, đoàn thanh niên, các tổ chuyên môn như:
tổ toán, tổ văn, tổ lý - kỹ thuật - tin, tổ hóa - sinh, tổ ngoại ngữ - thể dục, tổ hành
chính,…
Công văn có hai dạng : công văn trên giấy và công văn điện tử. Việc phân
loại này ám chỉ công văn trực tiếp (công văn giấy), công văn gián tiếp (công văn
điện tử) chứ không phụ thuộc là công văn đến hay công văn đi.
Quản lý công văn là công việc quản lí mã số của công văn; quản lý theo tiêu
chí phân loại công văn đi, công văn đến; tìm kiếm công văn theo các tiêu chí phân
loại trên; tìm kiếm theo ngày gửi, ngày nhận; tìm kiếm theo nơi ban hành hoặc nơi
nhận.
Nhóm chúng em, Nguyễn Trung và Nguyễn Ngọc Thắng đã xây dựng đề
tài này với mong muốn trợ giúp trường THPT Nguyễn Trãi - Ba Đình - Hà Nội có
một phần mềm tin học để quản lý việc gửi - nhận công văn.
PHẦN 2 - TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU VÀ ĐIỂM MỚI, SÁNG
TẠO CỦA ĐỀ TÀI
1.Tổng quan vấn đề cần nghiên cứu
Quản lí công văn là một bài toán cần thiết cho công tác quản lí văn bản ở các
văn phòng của một trường THPT, một đơn vị hành chính nhà nước, các doanh
nghiệp liên doanh hoặc ở các ngân hàng liên doanh trong nước và quốc tế.
Phần mềm có đầy đủ các chức năng:

3
- Nhập, sửa, xóa công văn đi, đến.
- Tổ chức phân loại công văn: báo cáo, quyết định, thông báo, luật - pháp
lệnh, biểu mẫu, thủ tục, khác,
- Tổ chức các đơn vị được ban hành công văn.
- Tổ chức các đơn vị nhận công văn.
- Định hướng mức ưu tiên lưu chuyển công văn: độ mật( thường, mật, tuyệt
mật, tối mật), độ khẩn (thường, khẩn, thượng khẩn, hỏa tốc), với nhiều hình thức
gửi - nhận: mạng máy tính, bưu điện, fax, trực tiếp, email, khác,
- Có nhiều tiêu chí tìm kiếm: tìm kiếm công văn đi đến trong ngày, tìm kiếm
theo phòng quản lí đơn vị, tìm kiếm qua nơi ký nhận văn bản, tìm kiếm theo số
công văn, tìm kiếm theo tên hoặc nội dung văn bản.
- Có chức năng thống kê công văn theo ngày truy nhập, theo đơn vị quản lí,
theo số văn bản hoặc theo tên công văn.
2. Tính sáng tạo của đề tài
Phần mềm được phát triển dựa trên nền tảng công nghệ số, là công nghệ
hiện đại dựa trên những bộ sưu tập thông tin của các đối tượng số hoặc đã được số
hóa có tổ chức và có tập trung ứng dụng trên nền tảng web.
Là phần mềm mã nguồn mở để chương trình có thể chạy với bất cứ mục
đích nào; có thể chỉnh sửa phù hợp với yêu cầu của lập trình viên; có thể chỉnh sửa
và tái phân phối bản sao hoặc không thu phí trên phần chỉnh sửa của phần mềm.
3. Điểm mới của đề tài
Sử dụng công nghệ quét hình - scannning cho ra sản phẩm số hóa dạng hình.
Tiếp đó cho ra sản phẩm dạng số hóa văn bản nhờ công nghệ nhận dạng kí tự
quang học- OCR (Optical Character Recognition).
Sử dụng kỹ thuật trích dẫn metadata tự động được định trước, xây dựng bộ
tổ chức biên mục và chỉ mục để định vị tổ hợp từ theo chuẩn MARC (Marchine -
Readable Cataloging record).
PHẦN 3 - QUÁ TRÌNH NGHIÊN CỨU VÀ KẾT QUẢ
1. Tìm hiểu về văn bản và phân loại văn bản

Khái niệm văn bản, theo nghĩa rộng là vật mang tin được ghi bằng ký hiệu
hay bằng ngôn ngữ, nghĩa là bất cứ phương tiện nào dùng để ghi nhận và truyền
đạt thông tin từ chủ thể này đến chủ thể khác.
Khái niệm văn bản, theo nghĩa hẹp là các tài liệu, giấy tờ, hồ sơ được hình
thành trong quá trình hoạt động của các cơ quan nhà nước, các tổ chức xã hội, các
tổ chức kinh tế. Theo nghĩa này, các loại giấy tờ dùng để quản lý và điều hành các
4
hoạt động của cơ quan, tổ chức như chỉ thị, thông tư, nghị quyết, quyết định, đề án,
báo cáo,… đều được gọi là văn bản.
Văn bản quản lí nhà nước là các công văn, giấy tờ hình thành trong hoạt
động quản lý của các cơ quan trong bộ máy nhà nước, bao gồm 3 hệ cơ quan là:
lập pháp, hành pháp và tư pháp theo một hình thức, thủ tục và thẩm quyền do pháp
luật quy định.
Trong khái niệm này, cần lưu ý:
+ Thể thức (mẫu các loại văn bản) nếu không đúng thì không có giá trị và nó
là yêu cầu mang tính bắt buộc.
+Thủ tục, tùy loại văn bản khác nhau mà khi ban hành phải theo trình tự
nhất định (Ví dụ: muốn ban hành một QĐ của Trường thì Hiệu trưởng phải soạn
thảo văn bản, tập trung ý kiến của các BGH khác liên quan, sau đó ký ban hành,
nếu không làm đúng các quy trình trên thì tính hợp pháp cũng không có giá trị.
+Thẩm quyền, là giới hạn quyền hạn của chủ thể (Ví dụ: QĐ tuyển sinh 10
là do Sở Giáo dục - Đào tạo Hà Nội ban hành, thông báo tuyển sinh là do Hiệu
trưởng ban hành,…)
Phân loại văn bản là áp dụng phương pháp khoa học để giúp cho mọi người
có thể đi sâu nhận biết một cách đầy đủ, cụ thể về các loại hình văn bản hình thành
trong hoạt động của các cơ quan, đơn vị.
Để phân loại văn bản, người ta dựa theo các tiêu chí:
+ Phân loại theo chủ thể ban hành văn bản: Chia theo hệ cơ quan ban hành
văn bản; chia theo các cơ quan cụ thể hoặc kết hợp với mối quan hệ giữa các cơ
quan trong hoạt động quản lý. Ví dụ: hệ thống văn bản của Sở Giáo dục & Đào tạo

Hà Nội, hệ thống văn bản của Bộ Tài chính,
+ Phân loại theo nguồn gốc xuất xứ của văn bản, xem văn bản từ đâu ra, từ
đâu đến, thường được chia làm 3 loại: công văn đi, công văn đến,công văn lưu
hành nội bộ.
+ Phân loại theo tên gọi của văn bản (vd: QĐ, CT, BC, TT, Hợp đồng…).
Cách thức này hay được sử dụng để tra tìm, nghiên cứu chuyên đề nào đó, thuận
lợi cho lập hồ sơ và công tác văn thư.
+ Phân loại theo mức độ chính xác: bản chính, bản sao (có giá trị như bản
chính và bản phô tô), bản gốc (bản có chữ ký và đóng dấu đỏ của thủ trưởng cơ
quan).
+ Phân loại theo kỹ thuật chế tác văn bản, hình thức này thường được các
kho lưu trữ quan tâm để có cách thức tổ chức, bảo trì phù hợp: nhóm đánh máy,
nhóm in rô - nê - ô, nhóm viết tay (chủ yếu là bản thảo, biên bản ), nhóm vi tính
(có in kim, in laze, )
5
+ Phân loại theo mục đích soạn thảo, ban hành văn bản: nhóm văn bản hỏi,
chất vấn; nhóm văn bản trao đổi; nhóm văn bản thống kê; nhóm văn bản mệnh
lệnh.
+ Phân loại theo giá trị pháp lý của văn bản. Người ta căn cứ vào phạm vi
hiệu lực về không gian hay thời gian để chia thành các nhóm: nhóm văn bản
QPPL, nhóm văn bản áp dụng pháp luật, nhóm văn bản hành chính. Trong đó hai
nhóm đầu thường được ghép vào gọi là văn bản pháp luật và nó có giá trị pháp lý
cao, còn nhóm văn bản hành chính chủ yếu mang tính chất trao đổi thông tin.
+ Phân loại văn bản theo tính chất nội dung: văn bản QPPL, văn bản hành
chính, văn bản chuyên môn (ví dụ như: các văn bản hướng dẫn các thao tác nghiệp
vụ như sổ sách, biểu mẫu,…), văn bản kỹ thuật (ví dụ như: các bản vẽ, các số liệu
kỹ thuật, các đề tài,…)
Theo thông tư liên tịch sô 55/2005/TTLT-BNV-VPCP ngày 06 tháng 5 năm
2005 của Bộ Nội Vụ và Văn Phòng Chính phủ(hướng dẫn thi hành Nghị định số
110/2004/NĐ-CP ngày 08/4/2004 của Chính phủ),

*Văn bản quy phạm pháp luật gồm các loại sau đây:
a) Luật (Lt): là văn bản được ban hành để cụ thể hóa Hiến pháp nhằm mục
đích điều chỉnh các quan hệ xã hội trong các lĩnh vực đối nội, đối ngoại, nhiệm vụ
kinh tế xã hội, an ninh quốc phòng của đất nước; quy định những nguyên tắc chủ
yếu về tổ chức và hoạt động của bộ máy Nhà nước, về quan hệ xã hội và hoạt động
của công dân. Luật có tính ổn định, không thể sửa đổi, bổ sung mà có thể thay thế
bằng văn bản luật mới, luật được Quốc hội thông qua và Chủ tịch nước ký lệnh
công bố.
b) Pháp lệnh (Pl): là văn bản có giá trị pháp lý như luật, cụ thể hóa những
quy tắc được quy định trong Hiến pháp, quy định những vấn đề được Quốc hội
giao, sau một thời gian thực hiện trình Quốc hội xem xét quyết định ban hành
thành luật. Pháp lệnh có thể sửa đổi, bổ sung trong quá trình thực hiện, do Ủy ban
Thường vụ Quốc hội thông qua và Chủ tịch nước ký lệnh công bố.
c) Lệnh (L): là văn bản dùng để công bố Hiến pháp, luật, pháp lệnh; để tổng
động viên cục bộ; để công bố tình trạng khẩn cấp trong cả nước hoặc từng địa
phương; để công bố lệnh đặc xá hoặc ân xá; để phong cấp hàm ngoại giao hoặc
quân sự cao cấp. Lệnh do Chủ tịch nước ban hành.
d) Nghị quyết (NQ): là văn bản dùng để quyết định chủ trương, chính sách
của Chính phủ, thông qua các dự án, kế hoạch và ngân sách nhà nước, phê duyệt
và điều ước quốc tế thuộc thẩm quyền của Chính phủ; cụ thể hóa các chương trình
hoạt động của Quốc hội, Hội đồng Nhân dân và Ủy ban Nhân dân; thông qua ý
kiến kết luận tại các kỳ họp của cơ quan quản lý Nhà nước. Nghị quyết là cơ sở để
tổ chức hoạt động và ban hành các văn bản về quản lý nhà nước như hiến pháp,
6
luật, pháp lệnh. Nghị quyết do Quốc hội, Chính phủ, Hội đồng Nhân dân các cấp
ban hành.
e) Nghị quyết liên tịch (NQLT): là quyết định do các cơ quan Nhà nước có
thẩm quyền kết hợp ban hành, thống nhất ý kiến trong quá trình tham gia quản lý
Nhà nước. Thẩm quyền ban hành của các văn bản liên tịch gồm có Thủ trưởng các
Bộ, cơ quan ngang Bộ, các tổ chức chính trị - xã hội cấp Trung ương có thẩm

quyền tham gia quản lý nhà nước theo luật định.
f) Nghị định (NĐ): là văn bản quy định chi tiết thi hành luật, nghị quyết của
Quốc hội; pháp lệnh, nghị quyết của Ủy ban Thường vụ Quốc hội; lệnh, quyết định
của Chủ tịch nước; quy định nhiệm vụ, quyền hạn, tổ chức bộ máy của cơ quan
nhà nước ở cấp trung ương; quy định những vấn đề cấp thiết nhưng chưa được xây
dựng thành luật hoặc pháp lệnh. Nghị định do Chính phủ ban hành.
g) Quyết định (QĐ): là văn bản dùng để quy định hay định ra chế độ chính
sách trong phạm vi của cơ quan có thẩm quyền (Chính phủ, Bộ, UBND tỉnh, thành
phố, quận huyện); điều chỉnh những công việc về tổ chức nhân sự thuộc thẩm
quyền của Chủ tịch nước, Thủ tướng Chính phủ, Bộ trưởng hoặc Thủ trưởng cơ
quan ngang Bộ, UBND các cấp ban hành.
h) Chỉ thị (CT): là văn bản dùng để truyền đạt chủ trương, quy định các biện
pháp chỉ đạo, đôn đốc, phối hợp và kiểm tra hoạt động của các bộ phận do cơ quan
có thẩm quyền phụ trách. Chỉ thị do Thủ tướng, Bộ trưởng, UBND các cấp ban
hành.
i) Thông tư (TT): là văn bản dùng để hướng dẫn thực hiện, giải thích và đề ra
các biện pháp thi hành các quy định của những văn bản quy phạm pháp luật có giá
trị pháp lý cao hơn như luật, pháp lệnh, nghị quyết, nghị định, quyết định và chỉ thị
của Thủ tướng Chính phủ. Thông tư do Bộ trưởng hoặc Thủ trưởng các cơ quan
ngang Bộ ban hành.
k) Thông tư liên tịch (TTLT): là thông tư do các cơ quan nhà nước có thẩm
quyền (Bộ, cơ quan ngang Bộ, các tổ chức chính trị xã hội cấp trung ương được
tham gia quản lý Nhà nước theo luật định) cùng phối hợp ban hành để hướng dẫn
thi hành các văn bản quy phạm pháp luật của cơ quan nhà nước cấp trên có liên
quan đến chức năng, nhiệm vụ, quyền hạn của các cơ quan đó.
*Hệ thống văn bản hành chính:
Các văn bản hành chính thông thường là những văn bản mang tính thông tin
quy phạm nhằm thực thi các văn bản quy phạm pháp luật, hoặc dùng để thực hiện
các tác nghiệp hành chính trong hoạt động của các cơ quan quản lý hành chính nhà
nước, các tổ chức khác. Đây là hình thức văn bản được sử dụng phổ biến trong các

cơ quan, tổ chức.
7
Trong hệ thống văn bản hành chính, ngoại trừ chỉ thị (cá biệt) và thông cáo
quy định rõ chủ thể ban hành, các văn bản hành chính khác không xác định thẩm
quyền ban hành theo tên loại của văn bản. Các cơ quan, tổ chức, đơn vị, cá nhân
tùy theo thẩm quyền giải quyết công việc có thể ban hành loại văn bản phù hợp.
Hệ thống văn bản hành chính bao gồm các loại sau:
** Văn bản cá biệt
a) Quyết định (cá biệt) (QĐ): là loại văn bản dùng để quy định các vấn đề về
chế độ, chính sách, tổ chức bộ máy, nhân sự và giải quyết những vấn đề khác dưới
hình thức áp dụng các văn bản quy phạm pháp luật. Việc áp dụng này chỉ được
thực hiện một lần cho một cá nhân, một sự việc hay một vấn đề cụ thể. Do đặc
điểm nói trên, chủ thể ban hành quyết định là Thủ trưởng các cơ quan quản lý Nhà
nước (Thủ tướng, bộ trưởng hoặc Thủ trưởng cơ quan ngang Bộ, UBND các cấp),
Thủ tưởng các cơ quan hành chính sự nghiệp, Thủ trưởng các doanh nghiệp nhà
nước và doanh nghiệp dân doanh.
b) Chỉ thị (cá biệt) (CT): là loại văn bản dùng để giải quyết những công việc
mang tính chất cá biệt của các cơ quan quản lý Nhà nước. Chỉ thị (cá biệt) do Thủ
trưởng, Bộ trưởng và Thủ trưởng cơ quan ngang Bộ ban hành.
**Văn bản hành chính thông thường có tên loại:
c) Thông cáo (TC): là văn bản do các cơ quan quản lý Nhà nước trung ương
dùng để công bố với Nhân dân một quyết định hoặc một sự kiện quan trọng về đối
nội, đối ngoại của quốc gia. Thông cáo do Quốc hội, Ủy ban Thường vụ Quốc hội,
Chính phủ, Ban chấp hành trung ương Đảng cộng sản Việt Nam ban hành.
d) Thông báo (TB): là loại văn bản dùng để thông tin các vấn đề trong hoạt
động của các cơ quan, đơn vị, tổ chức, cá nhân… để các đối tượng có liên quan
biết hoặc thực thi.
e) Chương trình (CTr): là loại văn bản dùng để sắp xếp nội dung công tác,
lịch làm việc cụ thể theo một trình tự nhất định và trong một thời gian nhất định.
f) Kế hoạch (KH): là loại văn bản được dùng để xác định mục tiêu, yêu cầu,

chỉ tiêu của nhiệm vụ cần hoàn thành trong một thời gian nhất định và các biện
pháp về tổ chức, nhân sự, cơ sở vật chất cần thiết để thực hiện nhiệm vụ đó.
g) Phương án( PA): là loại văn bản nêu dự kiến về cách thức, trình tự tiến
hành công việc trong hoàn cảnh, điều kiện nhất định.
h) Đề án (ĐA): Đề án là văn bản dùng để trình bày dự định, mục tiêu, kế
hoạch thực hiện công tác trong một khoảng thời gian nhất định dựa trên cơ sở
những đặc điểm, tình hình thực tiễn của cơ quan, đơn vị.
8
i) Báo cáo (BC): là loại văn bản dùng để phổ biến tình hình, sự việc, vụ việc,
hoạt động của các cơ quan, tổ chức, đơn vị, cá nhân trong một khoảng thời gian cụ
thể nhằm kiến nghị các giải pháp hoặc đề nghị cấp trên cho phương hướng xử lý.
k) Biên bản (BB): là loại văn bản dùng để ghi lại sự việc, vụ việc đã hoặc
đang xảy ra để làm chứng cứ pháp lý. Biên bản được sử dụng trong các hoạt động
của cơ quan, doanh nghiệp hoặc trong hoạt động giữa cơ quan nhà nước với công
dân.
l) Tờ trình (TTr): là loại văn bản dùng để đề xuất với cấp trên phê chuẩn hay
xét duyệt một vấn đề mới hoặc đã có trong kế hoạch mà cấp dưới không thể tự
quyết định được.
m) Hợp đồng (HĐ): là văn bản dùng để ghi lại sự thỏa thuận giữa hai hay
nhiều bên bằng văn bản, trong đó các bên ký với nhau lập một quan hệ pháp lý về
quyền lợi và nghĩa vụ.
n) Công điện (CĐ): là loại văn bản đặc trưng dùng để truyền đạt nhanh một
mệnh lệnh, một nội dung công việc đến cơ quan, đơn vị, tổ chức để thực hiện trong
trường hợp khẩn cấp.
p) Giấy chứng nhận (CN): là văn bản dùng để xác nhận một sự việc, một đối
tượng có liên quan đến hoạt động của cơ quan, doanh nghiệp.
q) Giấy ủy nhiệm (UN): là loại văn bản dùng để ghi nhận sự thỏa thuận giữa
người có quyền (hoặc người đại diện theo pháp luật) và người được ủy nhiệm.
Theo đó, người được ủy nhiệm thực hiện quyền hoặc nghĩa vụ thay cho người có
quyền (hoặc người đại diện theo pháp luật).

r) Giấy mời (GM): là loại văn bản dành cho cơ quan nhà nước sử dụng khi
cần triệu tập công dân đến trụ sở cơ quan để giải quyết những vấn đề liên quan đến
yêu cầu hoặc khiếu nại của công dân đó (giấy mời của cơ quan hành chính).
s) Giấy giới thiệu (GT): là loại văn bản dùng để cấp cho cán bộ, nhân viên
liên hệ giao dịch, giải quyết các nhiệm vụ được giao khi đi công tác.
t) Giấy nghỉ phép (NP): là loại văn bản dùng để cấp cho cán bộ, nhân viên
được nghỉ phép theo Luật Lao động để giải quyết các công việc của cá nhân.
u) Giấy đi đường (ĐĐ): là loại văn bản dùng để cấp cho cán bộ, nhân viên đi
công tác để tính phụ cấp đi đường, không có giá trị thay cho giấy giới thiệu.
v) Giấy biên nhận hồ sơ (BN): là loại văn bản dùng để xác nhận số lượng và
loại hồ sơ, giấy tờ do cơ quan hoặc cá nhân khác gửi đến.
w) Phiếu gửi (PG): là loại văn bản dùng để gửi tài liệu của cơ quan, tổ chức
đơn vị, cá nhân này đến cơ quan, tổ chức đơn vị, cá nhân khác. Phiếu gửi không
thay thế cho công văn.
9
x) Phiếu chuyển (PC): là loại văn bản dùng để chuyển hồ sơ, tài liệu của cơ
quan, tổ chức, đơn vị, cá nhân đến bộ phận khác để tiếp tục giải quyết hoặc do chủ
thể chuyển không có thẩm quyền giải quyết.
**Văn bản hành chính thông thường không có tên loại:
y) Công văn (hành chính): là loại văn bản dùng làm phương tiện giao dịch
hành chính giữa các cơ quan, tổ chức hoặc giữa cơ quan, tổ chức với công dân.
Phạm vi sử dụng của công văn rất rộng, liên quan đến các lĩnh vực hoạt động
thường xuyên của cơ quan, tổ chức.
*Phân loại bản sao văn bản
a) Bản sao y bản chính: là bản sao đầy đủ, chính xác nội dung văn bản và
được trình bày theo thể thức đúng quy định. Bản sao y bản chính phải được thực
hiện từ bản chính.
b) Bản trích sao: là bản sao một phần nội dung của văn bản và được trình
bày theo thể thức quy định. Bản trích sao phải được thực hiện từ bản chính.
c) Bản sao lục: là bản sao đầy đủ, chính xác nội dung của văn bản, được

thực hiện từ bản sao y bản chính và trình bày theo thể thức quy định.
Từ nhiều năm nay, các trường phổ thông ở Việt Nam có sự phân cấp quản
lý. Ví dụ: hệ thống các trường mầm non - tiểu học là các trường trực thuộc quản lý
của UBND Thành phố, hệ thống các trường trung học cơ sở trực thuộc quản lý của
Quận, hệ thống các trường trung học phổ thông trực thuộc quản lý của Sở Giáo
dục, hệ thống các trường trung cấp nghề và cao đằng nghề trực thuộc quản lý của
Bộ Lao động thương binh và xã hội hoặc các đơn vị hành chính liên quan, các
trường trung học, cao đẳng chuyên nghiệp và đại học trực thuộc quản lý của Bộ
Giáo Dục. Như vậy, việc phân loại công văn đi - đến phụ thuộc rất nhiều vào các
cấp quản lý. Để tìm hiểu nó, ta đi vào tìm hiểu về quy trình công văn đi - đến sau.
2. Tìm hiểu quy trình công văn đi - công văn đến
Xác định quy trình công văn đi - công văn đến căn cứ theo các tiêu chí sau:
2.1 Căn cứ theo đơn vị ban hành văn bản :
Văn bản của cơ quan cấp trên ban hành
Văn bản do chính cơ quan ban hành
Văn bản do cơ quan cấp dưới ban hành
2.2 Căn cứ theo loại văn bản
Văn bản quy phạm pháp luật (QPPL)
Văn bản hành chính
2.3 Căn cứ vào thẩm quyền ban hành văn bản
10
Thẩm quyền ban hành văn bản QPPL: Quốc hội, UBTVQH, Chủ tịch nước,
Chính phủ, Thủ tướng Chính phủ, Bộ trưởng, thủ trưởng CQ ngang bộ,…
Thẩm quyền ban hành văn bản hành chính: Giám đốc Sở Giáo dục, Hiệu
trưởng,…
2.4 Căn cứ thời điểm có hiệu lực và hết hiệu lực của văn bản
2.5 Căn cứ thể thức văn bản
Quốc hiệu: là tên nước và chế độ chính trị của một quốc gia.
Tác giả văn bản: là tên cơ quan ban hành văn bản. Dùng để chỉ vị trí của cơ
quan ban hành văn bản và nó thuộc vào hệ thống cơ quan nào.

2.6 Căn cứ vào Số, ký hiệu văn bản
Số, ký hiệu thông tin của văn bản là ký hiệu ghép giữa phần số + ký hiệu.
Ví dụ: Số 25/BC - NT
Trong đó,
+ Số của văn bản: là số thứ tự. Có nhiều cách đánh STT khác nhau: đánh
theo năm, theo nhiệm kỳ công tác hoặc theo học kỳ,…
+ Ký hiệu văn bản: là chữ viết tắt của tên loại văn bản và chữ viết tắt tên cơ
quan ban hành văn bản. Đối với các cơ quan QLNN thông thường người ta phải
ghi đầy đủ (VD: Số…/BNNPTNT, Số…/BQP…); còn đối với các cơ quan sự
nghiệp thì ghi theo quy ước của từng khối cơ quan.
2.7 Căn cứ vào Định danh, ngày tháng văn bản
Định danh văn bản, là tên của đơn vị hành chính mà cơ quan đóng trụ sở.
Mục đích dùng để biết nơi cơ quan đóng trụ sở và cấp quản lý của cơ quan đó ở
TW hay địa phương. Với các CQTW thì địa danh là tên tỉnh hoặc TP thuộc TW,
còn với cơ quan địa phương thì ghi tên của đơn vị hành chính cấp mình.
Ngày tháng văn bản, là ngày tháng năm vào sổ đăng ký, đóng dấu vào văn
bản. Văn bản phải ghi ngày tháng năm để xác định thời gian có hiệu lực của văn
bản và trách nhiệm pháp lý của văn bản, và nó cũng xác định tính chân thực cho
văn bản. Ngoài ra, nó còn phục vụ cho việc tra cứu, tìm kiếm văn bản.
Vị trí trình bày định danh, ngày tháng năm ghi ở góc trên, bên phải, dưới
phần quốc hiệu của văn bản. Giữa địa danh và ngày tháng năm của văn bản được
ngăn cách bằng dấu phảy; tên của địa danh được viết hoa theo quy định của chính
tả Tiếng Việt, phần ngày tháng không được viết tắt, nếu ngày từ 1-9, tháng là 1, 2
thì phải thêm chữ số không ở đằng trước.
Ví dụ: Hà Nội, ngày 02 tháng 05 năm 2014.
2.8 Căn cứ vào tên loại và trích yếu nội dung văn bản
11
Tên loại văn bản, là tên gọi chính thức của văn bản, dùng để xác định tính
chất và tầm quan trọng của văn bản (VD: báo cáo, chỉ thị, thông tư, hướng dẫn,…)
Trích yếu nội dung văn bản: là mệnh đề ngắn gọn, tóm tắt nội dung của văn

bản.
Đối với loại văn bản không có tên gọi, trích yếu nội dung được viết ở phía
trên, trang đầu, bên trái, dưới phần số, ký hiệu và được bắt đầu bằng chữ v/v.
2.9 Căn cứ vào con dấu
Văn bản khi có chữ ký của người có thẩm quyền thì phải được đóng dấu của
cơ quan, không đóng dấu vào văn bản ký trái thẩm quyền.
Ý nghĩa của con dấu, đảm bảo tính chân thực và pháp lý của văn bản vì con
dấu biểu thị cho tính quyền lực của cơ quan.
2.10 Căn cứ vào nơi nhận
Nơi nhận là cơ quan hoặc cá nhân tiếp nhận văn bản. Nhìn vào nơi nhận cho
ta biết những cơ quan, cá nhân nào được nhận văn bản và trách nhiệm của cơ quan,
cá nhân đó trong giải quyết văn bản.
3. Tìm hiểu về tổ chức cơ cấu Phòng - Ban ở trường THPT Nguyễn Trãi - Ba
Đình - Hà Nội
*Các phòng ban trong trương
- Phòng Hiệu trường :
-Phòng Hiệu phó
- Phòng Công Đoàn nhà trường
- Phòng Đoàn thanh niên
- Phòng Giám thị
- Phòng Bảo vệ
- Phòng Kế toán
- Phòng Thủ quỹ
* Tổ chuyên môn
- Tổ Tự nhiên: Tổ toán, Tổ Vật lý – Kỹ thuật – Tin học, Tổ Ngoại ngữ -
Thể dục.
- Tổ Xã hội: Tổ Sử - Địa – Công dân, Tổ Hóa – Sinh, Tổ Văn
-Tổ Hành chính: Tổ Bảo vệ, Tổ Lao động, Kế toán, Thủ quỹ, Văn phòng
12


Sơ đồ quản lý các Phòng - Ban của trường THPT Nguyễn Trãi - Ba Đình - Hà Nội
4. Tìm hiểu về Công nghệ số biểu diễn tài liệu văn bản
Ngày nay nguồn tài liệu điện tử phát triển nhanh chóng và sự phân tán trên
mạng nhiều đến mức không thể xử lí được một cách thủ công như đã và đang áp
dụng đối với tài liệu xuất bản trên giấy. Để xử lý được hết tài liệu điện tử phân tán,
người ta phải áp dụng các phương pháp tự động như duyệt bằng robots, crawlers,
spiders, ). Đây là những robot cho phép nhận dạng tự động các yêu cầu mô tả
thông thường như tác giả, địa chỉ về xuất bản, thông tin về khối lượng,… chúng là
những quy định thống nhất và được gọi là siêu dữ liệu.
4.1 Siêu dữ liệu (metadata).
Siêu dữ liệu (metadata) là dạng dữ liệu miêu tả về dữ liệu.
Theo Gail Hodge siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả,giải
thích, định vị hoặc làm cho nguồn tin trở nên dễ tìm kiế, sử dụng và quản lý hơn.
Siêu dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin” .
Mục đích đầu tiên và yêu cầu cốt lõi nhất của siêu dữ liệu (metadata) là góp
phần mô tả và tìm lại các tài liệu điện tử trên mạng Internet. Sự phát triển mạnh mẽ
của Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng số, văn bản,
âm thanh, hình ảnh, tài liệu đa phương tiện. Những tài liệu này có thể truy cập
được trên mạng Internet, song việc tìm kiếm chúng một cách hiệu quả, khoa học
như với các hệ thống thông tin trực tuyến là hết sức khó khăn.
Trong cơ sở dữ liệu, metadata là các biểu diễn khác nhau của các đối tượng
trong cơ sở dữ liệu.Trong cơ sở dữ liệu quan hệ thì metadata là các định nghĩa của
bảng, cột, cơ sở dữ liệu, view và các đối tượng khác. Trong kho dữ liệu, metadata
là dạng định nghĩa dữ liệu như: bảng, cột, một báo cáo, các luật doanh nghiệp hay
những quy tắc biến đổi.
13
Dữ liệu Metadata phải chứa những thông tin:
+ Cấu trúc của dữ liệu
+ Thuật toán sử dụng để tổng hợp dữ liệu
+ Ánh xạ xác định sự tương ứng dữ liệu từ môi trường tác nghiệp sang kho

dữ liệu.
4.2 Tài liệu số
Tài liệu số là đối tượng số hoặc đã được số hóa có tổ chức và có tập trung.
Có hai loại tài liệu: tài liệu đã ở dạng điện tử rồi và tài liệu in ấn cần phải số hóa.
Với tài liệu ở dạng điện tử rồi thì công việc hết sức dễ dàng để tổ chức tập tin và
chuyển đổi dạng thức, việc này rẻ hơn rất nhiều so với việc số hóa tài liệu.
Vấn đề là chúng ta phải xác định metadata. Có được metadata cần thiết và
chuyển đổi sang dạng điện tử là việc chúng ta cần làm để xây dựng bộ sưu tập.
Có hai giai đoạn trong tiến trình số hóa tài liệu. Giai đoạn đầu là quét hình -
scanning cho ra sản phẩm số hóa dạng hình, công cụ thông thường được sử dụng là
các máy quét văn bản bày bán trên thị trường. Giai đoạn hai cho ra một sản phẩm
dạng số hóa văn bản qua một tiến trình gọi là nhận dạng ký tự quang học - OCR
(Optical Character Recognition). Đây là giai đoạn quan trọng nhất đối với việc xử
lý văn bản thành dạng số. Vì ở giai đoạn một, tài liệu được quét để cho về dạng
hình ảnh, sau đó người ta chuyển hóa nó về dạng căn bản ASCII để dễ dàng tổ
chức biên mục và chỉ mục. Nhờ phần mềm OCR, tài liệu được tổ chức thành dạng
định vị được với bất kỳ tổ hợp từ nào, dễ dàng xác định từ khóa của tài liệu trong
thuật toán tìm kiếm nội dung văn bản, được gọi là kỹ thuật trích dẫn metadata tự
động. Việc xử lí vản bản tiếng Việt với tài liệu số không còn khó khăn với phần
mềm OCR, nó sẽ tự động tạo nên một tập tin định dạng HTML kèm theo để giải
quyết việc truy tìm nội dung văn bản.
4.3 Tài liệu số - XML
a) Khái quát XML
XML (eXtensible Markup Language) là ngôn ngữ tạo cấu trúc dữ liệu văn
bản được phát triển từ đầu năm 1996 dựa theo và tận dụng những điểm mạnh của
chuẩn SGML (Standard Generalized Markup Language - được coi là siêu ngôn
ngữ có khả năng sinh ngôn ngữ khác), cùng những kinh nghiệm có được từ ngôn
ngữ HTML (Hyper Text Markup Language). SGML phát triển cho việc định cấu
trúc và nội dung tài liệu điện tử do tổ chức ISO chuẩn hóa năm 1986.
SGML là do IBM đưa ra nhưng được phát triển bởi W3C (World Wide Web

Consortium: tổ chức độc lập định ra tiêu chuẩn cho định dạng Web, máy chủ và
ngôn ngữ). Nhưng XML do Netscape, Microsoft và các thành viên dự án Text
Encoding Intiative (TEI) xây dựng.
14
XML là một hệ thống có luật dùng cho việc thiết kế các khổ mẫu(format)
cho văn bản giúp tạo cấu trúc cho dữ liệu. Trong thực tế XML không phải là một
ngôn ngữ lập trình nhưng XML giúp máy tính dễ dàng tạo dữ liệu, đọc dữ liệu,
trao đổi dữ liệu và làm cho cấu trúc dữ liệu trở nên rõ ràng và dễ hiểu hơn. Ngoài
ra, XML còn có thể mở rộng, có nền tảng hoàn toàn độc lập và hỗ trợ tính quốc tế
hóa, nội địa hóa. XML được hỗ trợ hoàn toàn unicode.
b) Một số đặc điểm của XML
XML có nguồn gốc giống như ngôn ngữ định dạng siêu văn bản HTML từ
chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc SGML. Mỗi văn bản
XML cũng sử dụng các thẻ (tag) được đặt trong ngoặc mở và đóng và cũng sử
dụng thuộc tính tên gọi của các phần tử với mẫu. Ví dụ: name = “value”.
Các chương trình dùng để tạo dữ liệu XML được cấu trúc hóa và lưu dữ liệu
trên đĩa cứng, sử dụng khuôn dạng text hay nhị phân. Vì vậy, người đọc có thể đọc
nó với bất kỳ bộ soạn thảo văn bản nào tùy thích.
Khác với HTML cac luật dùng trong XML rât hạn chế, chỉ cần quên một
thẻ, hay một thuộc tính không đi kèm với nội dung sẽ làm cho toàn bộ file XML đó
ngừng hoạt động, trong khi đó lỗi này không xảy ra ở HTML.
XML cung cấp “ siêu dữ liệu” cho phép các nhà phát triển và quản trị công
nghệ thông tin mô tả thông tin có liên quan tới các nguồn thông tin khác. Cấu trúc
chặt chẽ của XML (nội dung được đặt giữa các thẻ metadata) cho phép các ứng
dụng dễ dàng tìm kiếm và sử dụng nội dung đã tạo. Môi trường tài liệu XML trở
thành một kho dữ liệu hỏi - đáp (query data repository) tương tự như cơ sở dữ liệu.
Ngôn ngữ XML là giải pháp thích hợp cho việc trao đổi dữ liệu tự động giữa các
kho thông tin trên mạng Internet.
c) Nội dung tài liệu XML
Nội dung của tài liệu XML bao gồm 2 phần:

+ Nội dung chính: hệ thống các thẻ đánh dấu (có hay không có nội dung)
tương ứng với các thông tin cần biểu diễn.
+ Nội dung phụ: hệ thống các thẻ khác có ý nghĩa bổ sung, tăng cường một
số thông tin về tài liệu XML. Các thẻ này có tác dụng giúp cho việc sử dụng, xử lý
trên tài liệu XML tốt hơn trong một số trường hợp nhất định.
Các thẻ bên trong nội dung phụ bao gồm các loại sau:
+ Thẻ khai báo tham số: cho phép mô tả thông tin chung về tài liệu XML
như version, encoding, standalone,
Ví dụ khai báo phiên bản của định chuẩn XML
< ?xml version = “1.0”?>
Ví dụ Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf -8
15
<?xml version = “1.0” encoding = “utf - 8” ?>
+ Thẻ chỉ thị xử lý: cho phép mô tả thêm một số thông tin (liên quan xử lý)
về tài liệu XML có ý nghĩa với một công cụ xử lý nào đó. Đây chính là một
phương pháp cho phép mở rộng, bổ sung các xử lý riêng vào một lớp tài liệu XML
cùng thuộc một hệ thống phân lớp nào đó.
Ví dụ: thẻ chỉ thị cần xử lý định dạng thể hiện tài liệu XML với “chương
trình định dạng” theo ngôn ngữ css được lưu trữ bên trong tập tin Dinh_dang.css.
<?Stylesheet type = “text/css” href = ‘Dinh_dang.css’?>
+ Thẻ ghi chú: cho phép bổ sung các thông tin ghi chú có ý nghĩa đối với
con người và hoàn toàn không có ý nghĩa với các hệ thống xử lý tài liệu XML.
+ thẻ CDATA, thẻ có ý nghĩa yêu cầu các bộ phân tích tài liệu XML bỏ qua
và không phân tích vào nội dung bên trong của thẻ này. Tác dụng của thẻ này là
cho phép sử dụng trực tiếp bên trong thẻ một số ký hiệu không được phép nếu sử
dụng bên ngoài.
+ Thẻ khai báo cấu trúc
+ Thẻ khai báo thực thể
4.4 Chuẩn mô tả dữ liệu
a) Chuẩn Dublin Core Metadata

Dublin Core Metadata là một trong những sơ đồ yếu tố siêu dữ liệu phổ biến
và được nhiều người biết đến. Bộ yếu tố này được hình thành lần đầu tiên vào năm
1995 bởi sáng kiến Yếu tố siêu dữ liệu Dublin Core.
Nội dung chủ yếu của chuẩn mô tả dữ liệu - Dublin Core Metadata gồm 15
trường dữ liệu. Đây là các trường dữ liệu phổ biến và hữu ích nhất kèm theo một
tài liệu số hóa để trao đổi trên mạng Internet.
Stt Dublin Core Marc 21
1
Nhan đề
(Title)
245 00$a
2
Tác giả
(Creator)
700 1#$a: Tác giả cá nhân | $eVai trò
710 2#$a: Tác giả tập thể | $eVai trò
711 2#$a: Hội nghị, hội thảo | $eVai trò
3
Chủ đề
(Subject)
653 ##$a (Thuật ngữ chủ đề không kiểm soát
650 #7$a (Thuật ngữ chủ đề có kiểm soát) | $2Nguồn
4 Mô tả(Description)
520 ##$a: Mô tả tóm tắt nội dung tài liệu
505 0#$a: Phụ chú nội dung được định dạng
5 Nhà xuất
bản(Publisher)
260 ##$b (Nhà xuất bản, phát hành, in ấn )
700 1#$a (Tiêu đề bổ sung – Tên cá nhân) | $eNhà xuất bản
16

710 2#$a (Tiêu đề bổ sung – Tên tổ chức) | $eNhà xuất bản
711 2#$a (Tiêu đề bổ sung – Tên hội nghị, hội thảo) | $eNhà xuất
bản
6
Tác giả
phụ(Contributor)
720##$a (Tiêu đề bổ sung – Tên/tên không kiểm soát): tên người,
tên tổ chức | $eThông tin về trách nhiệm liên quan
700 1#$a(Tiêu đề bổ sung – Tên cá nhân) | $eThông tin trách
nhiệm
710 2#$a(Tiêu đề bổ sung – Tên tổ chức) | $eThông tin trách nhiệm
711 2#$a (Tiêu đề bổ sung – Tên hội thảo, hội nghị) | $eThông tin
trách nhiệm
7 Ngày tháng(Date) 260 ##$g (Ngày in, ngày sản xuất)
8 Loại tài liệu(Type)
655 #7(Thuật ngữ chủ đề - Thể loại/hình thức | $2Nguồn của thuật
ngữ
9 Mô tả vật lý(Format)
856 ##$qVị trí và kiểu truy cập
300 ##$a Mô tả vật lý
10
Định
danh(Identifier)
024 8#$a(Các số/mã nhận dạng chuẩn khác)
856 40$u(Định danh tài nguyên thống nhất): URI (Uniform
Resource Identifier)
020 ##$a (ISBN: International Standard Book Number)
022 ##$a (ISSN: International Standard Serial Number)
11 Nguồn gốc(Source)
786 0#$o (Nguồn dữ liệu/Phụ chú)

URI: 786 0#$o (Nguồn dữ liệu/Chỉ số nhận dạng khác)
12 Ngôn ngữ(Language)
546 ##$a (Phụ chú ngôn ngữ)
041$4 (Mã ngôn ngữ: ISO 639-2)
13 Liên kết(Relation)
787 0#$n (Quan hệ không đặc thù/ Phụ chú)
URI: 787 0#$o (Quan hệ không đặc thù/ chỉ số nhận dạng khác)
776 0#$n (Hình thức vật lý bổ sung/ Phụ chú)
776 0#$o (Hình thức vật lý bổ sung/ Chỉ số nhận dạng khác)
14
Diện bao
quát(Coverage)
500$a (Phụ chú chung)
522##$aKhông gian (Phụ chú diện bao quát về địa lý)
513##$bThời gian (Phụ chú dạng báo cáo và thời kỳ được nói tới)
15 Bản quyền(Rights)
540 ##$a (Phụ chú điều kiện sử dụng và tái bản)
URL: 856 42$u (Địa chỉ điện tử và truy cập/Vị trí tài nguyên thống
nhất) | $3Đặc tả tài liệu
17
b) Chuẩn MARC2
MARC là từ viết tắt thuật ngữ tiếng Anh: “Machine readable cataloguing”.
Thuật ngữ này có nghĩa là “biên mục có thể đọc bằng máy”. Khổ mẫu MARC 21
là chuẩn để trình bày và trao đổi thông tin thư mục và những thông tin liên quan
dưới dạng máy tính đọc được (machine-readable). Nó là khổ mẫu trao đổi, được
thiết kế để cung cấp các đặc tả kỹ thuật cho việc trao đổi thông tin thư mục và
thông tin liên quan khác giữa các hệ thống. Với thư cách một khổ mẫu trao đổi,
MARC 21 không áp đặt những chuẩn lưu trữ dữ liệu bên trong hệ thống và chuẩn
trình bày dữ liệu (display format)
MARC 21 bao gồm 5 thành phần hoàn chỉnh hỗ trợ và bổ sung lẫn nhau để

hoàn chỉnh việc biên mục và kiểm soát dữ liệu thư mục. Khổ mẫu này còn mang
nhiều yếu tố đặc trưng quốc gia (Mỹ). 5 thành phần đó là:
+ MARC 21 Format for Authory Data: Khổ mẫu MARC 21 cho dữ liệu tác
giả.
+ MARC 21 Format for Bibliographic Data: Khổ mẫu MARC 21 cho dữ
liệu thư mục.
+ MARC 21 Format for Classification for Data: Khổ mẫu MARC 21 cho dữ
liệu phân loại.
+ MARC 21 Format for Communty Informstion: Khổ mẫu MARC 21 cho
thông tin cộng đồng.
+ MARC 21 Format for Holdings Data: Khổ mẫu MARC 21 cho dữ liệu về
vốn tư liệu.
Khổ mẫu MARC là công cụ không thể thiếu của quá trình biên mục tự
động, cho phép các thư viện chuẩn hoá các dữ liệu biên mục, tích hợp trao dổi dữ
liệu, mở rộng các phương thức tiếp cận và tra tìm tài liệu thuận tiện.
Một biểu ghi MARC 21 gồm 3 phần chính: Đầu biểu, danh mục, các trường.
Cụ thể như sau:
+ Đầu biểu (Leader) gồm các phần tử cho phép chương trình xử lý các phần
còn lại của biểu ghi (Thư mục, các trường…). Đầu biểu là một chuỗi liên tục gồm
24 ký tự được quy định những chức năng riêng biệt, để từ đó máy tính nhận dạng
và xử lý biểu ghi. Chuỗi ký tự này đứng đầu tiên trong dãy ký tự mã hoá biểu ghi
của máy tính, tiếp đó là thư mục, cuối cùng là dữ liệu thư mục.
+ Danh mục (Directory) là một chuỗi mục có độ dài cố dịnh theo ngay sau
đầu biểu dể xác định nội dung của biểu ghi. Danh mục được tạo ra bởi máy tính,
căn cứ vào biểu ghi thư mục, cho thấy trong biểu ghi thư mục bao gồm các nhãn
trường nào, vị trí bắt đầu của trường, độ dài của trường. Danh mục chỉ được sử
18
dụng bởi người lập trình máy tính, nội dung của danh mục được mã hoá bằng chữ
số.
+ Các trường của khổ mẫu MARC 21 bao gồm các trường, ngoài các trường

dành cho các yếu tố mô tả thư mục theo AACR2 như nhan đề, thông tin trách
nhiệm, thông tin xuất bản, tùng thư, đặc trưng số lượng,… còn có các trường dành
cho đề mục chủ đề, ký hiệu phân loại… Các trường này có thể chia nhỏ thành các
trường con.
Trong biểu ghi của MARC 21 mỗi trường được biểu thị bằng một nhãn
trường gồm 3 chữ số.Khổ mẫu MARc 21 có khoảng trên 200 trường, phân thành
từng khối trường tuỳ vào chức năng. Cụ thể như sau:
0XX : Thông tin kiểm soát, định danh, chỉ số phân loại,v.v.
1XX : Tiêu đề mô tả chính
2XX : Nhan đề và thông tin liên quan đến nhan đề (nhan đề, lần xuất bản, thông tin
về in ấn)
3XX : Mô tả vật lý, v.v.
4XX : Thông tin về tùng thư
5XX : Phụ chú
6XX : Các tiêu đề mô tả theo chủ đề
7XX : Tiêu đề bổ sung, không phải chủ đề hoặc tùng thư; trường liên kết
8XX : Tiêu đề tùng thư bổ sung, sưu tập, v.v.
9XX : Thông tin nội bộ
MARC 21 không ngừng mở rộng phạm vi ứng dụng và liên kết. Trong đó,
khổ mẫu thư mục MARC 21 giữ vai trò chủ đạo, với một cấu trúc hoàn thiện, có
những ưu điểm và đặc điểm nổi bật, vì vậy nó thu hút được sự quan tâm của ngành
thư viện thế giới nói chung và các thư viện Việt Nam nói riêng.
4.5 Công nghệ nhận dạng ký tự quang học OCR (Optical Character
Recognition).
Đây là công nghệ được áp dụng để nhận dạng ký tự trên một định dạng file
hình và chuyển nó thành định dạng file text.
OCR thường được ứng dụng như một phần mềm cài đặt trên máy tính hoặc
tích hợp đi kèm với phần cứng (ví dụ: máy Scanner) hoặc được thiết lập như một
ứng dụng trực tuyến.
Có thể kể ra một số phần mềm OCR nổi tiếng nhất hiện nay

+ ABBYY FineReader là phần mềm OCR thông minh có thể chuyển đổi tài
liệu giấy, ảnh số và các tập tin PDF sang văn bản điện tử ở định dạng có thể soạn
thảo và tìm kiếm được. ABBYY FineReader thế hệ mới nhất (phiên bản 11) là thế
19
hệ đầu tiên hỗ trợ nhận dạng tiếng Việt. Không chỉ nhận dạng tiếng Việt với độ
chính xác lên tới 99%, ABBYY FineReader 11 còn có khả năng giữ nguyên định
dạng và dàn trang của tài liệu gốc tốt hơn bao giờ hết.
+ OmniPage là một ứng dụng đi kèm với dòng máy Kodak ScanMate i1120
giúp nhận dạng văn bản sau khi quét.
+ Website www.ocrnow.com là một trang web cung cấp giải pháp OCR trực
tuyến giúp người dùng có thể upload trực tiếp file cần OCR lên server và nhận lại
kết quả dưới dạng text chỉ sau vài phút.
+ VnDOCR hoặc VietOCR là các phần mềm nhận dạng Tiếng Việt của Việt
Nam. Dự án này được phát triển dựa trên nền tảng mã nguồn mở của Tesseract -
ocr do Google tài trợ. Tuy nhiên thì các chương trình này vẫn còn trong giai đoạn
khởi đầu, tính năng và chất lượng nhận dạng chỉ ở mức trung bình. Đối với các văn
bản viết tay thì hầu như chưa nhận dạng được.
Hạn chế của OCR là: các chương trình hỗ trợ OCR có thể nhận dạng ký tự
với tỷ lệ trên 90% đối với chất lượng hình ảnh rõ nét và font chữ thông thường.
Nhưng đối với hình chất lượng kém, font chữ đặc biệt hoặc chữ viết tay thì kết quả
cho ra không mấy khả quan. Đối với văn bản Tiếng Việt thì tỷ lệ phần trăm chính
xác không cao so với các văn bản ngôn ngữ khác.
5. Tìm hiểu về ngôn ngữ lập trình ASP.NET ứng dụng cho bài toán
“Quản lí công văn với công nghệ số”
a) Khái quát về ASP
ASP (Active Server Pages) là một công cụ phát triển Web hàng đầu của
Microsoft. Sự thành công của nó nhờ vào tính dễ dùng và tính linh hoạt, cung cấp
một cách đơn giản để tạo các chuyên khu Web động.
ASP.NET là một phần của toàn bộ cơ cấu .NET, được xây dựng trên
Common Language Runtime (CLR) là một thời gian chạy cho tất cả các ngôn

ngữ .NET. Nó chịu trách nhiệm về việc thi hành và quản lí toàn bộ mã được viết
bằng một ngôn ngữ bất kỳ nhắm đến nền tảng .NET. CLR hoàn toàn khác biệt với
các trình biên dịch khác ở chỗ là nó biên dịch toàn bộ mã theo bẩm sinh.
Trong các trình biên dịch .NET, IL (Intermediate Language) là một ngôn
ngữ, nó được biên dịch, được chuyển đổi thành mã máy, rồi thi hành. Để bổ trợ IL,
các trình biên dịch có đích là CLR cũng phát ra dữ liệu mêta phong phú mô tả các
kiểu hàm chứa với một DLL hoặc EXE và thông tin phiên bản phụ thuộc. Dữ liệu
mêta này cho phép CLR phân giải một cách thông minh các tham chiếu giữa các
tập tin ứng dụng khác nhau vào thời gian chạy, và cũng gỡ bỏ mối phụ thuộc vào
sổ đăng ký hệ thống.
CLR cung cấp nhiều dịch vụ cốt lõi cho các ứng dụng như: gom rác, xác
minh mã, và bảo mật truy cập mã. CLR có thể cung cấp các dịch vụ này nhờ vào
20
cách nó quản lý luồng thi hành mã, và sự việc nó có thể hiểu rõ tất cả các kiểu
được dùng bên trong mã nhờ vào dữ liệu mêta phong phú mà các trình biên dịch
tạo.
Mã được tạo cho một ứng dụng được thiết kế để chạy dưới CLR có tên mã
có quản lý (managed code), cónghĩa là mã tự mô tả vận dụng CLR và yêu cầu nó
chạy. Thể hiện các chức năng sau:
+ Luôn định vị dữ liệu mêta kết hợp với một phương pháp vào một thời
điểm bất kỳ đúng lúc.
+ Bước qua ngăn xếp
+ Điều quản các ngoại lệ
+ Lưu trữ và truy lục thông tin bảo mật
Các yêu cầu cấp thấp này là cần thiết để CLR xem xét mã, cung cấp các dịch
vụ và đảm bảo tính nguyên vẹn.
b) Cấu hình ứng dụng ASP.NET trong IIS.
Mục đích của việc tạo cấu hình ứng dụng ASP.NET trong ISS là để tạo
chuyên khu Web riêng. Điều này cho phép người sử dụng gọi chúng trên trình
duyệt bằng cách gõ: http://localhost.

Việc đầu tiên cần làm đó là quyết định nơi tạo các mẫu riêng cho phần mềm.
Ta tạo ra một thư mục \InetPub\wwwroot và dùng một Virtual Site hoặc Virtual
Directory để trỏ đến nó. Điều này có nghĩa
Thư mục bin là nơi các thành phần của một ứng dụng sinh sống. ASP sẽ tự
động nạp các thành phần đã thay đổi, và dùng chúng để xử lý tất cả các yêu cầu
web mới hiện chưa thi hành, trong khi vẫn giữ các phiên bản cũ của các thành phần
ở tình trạng nạp cho đến khi hoàn tất các yêu cầu hoạt động trước đó.
c) Làm việc với cơ sở dữ liệu quan hệ
Tạo và điền một DataTable mới bằng phương pháp Add . Việc khai báo các
kiểudữ liệu trong bảng được điều quản thư viện lớp System. Công việc này cũng
giống như làm việc với cơ sở dữ liệu trên Access hoặc SQL Server bao gồm các
tính năng sau:
+ Tạo bảng, bổ sung bảng
+ Chỉ định khóa chính và khóa lạ
+ Việc truy cập được thực hiện bằng lệnh DataReader
+ Truy cập dữ liệu bằng DataSet, sử dụng từ khóa New kèm với một đối
tượng DataAdapter để truy cập.
+ Cho phép bổ sung, sửa đổi, gỡ bỏ, và xóa các hàng
+ Cho phép sắp xếp và lọc dữ liệu nhờ đối tượng DataTable, DataView
21
+ Cho phép ánh xạ cột và bảng
d) Viết các trang ASP.NET với đối tượng HttpRequest và HttpResponse
+ Đối tượng HttpRequest trong ASP.NET được ánh xạ theo tính chất
Request của đối tượng Page. Với ASP, bạn phải tham chiếu sưu tập
ServerVariables nếu muốn có thông tin về User Agent, IP Address của hệ khách
thực hiện yêu cầu hoặc thậm chí đường dẫn vật lí đến tập tin nguồn ASP.NET.
Nhưng nhờ HttpRequest mà tiến trình truy cập thông tin trở nên dễ và đơn giản
hơn nhiều. Ngoài ra, nó còn chứa tính chất Browser, chứa thông tin về các khả
năng của trình duyệt thực hiện yêu cầu.
Sưu tập Param gồm tất cả các mục QueryString, Form, ServerVariables và

Cookie ngầm định của chính đối tượng Request.
Đối tượng HttpRequest có một phương pháp MapPath. Phương pháp này sẽ
chấp nhận một đường dẫn ảo đến một tập tin dưới dạng một tham số và trả về
đường dẫn vật lí đến tập tin trên hệ phục vụ.
Phương pháp SaveAs, cho phép bạn lưu nội dung của yêu cầu hiện hành ra
đĩa. Điều này rất có ích trong khi gỡ rối một ứng dụng web.
+ Đối tượng HttpResponse, cho phép bạn gửi dữ liệu trở lại cho trình duyệt
dưới dạng kết quả của một yêu cầu. Đối tượng HttpResponse được ánh xạ theo tính
chất Response của đối tượng Page và do đó sẵn có trực tiếp bên trong các trang
ASP.NET.
Tính chất BufferOutput, tính chất Boolean này được ấn định cách gửi dữ liệu
đáp ứng trở lại cho hệ khách. Nó được ấn định là True, là giá trị ngầm định, thì nội
dung của đáp ứng được lưu giữ trên hệ phục vụ cho đến khi hoàn tất đáp ứng, hoặc
cho đến khi vùng đệm được gửi tường minh trở lại cho hệ khách. Khi giá trị này là
false, thông tin được gửi trở lại cho trình duyệt ngay khi nó được trang phát sinh.
Tham số Output và OutputStream đưa ra nội dung của vùng đệm dưới dạng
một đối tượng TextWrite hoặc một đối tượng Stream. Kết hợp với phương pháp
Save của lớp Bitmap để có thể tạo ảnh trong ASP.NET.
Phương pháp WriteFile cho phép đơn giản hóa đáng kể việc kết xuất thông
tin tập tin gốc cho đáp ứng. Phương pháp này chấp nhận một tên tập tin làm tham
số, và sẽ thực hiện toàn bộ công việc điều quản tập tin cần thiết để mở một tập tin
đó, đọc nó, rồi kết xuất nội dung của nó ra vùng đệm đáp ứng.
e) Các điều khiển danh sách và kết gán dữ liệu
Trong phần này đã nghiên cứu việc cung cấp một tập tin cơ sở .mdb
Microsot Access và hai ký mã SQL để tạo cơ sở dữ liệu trong SQL Server. Các tập
tin này và các chỉ dẫn về cách tạo cơ sở dữ liệu nằm trong thư mục database chứa
các tập tin mẫu.
22
Kết gán dữ liệu được thực hiện qua một số tính năng của ASP.NET như sau:
+ Cú pháp kết gán dữ liệu

+ Kết gán đơn trị
+ Kết gán giá trị lặp
+ Dùng các tập mẫu với các điều khiển được kết gán dữ liệu
+ Điều quản các sự kiện kết gán dữ liệu
+ Sắp xếp, lọc các hàng trong một DataGrid
+ Tự động phân trang trong một DataGrid
+ Lựa và điều chỉnh dữ liệu bằng điều khiển DataGrid và DataList.
f) Quản trị dữ liệu XML trong .NET
Quản trị dữ liệu XML trong .NET bao gồm các mục
+ Ghi, đọc dữ liệu từ một tập DataSet ra một tập XML
+ Lấy XML dưới dạng một chuỗi từ một DataSet
+ XML lồng ghép và dữ liệu liên quan trong một DataSet
+ XmlDataDocument và DataSet Synchronization
+ Đọc dữ liệu XML trực tiếp từ SQL Server
g) Ứng dụng Web và Global.asax
6. Đánh giá những vấn đề đã đạt được
a) Viết trang mẫu Đăng nhập hệ thống
b) Viết trang giao diện phần mềm hệ thống
c) Viết các trang chức năng của phần mềm
+ Thoát hệ thống
+ Đổi mật khẩu
+ Quản lí đơn vị
+ Ký nhận văn bản
+ Sổ công văn
+ Nhập văn bản
+ CV trong ngày
+ Sổ công văn
+ Kiểm tra kỳ nhập
+ Tìm văn bản
Phần mềm được viết bằng ngôn ngữ ASP.NET với mã nguồn mở.

Chuyển tài liệu giấy thành dạng tài liệu điện tử, tài liệu số hóa.
23
Quy trình chuyển - nhận công văn đi đến được thực hiện trên mạng Internet
hoặc mạng nội bộ.
Phần mềm dễ dàng cài đặt, vận hành nhanh, đơn giản trong quy trình sử
dụng.
7. Mục tiêu phát triển đề tài thi cấp Quốc gia - tháng 3/2015
Tiếp tục triển khai phần mềm có chất lượng cao hơn: mẫu công văn sẽ được
định dạng theo tiêu chuẩn của nhà nước ban hành để các đơn vị truy cập, tải và sử
dụng. Kiểm soát các công văn sai mẫu quy định.
Sử dụng công nghệ quét hình - scannning cho ra sản phẩm số hóa dạng hình.
Tiếp đó cho ra sản phẩm dạng số hóa văn bản nhờ công nghệ nhận dạng kí tự
quang học- OCR (Optical Character Recognition).
Sử dụng kỹ thuật trích dẫn metadata tự động được định trước, xây dựng bộ
tổ chức biên mục và chỉ mục để định vị tổ hợp từ theo chuẩn MARC (Marchine -
Readable Cataloging record), chuẩn Dublin Core Metadata.
Tiếp tục cải tiến phần mềm với nhiều chức năng phong phú, thân thiện.
24
KẾT LUẬN
Trước đây, việc gửi - nhận công văn ở các trường học được thực hiện qua
văn thư của nhà trường với các hình thức gửi - nhận đều được chuyển bằng tay.
Công nghệ máy tính phát triển, con người đã đổi mới cách thức soạn thảo tài liệu,
công văn, trên máy tính cá nhân (máy trạm) và gửi đến một máy tính cá nhân khác
(máy đích) qua hệ thống mạng nội bộ hoặc đường truyền internet. Như vậy, máy
tính trở thành công cụ vận chuyển công văn đến - công văn đi nhanh chóng, thuận
tiện và hiệu quả. Nhưng chưa hẳn đã tối ưu, vì công văn đến và đi trong ngày có
thể rất lớn, có nhiều người muốn chia sẻ từ tài liệu gốc để truy cập, đọc và sửa
chữa, bổ sung thông tin. Điều này, khó có thể thực hiện được vì tài liệu có những
tài liệu đã được số hóa như tài liệu điện tử, tài liệu soạn thảo bằng máy tính nhưng
vẫn còn tồn tại những tài liệu chưa số hóa (tài liệu giấy).

Phần mềm máy tính với cái tên “Quản lý công văn với công nghệ số” sẽ
giúp các thầy các cô quản lý dễ dàng công văn đi - đến diễn ra hàng ngày. Phần
mềm có khả năng tự động phân loại văn bản theo chuẩn quốc tế, chuẩn MARC và
chuẩn Dublin Core Metadata. Phần mềm cũng triển khai ứng dụng công nghệ số
đối với mọi tài liệu văn bản (ở đây là các công văn đi, công văn đến) để chuyển
hóa tài liệu giấy thành tài liệu dạng text và cuối cùng thành tài liệu dạng ASCII.
Việc tìm kiếm văn bản được triển khai ở tìm kiếm lướt, tìm kiếm nhanh dựa
trên các thuật toán tìm kiếm metadata và dựa vào các đặc tính CLR (Common
Language Runtime) của ASP.NET.
Phần mềm cũng nghiên cứu phương pháp nhận dạng tiếng Việt tự động như
OCR (Optical Character Recognition)-nhận dạng kí tự quang học.
Trên đây là toàn bộ ý tưởng của đề tài thuộc nhóm tác giả Nguyễn Trung và
Nguyễn Ngọc Thắng - là các học sinh của trường THPT Nguyễn Trãi - Ba Đình -
Hà Nội.
Trong quá trình nghiên cứu, học tập và phát triển dự án, chúng em đã gặp
phải không ít khó khăn và thất bại. Chúng em vô cùng biết ơn các Thầy, Cô đã
hướng dẫn và giúp đỡ chúng em xây dựng chương trình ngày một hoàn thiện.
Chân thành cảm ơn các Thầy, các Cô.
25

×