ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HÀ THANH
NGHIÊN CỨU VÀ ĐỀ XUẤT PHƯƠNG PHÁP
MÔ HÌNH HÓA TRI THỨC CHO HỆ THỐNG VĂN BẢN LUẬT
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
HÀ NỘI - 2017
i
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HÀ THANH
NGHIÊN CỨU VÀ ĐỀ XUẤT PHƯƠNG PHÁP
MÔ HÌNH HÓA TRI THỨC CHO HỆ THỐNG VĂN BẢN LUẬT
Ngành:
Công nghệ thông tin
Chuyên ngành:
Kỹ thuật phần mềm
Mã số:
60480103
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS. NGUYỄN VIỆT HÀ
HÀ NỘI - 2017
ii
LỜI CAM ĐOAN
Tôi xin cam đoan công việc trong luận văn này được thực hiện bởi chính tôi.
Các số liệu, kết quả được trình bày trong luận văn là hoàn toàn trung thực. Tất cả
các tài liệu tham khảo, công trình nghiên cứu, kết quả công việc của người khác
được sử dụng trong đề tài đều được ghi rõ nguồn. Nếu như những gì tôi nói trên
đây là trái sự thật, tôi xin chịu mọi trách nhiệm theo pháp luật và quy định của nhà
trường.
Hà Nội, ngày ... tháng ... năm ......
Chữ ký ..........................................
i
LỜI CẢM ƠN
Thực hiện luận văn là việc cá nhân của mỗi học viên cao học để có thể lấy
bằng Thạc sỹ nhưng để luận văn có được chất lượng tốt và có đóng góp thực tiễn
cho xã hội thì đó là công sức của nhiều người.
Đầu tiên, tôi xin cảm ơn gia đình tôi, những người đã ủng hộ tôi tuyệt đối
trên nhiều phương diện để tôi có thể theo đuổi sự lựa chọn của mình. Tôi cũng xin
cảm ơn Thầy Nguyễn Việt Hà, người Thầy đã truyền cho tôi động lực, cho tôi
nhiều kiến thức và kinh nghiệm quý báu trong nghiên cứu khoa học nói chung và
trong thực hiện đề tài nói riêng.
Tôi xin cảm ơn các thầy cô tại Trường Đại học Công nghệ và Khoa Luật, Đại
học Quốc gia Hà Nội, những người đã đào tạo và giúp tôi trưởng thành trong năng
lực nghề và năng lực nghiên cứu.
Tôi xin cảm ơn các bạn sinh viên trong nhóm nghiên cứu Skylab, Trường
Đại học Công nghệ, ĐHQGHN đã cùng tham gia đóng góp ý kiến cho đề tài và
giúp sức cho tôi trong việc thu thập dữ liệu cũng như thử nghiệm phương pháp
được đề xuất trong luận văn.
Tôi xin chân thành cảm ơn!
ii
MỤC LỤC
CHƯƠNG 1. ĐẶT VẤN ĐỀ ........................................................................... 1
1.1. Lý do chọn đề tài ....................................................................................... 1
1.2. Các nghiên cứu liên quan........................................................................... 2
1.2.1. Các nghiên cứu về biểu diễn tri thức.................................................. 2
1.2.2. Các nghiên cứu về Legal Engineering ............................................... 4
1.3. Nhiệm vụ của luận văn .............................................................................. 5
1.4. Cấu trúc luận văn ....................................................................................... 5
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT ............................................................... 7
2.1. Mô hình hóa tri thức .................................................................................. 7
2.1.1. Tri thức và biểu diễn tri thức .............................................................. 7
2.1.2. Mô hình tri thức .................................................................................. 8
2.1.3. Phương pháp mô hình hóa tri thức bằng ngôn ngữ khung ................. 8
2.1.4. Phương pháp mô hình hóa tri thức bằng luật sinh ............................. 9
2.1.5. Phương pháp mô hình hóa tri thức bằng mạng ngữ nghĩa ...............10
2.2. Văn bản pháp luật ....................................................................................12
2.2.1. Văn bản pháp luật và vai trò của văn bản pháp luật.........................12
2.2.2. Các loại văn bản pháp luật ...............................................................12
2.2.3. Đặc trưng về hiệu lực của văn bản pháp luật ...................................14
CHƯƠNG 3. MÔ HÌNH HÓA TRI THỨC CHO VĂN BẢN LUẬT ...... 15
3.1. Mô tả bài toán ..........................................................................................15
3.2. Phân tích tính chất của văn bản pháp luật................................................15
3.3. Mô tả phương pháp ..................................................................................17
3.3.1. Phân tích và lựa chọn kỹ thuật biểu diễn .........................................17
3.3.2. Cấu trúc khung .................................................................................18
3.3.3. Các luật suy diễn ..............................................................................23
3.5. Đánh giá phương pháp .............................................................................24
3.5.1. Điểm mạnh của phương pháp...........................................................24
iii
3.5.2. Hạn chế của phương pháp ................................................................25
CHƯƠNG 4. THỰC NGHIỆM .................................................................... 26
4.1. Phương pháp và dữ liệu thực nghiệm ......................................................26
4.2. Kết quả thực nghiệm và phân tích ...........................................................29
4.3. Xây dựng hệ thống hướng dịch vụ ..........................................................31
4.4. Đánh giá thực nghiệm ..............................................................................35
CHƯƠNG 5. KẾT LUẬN ............................................................................. 36
PHỤ LỤC A. CÁC CĂN CỨ PHÁP LÝ........................................................ 37
PHỤ LỤC B. CÀI ĐẶT CÁC LUẬT SINH .................................................. 42
TÀI LIỆU THAM KHẢO ............................................................................... 43
iv
Danh sách hình vẽ
Hình 1.1. Kiến trúc phân tầng của web ngữ nghĩa [39]........................................ 3
Hình 2.1. Dữ liệu, thông tin và tri thức [30] ......................................................... 7
Hình 2.2. Ví dụ về mạng ngữ nghĩa....................................................................10
Hình 2.3. Ví dụ về nhược điểm của mạng ngữ nghĩa .........................................11
Hình 3.1. Minh họa quan hệ trích dẫn giữa các VBPL ......................................21
Hình 3.2. Minh họa quan hệ hướng dẫn giữa các VBPL ...................................22
Hình 3.3. Minh họa quan hệ thay thế giữa các VBPL ........................................22
Hình 4.1. Dữ liệu thu thập được .........................................................................26
Hình 4.2. Tình trạng văn bản 01/2000/NQ-HĐTP theo CSDLQG ....................31
Hình 4.3. Kiến trúc của hệ cơ sở tri thức ............................................................32
Hình 4.4. Truy vấn và phản hồi giữa client và server ........................................33
Hình 4.5. Ứng dụng Hỗ trợ soạn thảo văn bản luật IEE.....................................34
Hình 4.6. Ứng dụng hỗ trợ đọc văn bản luật ......................................................34
Danh sách bảng
Bảng 3.1. Mức lương tối thiểu vùng thay đổi qua từng năm..............................17
Bảng 3.2. Các loại văn bản pháp luật .................................................................18
Bảng 3.3. Khung về loại văn bản........................................................................19
Bảng 3.4. Khung về văn bản pháp luật ...............................................................20
Bảng 3.5. Khung về quan hệ...............................................................................23
Bảng 3.6. Danh sách các luật suy diễn ...............................................................24
Bảng 4.1. Thống kê dữ liệu theo loại văn bản ....................................................27
Bảng 4.2. Thống kê dữ liệu theo năm ban hành .................................................28
Bảng 4.3. Kết quả thực nghiệm ..........................................................................29
v
Các ký hiệu viết tắt
AMD
BLDS
CPU
CSDLQG
GPU
IEE
KMP
MHz
MIPS
NĐ
NQ
QPPL
RAM
REST
TT
VBADPL
VBHC
VBPL
VBQPPL
Advanced Micro Devices
Bộ luật dân sự
Central Processing Unit
Cơ sở dữ liệu quốc gia
Graphic processing unit
Integrated editing environment
Thuật toán Knuth–Morris–Pratt
Megahertz.
Million instructions per second
Nghị định
Nghị quyết
Quy phạm pháp luật
Random Access Memory
Representaion State Transfer
Thông tư
Văn bản áp dụng pháp luật
Văn bản hành chính
Văn bản pháp luật
Văn bản quy phạm pháp luật
vi
Tóm tắt
Văn bản pháp luật đóng một vai trò quan trọng trong hệ thống pháp luật của
mọi quốc gia. Với mục tiêu xử lý tự động các thông tin và phát huy hiệu quả của
các tri thức từ văn bản pháp luật, chúng ta cần một phương pháp mô hình hóa tri
thức phù hợp cho chúng. Trong phạm vi của nghiên cứu này, chúng tôi khảo sát kỹ
lưỡng các đặc tính của hệ thống văn bản pháp luật Việt Nam và đề xuất phương
pháp mô hình hóa cho các văn bản và quan hệ giữa chúng. Thách thức chính của
công việc này là xử lý được tính chất luôn thay đổi của các văn bản luật, khoảng
thời gian có hiệu lực và các mối liên hệ chặt chẽ giữa chúng. Các tính chất và các
mối quan hệ được biểu diễn trong cơ sở tri thức mà chúng tôi thiết kế được lựa
chọn để thông tin trong các văn bản pháp luật trở nên hữu dụng nhất. Khi biểu diễn
cơ sở tri thức của mình, chúng tôi so sánh ba phương pháp biểu diễu tri thức phổ
biến là: Mạng ngữ nghĩa, Luật sinh và Ngôn ngữ khung, trên cơ sở đó, các điểm
mạnh của các phương pháp này được kế thừa trong phương pháp được đề xuất
trong nghiên cứu. Bên cạnh đó, chúng tôi cài đặt một hệ thống hướng dịch vụ cung
cấp dịch vụ truy vấn tri thức cho các hệ thống khác.
Từ khóa
Mô hình hóa tri thức, Văn bản pháp luật Việt Nam, Ngôn ngữ Khung, Luật sinh.
vii
Abstract
Legal documents play an important role in legal system of every nation. In
order to automated process information and make use of knowledge from legal
documents, we need an appropriate knowledge representation for them. In this
research, we investigate properties of Vietnamese legal document system and
propose a representation for the documents and their relationships. The main
challenge for this task is dynamic charateristics, validity period and binding
relationships among legal documents. Properties and relationships which we design
to represent in our knowlege base are selective in order to make use of information
within legal documents. In order to represent our knowlege base, we compare three
methods: Semantic Network, Production Rules, Frame Language and make use of
their advantages in our representation. Moreover, we implement a service-oriented
system providing knowledge querying service for other application systems based
on our research result.
Keywords
Knowledge representation, Vietnamese Legal Document System, Frame
language, Production rule.
viii
Luận văn đầy đủ ở file: Luận văn full