Tải bản đầy đủ (.pdf) (7 trang)

Sử dụng bài toán thỏa mãn ràng buộc để so khớp Ontology mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (490.34 KB, 7 trang )

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thơng tin (FAIR); Huế, ngày 07-08/6/2019
DOI: 10.15625/vap.2019.00054

SỬ DỤNG BÀI TỐN THỎA MÃN RÀNG BUỘC ĐỂ SO KHỚP
ONTOLOGY MỜ
Quách Xuân Hƣng
Khoa Công nghệ thông tin, Trường Đại học khoa học, Đại học Huế

TĨM TẮT: Bài tốn tích hợp ontology mờ có thể được chia thành hai giai đoạn: giai đoạn khớp giữa các ontology và giải quyết
mâu thuẫn trong các giá trị mờ. Bài viết này tập trung vào các vấn đề của giai đoạn so khớp, với phương pháp vét cạn và theo kinh
nghiệm hiện có. Hướng vét cạn thường xảy ra nhiều lỗi khớp, tuy nhiên hầu hết các cặp so khớp giữa hai ontology đều được phát
hiện. Cách tiếp cận theo hướng kinh nghiệm, thường dựa vào các tính chất ontology để cắt tỉa các cặp khơng tương đồng trước khi
so khớp. Với cách tiếp cận này mức độ xẩy ra so khớp sai giảm đáng kể, tuy nhiên thường bỏ qua nhiều cặp thành phần tương đồng
trong quá trình so khớp. Để khắc phục nhược điểm của hai phương pháp trên, chúng tôi đã đề xuất sử dụng bài tốn thỏa mãn ràng
buộc (CSP) để mơ hình hóa bài tốn so khớp ontology. Cụ thể, ở đây đề xuất các ràng buộc và đưa ra hàm tối ưu để tối thiểu các lỗi
so khớp. Bên cạnh đó, sử dụng phương pháp đồng thuận để xác định đại diện tốt nhất giữa các đối tượng mâu thuẫn trong q trình
tích hợp ontology mờ.
Từ khóa: Ontology, Tích hợp ontology, So khớp ontology, Thỏa mãn ràng buộc.

I. GIỚI THIỆU
Trong các hệ thống tri thức phân tán luôn luôn tồn tại tính khơng đồng nhất của thơng tin, vấn đề này cần thiết
phải giải quyết khi các hệ thống có yêu cầu trao đổi, chia sẻ, tái sử dụng thông tin và dữ liệu. Ontology được xem là
nền tảng của các hệ thống thơng tin tri thức, vì vậy trong q trình sử dụng và triển khai các hệ thống này chúng ta cần
thiết phải thực hiện tích hợp các ontology. Tuy nhiên thực hiện điều này là vấn đề phức tạp vì tính khơng đồng nhất về
thơng tin và cấu trúc đa dạng của nó. Tích hợp tri thức là một q trình mà trong đó sự khơng nhất qn của tri thức từ
các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức. Các nghiên cứu gần đây về tích hợp
ontology được thực hiện theo các mức độ khác nhau: so khớp ontology (ontology matching), liên kết ontology
(alignment ontology), trộn ontology (merge ontology), ánh xạ ontology (ontology mapping). Khái niệm tích hợp
ontology được định nghĩa như sau [1]: cho n ontology
tích hợp ontology là xác định một ontology mới tốt
nhất từ các các ontology


đã cho. Các nghiên cứu về tích hợp ontology, trước hết cần mơ hình hóa ontology mà
thơng thường họ sử dụng logic mơ tả cho mơ hình hóa ontology. Để tích hợp các ontology, các phép tốn tương đương
giữa các thành phần ontology được nghiên cứu. Ngoài ra, chiến lược hay phương pháp tích hợp ontology cũng là vấn
đề được quan tâm.
Hiện nay, khái niệm ontology rõ dựa trên logic mơ tả truyền thống bị hạn chế vì khơng đủ khả năng để mô tả và
biểu diễn các thông tin mơ hồ và không chắc chắn. Điều này dẫn đến sự xuất hiện ngày càng nhiều các nghiên cứu về
ontology mờ. Cùng với các định nghĩa ontology mờ được đề xuất, các nghiên cứu về tích hợp ontology mờ bắt đầu
được quan tâm. Các kỹ thuật tích hợp ontology rõ hiện nay không phù hợp với ontology mờ. Thực tế hiện nay khơng
có nhiều nghiên cứu về bài tốn tích hợp ontology mờ. Các nghiên cứu về so khớp/liên kết ontology trên ontology mờ
[2] có thể được phân thành hai loại: một là phương pháp tiếp cận mở rộng so khớp ontology rõ để giải quyết bài toán so
khớp trên ontology mờ; hai là phương pháp tiếp cận giải quyết tính mơ hồ của các khái niệm trong q trình so khớp.
Rung-Ching Chen [3] và các cộng sự đề xuất một phương pháp trộn ontology kết hợp WordNet và FFCA (Fuzzy
Formal Concept Analysis) [4] để tạo một ontology mờ gọi là trộn FFCA. Gần đây nhóm nghiên cứu của Giáo Sư
Nguyễn Ngọc Thành đã đề xuất các giải pháp xử lý mâu thuẫn ontology mờ cho bài tốn tích hợp ontology mờ [4-7].
Chúng tơi cũng đã nghiên cứu về tích hợp ontology mờ dựa trên lý thuyết đồng thuận [8]. Trong bài báo này, đề xuất
một mơ hình chung cho việc tích hợp ontology sử dụng lập trình ràng buộc CSP. Bên cạnh đó, đề xuất phương pháp xử
lý mâu thuẫn tính mờ giữa các thành phần tích hợp sử dụng phương pháp đồng thuận.
II. MƠ HÌNH HĨA ONTOLOGY MỜ DỰA VÀO LOGIC MÔ TẢ MỜ
Bài báo này đề xuất một mơ hình ontology mờ trong đó các thành phần được mờ hóa bằng cách sử dụng một
hàm thành viên. Ở đây ontology mờ được đề xuất bằng cách tích hợp logic mờ và logic mô tả mờ vào ontology rõ để
giải quyết hiệu quả các phương pháp lập luận tri thức ontology mờ. Định nghĩa về ontology mờ ở đây là mở rộng của
các khái niệm ontology mờ đã được đề xuất trước đó [8]:
Định nghĩa 1: Ontology mờ
Cho (A, V) là một thế giới thực, trong đó A là tập hữu hạn các thuộc tính, V miền giá trị của A. Ontology mờ
được định nghĩa là bộ tứ (C, R, I, Z), trong đó:
– C là tập hữu hạn các khái niệm mờ. C
của khái niệm
,
[0,1].


)| i=1..n}, trong đó

là giá trị hàm thành viên


SỬ DỤNG BÀI TỐN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ

424

– R là tập các quan hệ mờ giữa các khái niệm, R= { , ,…,
},
C C [0,1], i = 1,..,m. Một quan hệ
là một tập bao gồm một cặp khái niệm và giá trị mờ biểu diễn mức độ quan hệ giữa chúng. Mối quan hệ
giữa hai
khái niệm trong ontology chỉ được biểu diễn bằng một giá trị mờ duy nhất, nghĩa là nếu (c, c’, v)
và (c, c’, v’)
thì v = v’.
– I là tập các thực thể mờ, I = { ,
của trường hợp
[0,1].

,…,

},

, trong đó

là giá trị hàm thành viên

- Z là tập hợp các tiên đề, các ràng buộc toàn vẹn hoặc mối quan hệ giữa các khái niệm và thực thể trong

ontology mà không thể biểu diễn bằng các mối quan hệ trong tập R hoặc là các điều kiện (cần và đủ) để xác định các
khái niệm C.
Định nghĩa 2: Khái niệm mờ cụ thể
Khái niệm mờ cụ thể
được định nghĩa là một bộ năm:
duy nhất của khái niệm.
là một tập cụ thể, được gọi là miền giá trị của khái niệm.
trị mờ của tập cụ thể
.
là một hàm thành viên mờ được xác định:
là giá trị ngôn ngữ để xác định mức độ giá trị thuộc tính trong

. Trong đó cf là định danh
biểu diễn các giá

.

Định nghĩa 3: Thực thể instances
Một thực thể của khái niệm c được mô tả bởi các thuộc tính của tập , với các giá trị trong tập
là cặp (id, v),
trong đó id là định danh của thực thể và v là giá trị của thực thể với một ánh xạ v: → , v(a)
, a
.
Định nghĩa 4: Thuộc tính mờ cụ thể
Thuộc tính mờ cụ thể d được định nghĩa là một cặp:
, hoặc bộ 5:
. Trong đó,
d là định danh duy nhất của thuộc tính.
là khái niệm mờ được gọi là miền của thuộc tính d, là khái niệm mờ
cụ thể.

là một tập cụ thể được gọi là miền giá trị của thuộc tính d.
biểu diễn cho các giá trị mờ của
tập cụ thể . là hàm thành viên mờ được xác định:

là giá trị ngôn ngữ
để xác định mức độ giá trị thuộc tính trong
Định nghĩa 5: Khái niệm mờ
Một khái niệm của ontology mờ được định nghĩa là một bộ tứ: ( ,
,
) , với là tập hợp các đối tượng
(objects) hay các thể hiện (instances),
A là tập các thuộc tính mơ tả khái niệm,
V là miền giá trị của thuộc
tính:
( là miền giá trị của thuộc tính a) và
là hàm thành viên thuộc tính mờ:
:
[0,1] biễu

diễn mức độ quan trọng/ xác định của thuộc tính đối với khái niệm . Bộ ( ,
) được gọi là cấu trúc mờ của .
III. TÍNH TƢƠNG ĐƢƠNG GIỮA CÁC THÀNH PHẦN ONTOLOGY
Một trong những bài toán cơ bản nhất đối với quá trình tích hợp là tìm sự tương đồng của các thành phần giữa
các ontology. Sự tương đồng giữa các thành phần trong các ontology được thực hiện bằng các phương pháp so khớp
khác nhau và cần được sử dụng kết hợp với nhau một cách hiệu quả. Nghệ thuật so khớp ontology nằm ở chỗ lựa chọn
phương pháp và sự kết hợp các phương pháp này theo cách thích hợp nhất. Theo cách tiếp cận này [11], đề xuất cách
xác định mức độ tương đồng cho bài tốn tích hợp ontology thành bốn nhóm sau:
Tương đồng dựa trên thực thể: Sự tương đồng giữa các khái niệm được xác định bởi các thực thể chung.
Tương đồng dựa trên từ vựng: Sự tương đồng giữa các khái niệm được xác định bởi ý nghĩa ngôn ngữ của tên
liên quan.

Tương đồng dựa trên lược đồ: Sự tương đồng giữa hai khái niệm này dựa trên sự giống nhau giữa các thuộc
tính liên quan.
Tương đồng dựa trên phân loại: Sự tương đồng giữa hai khái niệm được xác định bởi các mối quan hệ tương
đồng cấu trúc của chúng.
Trong bài báo [12], các tác giả cụ thể hóa hai cách tiếp cận tính tốn tính tương đồng mờ giữa các thành phần
trong ontology. Việc đầu tiên, sử dụng đo khoảng cách đối với chiều dài đường đi giữa hai khái niệm trong cấu trúc
liên kết (link chính trong liên kết phân loại IS-A). Việc thứ hai, dựa trên nội dung thông tin chia sẻ của nút chung cụ
thể nhất của hai khái niệm. Phương pháp xem như là một mở rộng của mô hình độ đo t lệ giống nhau của Tversky .
Xác định mức độ, độ tương đồng ngữ nghĩa, khoảng cách ngữ nghĩa, hoặc quan hệ ngữ nghĩa giữa các khái niệm
từ các hệ thống hoặc các lĩnh vực khác nhau đang trở thành một nhiệm vụ ngày càng quan trọng. Bài báo trình bày khái
quát các biện pháp đo giữa các khái niệm trong ontology và cung cấp một số ví dụ về các độ đo được trình bày trong
các nghiên cứu. Và dùng các biện pháp tập mờ tương tự để kiểm tra các biện pháp trên.


Quách Xuân Hưng

425

Gần đây, các nhà nghiên cứu đã bắt đầu để xuất việc sử dụng các ontology mờ để tìm kiếm thơng tin và cho sáp
nhập nhiều ontology để xây dựng một kiến thức chung bởi nhiều người dùng khác nhau. Các ví dụ cụ thể về xác định
mức độ giống nhau và biện pháp đo khoảng cách giữa các ontology sử dụng trong các ontology mờ được đề xuất.
Một trong những phương pháp đơn giản nhất để điều chỉnh khoảng cách [13] là mở rộng khoảng cách số cạnh
tối thiểu giữa cl và c2 bởi độ sâu D tối đa của một hệ thống phân loại cấp bậc. Ví dụ, chỉ sử dụng hyponymy, is-a, loại
liên kết giữa các khái niệm.
0

.

/1


Một phương pháp tính độ tương tự khái niệm giữa một cặp khái niệm cl và c2 được trình bày ở [14]. Xác định
sự giống nhau dựa trên độ sâu của các siêu khái niệm chung nhất c3 giữa cl và c2.

N1 là chiều dài (số node) của con đường từ cl đến c3, N2 là chiều dài của con đường từ c2 đến c3, và N3 là
chiều dài của con đường từ c3 vào thư mục gốc của hệ thống phân cấp.
Độ đo sự tương đồng giữa các khái niệm/thuộc tính mờ cụ thể:
Cho bộ ba {A, V, } và {A’, V’, } thuộc về các khái niệm/thuộc tính mờ cụ thể a và a’ tương ứng. Trong đó V
và V’ là các tập cụ thể, và và là các tập mờ tương ứng của tập V và V’. Lấy
, các phép toán trên các tập
con mờ của và được định nghĩa như sau:
[

]

(1)

[

]

(2)

*

(

)

+


(3)

Độ tương đồng giữa các thuộc tính của ontology mờ:
|

|

(4)
(5)
(6)

Độ tương đồng giữa các khái niệm của ontology mờ:
Xét hai khái niệm hình thức mờ ( ,
,
) và ( ,
,
) từ hai khái niệm mờ khác nhau. Cho
là số các thành viên của bộ , , tức là, = | |, = | |, với giả sử rằng n m. Tập 𝓣( ,
) của các bộ ứng viên
của các cặp được định nghĩa bởi tất cả các tập có thể có của n cặp thuộc tính được định nghĩa như sau:
(

,

={{<a1,b1>...<an,bn>}|ah

, bh

, h=1,...,n, and ah


Xét một miền ontology, độ tương tự của hai khái niệm mờ ( ,
như sau:

}
,

) và ( ,

,

) được xác định

- Tương đồng dựa trên lược đồ:
(

)

(

)

[ ∑


]



- Tương đồng dựa trên thực thể:
(


)

|

|
(

)

- Tương đồng dựa trên thực thể và lược đồ
(

)

Với:
là mức độ thành viên của thuộc tính a, b.

(

)

(

)


SỬ DỤNG BÀI TỐN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ

426


là là trọng số sao cho
, và giá trị được thiết lập bởi người sử dụng.
(a,b) là giá trị tương đương giữa từ a và b.
IV. TÍCH HỢP ONTOLOGY MỜ DỰA VÀO LẬP TRÌNH RÀNG BUỘC CSP
Lập trình ràng buộc là công nghệ quan trọng trong việc giải quyết các bài tốn tối ưu tổ hợp. Tích hợp ontology
mờ bằng cách so khớp ontology là một quá trình nhằm mục đích tìm kiếm sự tương đồng ngữ nghĩa giữa các thành
phần trong hai ontology cho trước. Vì vậy, lập trình ràng buộc là một phương pháp phù hợp để đại diện cho xử lý so
khớp ontology.
Lập trình ràng buộc là một cách tiếp cận mới về vấn đề giải quyết thỏa mãn các ràng buộc và tối ưu hóa. Trong
bài báo này chỉ tập trung vào giải quyết thỏa mãn các ràng buộc (CSPs): các định nghĩa cho các CSPs, ràng buộc và
giải pháp cho các CSPs cho so khớp ontology được thể hiện như sau:
4.1. Định nghĩa 6: So khớp ontology sử dụng CSP
Cho hai ontology

, bài toán so khớp thỏa mãn ràng buộc bao gồm
3 thành phần
. Trong đó
{
} là tập các biến. D={D1,D2,...,Dn} là tập các miền
giá trị tương ứng với mỗi biến trong . Mỗi miền giá trị
là tập các giá trị khởi tạo có thể
cho các biến
tương ứng, và
} là tập khác rỗng, tập hữu hạn các ràng buộc trên các biến số
của .
Một ràng buộc như trước đây thường được định nghĩa, đó là một cặp bao gồm một tập hợp các biến và các mối
quan hệ giữa chúng. Định nghĩa này cho chúng ta cơ sở để mơ hình hóa các loại không chắc chắn khác nhau trong đối
sánh lược đồ. Trong nghiên cứu này cần xác định các cặp khái niệm tương đồng giữa hai ontology mờ, được gọi là tích
hợp ontology mờ.

4.2. Định nghĩa 7: Một ràng buộc mờ
trên một tập biến

quan hệ mờ
được xác định bởi
với
gọi là thỏa mãn .
có nghĩa là hồn tồn thỏa .
có nghĩa là đáp ứng một phần .

là một cặp
với mối
là hàm thành viên thể hiện mức độ mà bộ được
có nghĩa là vi phạm .

4.3. Định nghĩa 8: Bài toán tối ưu hóa ràng buộc mờ
là một bộ tứ
, với C là danh sách các khái
niệm thuộc ontology , D là danh sách các khái niệm thuộc ontology
có thể khớp với các khái niệm trong C,

danh sách các ràng buộc mờ mà mỗi ràng buộc đề cập đến một hoặc vài khái niệm trong C và trong D và g là hàm mục
tiêu được tối ưu hóa.
V. XÂY DỰNG CÁC RÀNG BUỘC
5.1. Ràng buộc quan hệ
giữa hai khái niệm

Nếu có tồn tại một quan hệ
như sau.
Với:

)

(

,

)

{(

, thì sẽ tồn tại các ánh xạ tương ứng của chúng

)

(

|
)

Với mọi cặp hai biến khái niệm
Ràng buộc quan hệ cha:

)
(

(

(

)


)

, như sau:
(

)

diện cho mối quan hệ con cha từ

, như sau:
(

)

)

đại diện cho các cấu trúc có thể hiện được của mối quan hệ đồng cấp như sau:

)

(

)

, tồn tại một ràng buộc

(

)


(

,

|

(

( ))

-. Với

)

đảm bảo tương đồng

thông qua sự tương đồng ý nghĩa ngôn ngữ của các nhãn tương ứng:


(

)-

)

5.2. Tƣơng đồng dựa trên từ vựng: Với mọi khái niệm
ngữ nghĩa giữa

)


(

đại diện cho mối quan hệ cha con từ

) đại

(
(

Ràng buộc đồng cấp:

((

tồn tại một tập ràng buộc nhị phân thỏa mãn:

(

Ràng buộc quan hệ con:

}


Quách Xuân Hưng

Với
xác định trước.

427


là hàm xác định ngữ nghĩa tương đồng giữa các nhãn của các khái niệm và

5.3. Tƣơng đồng dựa trên thực thể: Với mọi khái niệm
ngữ nghĩa giữa



, tồn tại một ràng buộc

,

)

|

(

5.4. Tƣơng đồng dựa trên lƣợc đồ: Với mọi khái niệm


- Với

, tồn tại một ràng buộc

,

)

|


(

( ))

5.5. Tƣơng đồng dựa trên phân loại: Với mọi khái niệm


( ))

đảm bảo tương đồng

dựa trên sự giống nhau giữa các thuộc tính liên quan.
(

ngữ nghĩa giữa

đảm bảo tương đồng

được xác định bởi các thực thể chung.
(

ngữ nghĩa giữa

như là một ngưỡng

- Với

, tồn tại một ràng buộc

đảm bảo tương đồng


được xác định các mối quan hệ tương đồng cấu trúc của chúng.
(

)

,

|

(

( ))

-Với

Các ràng buộc về cú pháp và ngữ nghĩa trên phụ thuộc vào một hàm thành viên
để chỉ đến mức
thỏa mãn, có thể chấp nhận được. Nếu
, điều này thể hiện vi phạm tất cả các ràng buộc và với
thể hiện hoàn toàn thỏa mãn các ràng buộc đặt ra. Các ràng buộc hạn chế các khơng gian tìm kiếm cho vấn đề tích
hợp, điều này có thể đem lại hiệu quả cao của quá trình tìm kiếm. Mặt khác, nếu vấn đề quá phức tạp, các ràng buộc sẽ
giúp đưa ra các tính toán phức tạp giúp cho vấn đề giải quyết.
5.6. Hàm mục tiêu
Hàm mục tiêu nhằm tối ưu, tối thiểu hóa các lỗi so khớp thông qua mức độ thỏa mãn các ràng buộc và tìm ra
nhiều nhất các so khớp thông qua các tổng số phần từ được gán cho các biến. Với ý nghĩa của hàm mục tiêu như trên,
chúng ta có:

Trong đó
là hàm thành viên

phép gán với các ràng buộc;
là tổng số ràng buộc,
đầu vào.


để chỉ đến mức thỏa mãn, có thể chấp nhận được với một
=1 là các biến điều khiển tùy thuộc vào các ontology mờ

VI. CÁC PHƢƠNG PHÁP GIẢI QUYẾT MÂU THUẪN TRONG TÍCH HỢP ONTOLOGY MỜ
6.1 Giải quyết mâu thuẫn ontology mờ ở mức khái niệm
Cho hai ontology mờ

, khái niệm c thuộc
là (c,
,
rằng sự mâu thuẫn khái niệm xảy ra nếu

hoặc
≠ Vc2 hoặc ≠

) và thuộc
).

là (c,

,

). Ta nói

Ví dụ: Chúng ta xem xét thuộc tính hasPrice của cùng một khái niệm Car trong các ontology khác nhau (Biểu

thị là thuộc tính hasPrice trong ontology ). Chúng ta thấy các mâu thuẫn ontology mờ xảy ra như sau:
Car(hasPrice) = {(P1, 0.8), (P1, 0.9), (P1 , 1), (P2, 0.6), (P2, 0.7), (P2, 0.8), (P3, 0.8), (P3, 0.9)}
6.2. Giải quyết mâu thuẫn ontology mờ ở mức quan hệ
Cho hai ontology mờ

Ri1(c,c’) Ri2(c,c’),i {1,…,m}.

. c

, c’

. Chúng ta nói rằng sự mâu thuẫn mức quan hệ xảy ra nếu

Ví dụ: Trong bảng 1, cho hai ontology

có các quan hệ
thuẫn mức quan hệ xảy ra như sau:
= <a, b, 0.5> khác với

,

và các khái niệm a, b, c. Các mâu

Bảng 1. Mâu thuẫn mức quan hệ

O1

O2

R1

<a, b, 0.5>
<a, c, 0.7>
<b, c, 0.2>

R2
<a, c, 1>
<b, c, 0.3>
<b, a, 0.9>

<b, a, 0.5>
<a, b, 0.7>
<c, a, 0.2>

<c, a, 0.5>
<c, b, 0.8>
<a, c, 0.1>

R3
<a, b, 0.2>
<b, a, 0.5>
<c, a, 0.7>
<b, c, 0.7>
<c, a, 0.5>
<a, b, 0.4>


SỬ DỤNG BÀI TỐN THỎA MÃN RÀNG BUỘC ĐỂ TÍCH HỢP ONTOLOGY MỜ

428


Hoặc
<b, c, 0>.

không tồn tại. Trong trường hợp này chúng ta có thể giả sử

, trong khi

6.3. Giải quyết mâu thuẫn ontology mờ ở mức thực thể
Trong các hệ thống tri thức ontology, thông tin về các khái niệm và các mối quan hệ giữa các thành phần của
các ontology là đầy đủ và chắc chắn. Tuy nhiên trong một số trường hợp có thể xuất hiện một số giá trị thuộc tính của
các thực thể là khơng đầy đủ hoặc chưa biết.
Bảng 2. Dữ liệu quan sát của hệ thống dự báo thời tiết các trạm khí tượng

Thực thể

I1

I2

I3

I4

I5

I6

990-997

992-999


993-997

992-998

Thuộc tính
Áp suất

990-995

Hướng gió

{W, W-N}

{E, E-N}

{S, W-S}

{S, W-S}

{W-N}

Vận tốc gió

10-12

5-10

20-30


40-50

0-10

Nhiệt độ

15-25

20-24

12-21

12-21

22-24

17-20

Mưa

khơng



khơng

khơng






Nắng

khơng

khơng

khơng

khơng



khơng

Tuyết



khơng



Trong các ontology mờ, các thực thể bao gồm nhiều thuộc tính và các giá trị thuộc tính khơng phải là giá trị đơn
mà có thể là một tập hợp các giá trị. Trong trường hợp này các giá trị mờ không phải là một số mà là một tập các giá
trị. Để giải quyết vấn đề này, ở đây sử dụng cấu trúc đa thuộc tính - đa giá trị để biểu diễn các thực thể mờ và giải pháp
cho bài tốn tích hợp ontology mờ ở mức thực thể [5].
v)


(

Cho hai ontology

, khái niệm c thuộc
là (c,
,
) và thuộc
là ( ,
,c) và (i, ) ( , ). Ta nói rằng sự mâu thuẫn thực thể xảy ra nếu v(a) =
,a

,
.

). Cho (i,

Thực thể mờ:
Một thực thể mờ của khái niệm c được mô tả bởi các thuộc tính của tập
là một căp (i, v), với:

có các giá trị thuộc tập

(X=

)

– i là định danh của thực thể, v là giá trị của thực thể,
– v là một bộ có kiểu


được biểu diễn là một hàm

̅

với v(a)

, a

.

VII. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN
Bài tốn tích hợp ontology mờ có thể được chia làm hai giai đoạn. Giai đoạn so khớp giữa các ontology và giải
quyết mâu thuẫn trong giá trị mờ. Về so khớp, có hai trường phái, đó là vét cạn và theo kinh nghiệm. Hướng vét cạn
thường xẩy ra nhiều lỗi so khớp, tuy nhiên hầu hết các cặp so khớp giữa hai ontology đều được phát hiện. Theo trường
phái kinh nghiệm, thường dựa vào các tính chất ontology để cắt tỉa các cặp khơng tương đồng trước khi so khớp. Với
cách tiếp cận này mức độ xẩy ra so khớp sai giảm đáng kể, tuy nhiên thường bỏ qua nhiều cặp thành phần tương đồng
trong quá trình so khớp. Để khắc phục nhược điểm của hai cách tiếp cận trên, bài báo này đề xuất sử dụng CSP cho mơ
hình hóa bài tốn so khớp. Đề xuất các ràng buộc và đưa ra hàm tối ưu để tối thiểu các lỗi so khớp.
Trong giai đoạn giải quyết mâu thuẫn tích hợp ontology mờ, đề xuất sử dụng lý thuyết đồng thuận nhằm giải
quyết mâu thuẫn trên mức quan hệ, mức thực thể và mức khái niệm, các thuộc tính của các khái niệm tương đồng. Các
khái niệm của ontology sau khi trộn bao gồm tất cả các thuộc tính của các khái niệm tham gia trộn gây ra sự dư thừa dữ
liệu. Trong khi đó, ở đây sử dụng phương pháp đồng thuận để xác định đại diện tốt nhất giữa các đối tượng mâu thuẫn.
Do đó, các mâu thuẫn có thể được xóa bỏ và giảm đi sự dư thừa dữ liệu.
Kết quả nghiên cứu tại thời điểm này bao gồm đề xuất mơ hình ontology mờ, trong đó ontology được tích hợp
với logic mờ và logic mô tả mờ. Dựa trên mô hình ontology mờ, chúng tơi đã mơ hình hóa bài toán tối ưu sử dụng CSP
cho so khớp ontology mờ. Định nghĩa bài tốn tối ưu hóa sử dụng CSP và hàm mục tiêu cho tối ưu hóa q trình so
khớp. Trong nghiên cứu tiếp theo, chúng tôi sẽ cụ thể hóa các giải thuật cho việc tích hợp ontology mờ đã được mơ
hình hóa dựa trên CSP. Sử dụng các tập dữ liệu chuẩn trong việc đánh giá kết quả nghiên cứu, so sánh với các nghiên
cứu trước đây để cho ra các đánh giá và kết luận với mơ hình tích hợp ontology mờ được đề xuất trong bài báo này.



Quách Xuân Hưng

429

VIII. TÀI LIỆU THAM KHẢO
[1] Hai Bang Truong, Trong Hai Duong, Ngoc Thanh Nguyen, “A Hybrid Method For Fuzzy Ontology Integration”,
Cybernetics and Systems: An International Journal, 44:2-3, pp.133-154, 2013.
[2] Konstantin Todorov, Peter Geibel, and C_eline Hudelo, ”A Framework for a Fuzzy Matching between Multiple
Domain Ontologies”, KES'11 Proceedings of the 15th international conference on Knowledge-based and
intelligent information and engineering systems, Springer-Verlag Berlin, Heidelberg, vol. part I. p538-547, 2011.
[3] Rung-Ching Chen, Cho-Tscan Bau, Chun-Ju Yeh, “Merging domain ontologies based on the WordNet system and
Fuzzy Formal Concept Analysis techniques”, Applied Soft Computing 1, pp.1908-1923, 2011.
[4] Hai Bang Truong, Ngoc Thanh Nguyen, “A Multi-attribute and Multi-valued Model for Fuzzy Ontology
Integrationon Instance Level”, ACIIDS The 4nd Asian Conference on Intelligent Information and Database
Systems, Springer Verlag in a vol. LNAI, pp.187-197, 2012.
[5] Trong Hai Duong, Hai Bang Truong, Ngoc Thanh Nguyen, “Local Neighbor Enrichment for Ontology
Integration”, ACIIDS The 4nd Asian Conference on Intelligent Information and Database Systems, Springer
Verlag in a vol. LNAI: pp.156-166, 2012.
[6] Hai Bang Truong, Ngoc Thanh Nguyen, Phi Khu Nguyen, “Fuzzy Ontology Building and Integration for Fuzzy

Inference Systems in Weather Forecast Domain”, ACIIDS-2011 The 3nd Asian Conference on Intelligent
Information and Database Systems, Springer Verlag in a vol. LNAI, in Daegu city, Korea: pp.517-527, 2011.
[7] Hai Bang Truong, Trong Hai Duong, Ngoc Thanh Nguyen, “A Hybrid Method For Fuzzy Ontology Integration”,
Cybernetics and Systems: An International Journal, 44:2-3, pp.133-154, 2013.
[8] Hai Bang Truong, Xuan Hung Quach, “An Overview of Fuzzy Ontology Integration Methods Based on Consensus
Theory”. ICCSAMA, pp. 217-227, 2014.
[9] K. Marriott, P. Stuckey: “Programming with Constraints”, An Introduction, MIT Press, 1998.
[10] E. Tsang, “Foundations of Constraint Satisfaction”, Acadimic Press, 1993.
[11] Hai Bang Truong, Ngoc Thanh Nguyen, “A framework of an effective fuzzy ontology alignment


technique. International Conference on Systems, Man and Cybernetics, Anchorage, Alaska, USA, IEEE 2011,
ISBN 978-1-4577-0652-3, pp.931-935, 2011.
[12] Ling Song, Jun Ma, Hui Liu, Dongmei Zhang, “Fuzzy Semantic Similarity Between Ontological Concepts,
Advances and Innovations in Systems”, Computing Sciences and Software Engineering, pp.275-280, 2011.
[13] Claudia Leacock and Martin Chodorow, “Combining local context and WordNet similarity for word sense identification”, In Fellbaum, pp. 265-283, 1998.
[14] Silvia Calegari, Marco Loregian, “Using Dynamic Fuzzy ontologies to Understand Creative Environments”, In:
Proceedings of the 7th International Conference on Flexible Query Answering Systems (FQAS 2006), Edited by
Henrik Legind Larsen, Gabriella Pasi, Daniel Ortiz Arroyo, Troels Andreasen, and Henning Christiansen,Vol.
4027, Lecture Notes in Computer Science. Milan, Italy, Springer-Verlag, pp.404-415, 2006.
[15] Nguyen, N. T., “Advanced methods for inconsistent knowledge management”, Springer, London, 2008.

ONTOLOGY MATCHING METHOD BY USING CONSTRAINT
SATISFACTION PROBLEM
Quach Xuan Hung
ABSTRACT:The problem of fuzzy ontology integration can be divided into two phases: the matching phase between ontologies and
conflicting resolution on fuzzy values. This paper focuses on the problems of the matching phase, which currently has exhaustive
and heuristic approaches. While the exhaustive method has many matching errors, most of the matched pairs between the two
ontologies are detected. The heuristic approach uses the ontology nature to trim the non-homologous pairs which can decrease
significantly the number of mismatching pairs, but often skips lots of homologous element pairs. To overcome the disadvantages of
the two approaches, we proposed to use the constraint satisfaction problem (CSP) for modeling the ontology matching problem. In
particular, we introduce constraints and suggest optimal function to minimize the matching errors. In the experiment, the
mismatching pairs between ontologies are significantly reduced by applying CSP for refinement. Besides, using consensus method
to determine the best representation between conflicting objects in the process of integrating fuzzy ontology.



×