Institut de la Francophonie pour l’Informatique
Bâtiment D, ruelle 42, Ta Quang Buu
Hanoï, Vietnam
Ecole Nationale Supérieure des Télécommunications de Bretagne
Département Logiques des Usages,
Sciences Sociales et Sciences de l’Information
Technopôle de Brest-Iroise, CS 83818, 29238 Brest CEDEX
Rapport de stage DEPA
LA COMPOSITION SEMANTIQUE DANS
LES DOCUMENTS VIRTUELS ADAPTATIFS
APPLIQUEE AU PROJET KMP
Etudiante : NGUYEN Thi Ngoc Tu – Promotion 8
Responsable de stage : Segre GARLATTI
Brest – Août 2004
Remerciements
Je tiens, tout d’abord, `a remercier M. Serge Garlatti, mon maˆıtre de stage, pour
m’avoir accept´e `a ce stage et fait en sorte qu’il se passe dans les meilleures conditions et
pour ses conseils sur les directions `a suivre tout au long du stage en portant une grande
attention `a l’ensemble de mes r´ealisations.
Je remercie tout particuli`erement M. S´ebastien Iksal, M. Philippe Tanguy, M. S´ebastien Bigaret pour les connaissances qu’ils m’ont apport´ees.
Merci ´egalement `a tous les stagiaires au sein de d´epartement LUSSI pour le tr`es bon
accueil qu’ils m’ont r´eserv´e.
J’adresse mes sinc`eres remerciements aux professeurs de l’IFI pour leur soutiens pendant mes ´etudes de DEPA et mes camarades pour les bons moments pass´es avec eux. Je
n’oublie pas de remercier tous les personnels de l’IFI qui m’apportent de l’aide.
Finallement, je ne remercierai jamais assez mes parents, mon grand fr`ere et mon petit
ami. Ils sont toujours pr`es de moi dans les moments difficiles.
ii
R´
esum´
e
L’objectif du projet de KMP (Knowlegde Management Portal) est de construire un
service web de comp´etences qui permet de faciliter le partage des comp´etences au sein
d’une communaut´e - la vall´ee de t´el´ecommunication (Telecom Valley) - qui recueille des
entreprises, des institutionnels et des organismes acad´emiques int´eress´es par le domaine de
t´el´ecommunications. Ainsi, pour mod´eliser le savoir-faire des entreprises et pour assurer la
r´eutilisation et le partage des ressources, il est n´ecessaire de d´evelopper un environnement
de type hyperm´edia adaptatifs fond´e sur les documents virtuels et le web s´emantique.
Ce m´emoire de stage pr´esente principalement
– la r´eutilisation et la mise en oeuvre des ontologies pour d´ecrire et chercher des
comp´etences
– la construction d’un moteur de composition s´emantique pour analyser et rassembler des donn´ees li´ees aux comp´etences des organismes fond´es sur l’environnement
SCARCE (SemantiC & Adaptive Retrieval and Composition Engine).
iii
Abstract
The goal of KMP (Knowlegde Management Portal) project is to design a web site
facilitating the sharing of competences within a community - the Telecom Valley - which
gathers firms, local institutions, and academic organizations working in the telecommunications domain. Thus, for modeling the know-how of the organisations and re-using,
collecting of the resources, it is necessary to develop an adaptive environment hyperm´edia
based on the virtual documents and the semantic Web.
This study focuses on
– reuse and building of ontologies for describing and seeking on competences,
– construction of a semantic engine for collecting and analyzing data related to the
competences of the organizations based on the environment SCARCE (SemantiC &
Adaptive Retrieval and Composition Engine).
iv
Table des mati`
eres
Remerciement
ii
R´
esum´
e
iii
Abstract
iv
Table des mati`
eres
v
Table des figures
vii
1 Introduction
1
2 Survol des m´
ethodes existantes
2.1 Repr´esentation de connaissances pour le Web s´emantique
2.2 Adaptation/personnalisation pour le Web s´emantique . .
2.2.1 Les documents virtuels adaptatifs . . . . . . . . .
2.2.2 Les hyperm´edias adaptatifs . . . . . . . . . . . .
4
4
7
8
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Solution pour le projet KMP
3.1 Une approche fond´ee sur quatre types d’ontologies : moteur de composition
SCARCE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Repr´esentation de connaissances . . . . . . . . . . . . . . . . . . . .
3.1.2 Composition et adaptation dans moteur de composition de SCARCE
3.2 Les probl`emes li´ees au projet KMP et la partie de mon travail . . . . . . .
14
4 Mise en oeuvre du projet KMP
4.1 R´eorganisation de 4 types d’ontologies pour KMP . . . . . . . . . . . . . .
4.1.1 Les ontologies particuli`eres de KMP et les modifications . . . . . .
4.1.2 R´eorganisation de quatre types d’ontologies au sein du prototype
SCARCE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Mise en oeuvre d’ontologies en F-logic . . . . . . . . . . . . . . . .
4.2 D´eveloppement du moteur de composition s´emantique pour KMP . . . . .
4.2.1 Description du code source SCARCE - partie s´emantique . . . . . .
4.2.2 Re-engineering de code source SCARCE - partie s´emantique . . . .
4.2.3 Mise en oeuvre de moteur de composition s´emantique pour KMP .
4.3 Analyse des r´esultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
21
22
5 Conclusion
40
v
14
15
16
19
25
26
28
28
30
32
33
Bibliographie
41
Annexes
41
vi
Table des figures
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
Repr´esentation des connaissances `a partir des ressources existantes .
Un example d’ontologies . . . . . . . . . . . . . . . . . . . . . . . .
Instances avec attribut ”aCapitale” . . . . . . . . . . . . . . . . . .
Processus de composition d’un document virtuel . . . . . . . . . .
Une technique de pr´esentation adaptative . . . . . . . . . . . . . .
Une technique de navigation adaptative . . . . . . . . . . . . . . .
Strat´egie d’adaptation : Guidage direct . . . . . . . . . . . . . . .
Strat´egie d’adaptation : Tri . . . . . . . . . . . . . . . . . . . . . .
3.1
3.2
3.3
4 types d’ontologies de SCARCE . . . . . . . . . . . . . . . . . . . . . . . 15
Pr´esentation d’une page Web . . . . . . . . . . . . . . . . . . . . . . . . . 17
Architecture de moteur de composition SCARCE . . . . . . . . . . . . . . 18
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
4.20
4.21
Ontologies de KMP . . . . . . . . . . . . . . . . . . . . . . . . . .
Ontologies des r´eseaux . . . . . . . . . . . . . . . . . . . . . . . .
Ontologies des comp´etences . . . . . . . . . . . . . . . . . . . . .
Ontologies des ´echanges de valeurs . . . . . . . . . . . . . . . . .
Nouvels ontologies des KMP . . . . . . . . . . . . . . . . . . . . .
Mod´elisation des connaissances en F-logic . . . . . . . . . . . . .
Des ressources mod´eli´es en F-logic . . . . . . . . . . . . . . . . . .
Les paquets pour le moteur de composition s´emantique SCARCE
Nouvelle structure de paquets de services s´emantiques . . . . . . .
Nouvelle structure des paquets SCARCE . . . . . . . . . . . . . .
Le code source KMP . . . . . . . . . . . . . . . . . . . . . . . . .
La fonction ”r´ecup´erer les informations d’une organisme” . . . . .
Page d’entr´ee du site KMP . . . . . . . . . . . . . . . . . . . . . .
Page d’accueil du site . . . . . . . . . . . . . . . . . . . . . . . . .
La navigation dans la Chaine de Valeur . . . . . . . . . . . . . . .
Repr´esentation des entreprises sur une segment . . . . . . . . . .
Espace personnel . . . . . . . . . . . . . . . . . . . . . . . . . . .
Listes des entreprises de recherche . . . . . . . . . . . . . . . . . .
Les informations d’entreprise . . . . . . . . . . . . . . . . . . . . .
Liste de comp´etences d’une entreprise . . . . . . . . . . . . . . . .
Les informations de comp´etences . . . . . . . . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
6
6
9
11
12
13
13
22
23
24
25
26
27
28
29
30
31
33
33
34
35
36
36
37
38
38
39
39
CHAPITRE 1. INTRODUCTION
Chapitre 1
Introduction
De nos jours, Internet fait une intrusion remarquable dans la vie quotidienne. Les
besoins en recherche d’informations sont de plus en plus importants et les ressources sur
Internet s’accroissent. Ainsi, il est important de trouver une meilleure solution pour la
recherche d’information sur Internet.
D’ailleurs, les informations fournies sur Internet sont pr´esent´ees de la mˆeme mani`ere
pour tous les utilisateurs mˆeme s’ils ne sont pas int´eress´es par les mˆemes informations.
Alors, en plus du probl`eme des ressources, il faut trouver une solution pour fournir les
informations adapt´ees aux besoins de l’utilisateur.
Les situations propos´ees permettent donc aux utilisateurs d’Internet d’acc´eder `a l’information pertinente, de naviguer dans un grand espace d’information sur Internet. Le
Web s´emantique et les m´ethodes d’adaptation/personnalisation permettent de r´esoudre
ces probl`emes.
Telecom Valley1 est une association professionnelle qui, avec environ 70 membres repr´esentant plus de 10.000 emplois, supporte activement le d´eveloppement d’un pˆole de
comp´etences unique, `a vocation internationale, dans les domaines des T´el´ecommunications
et des Technologies de l’Information. Afin de capturer le renseignement des comp´etences
des membres de Telecom Valley, il s’agit de cr´eer une plate-forme permettant de cartographier les comp´etences dans le domaine des t´el´ecommunications existantes au sein de
l’association et de favoriser ainsi les partenariats entre entreprises, puis entre entreprises
et laboratoires de recherche.
Ainsi, les probl`emes li´ees au plate-forme sont
– de capturer les connaissances explicites d’une organisation pour en faciliter l’acc`es,
le partage et la r´eutilisation,
– d’am´eliorer le partage des connaissances et le travail coop´eratif au sein de l’organisation,
– d’am´eliorer les relations avec le monde externe (en particulier, les clients ou les
partenaires),
– de pr´eserver les connaissances pass´ees de l’entreprise pour les r´eutiliser et am´eliorer
la qualit´e des projets.
Alors, KMP (Knowledge Management Portal) est un projet de la Telecom Valley qui
1
Telecom Valley est une association loi 1901 fond´ee en 1991 par 7 majors des t´el´ecommunications
pr´esents `a et autour de Sophia Antipolis : A´erospatiale (Alcatel Space), AT&T Paradyne, Digital (Compaq
puis HP), ETSI (Institut Europ´een de Normes des T´el´ecommunications), France Telecom, IBM, Texas
Instruments. Telecom Valley rassemble aujourd’hui plus de 70 membres industriels et institutionnels
NGUYEN Thi Ngoc Tu
1
M´emoire de fin d’´etudes
CHAPITRE 1. INTRODUCTION
se propose les m´ecanismes de partage de connaissances au sein de la communaut´e Telecom
Valley et de les renforcer par un usage des technologies multim´edia. Une tendance actuelle
est de cr´eer des applications web du genre portails et services fond´ees sur des ontologies.
Le projet KMP repose sur les travaux r´ealis´es dans le cadre de 5 Sous-Projets :
1. Construction d’ontologies pour la repr´esentation des comp´etences
2. Cartographie des comp´etences
3. R´ealisation informatique d’un service web de comp´etences
4. Evaluation du service web sur la dynamique communautaire
5. Evaluation du service web sur la cr´eation de valeur et la dynamique des connaissances au sein d’une communaut´e de pratique
Notre travail repose sur le sous-projet 3 : d´eveloppement un service web de comp´etences.
Objectifs du stage
Le stage a pour but de mettre en place un service web de comp´etence interactif pour
mod´eliser le savoir-faire des membres de la Telecom Valley et pour assurer la r´eutilisation
et le partage des ressources entre eux.
Fond´e sur le premier prototype du KMP, les processus d’identification, de description
des fonctionnalit´es importantes pour les utilisateurs, et de sp´ecification et de conception
des interfaces sont auparavant r´ealis´es. Notre travail est de g´erer, d’identifier, de composer,
de s´electionner les donn´ees li´ees aux comp´etences et d’adapter aux besoins de l’utilisateur.
Le prototype d´evelopp´e sera fond´e sur l’environnement SCARCE 2 . C’est un environnement de type hyperm´edia adaptatif fond´e sur les documents virtuels et le web s´emantique.
Contribution personnelle du stagiaire
Nous sommes trois stagiaires de l’IFI, M. Bui Huy Duc, M. Dinh Van Hoan et moimˆeme, qui travaillent en ´equipe sur le projet KMP. Pendant la dur´ee du stage, nous
travaillons ensemble, discutons et r´esolvons les probl`emes li´ees au projet pour mieux le
comprendre. Et puis, nous divisons ce projet en trois parties et chacun est responsable
d’une partie dans le projet.
Dans le cadre de mon stage, je suis responsable de la r´eutilisation et de la mise en
oeuvre des ontologies pour d´ecrire et chercher les comp´etences et de l’´etude et du d´eveloppement d’un moteur de composition s´emantique pour analyser et rassembler des donn´ees
li´ees aux comp´etences des organismes bas´es sur l’environnement SCARCE.
Le travail de M. Duc est l’´etude et le d´eveloppement de moteur de composition logique
pour r´ecup´erer les gabarits de page au format XML que d´efinit l’organisation de la page
locale.
Le travail de M. Hoan est l’´etude et le d´eveloppement de mod`ele de document bas´e
sur l’environnement SCARCE.
2
SemantiC & Adaptive Retrieval and Composition Engine.
NGUYEN Thi Ngoc Tu
2
M´emoire de fin d’´etudes
CHAPITRE 1. INTRODUCTION
Environnement de stage
Ce stage est effectu´e au sein du d´epartement LUSSI (Logiques des Usages, Sciences Sociales et Sciences de l’Information) `a l’Ecole Nationale Sup´erieur des T´el´ecommunications
(ENST) de Bretagne, situ´e `a Brest pour la p´eriode du 1er avril au 31 aoˆ
ut 2004.
L’ENST Bretagne offre un large programme de formations (Ing´enieurs, Mast`eres, MSc,
DEA, Th`eses, Formation Continue) dans les domaines li´es aux technologies de l’information. Elle est ´egalement un des acteurs principaux de la recherche dans le domaine et
travaille en partenariat avec les plus grandes entreprises du secteur priv´e ou public.
Le d´epartement LUSSI a ´et´e form´e par les deux d´epartement IASC (Intelligence Ar´
tificielle et Sciences Cognitives) et d´epartement ECO (Economie
et Sciences Humaines)
depuis le mois d’avril 2004. Les activit´es du d´epartement LUSSI s’appuient sur des recherches en sciences cognitives, en algorithmique, en mod´elisation math´ematique et informatique autour du th`eme ”Mod´elisation des syst`emes anthropocentr´es” dans lesquels
l’homme, plus qu’un simple utilisateur, est vraiment au centre du syst`eme.
L’adresse du site Web de LUSSI est http ://www-iasc.enst-bretagne.fr/
Organisation du m´
emoire
Ce m´emoire est compos´e de 5 chapitres :
– La premi`ere partie aborde les probl´ematiques, les objectifs g´en´eraux du travail et
puis, elle pr´esente ´egalement le lieu d’accueil o`
u s’est d´eroul´e notre travail et la
contribution personnelle de mon travail dans l’´equipe de trois personnes.
– La deuxi`eme partie passe en revue les m´ethodes existantes que nous allons d´evelopper pour le projet KMP.
– La troisi`eme partie a pour objectif de pr´esenter une approche existants - l’environnement de SCARCE - pour le d´eveloppement de KMP. Et puis, les probl`emes li´ees
au projet KMP seront abord´es.
– Nous verrons, dans la quatri`eme partie, la r´ealisation et la mise en place des ontologies et du moteur de composition s´emantique au sein du projet KMP. Et puis, elle
a pour objectif de pr´esenter et d’analyser les r´esultats.
– Dans la derni`ere partie, nous dressons un synth`ese des r´esultats les plus importants.
NGUYEN Thi Ngoc Tu
3
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Chapitre 2
Survol des m´
ethodes existantes
Le projet KMP est une solution innovante de gestion des connaissances partag´ees entre
diff´erents acteurs au sein d’une mˆeme communaut´e. Il va falloir de cr´eer une application
web du genre portails et services fond´ees sur des ontologies.
Dans ce chapitre, il s’agit d’une simple bibliographie de pr´esentation des m´ethodes
existantes pour r´epondre aux deux questions suivantes : Comment fait-on pour g´erer efficacement les immenses ressources du Web ? Comment fait-on pour adapter `a des besoins
d’utilisateurs diff´erents sur Internet ?
2.1
Repr´
esentation de connaissances pour le Web s´
emantique
Le Web actuel est essentiellement syntaxique. Actuellement, la structure des documents (ou ressources) sur le Web est bien d´efinie, n´eanmoins, seuls les humains peuvent
interpr´eter leurs contenus et ils sont quasi inaccessible aux traitements machines. D’autre
part, la recherche d’information sur le Web est une tˆache de ”tri manuel” des documents
retourn´es. Alors, les recherches sont impr´ecises et lentes. A cause du probl`eme de la recherche d’information dans une vaste source d’information, on d´esire s´erieusement trouver
des m´ecanismes ou m´ethodes plus efficaces. Alors, le W3C (World Wide Web Consortium)
- une organisation charg´ee de d´efinir et publier les diff´erents standards et formats constituant les bases logiques de la structuration et de l’´echange d’information sur le Web - le
Web S´emantique. L’objectif du Web s´emantique est de permettre aux machines d’exploiter automatiquement les contenus de sources d’information accessibles par le Web grˆace `a
la repr´esentation s´emantique de leurs contenus. Ainsi, on peut aider l’internaute `a rechercher l’information plus rapidement et plus exactement grˆace aux capacit´es des machines
`a acc´eder aux contenus des ressources et `a effectuer des raisonnements sur ceux-ci.
Le probl`eme essentiel est de savoir comment repr´esenter des informations, des ressources pour que les machines puissent les comprendre et qu’on puisse localiser, identifier,
transformer, combiner et int´egrer facilement des ressources. Alors, il est n´ecessaire de d´evelopper des langages de repr´esentation de la s´emantique des contenus ou des ressources
(repr´esentation de connaissances) et de m´ecanismes d’inf´erence sur ceux-ci et de d´evelopper des ressources conceptuelles utilisant ces langages.
NGUYEN Thi Ngoc Tu
4
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Une vision de l’ontologie
L’ensemble des ressources sur Internet se compose
– sources non structur´ees : textes
– sources semi-structur´ees : emails, pages HTML
– sources structur´ees : documents XML, base de donn´ees
La figure 2.1 montre que la structure des ressources est mod´elis´ee sous forme d’un
langage commun qui s’appelle l’ontologie et d’un sch´ema de m´eta-donn´ees.
Fig. 2.1 – Repr´esentation des connaissances `a partir des ressources existantes
Comme une ontologie d´efinit un vocabulaire commun afin de partager l’information
dans un domaine, elle inclue des d´efinitions interpr´etables en machine des concepts de
base de ce domaine et de leurs relations.
D’autre part, un sch´ema de m´eta-donn´ees qui se compose des informations ajout´ees
d’une ressource permet de favoriser l’exploitation de ressources par les machines. Les
m´eta-donn´ees est comme la description de ressources. Le rˆole des m´eta-donn´ees est de
– g´erer des ressources (le droits de propri´et´e `a des pages Web, auteur, ´editeur, version
de document, etc.)
– identifier des ressources (type de document, auteur, etc.)
Le sch´ema de m´eta-donn´ees peut ˆetre mod´elis´e sous forme des ontologies.
Ainsi, pour l’int´egration de sources de donn´ees h´et´erog`enes sur Internet, d’une part,
il permet la mod´elisation des ressources du Web `a partir de repr´esentations conceptuelles
des domaines particuliers. D’autre part, il a pour objectif de raisonner automatiquement
ou faire des inf´erences pour partager ou combiner des ressources.
Qu’est-ce qu’une ontologie et que repr´
esente-t-on dans une ontologie ?
Une ontologie est une description formelle explicite des concepts dans un domaine
particulier (classes (appel´ees parfois concepts)), des propri´et´es de chaque concept d´ecrivant des caract´eristiques et attributs du concept (attributs (appel´es parfois rˆ
oles ou
propri´
et´
es)). Une ontologie ainsi que l’ensemble des instances individuelles des classes
constituent une base de connaissances [NM].
Toutefois, une ontologie d´efinie doit ˆetre connue et ˆetre distribu´ee par les chercheurs
qui ont besoin de partager l’information dans un domaine, c’est-`a-dire, cela doit ˆetre le
r´esultat d’un consensus social.
NGUYEN Thi Ngoc Tu
5
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
La figure 2.2 illustre une partie de la hi´erarchie de concepts pour l’ontologie des entit´es
geographiques.
Fig. 2.2 – Un example d’ontologies
On a une classe sup´erieure ”EntiteGeographique” et deux sous-classes ”Pays” et ”Ville”
qui repr´esentent des concepts plus sp´ecifiques que la super-classe. La classe ”Pays” repr´esente tous les pays dans le monde et elle est aussi la super-classe de la classe ”PaysEuropeen” qui repr´esente tous les pays europ´een. La classe ”Ville” repr´esente toutes les villes
dans le monde et la sous-classe ”Capitale” de cette classe repr´esente une ville qui est une
capitale du pays.
Pour d´ecrire une capitale d’un pays, on a d´efinir un attribut ”aCapitale” du concept
”Pays” et le valeur de cet attribut est une instance du classe ”Capitale”.
Maintenant, nous pouvons cr´eer une base de connaissances en d´efinissant les instances
individuelles de ces classes, en pr´ecisant les valeurs sp´ecifiques des attributs (figure 2.3).
Fig. 2.3 – Instances avec attribut ”aCapitale”
NGUYEN Thi Ngoc Tu
6
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Les langages d’ontologies
Un langage d’ontologies doit ˆetre satisfaire les conditions suivantes :
– d´efinir les connaissances
– interpr´eter les connaissances
Il existe plusieurs types de langages d’ontologies. Toutefois, nous voulons pr´esenter ici
un type de langages d’ontologies que nous allons utiliser - F-Logic.
La F-Logic est un langage d´eductif de base de donn´ees orient´ee objets qui combine la
s´emantique d´eductive et l’expressivit´e des langages de bases de donn´ees d´eductives avec
la richesse de mod´elisation des mod`eles de donn´ees orient´es objets.[Iks02][Ont03b]
Pour la mod´elisation de connaissances, la F-logic permet de d´ecrire des ontologies
comme des classes d’objets, les hi´erarchies des classes, leurs attributs et les relations entre
les classes dans un mod`ele orient´e objet. Comme l’exemple dans la figure 2.2 qui d´efinir
les super-classes et ses sous-classes des entit´es g´eographique, la langage F-logic les d´efinit
comme ci-dessous :
Pays : :EntiteGeographique.
PaysEuropeen : :Pays.
Ville : :EntiteGeographique.
Capitale : :Ville.
Pays[aCapitale=>Capitale].
La derni`ere ligne ”Pays[aCapitale=>Capitale].” d´efinit l’attribut ”aCapitale” du classe
”Pays” et une valeur de cet attribut est une instance du classe ”Capitale”.
Les phrases suivantes - les faits - consistent `a cr´eer les instances des classes et les
renseigner avec la valeur des attributs.
”France” :PaysEuropeen.
”France”[aCapitale->”Paris”].
”Paris” :Capitale.
”France” est une instance individuelle de la classe ”PaysEurop´een” et repr´esente un
pays europ´een. Cette instance a un attribut ”aCapitale” qui est renseign´e avec une valeur
d’attribut ”Paris”. Cette valeur est une instance de la classe ”Capitale”.
Pour interpr´eter les connaissances, nous allons d´efinir l’ensemble de r`egles et requˆetes
bas´e sur ce base de faits. Les r`egles permettent de d´eriver la nouvelle information.
Par exemple, on utilise la r`egle suivante :
FORALL ObjectID IsInstance(ObjectID) <- EXISTS Y ObjectID :Y.
Cette r`egle montre un objet qui est instance d’une classe. Puis, la requˆete suivante
permet de prendre toutes les instances existantes dans la base de faits.
FORALL ObjectID <- IsInstance(ObjectID).
2.2
Adaptation/personnalisation pour le Web s´
emantique
Pour le Web actuel, les informations fournies sur Internet sont pr´esent´ees de la mˆeme
mani`ere pour tous les utilisateurs mˆeme s’ils ne sont pas int´eress´es par les mˆemes informations. Alors, un site web adaptatif doit pouvoir prendre en compte les besoins de
l’utilisateur afin d’en am´eliorer la compr´ehension et l’utilisabilit´e pour g´erer de vastes
espaces d’information [Gar03].
NGUYEN Thi Ngoc Tu
7
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Comment peut-on r´esoudre ces probl`emes ?
– Si l’on veut s’adapter aux besoins de l’utilisateur, il faut savoir qui est l’utilisateur,
quelles informations sur Internet il veut chercher, et lesquels il ne veut pas afficher,
etc.
– Pour aider l’utilisateur `a naviguer facilement dans un grand espace de ressources sur
Internet, il est n´ecessaire de repr´esenter la compr´ehension des ressources complexes.
Il faut donc fournir `a l’utilisateur une structure globale des informations sur l’´ecran
de l’ordinateur, l’aider `a se d´eplacer dans cette structure pendant la navigation.
Par cons´equent, l’adaptation aux utilisateurs dans le Web s´emantique peut s’appuyer
sur les domaines suivants :
– La m´ethode de conception pour composer les informations pertinentes aux besoins
de l’utilisateur : les documents virtuels adaptatifs,
– Le moyen d’adaptation aux utilisateurs : les hyperm´edias adaptatifs.
2.2.1
Les documents virtuels adaptatifs
D`es qu’un utilisateur fait une requˆete li´ee `a sa tˆache `a un syst`eme de recherche d’information sur Internet en fixant un ensemble de contraintes - donn´ees non persistantes,
le syst`eme s´electionnera un ensemble d’informations `a partir de cette requˆete. Puis, il
compose un document r´eel, non persistent, `a partir de ces informations et de r`egles de
composition. Un document r´eel est une s´equence de fragments d’information g´en´er´ee `a
partir de la demande d’un utilisateur.
Alors, un document virtuel poss`ede les caract´eristiques suivantes :
– r´eutilisation de diff´erentes sources d’information,
– g´en´eration dynamique du document `a la demande en fonction de l’utilisateur
Si l’un utilisateur peut adapter/personnaliser le document r´eel produit en fonction
de ses besoins, on parlera de document virtuel adaptatif, sinon uniquement de document
virtuel. [Gar03].
En effet, un document virtuel adaptatif peut ˆetre consid´er´e comme un ensemble d’´el´ements (ou fragments) associ´e `a des m´ecanismes de filtrage, d’organisation et d’assemblage
en fonction d’un mod`ele de l’utilisateur et d’un mod`ele structure narrative. Et puis, l’organisation et la s´election de fragments pertinents n´ecessitent des m´ecanismes de recherche
d’information et de filtrage qui utilisent entre autres les index des fragments.
La construction d’un document virtuel adaptatif sera fond´ee sur deux ´etapes :
1. la sp´ecification d’un document en d´efinissant les fragments du document r´eel
2. la compostion d’un document r´eel `a partir sa sp´ecification et des crit`eres de personnalisation.
Le processus de composition est principalement constitu´e de trois phases
– S´election
– Organisation
– Assemblage
NGUYEN Thi Ngoc Tu
8
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Fig. 2.4 – Processus de composition d’un document virtuel
Le processus de s´election permet de retrouver les informations pertinentes correspondant `a la demande de l’utilisateur.
Le processus d’organisation a pour but de calculer le r´esultat dans la phase de s´election
pour la repr´esentation dans le syst`eme
Le processus d’assemblage permet la pr´esentation de l’information choisie.
2.2.2
Les hyperm´
edias adaptatifs
Un hyperm´
edia est compos´e de deux types d’´el´ements : des contenus et des liens. Il
permet aux utilisateurs de naviguer entre diff´erentes pages d’un site Web. Toutefois, dans
un hyperm´edia traditionel, l’utilisateur ne fait plus le lien entre son projet de navigation
initial et les zones d’informations qu’il est en train de lire. Ce qui se r´esume en un certain
nombre de questions du type : ”O`
u suis-je ?”, ”D’o`
u est-ce que je viens ?”, ”O`
u vais-je ?” et
enfin ”Mais qu’est-ce que je recherche ?”.
Alors, les objectifs des hyperm´
edias adaptatifs sont de r´eduire la d´esorientation de
l’utilisateur et le risque d’incompr´ehension du document qui en r´esulte le plus souvent
[CLR03].
Par cons´equence, pour construire un syst`eme hyperm´edia adaptatif, il est n´ecessaire
de fournir
– Un mod`ele utilisateur
– Des r`egles d’adaptation
La mod´
elisation utilisateur
Le syst`eme a besoin d’un Mod`ele des Buts, Pr´ef´erences et Connaissances, etc. de
l’utilisateur et l’utilise dans l’interaction pour s’adapter aux besoins de ceux-ci.
Tandis qu’un utilisateur navigue sur un syst`eme, toutes les actions d’utilisateur sont
enregistr´ees. Fond´e sur ces informations, le syst`eme capture le mod`ele de la connaissance
de l’utilisateur au sujet de chaque concept choisi par l’utilisateur. Et puis, `a partir de ce
mod`ele, le syst`eme va adapter l’information, les liens ou la pr´esentation de l’hyperm´edia.
NGUYEN Thi Ngoc Tu
9
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
La mod´elisation utilisateur permet de repr´esenter les informations particuli`eres de l’utilisateur qui int´eragit avec le syst`eme. Un mod`ele de l’utilisateur se compose de plusieurs
sections :
– Les informations personnelles d’un utilisateur
– Ses comp´etences, son savoir-faire
– Les pr´ef´erences de l’utilisateur
– Ses objectifs
Le mod`ele de l’utilisateur peut ˆetre repr´esent´e sous forme des ontologies.
Les r`
egles d’adaptation
Le processus d’adaptation doit suivre les m´ethodes d’adaptation. Ces m´ethodes d’adaptation ont ´et´e class´ees en deux cat´egories :
– Les m´ethodes de pr´esentation adaptative qui manipulent le contenu des hyperm´edias :
Afin d’assurer que le contenu d’une page Web contient l’information pertinente,
le syst`eme pr´esentera, marquera les fragments conditionnels `a une page. Ceci a
pour but de s’assurer le contenu d’une page contient l’information appropri´ee pour
l’utilisateur donn´e au temps donn´e.
– Les m´ethodes de navigation adaptative qui concernent plus particuli`erement les
liens :
Le mod`ele d’utilisateur classifie tous les noeuds (pages Web) dans plusieurs groupes
selon les connaissances actuelles de l’utilisateur et les int´erˆets ou les buts. Le syst`eme
utilise des liens dans des noeuds pour guider des utilisateurs vers les informations
appropri´ees ou int´eress´ees. Selon la classification du noeud auquel un lien m`ene, il
pourrait ˆetre particuli`erement annot´e ou enlev´e.
Pour la pr´esentation adaptative, le contenu de la page d´ependant de l’utilisateur. On
prend en compte plusieurs techniques de pr´esentation adaptative. Dans la figure 2.5, on
utilise la m´ethode fond´ee sur les frames. Les informations sur un concept particulier est
repr´esent´e par une frame. La frame `a droit contient des explications diff´erentes du concept
et des liens avec d’autres frames, des exemples. La frame `a gauche contient des liens avec
les concepts.
NGUYEN Thi Ngoc Tu
10
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Fig. 2.5 – Une technique de pr´esentation adaptative
Pour la navigation adaptative, on prend en compte cinq strat´egies et chaque strat´egie de
navigation adaptative classe et filtre les liens du document hyperm´edia. Les cinq strat´egies
de navigation adaptative mises en oeuvre sont les suivantes [IG02] :
– Annotation : chaque lien est pr´esent´e diff´eremment en fonction du niveau de pertinence qui lui est associ´e. Une image ou une valeur de couleur peut ˆetre associ´e `a
un lien `a partir d’une ´evaluation du lien qui prend en compte les caract´eristiques
du lecteur. On pourra, par exemple, mettre un feu vert devant les liens les plus recommand´es pour le lecteur, un feu orange pour ceux qu’il peut consulter mais avec
lesquels il aura des difficult´es et un feu rouge pour ceux qui ne lui correspondent
pas. Les liens sont donc class´es.
– Guidage direct : le syst`eme d´etermine le ”meilleur lien suivant” `a partir du fragment
courant. Les liens sont donc filtr´es.
– Tri : les liens sont tri´es en fonction de leur niveau de pertinence pour un utilisateur
particulier. Le syst`eme placera le lien le plus pertinent au sommet de la liste. Les
liens sont donc class´es.
– Masquage : les liens estim´es les plus pertinents sont retenus pour l’utilisateur. Les
liens sont donc filtr´es.
– Masquage partiel : le syst`eme affiche les liens qui poss`edent un niveau de pertinence
compris dans un intervalle choisi par l’auteur. Les liens sont donc filtr´es et class´ees.
Les liens retenus sont ensuite annot´es.
NGUYEN Thi Ngoc Tu
11
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Fig. 2.6 – Une technique de navigation adaptative
Dans la figure 2.6, on pr´esente une page Web ICCARS - un prototype de syst`eme auteur pour la composition dynamique de dossiers th´ematiques personnalisables. Il pourrait
ˆetre appel´e un poste de journalisme assist´e par ordinateur. Il ne s’agit en aucun cas de
remplacer le journaliste, mais bien de l’aider `a r´ediger des dossiers personnalisables sous
forme de documents ´electroniques. Ces dossiers sont personnalis´es selon diff´erents points,
le contenu, l’organisation de l’information et sa pr´esentation. Dans ce prototype, on utilise les techniques de navigation adaptative. Par exemple, on utilise la guidage direct qui
montre le ”meilleur lien suivant” pour l’article ”Troph´ee Jules-Verne Olivier de Kersauson”
(voir la figure 2.7) et le tri (voir la figure 2.8).
NGUYEN Thi Ngoc Tu
12
M´emoire de fin d’´etudes
´
CHAPITRE 2. SURVOL DES METHODES
EXISTANTES
Fig. 2.7 – Strat´egie d’adaptation : Guidage direct
Fig. 2.8 – Strat´egie d’adaptation : Tri
NGUYEN Thi Ngoc Tu
13
M´emoire de fin d’´etudes
CHAPITRE 3. SOLUTION POUR LE PROJET KMP
Chapitre 3
Solution pour le projet KMP
L’objectif du projet KMP est de valoriser le capital de comp´etences de Telecom Valley
en aidant chaque entreprise `a exprimer ses int´erˆets dans un espace commun.
Le service web d´evelopp´e devra donc permettre un rep´erage :
– des comp´etences grˆace `a l’´elaboration d’une cartographie et leur description,
– des entreprises,
– des entreprises et de leurs interactions r´eelles ou potentielles.
Le service web sera fond´e sur des ontologies, afin de faciliter le partage des connaissances, la repr´esentation s´emantique des informations (permettant une recherche intelligente), l’interop´erabilit´e, l’adaptabilit´e du contenu `a l’utilisateur (via un mod`ele utilisateur
d´ecrit `a partir de l’ontologie ...).
Il s’agit de concevoir et de r´ealiser un prototype de service web de comp´etences, de
type hyperm´edia adaptatif, fond´e sur un document virtuel adaptatif.
En effet, fond´e sur l’ensemble des techniques cit´ees dans le chapitre deux comme les
ontologies, les hyperm´edias adaptatifs, les documents virtuels, un environnement appel´e
SCARCE (SemantiC and Adaptative Retrieval and Composition Environnement) ´etait
d´evelopp´e.
Puisque le SCARCE repose sur les probl`emes li´ees au projet KMP, le d´eveloppement
de KMP sera bas´e sur l’environnement de SCARCE.
Le chapitre trois a pour objectif de pr´esenter l’environnement de SCARCE. Puis, les
probl`emes li´ees au projet KMP seront abord´es quand le d´eveloppement de KMP au sein
de SCARCE.
3.1
Une approche fond´
ee sur quatre types d’ontologies : moteur de composition SCARCE
L’objectif de SCARCE est de
– fournir l’acc`es `a l’information pertinente en fonction des besoins utilisateur. Alors,
il permet de mod´eliser le savoir-faire des auteurs par les ontologies.
– guider l’utilisateur pour naviguer dans un grand espace de ressources du Web sans
d´esorientation en fonction d’un hyperm´edia adaptatif. Il utilise des caract´eristiques
de l’utilisateur afin de modifier la topologie d’hyperm´edia existante et de pr´esenter
le contenu par rapport `a ces caract´eristiques.
NGUYEN Thi Ngoc Tu
14
M´emoire de fin d’´etudes
CHAPITRE 3. SOLUTION POUR LE PROJET KMP
– apporter `a l’utilisateur la compr´ehension d’une ressource complexe par la construction d’un mod`ele de document. L’utilisateur doit connaˆıtre la structure globale du
document et identifier les composants majeurs du document. Alors, il est n´ecessaire
d’utiliser les documents virtuels adaptatifs.
Alors, SCARCE est un environnement qui permet de sp´ecifier, de g´erer la s´election, le
filtrage et l’organisation d’un ensemble de ressources par la compr´ehension de l’utilisateur.
Il est n´ecessaire de construire un moteur de composition qui permet de s´electionner le
contenu du document parmi les ressources fournies et puis l’organise.
Pour la gestion des ressources, cette architecture de composition sera fond´ee sur quatre
types d’ontologies : une ontologie de l’application, une mod´elisation de l’utilisateur, un
mod`ele du domaine et un sch´ema de m´etadonn´ees.
3.1.1
Repr´
esentation de connaissances
En fait, l’environnement SCACRE est propos´es dans la th`ese de M. S´ebastien Iksal
[Iks02]. SCARCE est un moteur de composition des documents virtuels adaptatifs a` base
d’ontologies. Il s’agit de l’utilisation de 4 mod`eles repr´esent´es sous forme d’ontologies : un
mod`ele de documents, un mod`ele de domaine, un mod`ele utilisateur ainsi qu’un sch´ema
de m´eta-donn´ees.
Fig. 3.1 – 4 types d’ontologies de SCARCE
Mod`
ele de document
Le mod`ele de document permet de mod´eliser le savoir-faire de l’utilisateur sous la
forme d’une structure globale de document. La structure narrative est repr´esent´ee par un
mod`ele de document ainsi que par des types de fragments et de relations. Cette structure
est un graphe dont le contenu des noeuds est personnalis´e en fonction de l’utilisateur et
donc calcul´e au moment de la consultation du document.
NGUYEN Thi Ngoc Tu
15
M´emoire de fin d’´etudes
CHAPITRE 3. SOLUTION POUR LE PROJET KMP
Mod`
ele utilisateur
Le mod`ele utilisateur repr´esente les caract´eristiques de l’utilisateur. Elle se compose
de cinque parties :
– Personnel : informations personnelles concernant l’utilisateur
– Pr´ef´erences : informations sur les pr´ef´erences de l’utilisateur
– Connaissance : informations sur les connaissances de l’utilisateur
– Historique : informations sur leur acc`es
– Session : informations sur la session courante
Mod`
ele de domaine
Le mod`ele de domaine repr´esente l’ensemble des concepts du domaine particuliers de
l’application.
Sch´
ema de m´
eta-donn´
ees
Les m´eta-donn´ees sont utilis´ees en recherche d’information car elles rendent la recherche plus efficace et plus pr´ecise, et permettent une utilisation plus pertinente de la
ressource. Elles sont structur´ees selon un sch´ema de m´eta-donn´ees. En effet, le sch´ema
de m´eta-donn´ees permet l’indexation des fragments en fonction des documents virtuels
adaptatifs. Un sch´ema de m´eta-donn´ees est compos´e de diff´erentes parties, chaque parties
correspond `a un point de vue particulier sur la ressource.
– Partie g´en´erale : informations d’identification de la ressource : l’identifiant, le titre,
les auteurs, la langue ainsi qu’une description.
– Cycle de vie : informations relatives `a la gestion des diff´erentes versions d’une ressource, comme le num´ero, la date, les auteurs, etc.
– M´eta-m´etadonn´ees : informations sur les m´etadonn´ees d’une ressource
– Droits : informations concernantes les droits et conditions d’utilisation de la ressource, comme la restriction d’acc`es, le licence, etc.
– Technique : informations relatives la ressource en terme d’utilisation, comme sa
localisation physique, le format de fichier, etc.
– Classification : informations relatives la ressource en terme de contenu
3.1.2
Composition et adaptation dans moteur de composition
de SCARCE
Fonctionnement d’un syst`
eme bas´
e sur le moteur de composition de SCARCE
Dans un document num´erique, il existe trois vues diff´erentes : s´emantique, logique
et pr´esentation. Chaque vue a une structure sp´ecifique. La structure s´emantique d’un
document donne l’organisation de la signification du contenu de document. La structure
logique donne l’organisation syntactique d’un document. La pr´esentation d´ecrit comment
les documents apparaissent sur l’´ecran [IG04]. Le moteur de composition de SCARCE est
divis´e en trois moteurs : composition s´emantique, composition logique et composition de
pr´esentation selon ces trois vues.
Une page Web se compose de trois composants dynamiques diff´erents (guides locaux
et globaux de navigation et de contenu). Une ´etape correspond au calcul de la prochaine
NGUYEN Thi Ngoc Tu
16
M´emoire de fin d’´etudes
CHAPITRE 3. SOLUTION POUR LE PROJET KMP
page selon l’interaction d’utilisateur dans la page Web courante. Dans la figure 3.2, le
guide local de navigation se compose de trois types diff´erents de liens : pages pr´ec´edentes,
page courante et prochaines pages. En cons´equence, les prochaines pages Web doivent ˆetre
calcul´ees `a l’avance pour pouvoir montrer et annoter ces liens. Le calcul de la prochaine
page Web est divis´e en deux parts : le premier est la composition s´emantique adaptative
et le second est la composition logique et de pr´esentation.
Fig. 3.2 – Pr´esentation d’une page Web
Architecture du moteur de composition de SCARCE
L’architecture de SCARCE se compose de trois moteurs de composition (s´emantique,
logique et de pr´esentation) (voir la figure 3.3).
1. Le moteur de composition s´emantique g´en`ere les ´el´ements d’un document personnalis´e `a partir d’une structure narrative et de l’espace d’information du document
r´eel.
2. Le moteur de composition logique parcourt ce document personnalis´e et pour chaque
fragment du document, il r´ecup`ere les gabarits de page au format XML que d´efinit
l’organisation de la page locale.
3. Le moteur de compostion de pr´esentation g´en`ere un page HTML `a partir de page
au format XML en fonction de gabarit de page au format XSLT.
NGUYEN Thi Ngoc Tu
17
M´emoire de fin d’´etudes
CHAPITRE 3. SOLUTION POUR LE PROJET KMP
L’´etape de composition comporte au moin quatre processus qui peuvent ˆetre s´epar´es :
la s´election des fragments, le filtrage et l’organisation de ceux-ci et leur assemblage.
Ces quatre m´ecanismes des documents virtuels sont implant´es comme suivant :
– les phases de s´election, de filtrage et d’organisation sont r´ealis´es dans la composition
s´emantique.
– la phase d’assemblage est divis´ee dans la composition logiques et de pr´esentation.
Fig. 3.3 – Architecture de moteur de composition SCARCE
Moteur de recherche s´
emantique OntoBroker : la gestion des ontologies
Le fonctionnement du moteur de composition s´emantique est li´e au moteur de recherche
s´emantique OntoBroker. OntoBroker est un logiciel de gestion de connaissances qui permet
de naviguer dans des diff´erents ontologies et les m´eta-donn´ees associ´ees pour rechercher
des ressources.
Alors, la gestion des ontologies au sein du m´ecanisme de composition s´emantique repose
sur OntoBroker qui poss`ede un syst`eme de requˆete fond´e sur un moteur d’inf´erence. Et
puis, les processus de s´election, de filtrage et d’organisation sont r´ealis´ees via des requˆetes
du moteur de composition s´emantique au OntoBroker.
Moteur de composition s´
emantique : la s´
election, l’organisation et le filtrage
Le moteur de composition s´emantique prend en param`etre d’entr´ee de quatre mod`eles
repr´esent´es sous forme d’ontologies : le mod`ele de document, le mod`ele de domaine, le
mod`ele utilisateur et le sch´ema de m´eta-donn´ees. Le mod`ele de document est instantiated
comme document g´en´erique contenant une sp´ecification d´eclarative des r`egles d’organisation, de s´election et de filtrage.
Le processus de composition s´emantique calcule un graphe s´emantique. Une page Web
est associ´ee `a un noeud du graphe s´emantique et le noeud de la prochaine page a ´et´e
calcul´e. Pour chaque noeud voisin, le processus de composition s´emantique se compose
de trois m´ecanismes : le premier choisit les ressources appropri´ees pour le noeud courant,
NGUYEN Thi Ngoc Tu
18
M´emoire de fin d’´etudes