Tải bản đầy đủ (.pdf) (53 trang)

La composition logique dans les DVP appliquée à KMP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (966.79 KB, 53 trang )

Rapport du stage de fin d’étude

La composition logique dans les DVP appliquée
à KMP

Réalisé par
BUI Huy Duc
Promotion VIII – IFI

Encadrant
Serge GARLATTI

08/2004
Département LUSSI
ENST Bretagne – Brest FRANCE

La composition logique dans les DVP appliquée à KMP

1


Remerciements
En premier lieu, je tiens à remercier tous les personnes de l’IFI (Institut de la
Francophonie pour l'informatique), spécialement les professeurs qui m’ont formé et encadré
au cours de ces deux années de DEPA.
Je remercie tout particulièrement M. Serge Garlatti, mon tuteur de stage, pour sa
direction et son amitié. Il est toujours présent, disponible et me donne des conseils durant
tout le stage. Je le remercie pour les discussions qui sont toujours intéressantes et amitiés.
J’adresse finalement mes remerciements les plus affectueux à tous les membres de ma
famille. Aucun mot n’est assez fort pour exprimer leurs sentiments pour moi.


La composition logique dans les DVP appliquée à KMP

2


Table des matières
RESUME........................................................................................................................................................... 4
ABTRACT ........................................................................................................................................................ 5
INTRODUCTION GENERALE..................................................................................................................... 6
PRESENTATION DU PROJET .............................................................................................................................. 6
CONTEXTE DE TRAVAIL ................................................................................................................................... 7
ORGANISATION DU RAPPORT ........................................................................................................................... 7
PREMIERE PARTIE : PROBLEMATIQUE ET DOMAINES DE RECHERCHE ............................................................. 7
DEUXIEME PARTIE : RE-ENGINEERING DE LA PLATE-FORME DE SCARCE ET APPLICATION A KMP ............... 8
I PROBLEMATIQUE ET DOMAINES DE RECHERCHE ..................................................................... 9
1

LE WEB SEMANTIQUE ........................................................................................................................ 9
1.1
1.2
1.3
1.4

2

LE DOCUMENT VIRTUEL PERSONNALISABLE......................................................................... 15
2.1
2.2
2.3


3

PRINCIPES............................................................................................................................................ 9
L'ARCHITECTURE DU WEB SEMANTIQUE ........................................................................................... 10
LES CHAMPS D'APPLICATION ............................................................................................................. 14
CONCLUSION ..................................................................................................................................... 14

INTRODUCTION .................................................................................................................................. 15
DOCUMENT VIRTUEL PERSONNALISABLE ......................................................................................... 16
CONCLUSION ..................................................................................................................................... 17

SCARCE.................................................................................................................................................. 18
3.1
3.2
3.3
3.4
3.5

INTRODUCTION .................................................................................................................................. 18
HYPERMEDIA ADAPTATIF (ADAPTIVE HYPERMEDIA - AH) ............................................................... 18
CONCEPTION ..................................................................................................................................... 19
MOTEUR DE COMPOSITION ADAPTATIVE ........................................................................................... 24
CONCLUSION ..................................................................................................................................... 25

II RE-ENGINEERING DE LA PLATE-FORME ET APPLICATION A KMP..................................... 26
4

RE-ENGINEERING DE LA PLATE-FORME ................................................................................... 26
4.1
4.2

4.3
4.4

5

INTRODUCTION .................................................................................................................................. 26
ANALYSE .......................................................................................................................................... 26
REALISATION .................................................................................................................................... 29
CONCLUSION ..................................................................................................................................... 32

CONSTRUIRE KMP EN APPLIQUANT LA PLATE-FORME SCARCE ..................................... 33
5.1
5.2
5.3
5.4

INTRODUCTION .................................................................................................................................. 33
ANALYSE .......................................................................................................................................... 34
REALISATION .................................................................................................................................... 38
RESULTAT ......................................................................................................................................... 44

III CONCLUSION GENERALE .................................................................................................................. 46
IV ANNEXES ................................................................................................................................................. 47
LES FICHIERS MANIPULES AU COUR DE LA COMPOSITION DYNAMIQUE ................................. 47
GLOSSAIRE ................................................................................................................................................ 51
REFERENCES............................................................................................................................................. 53

La composition logique dans les DVP appliquée à KMP

3



Résumé
Notre travail est mené dans le cadre du projet KMP (Knowledge Management Portal).
L'objectif du projet est de construire une solution innovante de "Knowledge Management"
partagée au sein d'une même communauté, afin de favoriser les synergies et les
partenariats par l'élaboration d'une cartographie des compétences des différents acteurs en
présence.
Le principe de SCARCE (SemantiC and Adaptive Retrieval and Composition
Environnement) - un environnement flexible pour les documents virtuels adaptatifs basés
sur une approche de web sémantique est considéré dans le premier temps afin de
l’appliquer à KMP.

La composition logique dans les DVP appliquée à KMP

4


Abtract
Our work is leaded within the framework of the project KMP (Knowledge Management
Portal). The objective of the project is to build an innovating solution of "Knowledge
Management" shared within the same community, in order to support the synergism and the
partnership by the development of cartography for the competences of the various actors.
The principle of the SCARCE (SemantiC and Adaptive Retrieval and Composition
Environnement) - a flexible environment for the adaptive virtual documents based on the
approach Web semantic - is considered at first then applied to KMP.

La composition logique dans les DVP appliquée à KMP

5



Introduction générale
Internet offre un accès à un vaste ensemble d'informations. Aujourd'hui, l'objectif du
Web de troisième génération est l'amélioration de la recherche d'informations : meilleurs
précision et rappel, favoriser le partage et la réutilisation des connaissances et des
documents par l'utilisation d'ontologies, de mécanismes d'inférence et l'association de
métadonnées sémantiques aux connaissances et documents. Le Web Sémantique est un
Web interprétable par les machines de façon à automatiser ou semi-automatiser certains
processus et par conséquent aider l'utilisateur dans sa tâche. Il propose une architecture et
des standards pour atteindre cet objectif. L’adaptation/personnalisation est également un
des enjeux principaux pour des services web.
Un Document Virtuel Personnalisable (DVP) est une bonne approche pour la
personnalisation, l'automatisation et la réutilisation. En effet, un document virtuel
personnalisable compose dynamiquement des documents à partir d'informations provenant
de sources diverses, qui satisfont au mieux les besoins utilisateurs. La composition est
découpée en trois étapes, la sélection de l'information, son organisation et son assemblage
en un document réel. Le document réel est le document qui est effectivement présenté à
l'utilisateur. Pour composer un document réel, un DVP automatise – ou semi-automatise,
notamment les processus d'organisation, de sélection des informations les plus pertinentes
et les plus récentes par filtrage, ainsi que le processus de personnalisation en utilisant
notamment un modèle utilisateur. La question qui se pose est donc la réutilisation de ces
processus pour générer des services le plus aisément possible.

Présentation du projet
Le sujet de ce stage est constitué de deux phases principales :
• Premièrement, c’est l’étude sur les principes de SCARCE1 - un environnement
d’hypermédia adaptatif fondé sur les documents virtuels et l’approche du web
sémantique, ainsi que la spécification déclarative et la composition sémantique d’un
document virtuel personnalisable qui ont été étudiées et implantées dans des

travaux précédents (projet Iccars2, Candle3 et une thèse [1]). Elles permettent de
concevoir plus simplement des applications Internet/Intranet avec une approche de
type «Semantic Web». La spécification et la composition sont fondées sur une
architecture structurant différentes ontologies et des propriétés sémantiques.
Ensuite, le re-engineering de cette plate-forme a été réalisé. Le résultat de cette
phase est une nouvelle version complète de la plate-forme.



Deuxièmement, c’est l’étude des principes de KMP ainsi que l’analyse et le
développement de KMP en utilisant la plate-forme de la phase I. Dans le processus
du développement de KMP, les travaux sont divisés à trois parties principales : (i)
Construire le modèle de document, (ii) Construire les ontologies et le moteur de
composition sémantique, (iii) Construire le moteur de composition logique et
physique ainsi que la liaison avec la partie client. Mon travail s’est concentré sur la
dernière partie. Le résultat de la composition sémantique est un ensemble de
fragments liés par des relations sémantiques. La composition logique utilise des
gabarits pour chaque composant d’une page de document afin de générer les pages

1

SCARCE: SemantiC and Adaptive Retrieval and Composition Environnement.
ICCARS: Integrated Cooperative Computer Assisted Reporting System,
3
CANDLE: Collaborative And Network Distributed Learning Environment (http ://www.candle.eu.org)
2

La composition logique dans les DVP appliquée à KMP

6



XML. Enfin, la composition physique construit une page HTML en appliquant des
règles de présentation.

Contexte de travail
Les travaux de recherche qui sont présentés dans ce stage ont été menés au sein du
Laboratoire de Logique des Usages en Sciences Sociales de l’Information (LUSSI),
laboratoire de recherche de l'Ecole Nationale Supérieure des Télécommunications (ENST)
de Bretagne, situé à Brest. Ces travaux de ce stage ont été menés dans le cadre du projet
ICCARS. Ensuite ces travaux ont été réutilisés au sein du projet KMP.

1.1.1 Le projet ICCARS
Le projet ICCARS (Integrated and Cooperative Computer-Assisted Reporting System)
est une collaboration entre l'ENST Bretagne, Atlantide - société de développement
informatique - et le Télégramme - quotidien régional - qui bénéficie du soutien financier du
Conseil Régional de Bretagne. ICCARS correspond à ce qui pourrait être appelé un poste
de journalisme assisté par ordinateur. Il s'agit d'un prototype de système auteur pour la
composition dynamique de dossiers thématiques personnalisables. Il ne s'agit en aucun cas
de remplacer le journaliste, mais bien de l'aider à rédiger des dossiers personnalisables
sous forme de documents électroniques. Ces dossiers sont personnalisés selon différents
aspects, le contenu, l'organisation de l'information et sa présentation.

1.1.2 Le projet KMP
KMP - Knowledge Management Portal. L'objectif du projet est de construire une solution
innovante de "Knowledge Management" partagée au sein d'une même communauté, afin de
favoriser les synergies et les partenariats par l'élaboration d'une cartographie des
compétences des différents acteurs en présence.
Cette solution repose sur la conception, la réalisation et l'évaluation d'un prototype de
service web de compétences, de type hypermédia adaptatif.

Ce prototype sera une composante d'un portail web destiné à une communauté
d'entreprises, d'institutionnels et d'organismes académiques intéressés par le domaine des
télécommunications (Telecom Valley).

Organisation du rapport
Nous revenons ici sur le contenu de chacune des parties de manière détaillée. Ce rapport
est composé de 5 chapitres regroupés en 2 parties :

Première partie : Problématique et Domaines de Recherche
La première partie fait le point sur les travaux concernés. Il s'agit donc de présenter le
cadre scientifique de l'étude menée en revenant en détail sur la problématique et les
solutions apportées.

Chapitre 1 : Le Web Sémantique

La composition logique dans les DVP appliquée à KMP

7


Les objectifs du Web Sémantique concernent l'utilisation de l'information disponible sur
Internet par des machines de façon à aider l'utilisateur dans sa tâche, ainsi que la
réutilisation, le partage et l'échange de cette information. Les premiers travaux ont
commencés par la séparation de la localisation de l'information et de sa présentation, c'està-dire la création d'Internet. Puis XML a permis la séparation entre la présentation de
l'information et sa structure, Finalement, le Web Sémantique propose de séparer le contenu
de la structure en caractérisant le contenu de manière suffisamment précise pour qu'il soit
facilement retrouvé et manipulé par les machines. Afin de résoudre les problèmes liés à
l'interprétation de l'information, le Web Sémantique repose sur l'utilisation d'ontologies et de
mécanismes de raisonnement.


Chapitre 2 : Les Documents Virtuels Personnalisables
Ce chapitre présente le document virtuel personnalisable qui correspond aux travaux
que nous avons menés. Les DVP se sont intéressés aux problèmes liés à la réutilisation de
l'information, ainsi qu'à la génération dynamique d'un document dont le contenu et
l'organisation sont pertinents soit pour un utilisateur, soit pour une tâche donnée.

Chapitre 3 : SCARCE
Nous verrons dans ce chapitre les principes fondamentaux de SCARCE (SemantiC &
Adaptive Retrieval and Composition Engine). C’est un environnement d’hypermédia
adaptatif fondé sur le document virtuel et l’approche du web sémantique. Il s’agit du cœur
de ce stage.

Deuxième Partie : Re-engineering de la plate-forme de SCARCE et
application à KMP
Cette seconde partie décrit les processus de développement. Le principe de SCARCE
est appliqué pour construire une plate-forme. Cette plate-forme va être utilisée dans projet
KMP.

Chapitre 4 : Re-engineering de la plate-forme de SCARCE
Basé sur le principe de SCARCE, la spécification déclarative et la composition
sémantique d’un document virtuel personnalisable ont été étudiées et implantées dans le
cadre du projet ICCARS. Ce chapitre a pour but d’analyser la structure ainsi que la
conception principale de plate-forme qui a été développée dans ICCARS afin de faire du reengineering.

Chapitre 5 : Construire KMP en utilisant la plate-forme de SCARCE
L’objectif de KMP est de construire une solution innovante de "Knowledge Management"
partagée au sein d'une même communauté de pratique. Cette solution repose sur
l’élaboration d’une cartographie des compétences et des acteurs, appartenant à Telecom
Valley. Ce chapitre a pour but de présenter les étapes de construire KMP en appliquant la
plate-forme de SCARCE.


La composition logique dans les DVP appliquée à KMP

8


I Problématique et Domaines de Recherche
1 Le Web Sémantique
Le World Wide Web a été conçu initialement comme un espace d'information
partageable entre humains. Il est constitué d'une masse d'informations et de connaissances
si vaste que l'homme seul éprouve des difficultés à s'y retrouver. Le succès du Web est
essentiellement dû à sa simplicité. Le revers de cette simplicité est le frein qu'elle constitue
pour le développement de services intelligents. L'objectif du Web de troisième génération
est l'amélioration de l'accès à l'information pour la rendre partageable et réutilisable par tous
les acteurs qu'ils soient humains ou machines ce qui permet alors l'automatisation ou la
semi-automatisation de certaines tâches et de ce fait la création de services intelligents. De
nouveaux standards ont émergés autour de ce nouveau Web - le Web Sémantique, qui
permet de palier au manque de structuration et au défaut d'interprétation automatique des
documents Web d'aujourd'hui en leur associant des descriptions sémantiques. Dans un
premier temps nous reviendrons sur les principes du Web Sémantique, puis nous
détaillerons son architecture. Pour finir, nous présenterons quelques champs d'application
de cette architecture.

1.1

Principes

Sur le Web actuel, l'information est principalement présentée d'une façon qui la rend
facile à envoyer et à montrer aux hommes. Les langages associés aux documents Web tels
que HTML et PDF sont des langages qui concernent la représentation visuelle des

documents. Par exemple "<H2>Web Sémantique</H2>" n'apporte aucune information sur le
contenu de la balise sans l'interprétation d'un lecteur humain. Toutefois, Internet n'est pas
utilisé que par des humains, mais de plus en plus par des robots, des agents et d'autres
algorithmes. Il est extrêmement difficile pour ces programmes d'interpréter l'information peu
ou pas structurée disponible sur Internet.
L'objectif du Web Sémantique est d'être "un Web qui parle aux machines", c'est-à-dire
dans lequel les ordinateurs offrent une meilleure aide aux utilisateurs de par le fait qu'ils se
servent du contenu du Web. Aujourd'hui, Internet permet aux hommes d'accéder aux
documents et services disponibles dans cet univers. Actuellement, les pages Web sont
conçues par des humains pour que des humains les consultent. Le Web Sémantique a pour
but d'augmenter le Web actuel avec de la connaissance formalisée et des descriptions
sémantiques manipulables par des machines. Cette ouverture de la connaissance aux
ordinateurs permettra à ces derniers d'assister les hommes dans leurs tâches. Cette
évolution du Web est considérée comme la troisième génération du Web. La contribution
principale du Web d'origine a été de rendre des documents disponibles au travers de
l'Internet, c'est-à-dire, en séparant la présentation d'un document de sa localisation. Ensuite,
l'arrivée d'XML a permis de séparer la structure d'un document de sa présentation. Ce qui
signifie qu'un document peut être perçu comme un conteneur de données dont la
présentation peut varier selon l'utilisation. Finalement, l'idée du Web Sémantique consiste à
séparer le sens de la structure, c'est-à-dire, étendre l'idée du document avec de la
sémantique manipulable par des machines.
Comme nous venons de le voir, l'interprétation et la manipulation sont facilitées par
l'ajout de descriptions sémantiques, appelées métadonnées. Des métadonnées sont "des
données sur des données", cette définition ambiguë est comprise de différentes manières
par les communautés qui conçoivent, créent, décrivent, préservent et utilisent les systèmes

La composition logique dans les DVP appliquée à KMP

9



d'information et les ressources. En ce qui concerne les métadonnées sur Internet, la
définition est plus précise. Il s'agit "d'informations structurées qui décrivent une ressource".
Ces descriptions rendent la recherche d'information plus efficace et plus précise, par
conséquent elles permettent une utilisation plus pertinente de la ressource. Les
métadonnées peuvent être séparées en deux grandes catégories, celles qui sont créées
automatiquement par le système comme les informations de gestion de version, et celles
qui sont renseignées par un utilisateur comme les informations de description du contenu de
la ressource. Le plus souvent les métadonnées sont définies en fonction d'un schéma de
métadonnées. Ce schéma spécifie pour chacune des métadonnées son domaine de valeur
et son rôle. En effet, un schéma de métadonnées est généralement décomposé en
plusieurs sections ayant des rôles bien définis comme la gestion du cycle de vie ou la
classification par rapport à un domaine. Ces rôles permettent d'obtenir une meilleure
précision dans la recherche d'information. Par exemple, lors de la recherche de documents
vidéo on se focalisera sur la section technique du schéma.
Le Web Sémantique est une extension du Web actuel et dans sa vision, Tim Berners
Lee [Berners-Lee et al. 2001] présente son double objectif :
• Le Web doit devenir un moyen très puissant de coopération entre les humains.
• Les ordinateurs présents sur le réseau doivent coopérer : ils seront capables
d'analyser toutes les données qui y circulent et de chercher les informations
pertinentes pour l'utilisateur dans les bases de données accessibles aussi bien
que dans les sites existants. Ces données sont ensuite traitées et présentées
correctement à l'utilisateur.
Il est important de noter que le terme "Sémantique" est employé dans un sens
différent de celui utilisé dans le langage naturel. En effet, "Sémantique" signifie ici
"interprétable par les machines". Les machines devront être capables d'utiliser des
ressources provenant de diverses sources. C'est pourquoi ces ressources devront être
disponibles, c'est-à-dire ouvertes et compréhensibles.

1.2


L'architecture du Web Sémantique

Le Web Sémantique n'est pas seulement une vision de l'avenir du Web. Certaines
technologies sont déjà disponibles et figurent dans l'architecture illustrée dans la figure cidessous :

La composition logique dans les DVP appliquée à KMP

10


Fig. 1.1 – Architecture du Web Sémantique
L'architecture repose sur des technologies de structuration de documents fondées sur
XML. Sur cette base, des langages de métadonnées sémantiques de haut niveau ont été
développés et permettent la description de ressources sur le Web. Afin de fournir un cadre
interprétatif à ces métadonnées sémantiques, le Web Sémantique utilise des ontologies. Au
niveau supérieur, le raisonnement sur les données est assuré par des mécanismes
d'inférence, qui permettent d'une part de construire de la connaissance, mais aussi d'en
maintenir la cohérence.
Le Web Sémantique n'est pas l'Intelligence Artificielle présentée sous une autre forme.
Le but n'est pas de développer des systèmes intelligents qui serait aussi intelligent qu'un
homme pour être utiles. Le point de référence n'est pas l'homme, mais le Web actuel qui est
non sémantique. L'idée est d'ajouter progressivement des descriptions sémantiques de
contenu sur le Web actuel afin de faire émerger petit à petit un Internet plus intelligent. Nous
allons maintenant présenter les trois niveaux importants du Web Sémantique : Le niveau de
l'adressage, le niveau syntaxique et le niveau sémantique.

1.2.1 Le niveau "Nommage/Adressage"
Le World Wide Web repose sur un concept important qu'est l'URI (Uniform Resource
Identifier). Tout ce qui est disponible sur Internet doit être identifié par un URI. Un URI

identifie de manière unique et non ambiguë chaque ressource du Web, comme une page,
une adresse e-mail, ou une image. Le point central des URIs est l'URL (Uniform Resource
Locator) traditionnelle utilisée pour définir les liens du Web (par exemple : http ://wwwiasc.enst-bretagne.fr). Ces URLs sont utilisées pour référencer des fichiers Web à travers
un protocol particulier, comme HTTP ou FTP.

La composition logique dans les DVP appliquée à KMP

11


1.2.2 Le niveau syntaxique
Le niveau syntaxique est le niveau de la structuration des documents. La spécification
de la structure logique des documents repose sur XML. XML (eXtensible Markup Language)
est un métalangage qui permet de définir d'autres langages. Les langages que définit XML
sont des langages de présentation de documents. Il est aussi particulièrement adapté à
l'échange de données. Son champ d'application est très vaste. XML permet de stocker des
données structurées dans un fichier de texte. Elles y sont stockées dans un format simple et
lisible relativement facilement.
XML est utilisé sur le Web car il permet la description de documents électroniques par
l'intermédiaire d'une DTD (Document Type Definition). Il fait le lien entre les documents et
les logiciels qui les utilisent. En effet, le but de XML est de faciliter la diffusion et l'échange
d'informations sur Internet.
Les points forts d'XML en plus de sa simplicité sont :
• Son indépendance quand à la plateforme utilisée
• Son exploitation possible par un système informatique
• La séparation de la présentation et du contenu
• C'est un langage de description facilement extensible et personnalisable en
fonction des besoins des applications
• La gestion de la cohérence grâce aux DTD
L'avantage d'XML est la possibilité de personnaliser la présentation des documents en

utilisant par exemple XSL (XML Stylesheet Language) qui permet de transformer
automatiquement un fichier XML en une page HTML qui est consultable via un navigateur
Internet. Son inconvénient : Il n'a pas de sémantique formelle permettant l'interprétation par
la machine. XML décrit uniquement la structure de l'information, sa syntaxe.

1.2.3 Le niveau sémantique
XML offre une solution à la structuration des données, mais la structure ne suffit pas à
rendre les données complètement exploitables par un système. Il est nécessaire de rendre
les données interprétables par une machine par l'association d'une sémantique formelle. Un
langage est interprétable par une machine s'il dispose d'informations sémantiques. Cela
signifie que les symboles et la structure du langage font référence à un modèle sémantique.
Le W3C propose d'adjoindre des métadonnées et/ou des annotations permettant de décrire
en terme de contenu chacune des ressources disponibles. La différence entre métadonnée
et annotation réside dans le fait qu'une métadonnée serait attachée à une ressource et
définie suivant un schéma, alors que l'annotation serait située au sein de la ressource et
mise en place au cours d'un processus d'annotation.

1.2.3.1 RDF et RDFS
Le meilleur langage à ce jour permettant d'apporter de la sémantique au Web est RDF
(Resource Description Framework). Une description RDF est un graphe orienté étiqueté
dont la syntaxe recommandée est fondée sur XML. Il s'agit d'un formalisme utilisé pour
représenter les propriétés d'une ressource et les valeurs de ces propriétés. RDF est donc un
ensemble de triplets : Ressource, Propriété, Valeur. Une ressource peut être une page

La composition logique dans les DVP appliquée à KMP

12


HTML, un élément situé dans une page HTML, un ensemble de pages, bref tout objet qui

peut être identifié de façon unique par un URI. RDF peut être vu comme un langage
déclaratif de représentation de connaissances.
La spécification de la syntaxe RDF est fondée sur XML, mais XML n'est pas le seul
langage possible pour exprimer du RDF. En effet, le formalisme de RDF consiste en un
ensemble de triplets. Mais de nombreux outils ont été développés autour d'XML.
RDF ne propose pas d'outils permettant de spécifier le vocabulaire utilisé dans les
descriptions. RDF Schema (RDFS) est une extension de RDF permettant de décrire les
concepts utilisés dans les descriptions et de définir des contraintes de type sur les objets et
les valeurs des triplets. En fait, les triplets RDF sont les instances d'un RDF Schéma.

1.2.3.2 Les ontologies
L'objectif principal du Web Sémantique concerne le partage et la réutilisation de
l'information par tous : Hommes et Machines. Le Web Sémantique s'oriente vers des
solutions qui consistent à ajouter de la connaissance à l'information de façon à améliorer la
compréhension de cette dernière. L'ajout de la connaissance est obtenu soit par la gestion
de métadonnées, soit par l'annotation des ressources. Un des problèmes soulevés porte sur
la signification des concepts. En effet, il est nécessaire qu'un même concept soit utilisé pour
représenter la même chose dans l'indexation de différents documents. La solution est
obtenue avec l'un des composants du Web Sémantique : les collections d'informations
appelées ontologies.
Le terme "ontologie" est souvent utilisé aujourd'hui et possède de nombreuses
définitions. Thomas Gruber [Gruber 1993] définit une ontologie de la façon suivante : "Une
ontologie est une spécification formelle explicite d'une conceptualisation partagée". Les
attributs "formelle" et "explicite" signifient qu'une ontologie permet une interprétation
automatisée par la machine de la conceptualisation.
En pratique, les ontologies sont des thésaurus et des hiérarchies de concepts évoluées
et formalisées. Elles définissent des termes, des concepts, et leurs relations dans différents
champs d'application. Elles diffèrent selon le domaine, l'utilisation ou les mécanismes de
représentation utilisés. Voici quelques exemples d'ontologies :
• Les ontologies pour les sciences (biologie, l'électronique, etc.)

• Les ontologies pour le commerce (représentation des produits, etc.)
• Les ontologies culturelles
• Les ontologies de métadonnées
• Les ontologies pour des phénomènes dynamiques (tâches, services, processus,
etc.)

1.2.3.3 Logique, Preuve et Confiance
Une ontologie définit les concepts d'un domaine particulier, mais n'explique pas
comment il faut les utiliser. Par exemple, considérons un agent électronique qui doit être
capable de déduire que si une commande est de 10 objets, que 4 ont été commandés à un
premier fournisseur et que 6 ont été commandés à un second fournisseur, alors la
commande est passée. Ce type de connaissance ne fait pas partie de l'ontologie mais
concerne les actions, processus et déductions logiques sur les objets de l'ontologie. Le

La composition logique dans les DVP appliquée à KMP

13


raisonnement sur la connaissance est donc un point important du Web Sémantique. Un des
inconvénients du raisonnement automatique est que l'utilisateur prendra pour acquis des
conclusions qui pourraient provenir de faits erronés. Il est nécessaire de savoir si l'on peut
faire confiance aux informations disponibles. La solution proposée est d'offrir des outils
permettant d'évaluer et de commenter les informations disponibles sur le Web, puis grâce
aux signatures électroniques, il sera possible d'identifier formellement la personne qui aura
annoté le document, et par conséquent de s'assurer de la pertinence des commentaires.

1.3

Les champs d'application


Les techniques du Web Sémantique, comme la description de ressources via des
métadonnées et les ontologies peuvent être utilisées dans différents types d'applications
telles que :
• Systèmes d'information
• Systèmes de gestion de connaissance
• E-Learning
• Commerce électronique
• Portails sémantiques
L'un des principaux problèmes du Web est de trouver l'information ou le service dont
l'utilisateur a besoin dans un espace d'information vaste et peu ou pas structuré. Le Web
Sémantique et plus particulièrement les méta-descriptions de contenu permettent
d'améliorer les méthodes de recherche d'information basées sur des mots clés, car la
sémantique apportée par les métadonnées combinée aux ontologies permet de disposer
d'un contexte d'interprétation des mots clés.
La séparation de la localisation, de la présentation, de la structure et du contenu d'un
document Web permettent par exemple l'adaptation à l'utilisateur sur différents points du
document et par conséquent une adaptation plus fine. La recherche d'information rendue
plus précise, offre de nouvelles opportunités pour la création de documents virtuels. Les
standards du Web Sémantique sont devenus les nouveaux standards des domaines tels
que les hypermédias adaptatifs et les documents virtuels.

1.4

Conclusion

Le Web Sémantique constitue une sorte de révolution de fond du Web actuel. La
connaissance et l'information qui sont disponible sur le Web peuvent être partagées,
échangées et réutilisées. Il est le point de départ pour le développement de services Web
intelligents. Les initiatives de standardisation sont nombreuses mais essentielles pour le

Web, et certains standards tels XML sont déjà bien implantés dans l'informatique
d'aujourd'hui. XML est devenu le langage privilégié en ce qui concerne l'échange de
données et leur stockage. En ce qui concerne la gestion des ontologies, les extensions de
RDF et de RDFS sont devenues des incontournables. Avec le Web Sémantique, les
ontologies vont devenir les points centraux des systèmes d'information de demain. Même si
leur principal défaut aujourd'hui est d'être élaborées pour des applications particulières,
néanmoins il existe déjà des banques d'ontologies sur le Web. Cette révolution
technologique offre de nouvelles opportunités au développement de systèmes et de
services intelligents et facile d'utilisation fondés sur la connaissance des contenus du Web.

La composition logique dans les DVP appliquée à KMP

14


2 Le Document Virtuel Personnalisable
Internet offre un accès à un vaste ensemble d'informations. Aujourd'hui, les nombreux
services sont disponibles sur Web : système d’information en ligne, E-Learning, musée
virtuel, etc. L'objectif du Web de troisième génération est l'amélioration de la recherche
d'informations : le partage et la réutilisation des connaissances et des documents par
l'utilisation d'ontologies, de mécanismes d'inférence et l'association de métadonnées
sémantiques aux connaissances et documents. L’adaptation/personnalisation est également
un des enjeux principaux pour des services web.
Un Document Virtuel Adaptatif/Personnalisable (DVP) est une bonne approche pour la
personnalisation, l'automatisation et la réutilisation. Nous verrons dans ce chapitre les
principes fondamentaux d’un environnement flexible pour le document virtuel
personnalisable basé sur l’approche de web sémantique.

2.1


Introduction

De nos jours, de nombreux services sont disponibles sur web, par exemple, l'ELearning, les bibliothèques numériques, les systèmes d'information en ligne, les musées
virtuels
et
les
journaux
numériques
sont
des
services
courants.
L’adaptation/personnalisation est un des enjeux principaux pour des services web. Les
services web adaptatifs ont la capacité à traiter des besoins de différents utilisateurs pour
augmenter l’utilisabilité et la compréhension et pour traiter de grands dépôts. En effet, les
services web adaptatifs – souvent appelés également les Systèmes Hypermédia Adaptatifs
- peuvent fournir différents types de ressources, différents outils de navigation et différentes
dispositions selon les besoins de l'utilisateur. La création et/ou la maintenance des services
web adaptatifs de ces dépôts exigent les caractéristiques suivantes: i) méthodes pour
faciliter la création et la gestion de service web: comment produire ces services
dynamiquement et automatiquement et comment les maintenir ? ; ii) réutilisation, partage et
échange des ressources par l'internet / intranet; iii) sélection des ressources appropriées recherche et filtrage d’information - et leur organisation selon les besoins de l'utilisateur.
Les hypermédias flexibles et notamment les documents virtuels permettent de proposer
des méthodes facilitant la conception, la création et la maintenance de services sur Internet.
En effet, ils se focalisent sur la génération dynamique de documents réels en réponse à une
demande de l’utilisateur. Le but principal de la composition est de choisir le contenu du
document - ressources - et de les organiser selon quelques buts - pour satisfaire les
besoins de l'utilisateur, pour transmettre un message particulier à l'utilisateur, etc. Les
documents virtuels se concentrent sur la génération dynamique des documents et sur la
réutilisation des ressources par un moteur de composition. Il a la capacité à choisir les

ressources pertinentes et là les organiser selon les besoins de l’utilisateur. Néanmoins, les
ressources sur Internet sont tellement nombreuses qu’il est insuffisant d'avoir un moteur de
recherche précis. Il est nécessaire de tenir compte des intérêts utilisateur et d'avoir un
schéma de métadonnées précis pour être sûr d’obtenir les informations appropriées. Les
documents virtuels adaptatifs - systèmes hypermédia - peuvent être considérés comme des
services web automatiques ou semi-automatiques traitant les besoins des différents
utilisateurs et des ressources distribuées.

La composition logique dans les DVP appliquée à KMP

15


2.2

Document Virtuel Personnalisable

Il y a de nombreuses manières pour générer dynamiquement des documents réels à
partir d'un ensemble de ressources distribuées. Ces documents réels peuvent être des
documents hypermédia. En effet, les documents virtuels peuvent être des documents web
pour lesquels le contenu, les nœuds et les liens ou les trois sont créés à la demande. Selon
C. Watters, un document virtuel est un document pour lequel aucun état persistant n'existe
et pour lequel chaque instance est générée à l'exécution (Watters et autres 1999). Un
document virtuel peut être composé de pages multiples, d’une excursion guidée, d’applets
Java ou des résultats d'application et peut ou ne peut pas associer des liens. Le contenu
peut être défini par des balises, un gabarit, un programme, une requête de base de données
ou par une application.
Un document virtuel adaptatif est un document virtuel qui peut distribuer un document
réel produit en fonction des besoins d'utilisateur - modèle utilisateur. S. Ranwez et M.
Crampes ont défini les documents virtuels adaptatifs comme suit: un document virtuel

adaptatif est une collection des ressources d'information non-organisées associées aux
outils et techniques permettant la création d'un document réel (Ranwez et autres 1999). Par
conséquent, un document réel est une séquence de ressources d'information générée par
un moteur de composition en concordance avec la requête de l'utilisateur, le modèle
utilisateur et des principes narratifs. Un DVP peut être considéré comme un ensemble
d'éléments (ou fragments) associé à des mécanismes de sélection, de filtrage,
d'organisation et d'assemblage sous contraintes, c'est-à-dire en respectant un modèle
utilisateur et une requête de l'utilisateur.
Le but principal de la sélection est d'appliquer des méthodes de recherche d’information
sur un espace d'information (base de données, web, etc.). Elle doit trouver l'ensemble des
ressources approprié à la requête de l'utilisateur. Cet ensemble constituera potentiellement
le contenu du document réel.
Le filtrage raffine la sélection en utilisant des contraintes (contexte, modèle de
l'utilisateur, etc.) pour garder un sous-ensemble de la ressource.
L'organisation associe le contenu - l'ensemble de ressources appropriées - à une ou
plusieurs structures qui doivent être cohérentes et compréhensibles par l'utilisateur.
L'organisation et le contenu sont étroitement liés pour assurer la cohérence et la
compréhension selon des besoins utilisateur. L'organisation peut fournir une structure de
document globale selon des principes narratifs. Ces principes dépendent des besoins de
l'utilisateur - approche pédagogique pour l'apprentissage, la tâche de l'utilisateur, le type de
roman, etc. L'organisation peut être implicite ou explicite. Une organisation est implicite
quand la structure est le résultat d'un calcul. Une organisation est explicite quand la
structure est explicitement représentée et utilisée par le moteur de composition. Elle définie
la structure d’un document virtuel à un niveau logique. Une structure logique reflète
l'organisation syntaxique d'un document. Un document (par exemple des livres et des
magazines) peut être décomposé de chapitres, paragraphes, articles, etc.
L'assemblage définit la présentation du document afin d'augmenter la compréhension
en rendant le document plus lisible. Des techniques diverses sont disponibles comme
l’utilisation d’une certaine charte graphique spécifique, la génération des transitions entre les
ressources ou l’ajout des guides de lecture pour représenter la position du lecteur dans le

document.

La composition logique dans les DVP appliquée à KMP

16


2.3

Conclusion

DVP compose dynamiquement des documents à partir d'informations provenant de
sources diverses, qui satisfont au mieux les besoins utilisateurs. Dans ce chapitre, nous
avons discuté surtout les mécanismes de création de DVP. Nous allons considérer un
environnement flexible pour les DVP dans le chapitre prochain.

La composition logique dans les DVP appliquée à KMP

17


3 SCARCE
Un environnement flexible pour les documents virtuels adaptatifs basés sur une
approche de web sémantique a été conçu et développé au département LUSSI – ENST
Bretagne. Cet environnement a été appelé SCARCE (SemantiC & Adaptive Retrieval and
Composition Engine). Nous verrons dans ce chapitre les principes fondamentaux d’un
environnement de l’hypermédia adaptatif basé sur le document virtuel et l’approche de web
sémantique.

3.1


Introduction

Dans un tel cadre, les documents virtuels et les hypermédia adaptatifs sont étroitement
liés - ils peuvent être vus comme les deux faces de la même pièce de monnaie. SCARCE
permet de gérer et de spécifier la sélection, le filtrage et l'organisation à un niveau
sémantique - spécifications déclaratives. Ces trois spécifications sont des paramètres du
moteur de composition et composent le document générique. Le filtrage est considéré
comme une méthode adaptative de navigation. Cinq techniques de navigation adaptative
(annotation, tri, masquage, masquage partiel et guidage direct) sont actuellement
disponibles, à partir desquels l’adaptation du contenu peut être déduite. La spécification du
filtrage est définie par les propriétés sémantiques liées à un document générique. Ces
propriétés ont les rôles suivants: définir comment évaluer les ressources choisies pour les
classer dans différentes classes d’équivalences et sélectionner une technique de navigation
adaptative pour l'utilisateur courant. Un auteur peut ainsi associer un stéréotype d'utilisateur
à chaque technique de navigation adaptative. En effet, quelques expériences ont prouvé
qu'il est nécessaire de fournir des techniques adaptatives appropriées à l'utilisateur courant
(Specht et autres 1999). Par exemple, la technique d'annotation est conseillée pour l'expert
et la technique de masquage pour le débutant. Les avantages principaux de cette approche
sont: i) les mécanismes fondamentaux d’un document virtuel sont des paramètres –
déclaratifs - de la composition, il est ainsi plus facile de maintenir et concevoir des
documents virtuels. En effet, de nouveaux documents réels sont générés dès que la
déclaration de la sélection, du filtrage ou de l'organisation est modifiée; ii) L'adaptation
nécessite d’acquérir les caractéristiques appropriés de l'utilisateur et d’appliquer la bonne
technique adaptative. A l’aide de nouvelles expériences et d’observation du comportement
de l'utilisateur, il est possible de découvrir les bons paramètres et de changer alors les
propriétés sémantiques pour l'adaptation.

3.2


Hypermédia adaptatif (Adaptive Hypermedia - AH)

Hypermédia adaptatif (AH) est un secteur au carrefour du hypermédia, des systèmes
adaptatifs et des systèmes d’instruction. AH modifie des techniques de la recherche
d’information en s'adaptant à la navigation d'utilisateur dans un espace limité de
l'information par rapport à l'information disponible. La recherche d’information devient plus
facile parce que le système garde seulement les liens et l'information qui semblent être les
plus appropriés pour l'utilisateur.
Peter Brusilovsky (Brusilovsky 1996) définit les systèmes hypermédia adaptatifs comme:
“All hypertext and hypermedia systems which reflect some features of the user in the user
model and apply this model to adapt various visible aspects of the system to the user”. Un
modèle d'utilisateur se compose généralement de préférences d'utilisateur, de
connaissance d'utilisateur et de caractéristiques d'utilisateur. AH est utilisé pour guider

La composition logique dans les DVP appliquée à KMP

18


l'utilisateur dans un espace énorme d’information et pour l'aider dans sa compréhension.
Les techniques principales d'adaptation sont des techniques adaptatives de navigation et de
présentation.
La navigation adaptative guide l'utilisateur en adaptant la structure de navigation selon le
modèle d'utilisateur. Une technique adaptative de navigation détermine un niveau particulier
des conseils accordés à l'utilisateur. Avant de l'appliquer, des ressources (contenu) sont
évaluées et rangées selon une mesure de pertinence qui utilise un modèle d'utilisateur. Les
techniques les plus communes sont :
• Guidage direct (direct guidance) : Déterminer la meilleure ressource
• Tri (sorting) : Toutes les ressources sont assorties selon la mesure de pertinence
• Masquage (hiding) : Cacher des liens qui n’ont pas pertinent. Il n’y a que des liens

qui ont la meilleure mesure de pertinence sont fournis à l'utilisateur
• Annotation (annotation) : Toutes les ressources sont annotées par une couleur ou
une image selon la mesure de pertinence
La présentation adaptative vise à adapter la présentation du contenue d'une page qui
est appropriée à l'utilisateur. Les techniques les plus communes sont :
• Texte conditionnel (conditional text)
• Stretchtext : Remplacer des mots-clés dans un texte par des «spans» de plus ou
moins de texte détaillée selon la connaissance d'utilisateur
• Variantes de fragment (fragment variants) : Fournir de nombreuses versions du
même contenu
Aujourd'hui, les systèmes hypermédia adaptatifs utilisent le web comme l’espace de
l'information où des ressources sont distribuées. Il est nécessaire d'assurer l'interopérabilité
des ressources. Ceci a lieu à trois niveaux différents: i) au niveau de l’adresse, l’URL/URI
rapporte aux ressources de ses location, ii) au niveau logique, ressources sont décrits en
XML et ont des DTD pour indiquer ses structure logique, iii) au niveau sémantique,
ressources ont des contextes de la définition de métadonnées, des conditions et des règles
pour la réutilisation et l’adaptation.

3.3

Conception

L’environnement doit être flexible pour les documents virtuels adaptatifs et doit gérer la
sélection, l'organisation et le filtrage à un niveau sémantique. En utilisant une organisation
explicite décrite au niveau sémantique, il est possible d’acquérir des modèles d'organisation
par observation du savoir-faire des utilisateurs. Ces derniers peuvent ensuite être réutilisés,
partagés et modifiés. Le filtrage est considéré comme une méthode de navigation
adaptative. En d'autres termes, la sélection, l'organisation et le filtrage peuvent être
spécifiés selon les principes du moteur de composition. Cet environnement peut générer
dynamiquement des documents réels adaptés - qui sont des documents hypermédia. Cette

approche est fondée sur le sémantique web. Les différentes ressources sont indexées par
des métadonnées sémantiques et les ontologies correspondantes.
Nous considérons un hypermédia adaptatif comme un document virtuel adaptatif
utilisant des ontologies. Nous le définissons comme suit: un document virtuel adaptatif se
compose d'un ensemble de ressources, de leurs métadonnées, de différentes ontologies et
d'un moteur de composition sémantique qui peut choisir les ressources appropriées, les
filtrer, les organiser et assembler en adaptant de divers aspects visibles du document fourni
à l'utilisateur.

La composition logique dans les DVP appliquée à KMP

19


Tout d'abord, nous présentons les principes d'organisation, de sélection et de filtrage.
• Organisation est explicite et associée à la sélection. Elle est fondée sur un graphe
orienté, ayant une racine unique, dans laquelle les nœuds ont des spécifications de
contenu - sélection - et les arêtes sont des relations sémantiques. Ce graphe
représente les besoins de l'utilisateur et contient des principes narratifs. Il est décrit
dans l’ontologie de document.
• Sélection est un processus de recherche d’information dans un espace
d’information qui est indexé dans un schéma de métadonnées. En effet, les
métadonnées sont des instances des entités de l’ontologie - des classes et des
relations. Dès qu'un schéma de métadonnées est défini pour l'indexation des
ressources, il est nécessaire de déterminer comment gérer les métadonnées. Elles
doivent être utilisées pour la recherche d’information et le filtrage qui est un
raffinement de la sélection.
• Filtrage : le filtrage est basé sur des méthodes de navigation adaptatives. Le
principe est comme suit:
o Premièrement, les ressources choisies sont évaluées : le but de l’évaluation

est de mettre chaque ressource dans une classe d’équivalence selon des
règles d'appartenance aux classes, les métadonnées et un modèle
utilisateur.
o Deuxièmement, une des techniques de navigation adaptative est choisie pour
l'utilisateur courant à partir des stéréotypes associés à chaque technique
adaptative et des préférences de l'utilisateur. La technique adaptative est
appliquée pour effacer, annoter, cacher, etc. les classes d’équivalence des
ressources - hyperliens. Si toutes les ressources choisies sont supprimées ou
sont cachées dans un nœud, ce nœud et tous ses sous-nœuds ne seront
pas accessibles dans le graphe - ils sont supprimés.
Nous appelons les résultats de ces trois spécifications un document générique à partir
duquel un ensemble de documents réels seront générés. Un document générique peut être
considéré comme un graphe orienté qui organise un ensemble de requêtes - une par nœud
- associé à des techniques de navigation adaptative. Les principes d'organisation, de
sélection et de filtrage sont les principes fondamentaux de cet environnement - moteur de
composition. La réutilisabilité de cet environnement est limitée par ces principes
fondamentaux. En d'autres termes, il est possible de concevoir de nouveaux documents
virtuels ou d’en maintenir si ces principes sont respectés.
Comme nous avons défini : un document virtuel adaptatif se compose d'un ensemble de
ressources, de leurs métadonnées, de différentes ontologies et d'un moteur de composition
sémantique, maintenant nous allons considérer la conception pour chacun.

3.3.1 Ontologie de document
L'ontologie de document se compose du modèle de document, du modèle d'adaptation,
de sous-catégories et d'ensemble des fragments atomiques et des fragments abstraits, des
relations sémantiques et des documents génériques.

La composition logique dans les DVP appliquée à KMP

20



EquivalenceClass

+HasEvaluation

+Type : string(idl)
+ClassMembershipRule : string(idl)

GenericDocument

*

1

+Type : string(idl)
+Stereotype : string(idl)

*

+HasAdaptation
+IsDetailedIn

Graphe générique

*
1
*

AbstractFragment


AtomicFragment

AdaptationMethod

1

+ID Document : string(idl)
+Title : string(idl)

Structure

*

+ID Structure : string(idl)
+Name : string(idl)

+Title : string(idl)

1

+HasStructure
«subclass»

+HasRoot
+IsComposedOf

*

1


*
1

Fragment
+ID Fragment : string(idl)

+IsComposedOf
+CouldRetrieve

GenericNode

*
*

+HasSpecification
*

+HasMetadata

+ID Node : string(idl)

*

1

Resource

1
MetaData


+IsValue

*

*

1

1

+IsSubject

SemanticRelation
+Type : string(idl)
1

Fig. 3.1 - Modèle de document
Le modèle de document est basé sur le concept du fragment abstrait. Un fragment
abstrait peut être organisé selon une ou plusieurs structures. Une structure est une
collection de nœuds génériques (Generic Node) parmi lesquels nous avons sa racine. Un
nœud générique est un objet abstrait qui existe seulement à l'intérieur d'une structure. Il est
lié aux autres par une relation sémantique. L'ensemble de relations sémantiques est
spécifique à la communauté des pratiques. Il doit être redéfini pour de nouveaux types
d'applications. Un fragment abstrait est un graphe orienté dans lequel les nœuds sont des
nœuds génériques et les arrêtes sont des relations sémantiques entre les nœuds
génériques. A l'exécution, un nœud générique peut être vue comme un processus de
recherche d’information qui utilise une description donnée par le concepteur selon les
métadonnées pour faire une requête. Il peut également utiliser le modèle d’utilisateur pour
filtrer des ressources. Les documents génériques peuvent être organisés dans une

hiérarchie dans laquelle les classes sont des modèles des documents génériques.
Un document générique se compose également de règles d'adaptation qui sont
consistués de différents éléments du modèle d'adaptation. Le modèle d'adaptation se
compose de classes d'équivalence, de leurs règles de classification, d'ensemble de
méthodes d'adaptation et de leurs stéréotypes. Une règle de classification est une
comparaison entre les caractéristiques d'utilisateur – à partir de l'ontologie d'utilisateur, et
des indexes des fragments – à partir de l'ontologie des métadonnées. Une méthode
d'adaptation est pertinente pour un modèle d'utilisateur si elle s’apparie avec le stéréotype
correspondant associé.

La composition logique dans les DVP appliquée à KMP

21


3.3.2 Ontologie de métadonnées
Le schéma de métadonnées fournit des informations de métadonnées des fragments. Le
moteur de composition sémantique utilise ce schéma pour la recherche d’information. Le
schéma de métadonnées permet de rechercher, gérer donc utiliser des informations
hétérogènes, et de définir un rôle particulier à différents ensembles de métadonnées.
Le schéma de métadonnées est composé de différentes sections, chaque section
correspond à un point de vue particulier sur la ressource. Ils sont classifiés à deux genres
de caractéristiques, le premier type s’agit aux sections typiques pour des ressources telles
que l'auteur, la langue et la date de la création, et l’autre s’agit aux sections spécifiques qui
dépendent la communauté des pratiques.
MD.1
MD.1.1
MD.1.2
MD.1.3
MD.1.4

MD.1.5
MD.2
MD.2.1
MD.2.2
MD.2.3
MD.2.4
MD.3
MD.3.1
MD.3.2
MD.3.3
MD.3.4
MD.4
MD.4.1
MD.4.2
MD.4.3
MD.4.3.1
MD.4.3.2
MD.5
MD.5.1
MD.5.1.1
MD.5.1.2
MD.6
MD.6.1
MD.6.2
MD.6.3
MD.6.4

Général
Identifiant
Titre

Auteurs
Description
Langue
Cycle de vie
Date
Etat
Version
Auteurs
Méta Métadonnées
Créateur
Validation
Langue
Date de création
Technique
Localisation
Format
Besoins
Logiciels
Matériels
Classification
Domaine
Concept
Niveau
Droits
Accès
Copyrights
Coût
Editeur

Informations générales sur la ressource

Identifiant unique
Titre donné par l'auteur
Un ou plusieurs auteurs de la ressource
Brève description de la ressource
Langue de la ressource
Données nécessaires au versioning
Date de la version
Etat de la ressource (brouillon, final, etc.)
Numéro de version de la ressource
Auteurs de la version
Informations sur les métadonnées
Auteur des métadonnées
Relecture des métadonnées
Langue des métadonnées
Date de création des métadonnées
Informations techniques sur la ressource
Lieu de stockage de la ressource
Format de la ressource
Ce qui est nécessaire à la lecture de la ressource?
Noms de logiciels et versions
Description matérielle
Données sur le contenu
Description en fonction du modèle de domaine
Nom de concept
Niveau de connaissance requis
Conditions d'utilisation de la ressource
Restrictions d'accès
Copyrights ou licences
Coût d'utilisation
Maison d'édition


Fig. 3.2 – Description du schéma de métadonnées
Dans la figure ci-dessus, le schéma se compose de six sections. Les sections typiques
sont «Général», «Méta métadonnées», «Technique» et «Droits». Ces sections sont souvent
proposées dans tous les schémas de métadonnées. Il y a des sections spécifiques comme
«Cycle de vie» et «Classification».
• La section «Général» correspond aux descriptions que l'on retrouve dans tous
les schémas de métadonnées. Elle regroupe les métadonnées minimales d'une
ressource.
• La section «Cycle de vie» permet de gérer les différentes versions d'une
ressource.
• La section «Technique» décrit la ressource en terme d'utilisation, c'est-à-dire sa
localisation physique, le format de fichier, etc.

La composition logique dans les DVP appliquée à KMP

22







La section «Classification» décrit la ressource en terme de contenu. Elle est donc
directement connectée à l'ontologie de domaine.
La section «Méta métadonnées» permet de décrire les métadonnées d'une
ressource (qui les a renseignées, validées, etc.).
La section «Droits» concerne les droits et conditions d'utilisation de la ressource.


3.3.3 Ontologie d’utilisateur
L’ontologie d'utilisateur décrit les caractéristiques d'utilisateur pour l'adaptation. Il est
utilisé par le modèle d'adaptation pour définir les règles de classification et les stéréotypes
des méthodes adaptatives. Il a besoin de l'ontologie de domaine pour décrire la
connaissance de l'utilisateur. En générale, le modèle d'utilisateur contient cinq sections
suivantes : personnel, préférences, connaissance, histoire et session. Il est possible
d'ajouter quelques sections spécifiques selon la communauté des pratiques.
Données
Personnelles
Identité

Données personnelles concernant
l'utilisateur
Son identité

Instance Unique

Son nom
Son prénom
Informations uniques de connexion
Le nom de connexion

Mono valuée
Mono valuée
Mono valuée
Mono valuée

UM.1.2.2
UM.1.3


Nom
Prénom
Connexion
Nom de
connexion
Mot de passe
Classification

Le mot de passe correspondant
Informations de classification

Mono valuée
Instance Unique

UM.1.3.1
UM.2

Location
Préférences

Mono valuée
Instance Unique

UM.2.1
UM.2.2

Préférences pour la consultation

Liste ordonnée


UM.3.1
UM.4

Domaine
Historique

Les composants graphiques à
supprimer
Données sur les connaissances de
l'utilisateur
Connaissances sur le domaine
Données sur les accès aux dossiers

Liste non ordonnée

UM.3

Centres d'intérêt
Règles
d'adaptation
en recherche
d'information
Règles
d'adaptation
en consultation
de documents
Composants à
supprimer
Connaissance


Où habite t-il?
Données sur les préférences de
l'utilisateur
Ses centres d'intérêt
Préférences sur la recherche
d'information

Liste non ordonnée
Instance Unique

UM.4.1
UM.4.2
UM.5
UM.5.1
UM.5.2
UM.5.3
UM.5.4

Accès
Bookmark
Session
Choix
Courant
Date de début
Date de fin

Traces d'accès
Données de Bookmark
Données sur la session courante
Premier choix de l'utilisateur

Informations sur le chemin courant
Date de début de session
Date de _n de session

Liste non ordonnée
Liste non ordonnée
Instance Unique
Instance Unique
Instance Unique
Mono valuée
Mono valuée

UM.1
UM.1.1
UM.1.1.1
UM.1.1.2
UM.1.2
UM.1.2.1

UM.2.3

UM.2.4

Instance Unique

Liste non ordonnée
Liste ordonnée

Instance Unique


Fig. 3.3 – Description du modèle utilisateur
• La section "personnelle" permet d'identifier et de catégoriser l'utilisateur en fonction
de caractéristiques personnelles telles que l'âge ou la profession.

La composition logique dans les DVP appliquée à KMP

23


• La section "préférences" regroupe l'ensemble des caractéristiques sur lesquelles
l'utilisateur peut agir pour modifier le comportement du système.
• La section "connaissance" décrit l'ensemble des connaissances de l'utilisateur
dans le domaine de l'application.
• La section "historique" a un double objectif, d'une part elle mémorise l'activité de
l'utilisateur et d'autre part elle permet de lui signifier les évolutions du document
depuis la dernière consultation (ce qu'il a lu, ce qui est nouveau).
• La section "session" représente la session courante de l'utilisateur. Elle comporte
un ensemble de caractéristiques nécessaires pour situer l'utilisateur dans le
cheminement de sa session.

3.3.4 Ontologie de domaine
L'ontologie de domaine est un modèle typique de domaine qui se compose de réseau
sémantique (des concepts et des relations) pour le domaine de l'application. C'est le lien
entre la connaissance d'utilisateur, la description de fragment et les spécifications
génériques de contenu des noeuds.

3.4

Moteur de composition adaptative


Dans un document numérique, trois vues différentes peuvent coexister : sémantique,
logique et présentation. Ces vues sont étroitement liées à l'architecture du sémantique web :
i) sémantique : logique, ontologies, RDFS/RDF, ii) logique : XML, iii) présentation :
XSL/XSLT. Chaque vue a une structure spécifique qui l'organise. La structure sémantique
d'un document donne l'organisation de la signification du contenu du document. La structure
sémantique - structure de document globale – peut jouer le rôle d'une carte de site dans un
document hypermédia ou le rôle de l'arbre de connaissance dans l'approche de P.
Brusilovsky (Brusilovsky et al 2002). En d'autres termes, des outils de navigation et d'accès
d'information peuvent être basés sur cette structure.
La structure logique reflète
l'organisation syntaxique d'un document. Un document (par exemple des livres et des
magazines) peut être décomposé en composants (des chapitres et des articles). La vue
logique adapte au niveau syntaxique de l'architecture sémantique web. Une structure
logique est codée en XML et représente une page Web. La vue de présentation décrit
comment les documents apparaissent sur un composant et une structure de présentation
qui le décrit (par exemple la taille et la couleur des titres, des textes, etc.).
Le moteur de composition est divisé en trois moteurs: composition sémantique,
composition logique et composition physique (fig. 3.4) selon ces trois vues. Ce sont des
processus séquentiels. Dans un cadre de document virtuel, les quatre mécanismes sont
répartis dans les processus suivants : la sélection, le filtrage et l'organisation sont réalisés
dans la composition sémantique; l'assemblage est réparti dans la composition logique et la
composition de la présentation. Le but du moteur de composition sémantique est de calculer
un document adapté à partir d’un modèle de l'utilisateur et d'un document générique spécifications de la sélection, du filtrage et de l'organisation. Le document adapté est une
instance du document générique dans lequel les spécifications de contenu - la sélection sont remplacées par les fragments dont les métadonnées - s’apparient aux spécifications.
La sélection est raffinée c'est-à-dire que les fragments sont filtrés selon la méthode de
navigation adaptative choisie. Le document réel est généré dynamiquement page Web par
page Web.

La composition logique dans les DVP appliquée à KMP


24


Semantic

Logical

Layout

Document Ontology

XML
Template

User Ontology
Domain Ontology
MetaData Schema Ontology
& metadata of resources

Generic
Document

Semantic
Composition

Elements of
the Adapted
Document

XML Page

Logical
Composition

SCARCE

S
E

Parameters

Assembly 1

HTML Page

Layout
R
Composition V

L
E
T

Queries

Selection &
Organization

Layout
Template


HTTP Query with
parameters

Assembly 2

Fig. 3.4 – Architecture du moteur de composition

Le moteur de composition logique parcours le document adapté selon les interactions de
l'utilisateur et calcule pour chaque nœud une page Web XML avec le contenu et les outils
de navigation. Un gabarit XML et un modèle de l'utilisateur sont utilisés pour obtenir cette
page Web XML. Dans les outils de navigation, les liens ont des propriétés pour la gestion
d'adaptation (Brusilovsky et al 1996). Le moteur de composition de présentation génère une
page de HTML à partir d’une page Web XML en appliquant les règles de présentation
données par le gabarit de présentation et en utilisant un processeur de XSLT. Les
processus d'adaptation peuvent avoir lieu dans les trois moteurs.
Les moteurs de composition sémantiques et logiques se fondent sur OntoBroker. Il est
utilisé pour parcourir les différentes ontologies et pour rechercher les fragments qui
s’apparient avec les spécifications de contenu à l’aide de métadonnées.

3.5

Conclusion

Dans ce chapitre, nous avons discuté sur le principe de SCARCE - un environnement
flexible pour les documents virtuels adaptatifs basés sur l’approche de web sémantique. La
construction de DVP est basée sur les différentes ontologies et un moteur de composition
sémantique qui peut choisir les ressources appropriées, les filtrer, les organiser et
assembler en adaptant de divers aspects visibles du document fourni à l'utilisateur. Dans les
deux chapitres prochains, nous allons considérer une plate-forme de SCARCE et l’appliquer
dans un projet.


La composition logique dans les DVP appliquée à KMP

25


×