TECHNOLOGIES CLÉS 2010 (novembre 2006)

Sommaire
Sommaire TIC

Technologies de l’information et de la communication

13. Technologies du Web sémantique

Description

En référence au concept introduit en 2001 par Tim Berners-Lee, fondateur du W3C (World Wide Web Consortium), les technologies du Web sémantique se rapportent à un ensemble de modèles et d'outils permettant aux contenus numériques d'être partagés et utilisés à travers Internet par diverses applications, personnes, entreprises.

La variété des contenus numériques reflète la variété des applications rendues possibles par les réseaux de communication (texte, images, documents multimédias, voix, musiques, programmes informatiques exécutables). Un contenu numérique circule (sur un réseau, entre des applications) sous la forme d'un ou plusieurs fichiers électroniques et la capacité des programmes à « comprendre » ce contenu numérique (pour l'afficher, le traiter, etc.) repose sur la connaissance des modèles utilisés pour la représentation des différents éléments composant ce contenu.

Ces modèles sont par essence complexes puisqu'ils doivent permettre la représentation d'une grande variété de contenus, selon plusieurs niveaux d'abstraction : signal, données, information, savoir. Ils doivent, en outre, être suffisamment génériques pour permettre l'interprétation dans différents contextes, l'affichage sur différents supports (comme par exemple l'édition d'un livre à partir d'un texte au format hypertexte, ou l'affichage d'une même vidéo sur un écran de téléphone portable ou sur une télévision haute définition) et autoriser l'échange.

De nombreux modèles ont pu être développés grâce à un effort considérable en matière de normalisation des langages de description de contenus issus de SGML, en particulier ces dernières années le langage XML. Mais le langage n'est pas suffisant pour permettre de représenter le « sens » des données. Les aspects sémantiques reposent sur l'existence de descriptions plus complexes des relations entre les données (RDF), et de schémas plus compliqués (ontologies) permettant de capturer le domaine concerné par les données (OWL, DAML+OIL). Pour être en mesure d'exploiter pleinement les technologies du web sémantique, plusieurs axes de développement doivent faire l'objet de progrès :

  • techniques d'exploration, d'apprentissage, pour le classement des connaissances ;
  • développement de modèles, de langages (métadonnées, ontologies) spécifiques à des domaines d'application, à des métiers, à des services, etc. ;
  • développement d'outils logiciels pour assister la description des données et des domaines, en particulier pour les documents multimédias (images, vidéos, etc) ;
  • approches pluridisciplinaires (sciences cognitives, psychologie, etc.) pour la représentation linguistique et sémantique ;
  • techniques et outils permettant de raisonner sur les modèles ;
  • technologies pour la publication et la découverte de services sur la toile ;
  • architectures distribuées pour l'échange de données (peer-to-peer) ;
  • architectures orientées services permettant à différentes applications (à destination de support fixes ou mobiles), connectées par le réseau (Internet), de communiquer et d'interopérer (composition de services).
Degré de développement :
Naissance
Croissance
Diffusion

Enjeux, Impact

En 2005, l'interopérabilité des réseaux de communication est un état de fait. L'enjeu de l'appropriation et du développement des technologies liées au Web sémantique est de permettre aux applications et aux utilisateurs d'être en mesure d'interopérer, de collaborer et d'échanger.

Au-delà de la nécessité réelle de référentiels communs pour faciliter l'échange dans un contexte ubiquitaire, la maîtrise de la représentation des données permet de maîtriser les clés de l'usage. De fait, les initiatives de normalisation se multiplient et sont au cœur de véritables stratégies industrielles dans tous les secteurs compétitifs. Si le langage de description et les schémas de base semblent à présent consensuels (XML, RDF), le développement de schémas et d'outils dépendant du domaine d'application est lui encore bien ouvert.

La notion de Web sémantique utilisée ici dépasse largement les seules activités du consortium du même nom, et de nombreux groupes de réflexion ont lancé des initiatives comparables, répondant à des problématiques d'interopérabilité : MPEG [1] (depuis MPEG4), Dublin Core [2] (bibliothèques numériques) mais aussi Oasis [3] (Active Objects, Semantics, Internet and Security - Web services), Globus [4] (Grilles), etc.

Cette domination de la politique des standards ouverts ne doit toutefois pas masquer la possibilité de développer des technologies propriétaires qui s'imposeront par leurs qualités intrinsèques, en particulier sur des marchés de niches.

Marché

L'exploitation des technologies du Web sémantique est à la base de nombreux types d'applications (dont la plupart restent à inventer) dans la quasi-totalité des domaines pour lesquels l'informatisation a un intérêt. On peut citer quelques exemples significatifs :

  • les applications d'entreprises : plates-formes de travail collaboratif, veille économique et concurrentielle, capitalisation de connaissance, mutualisation des ressources (grilles de calcul, de données, de services) ;
  • l'e-formation : les technologies du web sémantique et l'ingénierie des ontologies permettront d'accéder au grand nombre de ressources pédagogiques disponibles sur le web ou sur des plates-formes. Dans différents scénarios du e-learning, ces technologies permettront d'aider un enseignant à construire un cours, et à un étudiant de construire un curriculum personnalisé. Ces mêmes acteurs de la formation se verront également faciliter le concept de veille documentaire sur le réseau Internet pour la quête d'une information plus pertinente ;
  • l'e-commerce, e-entreprise : personnalisation de la relation client sur la base de l'exploitation de son profil et des services disponibles, agents conversationnels intelligents pour guider l'achat ou le service après-vente, orchestration des processus métiers (Business Process Management, Workflows), etc. ;
  • l'e-administration : composition des services disponibles à travers les portails de l'administration électronique ;
  • les loisirs : plates-formes thématiques de communication, de collaboration, de partage ou d'échange à destination du grand public.
Degré de diffusion de la technologie :
Naissance
Diffusion
Généralisation

Domaines d'application :
édition, imprimerie, reproduction ; services de transports ; activités financières ; postes et télécommunications ; services informatiques ; services aux entreprises ; recherche et développement ; activités récréatives, culturelles et sportives ; services personnels et domestiques ; éducation ; santé, action sociale ; administration.

Acteurs

Disciplines scientifiques : neurosciences, informatique, traitement du signal, mathématiques et leurs applications, sciences du langage, psychologie, sociologie.

Compétences technologiques : audiovisuel, télécommunications, informatique.

Pôles de compétitivité : Image, multimédia et vie numérique (Île-de-France), Images et réseaux (Bretagne), Transactions électroniques sécurisées (Basse-Normandie), EMC2 (Pays de la Loire), Viameca (Interrégional), System@tic (Île-de-France), Loisirs numériques (Rhône-Alpes), Industries du commerce (Nord-Pas-de-Calais).

Liens avec (technologies) : outils et méthodes pour le développement de systèmes d'information ; composants logiciels ; infrastructures et technologies pour réseaux de communication diffus ; virtualisation des réseaux ; sécurisation des transactions électroniques et des contenus ; acquisition et traitement de données ; gestion et diffusion des contenus numériques ; interfaces humain-machine ; réalité virtuelle, augmentée, 3D ; affichage nomade.

Principaux acteurs français

Centres de compétences : Inria-Oasis, Inria Nancy, Loria, LIP6, LLF (Paris 7), Declic (Aix en Provence), LIRMM (Montpellier), Semantic Web enabled web services (Projet IST) (swws.semanticweb.org/swws).

Industriels : Cegelec, Thomson, Arc Informatique, Xerox Research Center Europe (Grenoble), TIL technologies, Schneider Electric, Pertinence.

Exemples d'acteurs dans le monde : ERCIM (European Research Consortium for Informatics and Mathématics), MIT (États-Unis - Open mind common sense database), Stilo (Royaume-Uni), HP Labs (États-Unis), IBM (États-Unis).

Commentaires

Les technologies du web sémantique sont à la base des moteurs de recherche, des interfaces de navigation et des plateformes collaboratives de demain. Cette description est plus large que la notion de Semantic Web telle que développée dans le cadre du W3C.

Note

[1] Le groupe MPEG a été établi en 1988 dans le but de développer des standards internationaux de compression, décompression, traitement et codage d'image animées et de données audio. Il existe plusieurs standards MPEG.
[2] Norme de description simple des ressources d'information électronique.
[3] L’objectif du projet est de proposer des principes fondamentaux, des techniques et des outils pour la construction, l'analyse, la validation, la vérification et la maintenance de systèmes fiables.
[4] Le projet Globus a été initié par l’ université d'Argonne, en Californie, et concerne les grilles de calcul. Destinée principalement aux applications scientifiques, la grille de calcul (grid) est un environnement informatique distribué permettant d'exploiter la puissance et l'espace mémoire disponibles sur des machines réparties dans des entreprises ou des lieux géographiques différents.

 

Sommaire TIC
haut Sommaire

© Ministère de l'Économie, des Finances et de l'Industrie,
DGE Direction Générale des Entreprises, 12/2006