TECHNOLOGIES CLÉS 2010 (novembre 2006)
13. Technologies du Web sémantique Description En référence au concept introduit en 2001 par Tim Berners-Lee, fondateur du W3C (World Wide Web Consortium), les technologies du Web sémantique se rapportent à un ensemble de modèles et d'outils permettant aux contenus numériques d'être partagés et utilisés à travers Internet par diverses applications, personnes, entreprises. La variété des contenus numériques reflète la variété des applications rendues possibles par les réseaux de communication (texte, images, documents multimédias, voix, musiques, programmes informatiques exécutables). Un contenu numérique circule (sur un réseau, entre des applications) sous la forme d'un ou plusieurs fichiers électroniques et la capacité des programmes à « comprendre » ce contenu numérique (pour l'afficher, le traiter, etc.) repose sur la connaissance des modèles utilisés pour la représentation des différents éléments composant ce contenu. Ces modèles sont par essence complexes puisqu'ils doivent permettre la représentation d'une grande variété de contenus, selon plusieurs niveaux d'abstraction : signal, données, information, savoir. Ils doivent, en outre, être suffisamment génériques pour permettre l'interprétation dans différents contextes, l'affichage sur différents supports (comme par exemple l'édition d'un livre à partir d'un texte au format hypertexte, ou l'affichage d'une même vidéo sur un écran de téléphone portable ou sur une télévision haute définition) et autoriser l'échange. De nombreux modèles ont pu être développés grâce à un effort considérable en matière de normalisation des langages de description de contenus issus de SGML, en particulier ces dernières années le langage XML. Mais le langage n'est pas suffisant pour permettre de représenter le « sens » des données. Les aspects sémantiques reposent sur l'existence de descriptions plus complexes des relations entre les données (RDF), et de schémas plus compliqués (ontologies) permettant de capturer le domaine concerné par les données (OWL, DAML+OIL). Pour être en mesure d'exploiter pleinement les technologies du web sémantique, plusieurs axes de développement doivent faire l'objet de progrès :
Enjeux, Impact En 2005, l'interopérabilité des réseaux de communication est un état de fait. L'enjeu de l'appropriation et du développement des technologies liées au Web sémantique est de permettre aux applications et aux utilisateurs d'être en mesure d'interopérer, de collaborer et d'échanger. Au-delà de la nécessité réelle de référentiels communs pour faciliter l'échange dans un contexte ubiquitaire, la maîtrise de la représentation des données permet de maîtriser les clés de l'usage. De fait, les initiatives de normalisation se multiplient et sont au cœur de véritables stratégies industrielles dans tous les secteurs compétitifs. Si le langage de description et les schémas de base semblent à présent consensuels (XML, RDF), le développement de schémas et d'outils dépendant du domaine d'application est lui encore bien ouvert. La notion de Web sémantique utilisée ici dépasse largement les seules activités du consortium du même nom, et de nombreux groupes de réflexion ont lancé des initiatives comparables, répondant à des problématiques d'interopérabilité : MPEG [1] (depuis MPEG4), Dublin Core [2] (bibliothèques numériques) mais aussi Oasis [3] (Active Objects, Semantics, Internet and Security - Web services), Globus [4] (Grilles), etc. Cette domination de la politique des standards ouverts ne doit toutefois pas masquer la possibilité de développer des technologies propriétaires qui s'imposeront par leurs qualités intrinsèques, en particulier sur des marchés de niches. Marché L'exploitation des technologies du Web sémantique est à la base de nombreux types d'applications (dont la plupart restent à inventer) dans la quasi-totalité des domaines pour lesquels l'informatisation a un intérêt. On peut citer quelques exemples significatifs :
Acteurs Disciplines scientifiques : neurosciences, informatique, traitement du signal, mathématiques et leurs applications, sciences du langage, psychologie, sociologie. Compétences technologiques : audiovisuel, télécommunications, informatique. Pôles de compétitivité : Image, multimédia et vie numérique (Île-de-France), Images et réseaux (Bretagne), Transactions électroniques sécurisées (Basse-Normandie), EMC2 (Pays de la Loire), Viameca (Interrégional), System@tic (Île-de-France), Loisirs numériques (Rhône-Alpes), Industries du commerce (Nord-Pas-de-Calais). Liens avec (technologies) : outils et méthodes pour le développement de systèmes d'information ; composants logiciels ; infrastructures et technologies pour réseaux de communication diffus ; virtualisation des réseaux ; sécurisation des transactions électroniques et des contenus ; acquisition et traitement de données ; gestion et diffusion des contenus numériques ; interfaces humain-machine ; réalité virtuelle, augmentée, 3D ; affichage nomade. Principaux acteurs français Centres de compétences : Inria-Oasis, Inria Nancy, Loria, LIP6, LLF (Paris 7), Declic (Aix en Provence), LIRMM (Montpellier), Semantic Web enabled web services (Projet IST) (swws.semanticweb.org/swws). Industriels : Cegelec, Thomson, Arc Informatique, Xerox Research Center Europe (Grenoble), TIL technologies, Schneider Electric, Pertinence. Exemples d'acteurs dans le monde : ERCIM (European Research Consortium for Informatics and Mathématics), MIT (États-Unis - Open mind common sense database), Stilo (Royaume-Uni), HP Labs (États-Unis), IBM (États-Unis). Commentaires Les technologies du web sémantique sont à la base des moteurs de recherche, des interfaces de navigation et des plateformes collaboratives de demain. Cette description est plus large que la notion de Semantic Web telle que développée dans le cadre du W3C. [1] Le groupe MPEG a été établi en 1988 dans le but de développer des standards internationaux de compression, décompression, traitement et codage d'image animées et de données audio. Il existe plusieurs standards MPEG.
© Ministère de l'Économie, des Finances
et de l'Industrie, |
||||||||||||||||