Comprendre le web sémantique et ses enjeux

On entend parler de lui depuis longtemps, certains prétendent le connaître, le web sémantique arrive sur (et surtout derrière) nos écrans !

Web et sémantique : définitions.

Pour expliquer ce qu’est le web sémantique, commençons par  préciser ce qu’est le web :

Le web regroupe :

  • Des contenus de tout type : des médias (images, vidéos, sons) ainsi que du texte de tout format.
  • Des adresses pour accéder à ces contenus.
  • Des liens plus ou moins fort entre ces contenus. Par exemple, une page visuelle est fortement liée à l’image qu’elle contient.

Pour expliquer la sémantique, imaginez la situation : vous abordez un article qui parle des papiers, mais vous ne savez pas vraiment de quoi il parle. C’est pourquoi il doit préciser son sens. Par exemple, on traite des papiers d’identité. Le sens apporté vous permet alors de mieux comprendre le sujet.

Votre imaginaire se met en marche au fur et à mesure de la lecture. Vous comprenez qu’il va être question des normes internationales en matière d’identité, d’état civil, peut-être des spécificités locales comme notre ancien «signe particulier». Ou peut-être encore, des nouvelles informations biométriques qu’elles détiennent. C’est tout un système qui se tisse autour de cette notion de papiers d’identité.

web_semantique_liens

Vous qui êtes intelligents, vous interprétez ce que cela peut signifier. Mais les machines (qui ne sont qu’au stade enfantin) ont besoin qu’on leur dise tout explicitement. Ainsi, si on souhaite qu’une machine saisisse un sens, il faut tout lui dire. Et c’est ce que le web sémantique prétend faire : décrire. La sémantique, c’est le sens apporté à la chose.

Comment donner du sens au contenu du web ?

On peut se demander pourquoi essayer de faire comprendre tout ça à des machines ? En fait, l’objectif final reste l’utilisateur humain : lui offrir l’information qui l’intéresse. Pour cela, la machine doit comprendre la demande d’une part et les données disponibles d’autre part. C’est cette deuxième tâche que le web sémantique facilite.

Pour être honnête, le web sémantique n’apporte pas réellement de sens, comme nous le faisons, nous, humain. Seule la subjectivité et l’expérience peuvent permettre d’ interpréter un sens. C’est un cap que l’intelligence artificielle n’a pas réellement franchi.

Le web sémantique créé plutôt du lien, entre les concepts et leurs descriptions d’une part, et aussi entre les concepts entre eux. Par exemple :

  • «Napoléon Bonaparte» est un objet de type «personnage historique»
  • «Napoléon Bonaparte» est lié à l’objet «Joséphine» par le lien «époux»

 

Cela devient urgent car on est en train de passer du stade de la sur-information à celui d’infobésité (comme disent les québécois). Et ce sens doit être apporté par la source elle-même.

« L’objet du web sémantique, c’est de construire un web de données qui puisse être traitées directement et indirectement par des machines pour aider leurs utilisateurs à créer de nouvelles connaissances »  Tim Berners Lee, «inventeur» du Web et Fondateur et Directeur de la fondation W3C

Mais concrètement, ça marche comment ?

 

Concrètement, n’importe qui peut créer un modèle d’objet (ou descripteur), comme par exemple «personnage historique» ou «carte d’identité nationale». Ces modèles possèdent des propriétés propres, comme un nom, un prénom, une date de naissance, ou bien un format, un pays.

Le web sémantique est un concept issu du W3C (un consortium international qui établi des règles et des bonnes pratiques pour l’ensemble du web). Cet organisme a proposé un système pour créer des descripteurs : le RDF (Resource Description Framework). Chacun peut créer son modèle de donnée et une sélection «naturelle», basée sur les modèles les plus utilisés, révèle alors les meilleurs. Aujourd’hui, les modèles proposés par Wikipédia sont assez populaires.

Historiquement, le web sémantique est une des composantes essentielles du web depuis son origine, mais elle a parfois été écartée. Elle repose sur un principe : une adresse renvoi un contenu. Peu importe les actions précédentes ou le contexte.

Le client qui demande ce contenu peut être :

  • un robot qui parcourt tout internet à la recherche de contenu
  • un robot qui ne cherche que les modifications récentes
  • un humain sur un écran
  • un humain sur une machine à braille
  • un humain sur lecteur audio de contenu.

On ne peut pas (et on ne doit pas) prévoir tous les cas. Il faut simplement fournir le contenu qui sera décrit le mieux possible. Cela ne concerne pas seulement les ressources métier (article de blog, ressource archivistique …) mais aussi l’application elle-même (formulaire de recherche …). De cette manière, une machine sera capable de se servir d’une application elle-même. En informatique, on parle d’API (Application Programming Interface) : c’est un moyen programmé pour donner accès à une application pour une autre machine. Grâce au web sémantique, l’API et la vue utilisateur pourront être une seule et même chose.

Quels sont les usages du web sémantique ?

La finalité, c’est d’aider les utilisateurs humains a accéder aux informations.

Mais d’autres usages émergent. La partie la plus graphique, pour le moment, ce sont les graphes de liaison entre les concepts. Il se tisse alors tout un réseau sémantique qui révèle le domaine, les rapports, et tout le contexte d’un sujet.

http://www.edeation.fr/le-ggg-graphe-global-geant-sera-le-futur-du-www/

http://www.edeation.fr/le-ggg-graphe-global-geant-sera-le-futur-du-www/

D’autres possibilités s’offrent aux utilisateurs finaux. Si un contenu (ou une partie) est décrit par un descripteur, l’application qui accède au contenu peut alors le comprendre et proposer des actions associées. Ces actions peuvent être par exemple :

  • L’ajout automatisé d’un lien du type «ajouter au carnet d’adresse» sur l’auteur de l’article d’un blog
  • La fonction «ajouter à mon agenda» à l’indication d’une conférence sur une page web
  • «Météo à Nantes mardi prochain» pour un objet de type «événement».

Le potentiel à moyen et long terme est énorme !

Alexia Branchereau

9 Comments

  1. Bonsoir, Pour améliorer les graphes sémantiques tels que celui sur les mammifères plus haut sur cette page, il serait bon de diversifier la nature des liens. La terminologie notionnelle a défini des liens: un site comme celui-ci http://www.termisti.org/termisti.htm pourrait vous y aider. En gros, hyperonymes, hyponymes etc. type de, partie de etc. Des tas d’ouvrages ont été écrits sur le sujet. Bien à vous,

    • Merci pour le complément. Cet article se voulant être une approche vulgarisé, je n’avais pas été si loin.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *