Accueil > Agitons le net > Le sens commun

Le sens commun

Des taxinomies à l’ontologie

vendredi 9 juillet 2004, par Remy Marchand

Il est de bon ton de vouloir encadrer l’eXtensibilité de XML pour éviter autant que possible une inutile prolifération de langages-métiers et de balises différentes se référant en fait au même concept sous-jacent. Pour cela, il convient de pouvoir inde-xer ses données sur des catalogues d’informations pouvant être des nomenclatures organisées, aussi appelées taxinomies (les anglo-américains utilisent taxonomies qui est déconseillé en français). Mais encore faut-il d’abord établir une liste sans omission ni répétition. Et comme c’est assez lourd, autant se référer à ce qui a pu être déjà rassemblé dans un taxonomy warehouse. Ensuite, le mécanisme des URI pointant à partir des balises des données vers ces taxonomies permet de bien savoir de quoi on parle dans un domaine. Ordonner ce "sens commun" est tout particulièrement important pour les données administratives autour desquelles de nombreuses applications privées s’organisent. Les agences US ont ainsi été invitées par l’E-Government Act à établir leur taxonomy.
Un problème naît lorsque des échanges électro-niques de données doivent être organisés entre domaines ou secteurs différents. Deux solutions :
1/ Rapprocher les taxinomies, ce qui peut obliger à une redéfinition complète, les taxinomies n’ayant pas forcément été construites avec des partitions bien compatibles. Et simplement les réunir dans une liste de codes "fourre-tout" ne régle rien pour un traitement automatisé. En effet, si la comparaison des libellés peut suffire au spécialiste pour identifier le concept sous-jacent, il faudra aller plus loin pour un EDI "ouvert" ou un Service Web sans aucune intervention humaine.
2/ Passer à l’ontologie pour relier des taxinomies différentes pouvant avoir des zones de recou-vrement sémantique. Après l’indexation des données vers la taxinomie, on passe ainsi à la modélisation entre taxinomies. Là, les outils existent : RDF et XSLT permettent d’exécuter (cf VendrEDI n° 71) les transformations identifiées.
Mais c’est la sémantique et la syntaxe d’OWL (Web Ontology Language), avec ses trois versions Lite, DL et Full, qui valorisent complétement RDF et sa capacité à fournir un "sens commun" qui soit "machine processable". Et de même qu’il faut apprendre RDF (cf VendrEDI n° 72), il faut apprendre OWL, par exemple à partir du Guide OWL du W3C, assez convivial pour un francophone, puisqu’il est basé sur un exemple d’ontologie oenologique !