Note sur la gestion des gabarits de métadonnées
Quelques notions avant de commencer… Notion de gabarit ou metadata profile Notion de fiches de métadonnées ou références Notion de niveau de saisie d’une fiche de métadonnées Le gestionnaire de gabarits de métadonnées Qui doit s’en servir et à quoi çà sert ? Limites de la version actuelle Accès au module de gestion des gabarits Ajouter un gabarit de métadonnées Modifier un gabarit de métadonnées Supprimer un gabarit de métadonnées
Quelques notions avant de commencer…Un gabarit, ou encore adaptation, est un document ou un schéma (au sens structure de données) qui précise les options de mise en place d'une norme afin de répondre à un besoin particulier. Par essence, un gabarit ne contredit pas la norme à laquelle il se réfère et n'introduit pas, en principe, de nouveaux concepts. Il décrit plutôt la norme ou une partie de celle-ci afin qu'elle puisse être mise en place et utilisée dans un contexte particulier. Par contre, des éléments n’existants pas dans la norme (éléments étendus) peuvent y être intégrés. Ils viennent compléter celle-ci en y apportant des éléments de description utiles dans le contexte précis pour lequel est utilisé le gabarit. Un gabarit d'une norme permet, en outre, d'adapter culturellement et linguistiquement une norme internationale aux particularités d'un pays ou d'une région.
Une communauté peut ainsi définir des gabarits pour des types particuliers de jeux de données. Par exemple, un gabarit pour des jeux de données matricielles ou « raster » ne conservera que les éléments de métadonnées propres à ce type de données. Un gabarit peut aussi gérer certaines particularités ou règles qu'une organisation aimerait appliquer aux éléments de métadonnées. Un gabarit, par exemple, pourra identifier les éléments obligatoires et optionnels à renseigner. Dans MDweb, 9 gabarits sont proposés en standard. Ils correspondent à 9 types de données :
o BD géographique ou géodatabase o Base de données temporelles o Carte numérique De type jeu de données o Carte papier o Données vecteur o Image satellitale – photos aériennes o Documents texte o Tableaux de données o Référence bibliographique Les normes de métadonnées, et le standard international en particulier, s’appliquent en principe à des données numériques mais peuvent aussi s’appliquer à des documents analogiques tels que les cartes, plans, photographies aériennes, etc. Dans ce dernier cas, la documentation de la donnée et son catalogage font toujours référence au document lui-même. De plus, les jeux de données de ce type comprennent en général un ensemble bien identifiable de documents. En revanche, pour les données numériques, la définition de ce que constitue une donnée, ou un jeu de données, est plus difficile et reflète souvent le contexte institutionnel et technologique de l’organisation de laquelle est issue la donnée. De façon générale, on se rend compte que les données numériques peuvent être décomposées en une hiérarchie présentée dans le schéma suivant (figure 4), allant des attributs à la collection de données, en passant par les types d’entités et les jeux de données. Pour définir plus simplement cette vue des données, le terme général de ressource peut être utilisé. Il recouvre toutes les notions associées à la hiérarchie des données présentée en figure.
Pour illustrer cette notion, nous avons pris comme exemple, en figure ci-dessus, les cartes d’occupation des terres dressées sur un territoire, et en particulier celles du territoire de Oued Mird (Maroc). Cette ressource de type «carte numérique» peut être décomposée selon la hiérarchie des ressources proposée. Cette décomposition hiérarchique est proposée sous l’angle du formalisme UML. Si on la considère au plus haut niveau, on peut parler d’une collection de données. Il s’agit en effet, d’un ensemble de cartes portant sur le même thème et produite à différentes périodes d’observations, celle de l’occupation des terres des années 90, celle qui concernera l’occupation des terres pour la décennie 2000, etc. Au niveau jeu de données, on considérera, un élément de cette collection, par exemple, la carte d’occupation des terres des années 90. Dans ce cas, le niveau inférieur ou type d’entité correspond à l’ensemble des couches thématiques qui composent la carte d’occupation des terres des années 1990. Dans notre exemple, nous avons pris la couche « polygone » des classes d’occupation des terres. D’autres couches telles que les villages peuvent faire partie de la carte. Enfin, le niveau le plus élémentaire, ou type d’attribut, est l’ensemble de propriétés de la couche « polygone », un exemple de type d’attribut est donné avec l’attribut « % de recouvrement de ligneux ». Les niveaux traités dans MDweb se limitent à :
Définitions Collection de données : ensemble de jeux de données distincts reliés les uns aux autres par des caractéristiques communes telles que leur mode d’acquisition ou de traitement (images satellites), leur extension spatiale, la nature de leur contenu, par exemple, une série de données est synonyme de collection de données. Cette dénomination est utilisée dans MDweb pour les données de type « Carte numérique », « géodatabase », « base de données relationnelles » . Jeu de données : ensemble de données apparentées, identifiable sans équivoque reliées les uns aux autres par des caractéristiques communes telles que leur mode d’acquisition ou de traitement, leur extension spatiale, etc. Un jeu de données peut être considéré comme un petit ensemble de données ou une partie de cet ensemble. Cette dénomination est utilisée dans MDweb pour les données de type « Carte papier », « Données vecteur», « Image satellitale – Photo aérienne », « Document texte », « Tableaux de données », « référence bibliographique ».
Hiérarchie entre les collections et les jeux de données MDweb établie une hiérarchie entre les types de données notamment par la définition de gabarit parent et enfant (voir notion de gabarit ou metadata profile) . Dans la version standard, cette hiérarchie est la suivante :
Dans ce document est utilisé de la même manière la notion de fiche de métadonnées et de référence. Ces deux notions portent sur le même objet. Une fiche de métadonnées ou référence se définit comme un ensemble d’éléments de métadonnées renseignés par un utilisateur afin de décrire une collection de données ou un jeu de données, plus généralement une ressource. La notion de fiche de métadonnées se rapporte à la structure et de la nature des éléments qui la compose, les éléments de métadonnées issus de la norme ISO 19115. La notion de référence se rapporte davantage à une vision des métadonnées comme un élément du catalogue de données que gère MDweb. Le niveau de saisie fait référence à la quantité d’éléments et à leur nature pour décrire une ressource. Il correspond aux différents niveaux d’utilisation des métadonnées. En effet, selon les objectifs d’utilisation des métadonnées, les informations requises pour décrire les ressources ne sont pas les mêmes. Par exemple, des objectifs de recherche des ressources nécessitent des informations moins détaillées et moins complètes que des objectifs de documentation en vue de la diffusion et le transfert des ressources. Ainsi, pour le catalogage des ressources, qui sert de support à leur recherche, des métadonnées simplifiées peuvent s’avérer suffisantes. Ces différents contextes ou niveau d’utilisation des métadonnées peuvent conduire à définir plusieurs niveaux de détail des métadonnées. Le standard international définit deux niveaux de détail ou niveau de conformité. Le premier niveau de conformité ou niveau « élémentaire » correspond à des objectifs de catalogage des ressources. Pour cela, il propose un ensemble d’éléments obligatoires ou « metadata core profile » qui regroupe les éléments nécessaires à identifier la ressource et à connaître sommairement son contenu. Il peut être uniquement utilisé à des fins de catalogage et de support aux services de métadonnées permettant la recherche de ressources. Un deuxième niveau conformité ou niveau « complet » fournit les éléments de métadonnées nécessaires pour documenter une ressource de façon complète. Ce niveau de conformité définit les éléments de métadonnées requis pour identifier, évaluer, extraire utiliser et gérer les ressources de type géographique. Nous nous sommes inspirés de la proposition du standard international pour identifier trois niveaux de détail dans le gabarit de métadonnées ROSELT : ü un niveau élémentaire ü un niveau étendu, ü et un niveau complet. Le niveau élémentaire est construit à partir des éléments de métadonnées minimaux du standard. Le niveau étendu est construit sur la base du précédent en incluant des éléments de métadonnées permettant d’assurer l’échange et le transfert de la ressource, et de décrire plus précisément l’origine de la ressource (données sources et traitements mis en œuvre). Cette dernière description s’avère indispensable pour la réutilisation d’une ressource à des fins scientifiques. Pour les types de données proposés dans la version standard, les niveaux étendu et complet sont confondus.
Le gestionnaire de gabarits de métadonnées
Le gestionnaire de gabarit est le cœur de l’outil MDweb car il permet de redéfinir les structures et les éléments de description sur lesquels s’appuient les formulaires de saisie et le moteur de recherche. Pour cela, son utilisation doit être limitée à l’administrateur de l’application qui aura auparavant des connaissances approfondies sur les métadonnées et les normes afférentes. La mauvaise manipulation de ces structures et leur modification dans la base de données MDweb peut entraîner un grave disfonctionnement de l’outil.
Les fonctionnalités générales du gestionnaire de gabarits Il permet de définir (ajouter) un nouveau gabarit, de modifier des gabarits existants (sur sa structure ou sur ses propriétés) et d’en supprimer. Des précisions sur la notion de gabarit de métadonnées, de hiérarchie entre les gabarits sont données en introduction de cette note.
Le gestionnaire de gabarit est dans sa première version. Plusieurs limitations sont à noter : - Le choix de la norme : la norme ISO 19115 (TC/211) dans sa version FDIS 2003 ( http://jc.desconnets.free.fr/mdweb/docs/FDIS-19115.pdf ) est l’unique norme que l’on peut utiliser actuellement pour construire un gabarit. Tous les sections de cette norme ne sont décrites entièrement dans MDweb. Nous donnons la liste ci-dessus avec une indication sur la complétude : · MD_Identification (seulement la classe MD_DataIdentification) · MD_Constraints · DQ_DataQuality · MD_MaintenanceInformation · MD_SpatialRepresentation · MD_ReferenceSystem · MD_ContentInformation · MD_PortrayalCatalogueReference · MD_Distribution · MD_MetadataExtensionInformation · MD_ApplicationSchemaInformation - La définition ou la modification des listes prédéfinies rattachées aux éléments : la possibilité de modifier, définir des listes de valeurs prédéfinies qui sont associées à des éléments de métadonnées n’est pas encore implémentée. Ces ajouts ou modifications devront être réalisés directement dans la base de données MDweb sur les tables elmnt_mtd (champ list_short_name qui permet de définir une liste prédéfinie à un élément), code_list (définition d’une nouvelle liste de valeurs) et la table elmnt_code_list (définition des éléments). La traduction des éléments ajoutés se fait par l’insertion d’un nouveau libellé dans la table label_stand. - La définition ou modification d’une norme n’est pas implémentée dans cette version. Vous devez si vous souhaitez ajouter une norme ou compléter celle qui existe, insérer les éléments dans les tables elmnt_mtd, est_inclus et traduire les libellés des éléments ajoutés dans la table label_stand. - L’obligation de définir un sous ensemble minimal (metadata core) n’est pas implémentée. Vous devrez veiller par l’étude de la norme ISO 19115 à construire un gabarit qui respecte le cœur de la norme si vous souhaitez être compatible avec cette norme (ce sous ensemble est donné dans le paragraphe suivant).
En avant de se lancer dans le gestionnaire La définition et l’édition d’un gabarit sont des étapes cruciales qui vont vous permettre de choisir les éléments de description pertinents pour les jeux de données que vous souhaitez cataloguer. Aussi, vous devez y apporter, en relation avec les partenaires de votre projet, toute l’importance nécessaire afin de parvenir à une définition correcte et fonctionnelle de vos gabarits. Pour cela, nous vous suggérons de suivre un mode opératoire. Nous le décomposerons en 5 étapes :
1. Etude et choix de la structure de votre gabarit
En amont de l’utilisation de MDweb, il est nécessaire d’étudier selon le projet de catalogage que vous souhaitez mettre en place, de quelle manière vous voulez décrire vos jeux de données. Il s’agit de répondre aux questions : Quelles sont les informations dont les utilisateurs du catalogue (ceux qui feront la recherche de mes jeux de données) auront besoin pour trouver le jeux de données, quels éléments ont ils besoin pour apprécier la pertinence par rapport à leurs besoins ? Est-ce que je souhaite que mon application puisse permettre aux utilisateurs d’accéder aux jeux de données ? ² Quel est le nombre d’éléments de métadonnées que les utilisateurs seront prêts à saisir : 10, 20, 100, 200 ? A partir de ces interrogations et de bien d’autres, vous pourrez évaluer les descripteurs nécessaires à votre projet, ceux qui seront optionnels, etc. Pour définir la structure de votre gabarit (les différentes sections) et les éléments (champ qui permettront de saisir les valeurs), il est nécessaire de confronter vos besoins avec les éléments proposés dans la norme ISO 19115 ( http://jc.desconnets.free.fr/mdweb/docs/FDIS-19115.pdf ) afin d’ébaucher un premier prototype de gabarit. Vous pourrez aussi vous inspirer des gabarits qui sont donnés en standard dans MDweb. Ils sont au nombre de 9. Vous pouvez visualisez leur structure dans la rubrique ‘Utilitaires’ du menu de la page d’accueil MDweb > structure des gabarits utilisés’ http://localhost/mdweb-demo15/test/test_gabarit.php Les éléments indispensables (metadata core) de l’ISO 19115 La norme définit un sous ensemble d’éléments obligatoires pour pouvoir référencer un jeu de données. Dans MDweb, la conformité de votre gabarit à ce sous ensemble n’est pas gérée. Nous vous donnons les éléments faisant partie de ce sous–ensemble :
Lorsque vous avez défini la structure de vos différents gabarits, vous pouvez commencer sa construction à partir du module Ajouter un gabarit de métadonnées en utilisant un gabarit existant (voir paragraphe Ajouter un gabarit de métadonnées). A cette étape, vous avez défini la structure de vos gabarits, c'est-à-dire les sections et les éléments sur lesquels les utilisateurs s’appuieront pour décrire leurs jeux de données. Par contre, la construction du gabarit n’est pas terminée. En effet, pour que MDweb puisse construire les formulaires de saisie, stocker les métadonnées et construire les résultats de recherche, il est nécessaire pour chaque élément de définir la manière dont il sera traité dans MDweb (obligation de saisie, niveau de saisie, type de champ de formulaire, etc.).
2. Définition des propriétés des éléments La définition des propriétés des éléments est largement assistée dans le gestionnaire de gabarit. Elle doit être réalisée après la construction de la structure d’un gabarit (ajout des éléments). Afin de permettre d’automatiser le traitement des éléments d’un gabarit dans les formulaires de saisie et leur apparition dans les fiches détaillées données en consultation, un certain de nombres de propriétés doivent être définies pour chaque élément. Nous donnons la liste des ces propriétés ainsi que les valeurs prédéfinies lorsqu’il en existe. Les propriétés s’appliquent selon le type de l’élément (section, classe ou élément). Le gestionnaire de gabarits vous permet de définir quatre types de propriétés : · Les attributs qui précisent un élément de la norme · Les propriétés générales qui étendent les propriétés de la norme · Les propriétés pour la construction du formulaire de saisie propre à MDweb · La traduction du libellé de l’élément dans les langues gérées par MDweb
Les attributs d'un élément Certains éléments de la norme peuvent posséder des attributs précisant une caractéristique de l'élément (par exemple un attribut "unité de mesure" permettant de fixer l'unité dans laquelle l'élément devra être complété). Le gestionnaire de gabarits propose lorsqu'un élément possède un ou des attributs de donner une valeur par défaut par gabarit et par attribut (valeur libre ou à choisir dans une liste prédéfinie).
Les propriétés générales des éléments de gabarits
Les propriétés générales pour les éléments de type sections ou rubriques des gabarits Ce tableau complète le précédent sur les propriétés spécifiques aux sections et rubriques.
Les astuces : Allégez vos formulaires : Lorsque la valeur par défaut est constante, vous pouvez choisir comme valeur à la propriété ‘visibilité à la saisie’ : insertion automatique. Ainsi, le champ de cet élément n’apparaîtra dans aucun formulaire. Allégez vos formulaires (2) : en définissant un élément avec la valeur ‘Gestion des valeurs prédéfinies des formulaires’ la propriété ‘Visibilité à la saisie’
Les propriétés pour la construction du formulaire de saisie propre à MDweb Ces propriétés se rapportent uniquement aux éléments de description auquel on peut rattacher une valeur. Elles permettent de définir les propriétés qui permettront de construire les formulaires de saisie (type de champ de saisie, contrôle de la saisie (type de valeur, nombre de caractères, etc.)
La traduction du libellé de l’élément dans les langues gérées par MDweb
Le gestionnaire de gabarit vous permet de traduire ou modifier les libellés des éléments de métadonnées dans toutes les langues gérées par l’outil (anglais, français, portugais). Cette modification peut être réalisée lors de la définition des propriétés des éléments du gabarit. 3. Finalisation de la création ou de la modification d’un gabarit La dernière étape à considérer est la finalisation du gabarit crée ou modifié. Elle doit être réalisée lorsque l’ensemble des éléments a été choisi et leur propriétés définies in extenso. Le bouton ‘Modifier votre gabarit’ (frame du bas du gestionnaire) assure cette phase de finalisation. Elle consiste à vérifier la conformité des propriétés définies et calcule un index de position de chaque élément dans le gabarit. Cet indice permet notamment de gérer la multi - occurrence des rubriques et des éléments 4. Test du gabarit créé à partir du formulaire de saisie En dehors du gestionnaire, il est indispensable de tester la structure et les propriétés données à chaque élément en créant des fiches tests. Cela vous permettra de vérifier l’opérationnalité de votre gabarit en complétant si besoin ou modifiant certaines propriétés des champs, avant de commencer réellement la saisie de fiches de métadonnées. En effet, lorsque des fiches de métadonnées sont créées sur un gabarit donné, il est impossible, sans supprimer les fiches, de modifier sa structure. Par contre, vous pourrez modifier les propriétés des éléments. Malgré tout, une vérification complète est préférable avant de se lancer dans une phase de saisie à grande échelle.
L’accès au module de gestion de gabarits n’est possible que si vous êtes loggé dans MDweb en tant qu’administrateur. Vous devez accéder au module d’administration de MDweb. L’ensemble des fonctionnalités du module est accessible par l’élément ‘Gabarit’ du menu administrateur.
Le module de gestion de gabarits propose trois grandes fonctions : · Ajouter : pour créer une nouveau gabarit à partir d’un existant ou partir d’une norme · Modifier : pour modifier la structure ou les propriétés des éléments du gabarit · Supprimer un gabarit existant
1. Accédez à la page Ajouter un gabarit à partir du menu du module administration
2. Définissez votre nouveau gabarit en remplissant le formulaire proposé.
5 champs au maximum sont à définir : · Nom du standard de métadonnées : Standard de métadonnées que vous souhaitez utiliser pour créer votre nouveau gabarit. Dans la version actuelle, seule la norme ISO 19115 est utilisable (version FDIS 2003)
· Code du gabarit : Le code gabarit correspond au nom interne du gabarit. Il doit être court, compréhensible et sans espace. Ex : ‘couche_vecteur’ pour le gabarit ‘Données vecteur’, 20 caractères maximum
Commentaires des champs de formulaire
De la même manière
que dans les formulaires de saisie, chaque champ de ce formulaire est
accompagné d’un commentaire. Vous y accéder en passant la souris sur l’icône
Gestion de la hiérarchie entre gabarits
Cas d’un nouveau gabarit, fils d’un gabarit existant
Lors de la création d’un nouveau gabarit, vous pouvez le définir en tant que jeu de données (voir paragraphe notion de ressource) et lui attacher un ‘gabarit parent’ correspondant à un gabarit existant comme cela est montré dans la copie d’écran.
Cas d’un nouveau gabarit, père d’un gabarit existant
A l’inverse, vous pouvez le définir en tant que collection de données (voir paragraphe notion de ressource) et lui attacher un ‘gabarit fils’ correspondant à un gabarit existant comme cela est montré dans la copie d’écran.
Description de l’ergonomie du gestionnaire de gabarits
La page d’édition du gestionnaire de gabarits s’organise autour de 3 cadres :
L’ajout des éléments d’un gabarit s’appuie sur une représentation arborescente de la norme utilisée. Cas d’une création à partir de la norme Si vous avez choisi de créer un nouveau gabarit à partir de la norme utilisée, alors vous devrez procéder à l’ajout des éléments en deux étapes : a) Cocher les éléments que vous souhaitez incorporer à votre gabarit. Attention, seule l’arborescence d’une rubrique peut être déployée en même temps. Si vous cochez des éléments au sein d’une | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||