Bonjour à toutes et à tous,
Lors d’un précédent billet de blog, nous vous annoncions le chargement dans la plateforme ISTEX de valeurs ajoutées sous forme d’enrichissements.
Ces données XML sont décrites sous forme d’annotations en format TEI (Text Encoding Initiative), TEI est une norme de codage de structuration de textes qui repose sur XML. Ces annotations contiennent des informations
supplémentaires venant enrichir les documents sources disponibles dans l’API ISTEX.
Néanmoins la TEI n’a pas d’éléments spécifiques pour encoder ces informations. Afin de pouvoir faire vivre ces enrichissements et les rendre interopérables, chacun d’eux est traité dans un élément intégré dans la notice globale en TEI.
Afin de pouvoir traiter et valider ces annotations les équipes ISTEX-DATA et ISTEX-RD ont produit un schéma ODD-ISTEX, ainsi que sa documentation (disponible sous github).
La personnalisation ODD (One Document Does it all) (cf : http://www.tei-c.org/Guidelines/Customization/odds.xml) est un format de spécification compatible TEI permettant de personnaliser la TEI P5 sous forme de programmation alphabétisée.
ODD-ISTEX permet de paramétrer et de valider les enrichissements spécifiques produits par les équipes ISTEX et leurs partenaires.
La structure proposée pour l’encodage des annotations dans la TEI offre les avantages suivants:
- permettre d’annoter à la fois des informations textuelles et non textuelles
- permettre d’enrichir les documents par le billet d’ajout d’informations externe à la donnée source
- faciliter l’échange d’annotations sur des objets stockées dans le document TEI source annoté.
- intégrer ces annotations dans la structure hiérarchique du document TEI source grâce au bloc
Prochainement : Les enrichissements feront l’objet d’une mise à jour dans l’API ISTEX afin de prendre en compte les quelques modifications apportées suite à la création du schéma ODD-ISTEX.
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !
Bonjour ! c’est super d’avoir mis les fréquences comme donnée pour les termes et les entités nommées !