Bonjour à toutes et à tous,

L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.

Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API :
https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*

Pour toute remarque ou suggestion, n’hésitez pas à nous laisser un commentaire !

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale

Erreur : Formulaire de contact non trouvé !

2 réponses à “Nouveau corpus dans l’API : Oxford University Press (OUP)”

  1. Bonjour,
    Le corpus OUP semble avoir, en plus de ses 1 million 400 milles documents,
    quelques qualités supplémentaires,
    comme des métadonnées host.volume, host.issue, host.pages.first et .last,
    ainsi qu’un qualityIndicators.pdfPageCount (pdfPageSize).
    Est-ce due à une meilleur qualité des données fournies par l’éditeur,
    ou à une avant garde d’une amélioration de l’ensemble des corpus ?
    Cordialement

    • Etienne CARON dit :

      Bonjour,
      En effet, il s’agit d’une avant-garde d’une amélioration de l’ensemble des corpus. Nous avons profité de l’été pour recharger les différents corpus déjà ingérés, et allons bientôt mettre en ligne les changements, ainsi qu’un billet de blog expliquant de quoi il en retourne.
      Cordialement

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *