Nouveau corpus dans l’API : Oxford University Press (OUP)

Bonjour à toutes et à tous,

L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.

Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API :
https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*

Pour toute remarque ou suggestion, n’hésitez pas à nous laisser un commentaire !

projet Istex

Partager cet article

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

Faq Documentation Tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

Erreur : Formulaire de contact non trouvé !

2 réponses à “Nouveau corpus dans l’API : Oxford University Press (OUP)”

Dominique Rouger dit :

7 septembre 2015 à 10h47

Bonjour,
Le corpus OUP semble avoir, en plus de ses 1 million 400 milles documents,
quelques qualités supplémentaires,
comme des métadonnées host.volume, host.issue, host.pages.first et .last,
ainsi qu’un qualityIndicators.pdfPageCount (pdfPageSize).
Est-ce due à une meilleur qualité des données fournies par l’éditeur,
ou à une avant garde d’une amélioration de l’ensemble des corpus ?
Cordialement

Répondre
- Etienne CARON dit :
  
  7 septembre 2015 à 11h13
  
  Bonjour,
  En effet, il s’agit d’une avant-garde d’une amélioration de l’ensemble des corpus. Nous avons profité de l’été pour recharger les différents corpus déjà ingérés, et allons bientôt mettre en ligne les changements, ainsi qu’un billet de blog expliquant de quoi il en retourne.
  Cordialement
  
  Répondre