Bonjour à toutes et à tous,
L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.
Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API :
https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*
Pour toute remarque ou suggestion, n’hésitez pas à nous laisser un commentaire !
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !
Bonjour,
Le corpus OUP semble avoir, en plus de ses 1 million 400 milles documents,
quelques qualités supplémentaires,
comme des métadonnées host.volume, host.issue, host.pages.first et .last,
ainsi qu’un qualityIndicators.pdfPageCount (pdfPageSize).
Est-ce due à une meilleur qualité des données fournies par l’éditeur,
ou à une avant garde d’une amélioration de l’ensemble des corpus ?
Cordialement
Bonjour,
En effet, il s’agit d’une avant-garde d’une amélioration de l’ensemble des corpus. Nous avons profité de l’été pour recharger les différents corpus déjà ingérés, et allons bientôt mettre en ligne les changements, ainsi qu’un billet de blog expliquant de quoi il en retourne.
Cordialement