29 novembre 2022 :
Un nouvel exemple d’usage des données Istex dans data.istex
Lire l'article
28 juin 2022 :
« TXT Cleaned » : un nouveau format au service du TDM dans Istex
Lire l'article
15 février 2018 :
Documentation sur la constitution de corpus thématiques
Lire l'article
25 septembre 2017 :
Fulltexts structurés à partir des PDFs avec Grobid
Lire l'article
6 septembre 2017 :
OCR : production de plein texte
Lire l'article
19 mai 2017 :
Entraînement du modèle fulltext de Grobid par l’équipe R&D
Lire l'article
19 mai 2017 :
Entraînement du modèle segmentation de Grobid par l’équipe R&D
Lire l'article
11 avril 2016 :
Sprint #8 d’ISTEX-DATA : « Docteur Levenshtein »
Lire l'article