Du 3 au 5 octobre 2022, a eu lieu la 3e édition d’une action nationale de formation de « text and data mining » (ANF-TDM) intitulée : « Exploration documentaire et extraction d’information ».
Cette formation, qui était organisée conjointement par le CNRS et l’INRAE et s’est déroulée à la délégation Paris Michel-Ange du CNRS, a reçu comme chaque année un vif succès. Istex y était bien entendu présent pour mettre en avant les atouts de ses ressources pour le TDM.
Cette année, de nouveaux ateliers ont été proposés pour faire découvrir de nouveaux outils de fouille de textes.
Pour rappel, cette formation s’adressait aux chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitaient se former aux techniques numériques pour mettre en place ou développer la recherche d’information et la fouille de textes dans leur activité professionnelle.
4 interviews ont été réalisés pour présenter certains ateliers :
- Stéphéline Ginguené (Doctorante en psychologie sociale au sein du Pôle de Psychologie Sociale Inserm) propose une initiation à la visualisation et à la compréhension de la structure et des mondes lexicaux au sein d’un corpus textuel à l’aide du logiciel IRaMuTeQ => Stéphéline Ginguené – Logiciel IRaMuTeQ
- Alice Brenon (Doctorante sur le projet GEODE financé par le LabEx CNRS ASLAN) et Ludovic Moncla (Maitre de conférence en informatique à l’INSA Lyon) présentent l’utilisation de librairies Python (ie. NLTK, Stacy, Stanza) et de services Web (ie. PERDIDO) pour l’extraction d’entités nommées à partir de textes => Alice Brenon et Ludovic Moncla – Librairies Python et Services Web
- Justine Revol (Service TDM de l’Inist-CNRS) explique comment faire de la fouille de textes sans coder grâce à des web services dédiés => Justine Revol – Web services Istex
- Jeanne Vermeirsche (Doctorante en science politique et chargée d’enseignement – Laboratoire biens, normes, contrats) et Eric Sanjuan (Maitre de conférence en informatique – Laboratoire d’informatique d’Avignon) initient au moyen de la plateforme RStudio au suivi des tendances d’actualité sur Wikipédia avec l’étude des contributeurs => Jeanne Vermeirsche et Eric Sanjuan – Plateforme RStudio (…)
Une 4ème édition ANF-TDM est prévue pour octobre novembre 2023. Vous serez bientôt avertis des dates.
Pascale pour l’équipe Istex
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !