Présentation
Au sein d’ISTEX, l’équipe RD est chargée d’apporter des services à forte valeur ajoutée afin de faciliter l’interrogation et l’analyse des données.
Les axes principaux des enrichissements sont :
- L’extraction terminologique et l’indexation
- La reconnaissance d’entités nommées
- La structuration des documents
- La catégorisation par attribution d’un domaine scientifique
Exemples d’enrichissements réalisés, visibles dans l’API :
- L’extraction et la structuration des références bibliographiques
- L’attribution des catégories WoS
Exemples d’enrichissements réalisés, qui seront prochainement visibles dans l’API :
- La reconnaissance et l’extraction d’entités nommées
- L’attribution des catégories WoS et Science-Metrix
- L’indexation par extraction de mots-clés
- La classification supervisée par méthode bayésienne
L’équipe est aussi présente dans le projet ISTEX-R avec l’ATILF (Analyse et Traitement Informatique de la Langue Française) et le LORIA (Laboratoire LOrrain de Recherche en Informatique et ses Applications). Elle intervient plus spécifiquement sur la thématique du clustering diachronique.
Les partenaires
Dans le cadre de la reconnaissance d’entités nommées, l’équipe travaille en partenariat avec le Laboratoire d’Informatique de l’Université de Tours (LI) et la Société Ergonotics de Lille, avec l’outil Unitex-CasSys.
L’extraction terminologique est réalisée en partenariat avec le LINA (Laboratoire d’Informatique de Nantes Atlantique), avec l’outil TermSuite.
L’extraction des références bibliographiques est réalisée en partenariat avec la Société Science-Miner, avec l’outil Grobid.
Liste de diffusion
Une liste de diffusion est ouverte pour vous permettre de poser des questions sur les enrichissements, mais aussi discuter sur tous les sujets traités en R&D : rd-users@listes.istex.fr
Cordialement,
L’équipe ISTEX-R&D
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !