Istex offre à la communauté scientifique française l’opportunité d’utiliser son infrastructure et ses outils informatiques sur des documents présents dans Istex mais également sur des documents en Open Access ou non disponibles dans l’archive.

L’objectif est de proposer des services en ligne, des ressources ou des outils prêts à l’emploi pour faciliter l‘exploration ou l’exploitation de corpus de textes.

L’ambition est de permettre à tous, experts ou non en traitement automatique du langage de bénéficier des avantages et des techniques de « Text and Data Mining« 

Services TDM

Ces services mettent en œuvre des algorithmes d’apprentissage automatique, de traitement automatique du langage ainsi que des terminologies. Vous aurez ainsi accès à des traitements spécialisés, sans avoir à manipuler de langage de programmation, sans paramétrage complexe, sans connaissances a priori.

Cette facilité d’utilisation est liée au fait que les outils sont installés sur les serveurs de l’Inist, vous n’avez aucune installation à gérer, aucun langage informatique à maîtriser.

Nous développons et mettons à votre disposition :

  • des outils de TDM (Text and Data Mining) faciles à mettre en œuvre
  • couplés à un outil de création de tableaux de bords dynamiques.

Quels usages ?

  • Vous souhaitez homogénéiser ou enrichir vos données bibliographiques grâce à un DOI ? grâce à l’attribution d’identifiants (codes RNSR, IdRef, ORCID) ?
  • Vous souhaitez analyser le contenu de vos données en les indexant, en les classant ou en extrayant des entités nommées ?

Divers web services disponibles

Nous proposons déjà plusieurs services, que nous utilisons et que nous mettons à disposition. La liste de nos services en production ainsi que leur documentation est accessible sur le site « Istex TDM »

On peut distinguer deux grandes familles de web-services :

  • les services qui s’exécutent sur des métadonnées comme la source des documents, les affiliations des auteurs…
  • les services qui s’exécutent sur du texte comme le titre, les résumés, le texte intégral.

Accès à ce service : Services Istex TDM

Comment s’en servir ?

Vous pouvez faire appel à ces services de différentes manières, suivant vos besoins et vos compétences :

  • via Lodex, outil open source de visualisation de données structurées développé à l’Inist
  • via une ligne de commandes (outils curl, wget, ou autres)
  • via des programmes (peu importe le langage de programmation, pourvu que ce dernier puisse accéder au web)

Un site est disponible pour tester ces outils :  Test des outils de TDM
Vous ne trouvez pas l’outil adapté à votre besoin? Contactez nous afin d’évaluer ensemble la faisabilité d’un nouvel outil. Vous avez développé un programme de fouille de textes innovant et vous souhaitez le mettre à disposition de la communauté?  Contactez nous afin d’estimer la faisabilité d’intégration de votre outil.

Nous contacter

 

Ressources terminologiques

Pour vos projets de fouille de texte nous mettons à votre disposition, sur le site Loterre, des terminologies multilingues et multidisciplinaires répondant aux principes FAIR (Findable, Accessible, Interoperable, Reusable).

Quels usages ?

Ces terminologies permettent d’annoter vos données avec leurs termes (concepts). Il est alors possible de naviguer dans le corpus au moyen de filtres et de graphiques portant sur ces concepts.

Certaines terminologies de Loterre peuvent aussi être utilisées pour enrichir les métadonnées bibliographiques.
 
Accès à ce service : Terminologies Loterre
 
 

Parcourir les terminologies Terminologies

Exemples de réalisations 

Besoin d’une terminologie spécifique ?

Nous pouvons vous accompagner pour la création d’une nouvelle terminologie ou l’adaptation d’une terminologie existante. (Exemple de création d’un thésaurus en paléoclimatologie)

En savoir plus sur Loterre : FAQ

Nous contacter

Hébergement de corpus

Vous souhaitez analyser votre corpus de documents à travers un site web dédié. L’infrastructure Istex propose à ses membres la création et l’hébergement d’instance Lodex pour vos propres données.

  • Chargez votre corpus de documents,
  • configurez son affichage,
  • enrichissez-le avec les services d’enrichissement et
  • transformez le tout en site web.

Vous disposez ensuite de votre propre site web sur vos données, pour analyser son contenu pour vous même ou pour le diffuser dans le cadre vos projets.

Les points forts de Lodex

Pour accéder à ce service, prenez contact avec l’équipe Istex.

 

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale

Erreur : Formulaire de contact non trouvé !