Chers utilisateurs, vous l’aurez sans doute constaté, api.istex.fr est à nouveau disponible depuis plusieurs jours.
Nous avons profité du tumulte de ces dernières semaines pour passer l’API en version 2.1.1, version qui apporte son lot de nouveautés :
- amélioration des temps de réponse
- mise à disposition du corpus Wiley (4,6 millions de documents)
- ajout d’informations sur les temps de calcul, via le paramètres « stats » (ex de requête)
- renommage dans la réponse du champ « type » en « extension », pour éviter la confusion avec « mimetype »
Nous travaillons également activement à stabiliser l’API et à limiter les indisponibilités.
D’autres nouveautés sont dans les cartons, nous communiquerons au fur et à mesure de leur mise en place.
Toute l’équipe remercie les beta-testeurs et utilisateurs sans qui notre travail n’aurait aucun sens.
Statistiques sur la répartition des temps de calcul (moteur de recherche vs api elle-même)
distinction « mimetype » vs « extension » (auparavant « type » tout court)
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !
Bonjour,
Les temps de réponses ont en effet nettement diminués !
Concernant les données ramenées par le param &stats
« stats »: {
« elasticsearch »: {
« took »: 224,
« timed_out »: false,
« _shards »: {
« total »: 35,
« successful »: 35,
« failed »: 0
},
« total »: 4654374,
« max_score »: 1.4142128
},
« istex-rp »: {
« took »: 5
}
Pourriez-vous donner quelques explication sur la façon de les comprendre ?
Cordialement
Bonjour,
Nous avons un découpage en 2 parties :
– « elasticsearch » pour le moteur de recherche.
– « istex-rp » pour la partie logicielle de l’API (codée en NodeJS)
Pour chacune des 2, « took » représente le temps de traitement en ms. Si l’on additionne les 2, on obtient le temps de traitement total. Attention, ces temps n’incluent pas les temps réseau. Il s’agit uniquement de temps de calcul
Les sous-champs spécifiques à Elasticsearch sont :
– « time_out » : la requête a-t-elle répondu dans le délai maximum ?
– « _shards » : notion propre au moteur. Un index est découpé en shards.
– « total » (4654374) : nombre de documents correspondant à la recherche
– « max_score » : score de pertinence du premier résultat