Bug #3083
ferméConsommation de mémoire excessive lors de la réindexation
100%
Description
A partir d'un certain volume de données, la ré-indexation devient impossible en raison d'une consommation excessive de mémoire. Cela a été constaté en ré-indexant les données d'un client (DSR). C'est très gênant dans la mesure où l'effet se produit sur la ré-indexation de certains espaces individuellement.
Les erreurs sont de type "GC overhead limit exceeded" ou "Java heap space".
Après analyse d'un dump de la mémoire, il s'avère que les objets les plus présents en mémoire sont des objets provenant de XMLBeans et de POI, bibliothèques utilisées par Tika au moment de l'indexation.
Une piste intéressante est la présence de 96 instances de OpenDocumentParser pour 1 seule instance de TikaParser (le premier n'étant utilisé que par le deuxième).