Ajouter des documents à l’index et fusionner en Java avec GroupDocs.Search

Dans l’environnement numérique actuel, où tout va très vite, apprendre comment ajouter des documents à l’index efficacement est essentiel pour toute solution document management java. Que vous gériez des contrats, des factures ou des rapports internes, un index bien structuré vous permet de récupérer l’information en quelques millisecondes. Ce tutoriel vous guide à travers la création d’index, l’ajout de documents, la configuration des options de fusion, et même cancel merge operation si nécessaire — le tout avec GroupDocs.Search pour Java.

Réponses rapides

  • Que signifie “add documents to index” ? Cela indique à GroupDocs.Search de scanner un dossier et de stocker les métadonnées recherchables pour chaque fichier.
  • Puis‑je arrêter une fusion longue ? Oui — utilisez l’objet Cancellation pour cancel merge operation après un délai.
  • Ai‑je besoin d’une licence ? Un essai gratuit ou une licence temporaire suffit pour les tests ; une licence commerciale débloque toutes les fonctionnalités.
  • Quelle version de Java est requise ? JDK 8 ou plus récent.
  • Cette solution convient‑elle aux grands ensembles de données ? Absolument — surveillez simplement la mémoire et utilisez l’indexation incrémentale.

Qu’est‑ce que “add documents to index” dans GroupDocs.Search ?

Ajouter des documents à un index signifie fournir une collection de fichiers à GroupDocs.Search afin que la bibliothèque puisse analyser leur contenu, extraire les jetons et construire une structure de données recherchable. Une fois indexés, vous pouvez effectuer des recherches plein texte rapides sur l’ensemble des documents.

Pourquoi utiliser GroupDocs.Search pour document management java ?

  • Indexation évolutive – Gère des milliers de fichiers sans dégrader les performances.
  • API riche – Offre un contrôle granulaire sur l’indexation, la fusion et l’annulation.
  • Support multi‑format – Fonctionne avec les PDF, Word, Excel et de nombreux autres formats dès le départ.

Prérequis

  • GroupDocs.Search for Java version 25.4 ou ultérieure.
  • Maven (ou téléchargement manuel du JAR).
  • Connaissances de base en Java et un environnement JDK 8+.

Configuration de GroupDocs.Search pour Java

Maven Installation

Si vous gérez les dépendances avec Maven, ajoutez le dépôt et la dépendance à votre pom.xml :

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Téléchargement direct

Sinon, téléchargez le JAR le plus récent depuis le site officiel : GroupDocs.Search for Java releases.

Obtention de licence

  • Essai gratuit : Inscrivez‑vous sur le site GroupDocs pour obtenir une licence d’essai.
  • Licence temporaire : Demandez une clé temporaire si vous avez besoin d’une évaluation prolongée.
  • Licence commerciale : Achetez‑la pour une utilisation en production.

Une fois le fichier de licence obtenu, placez‑le dans votre projet et initialisez la bibliothèque comme indiqué plus loin.

Guide d’implémentation

Comment ajouter des documents à l’index – Créer le premier index

Tout d’abord, créez un index vide qui contiendra vos données recherchables.

import com.groupdocs.search.Index;

// Create an instance of the index at the specified path
Index index1 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index1");
  • Pourquoi : Cette étape crée un conteneur de stockage où les jetons indexés seront sauvegardés.

Ajout de documents à l’index

Indiquez maintenant à GroupDocs.Search de scanner un dossier et add documents to index.

index1.add("YOUR_DOCUMENT_DIRECTORY"); // Add documents from this directory
  • Pourquoi : La bibliothèque lit chaque fichier, extrait le texte et le stocke dans index1.

Création d’un second index pour des flux de travail flexibles

Parfois, vous avez besoin d’index séparés — par exemple, pour isoler les données d’un client.

Index index2 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index2");
index2.add("YOUR_DOCUMENT_DIRECTORY");
  • Pourquoi : Plusieurs index vous permettent de gérer des ensembles de documents distincts et de les combiner ultérieurement.

Comment configurer les options de fusion et annuler l’opération de fusion

Avant de fusionner, vous pouvez affiner le processus et même l’arrêter s’il dure trop longtemps.

import com.groupdocs.search.options.MergeOptions;
import com.groupdocs.search.options.Cancellation;

MergeOptions options = new MergeOptions();
options.setCancellation(new Cancellation()); // Initialize cancellation object
options.getCancellation().cancelAfter(5000); // Cancel merge operation after 5 seconds
  • Pourquoi : Cancellation vous donne le contrôle pour cancel merge operation automatiquement, évitant les tâches incontrôlées.

Fusion des index

Enfin, fusionnez l’index secondaire dans l’index principal.

index1.merge(index2, options);
  • Pourquoi : Après cet appel, index1 contient tous les documents des deux sources, vous offrant une expérience de recherche unifiée.

Applications pratiques pour Document Management Java

  • Cabinets d’avocats : Consolider les dossiers de cas provenant de plusieurs bureaux.
  • Institutions financières : Fusionner les rapports trimestriels dans un référentiel unique et recherchable.
  • Entreprises : Combiner les documents RH, de conformité et de politique pour une recherche à l’échelle de l’entreprise.

Considérations de performance

  • Indexation incrémentale : Ajoutez de nouveaux fichiers périodiquement au lieu de reconstruire l’ensemble de l’index.
  • Surveillance de la mémoire : De gros lots peuvent consommer de la RAM ; envisagez de traiter par morceaux plus petits.
  • Garbage collection : Libérez rapidement les objets Index inutilisés pour libérer les ressources.

Problèmes courants & solutions

ProblèmeSolution
Chemin de dossier incorrectVérifiez le chemin absolu et assurez‑vous que l’application dispose des permissions de lecture.
Mémoire insuffisanteAugmentez le heap JVM (-Xmx) ou indexez les fichiers par lots.
Annulation non déclenchéeAssurez‑vous que cancelAfter est défini avant d’appeler merge.
Format de fichier non pris en chargeInstallez des plugins de format supplémentaires depuis GroupDocs si nécessaire.

Questions fréquemment posées

Q: Pourquoi créer plusieurs index au lieu d’un seul ?
R: Les index séparés vous permettent d’isoler des domaines de données, d’appliquer différentes politiques de sécurité et de fusionner uniquement lorsque nécessaire, ce qui améliore les performances et l’organisation.

Q: Puis‑je annuler une opération d’indexation de la même façon que j’annule une fusion ?
R: Oui — utilisez l’objet Cancellation avec la méthode add pour arrêter les tâches d’indexation de longue durée.

Q: Comment garantir des performances optimales avec des collections de documents très volumineuses ?
R: Effectuez une indexation incrémentale, surveillez la mémoire JVM et envisagez d’utiliser un stockage SSD pour le répertoire d’index.

Q: Que faire si je reçois des erreurs “Access denied” ?
R: Vérifiez les permissions du dossier pour l’utilisateur exécutant le processus Java et assurez‑vous que le fichier de licence est lisible.

Q: GroupDocs.Search est‑il compatible avec d’autres bibliothèques GroupDocs ?
R: Absolument — vous pouvez l’intégrer avec GroupDocs.Viewer, GroupDocs.Conversion, etc., pour une solution documentaire complète.

Conclusion

En suivant ce guide, vous savez maintenant comment add documents to index, configurer le comportement de fusion et annuler en toute sécurité cancel merge operation si nécessaire — le tout dans un flux de travail robuste document management java. Expérimentez avec des ensembles de données plus volumineux, explorez des tokenizers personnalisés, ou combinez GroupDocs.Search avec d’autres produits GroupDocs pour créer une solution véritablement de niveau entreprise.

Ressources


Last Updated: 2026-01-03
Tested With: GroupDocs.Search 25.4 for Java
Author: GroupDocs