Effectuer une recherche de texte avec GroupDocs.Search pour Java
Optimisation des performances
Comment implémenter et optimiser un réseau de recherche avec GroupDocs.Search pour Java
Introduction
Dans le monde actuel axé sur les données, la capacité d’effectuer une recherche de texte rapidement à travers d’énormes collections de documents constitue un avantage concurrentiel. Que vous construisiez une base de connaissances interne, un référentiel de dossiers juridiques ou un catalogue de produits e‑commerce, un réseau de recherche bien optimisé peut améliorer considérablement la satisfaction des utilisateurs. Dans ce guide, vous apprendrez à configurer un réseau de recherche, créer un index consultable, optimiser les performances de recherche, et même supprimer l’index des documents lorsque nécessaire — le tout en utilisant GroupDocs.Search pour Java.
Ce que vous apprendrez
- Configurer un réseau de recherche avec GroupDocs.Search
- Déployer des nœuds au sein du réseau
- Indexer les documents efficacement (
index documents java) - Effectuer des recherches de texte à travers votre réseau (
perform text search) - Supprimer des documents spécifiques de l’index (
delete documents index)
Plongeons dans la façon dont vous pouvez exploiter ces fonctionnalités pour créer une expérience de recherche optimisée.
Réponses rapides
- Quel est le principal objectif de GroupDocs.Search pour Java ? Il fournit une recherche en texte intégral à travers de nombreux formats de documents.
- Comment effectuer une recherche de texte dans un environnement distribué ? Déployez un réseau de recherche, indexez les documents sur un nœud maître, puis interrogez n’importe quel nœud.
- Puis-je supprimer des documents de l’index sans le reconstruire ? Oui, utilisez l’API Delete pour retirer les fichiers sélectionnés.
- Quelle version de Java est requise ? JDK 8 ou supérieur.
- Une licence est‑elle nécessaire pour la production ? Une licence valide de GroupDocs.Search est requise ; un essai gratuit est disponible.
Qu’est‑ce que « perform text search » ?
Effectuer une recherche de texte signifie interroger un index en texte intégral afin de récupérer les documents contenant les mots‑clés ou expressions spécifiés. GroupDocs.Search construit un index inversé qui rend ces recherches extrêmement rapides, même sur des milliers de fichiers.
Pourquoi mettre en place un réseau de recherche ?
Un réseau de recherche répartit les charges de travail d’indexation et de requête sur plusieurs nœuds, vous permettant d’optimiser les performances de recherche, de mettre à l’échelle horizontalement et de maintenir une haute disponibilité. Cette architecture est idéale pour les référentiels de documents de niveau entreprise où la latence et le débit sont importants.
Prérequis
- Bibliothèques requises : GroupDocs.Search pour Java version 25.4 (dernière).
- Environnement : Java JDK 8+, Maven.
- Connaissances : Programmation Java de base et familiarité avec les concepts réseau.
Configuration de GroupDocs.Search pour Java
Pour commencer, intégrez GroupDocs.Search à votre projet Java en utilisant la configuration suivante :
Configuration Maven
Ajoutez le dépôt et la dépendance à votre fichier pom.xml :
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Téléchargement direct
Alternativement, vous pouvez télécharger la dernière version directement depuis GroupDocs.
Obtention de licence
GroupDocs propose un essai gratuit, qui vous permet d’évaluer ses fonctionnalités avant l’achat. Vous pouvez obtenir une licence temporaire en suivant les étapes sur leur page d’achat. Cela activera la pleine fonctionnalité pendant votre phase de test.
Initialisation et configuration de base
Initialisez GroupDocs.Search dans votre application Java avec :
import com.groupdocs.search.*;
class SearchNetworkSetup {
public static void main(String[] args) {
Index index = new Index("path/to/index/directory");
// Additional configuration can be set here.
}
}
Guide de mise en œuvre
Configuration du réseau de recherche
Vue d’ensemble : Définissez un chemin de base et un port pour votre réseau de recherche, permettant aux nœuds de communiquer efficacement.
Étape 1 : Définir la configuration de base
import com.groupdocs.search.options.*;
import com.groupdocs.search.scaling.configuring.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104; // Change if necessary.
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
- Paramètres :
basePath: Chemin du répertoire pour les opérations réseau.basePort: Numéro de port utilisé par le réseau de recherche.
Étape 2 : Dépannage
Assurez‑vous que le port spécifié n’est pas bloqué par les paramètres du pare‑feu ou utilisé par une autre application. Ajustez-le si nécessaire afin d’éviter les conflits.
Déploiement des nœuds du réseau de recherche
Vue d’ensemble : En utilisant votre configuration, déployez des nœuds à travers votre réseau pour l’indexation et la recherche distribuées.
import com.groupdocs.search.scaling.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
// Nodes are now deployed and ready for further operations.
- Options de configuration clés :
- Chemin de base & Port : Ces valeurs doivent correspondre à celles utilisées dans votre configuration initiale pour garantir la cohérence.
Indexation des documents (create searchable index)
Vue d’ensemble : Ajoutez des documents à l’index de recherche efficacement en utilisant un nœud maître.
import com.groupdocs.search.scaling.*;
String documentsPath = "YOUR_DOCUMENT_DIRECTORY/path/to/documents";
SearchNetworkNode masterNode = nodes[0];
IndexingDocuments.addDirectories(masterNode, documentsPath);
- Objectif :
masterNode: Le nœud principal qui gère l’indexation des documents.documentsPath: Chemin du répertoire contenant les documents.
Conseils de dépannage
Vérifiez que les chemins de vos documents sont corrects et accessibles. Assurez‑vous que les permissions permettent la lecture de ces répertoires.
Recherche de texte dans le réseau (perform text search)
Vue d’ensemble : Effectuez des recherches de texte complètes à travers votre réseau indexé.
import com.groupdocs.search.scaling.*;
String query = "nulla";
SearchNetworkNode masterNode = nodes[0];
TextSearchInNetwork.searchAll(masterNode, query, false);
- Paramètres :
query: Le texte que vous recherchez.masterNode: Nœud effectuant la recherche.
Suppression de documents de l’index (delete documents index)
Vue d’ensemble : Supprimez des documents spécifiques de votre index en utilisant leurs chemins de fichiers.
import com.groupdocs.search.scaling.*;
SearchNetworkNode node = nodes[0];
String[] filePaths = {
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.pdf",
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.docx"
};
deleteDocuments(node, filePaths);
void deleteDocuments(SearchNetworkNode node, String... filePaths) {
Indexer indexer = node.getIndexer();
DeleteOptions options = new DeleteOptions();
indexer.delete(filePaths, options);
}
- Objectif de la méthode :
node: Le nœud cible pour les opérations de suppression.filePaths: Chemins des documents à retirer de l’index.
Dépannage
Assurez‑vous que les chemins de fichiers sont précis et que les fichiers existent dans votre répertoire. Si les problèmes persistent, vérifiez les permissions réseau et la connectivité.
Applications pratiques
- Gestion de documents d’entreprise : Rationalisez la récupération de connaissances internes.
- Analyse de dossiers juridiques : Localisez rapidement les dossiers pertinents à travers plusieurs référentiels.
- Plateformes e‑commerce : Accélérez la recherche de produits en indexant les descriptions et les avis.
- Recherche académique : Recherchez efficacement de grandes bibliothèques numériques de papiers et de thèses.
- Systèmes de support client : Réduisez le temps de réponse en permettant aux agents de rechercher instantanément les tickets précédents.
Considérations de performance
- Optimiser la vitesse d’indexation : Ajoutez de nouveaux documents de façon incrémentale pendant les heures creuses afin de maintenir une faible latence.
- Directives d’utilisation des ressources : Surveillez le CPU et la mémoire, surtout lors de la mise à l’échelle du nombre de nœuds.
- Gestion de la mémoire Java : Ajustez les paramètres du tas JVM en fonction de votre charge de travail (par ex.,
-Xmx2gpour des index de taille moyenne).
Conclusion
En suivant ce guide, vous avez appris comment configurer un réseau de recherche, créer un index consultable, effectuer une recherche de texte, et supprimer l’index des documents en utilisant GroupDocs.Search pour Java. Ces capacités permettent une récupération de documents rapide et fiable dans des environnements distribués.
Étapes suivantes
- Expérimentez différentes configurations de nœuds pour trouver l’équilibre optimal pour votre charge de travail.
- Approfondissez les options d’indexation avancées telles que les analyseurs personnalisés et le réglage de la pertinence.
- Explorez l’intégration avec d’autres produits GroupDocs pour un traitement de documents de bout en bout.
Questions fréquentes
Q : Quel est le cas d’utilisation principal de GroupDocs.Search pour Java ?
R : Il fournit une recherche en texte intégral à travers de nombreux formats de documents, vous permettant d’effectuer une recherche de texte dans de grands référentiels.
Q : Comment améliorer la vitesse de recherche dans un grand réseau ?
R : Déployez des nœuds supplémentaires, ajustez le tas JVM, et planifiez l’indexation pendant les périodes de faible trafic pour optimiser les performances de recherche.
Q : Est‑il possible de supprimer un seul document sans ré‑indexer l’ensemble de la collection ?
R : Oui, utilisez l’API delete documents index comme illustré dans l’exemple de code pour retirer des fichiers spécifiques.
Q : Ai‑je besoin d’une licence pour le développement ?
R : Une licence d’essai gratuite suffit pour les tests ; une licence commerciale est requise pour les déploiements en production.
Q : Puis‑je indexer des PDF, des fichiers Word et des e‑mails ensemble ?
R : Absolument — GroupDocs.Search prend en charge un large éventail de formats dès le départ.
Dernière mise à jour : 2026-01-16
Testé avec : GroupDocs.Search pour Java 25.4
Auteur : GroupDocs