Comment créer un index avec GroupDocs.Search Java et activer la recherche homophone
Dans les entreprises modernes, comment créer un index rapidement et de façon fiable peut faire la différence entre trouver une information critique ou la manquer complètement. Que vous manipuliez des contrats juridiques, des retours clients ou des rapports internes, un index de recherche bien construit, propulsé par GroupDocs.Search pour Java, vous fournit des résultats instantanés et précis. Dans ce tutoriel, nous parcourrons l’ensemble du processus — de la configuration de la bibliothèque, à la création de l’index, à l’ajout de documents à l’index, et enfin à l’activation de la recherche homophone pour des requêtes plus intelligentes.
Réponses rapides
- Quelle est la première étape pour créer un index ? Initialise l’objet
Indexavec le chemin d’un dossier. - Quelle méthode ajoute des fichiers à l’index ?
index.add(yourDocumentsFolder). - Comment activer la recherche homophone ? Définissez
options.setUseHomophoneSearch(true). - Ai‑je besoin d’une licence ? Une licence d’essai gratuite ou temporaire suffit pour l’évaluation.
- Quelle version de Java est requise ? JDK 8 ou supérieur.
Qu’est‑ce qu’un index dans GroupDocs.Search ?
Un index est un magasin de données structuré qui associe les mots à leurs emplacements dans votre collection de documents, permettant des recherches ultra‑rapides similaires à un index de livre. Créer un index constitue la base de toute application axée sur la recherche.
Pourquoi activer la recherche homophone ?
La recherche homophone élargit le langage de requête pour inclure les mots qui sonnent de façon similaire (par ex., « write » vs. « right »). Cela augmente le rappel dans les scénarios où les utilisateurs peuvent faire des fautes de frappe ou utiliser des orthographes alternatives, offrant des résultats plus complets sans effort supplémentaire.
Prérequis
- Java Development Kit 8 ou plus récent.
- Bibliothèque GroupDocs.Search for Java (disponible via Maven).
- Familiarité de base avec la syntaxe Java et la configuration de projet.
Configuration de GroupDocs.Search pour Java
Tout d’abord, ajoutez le dépôt Maven de GroupDocs.Search et la dépendance à votre pom.xml :
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Vous pouvez également télécharger la dernière version depuis les releases GroupDocs.Search for Java.
Acquisition de licence : GroupDocs propose une licence d’essai gratuite ou des licences temporaires pour l’évaluation. Pour acheter, visitez leur site officiel.
Initialisation et configuration de base
Créez une classe Java simple pour initialiser l’index de recherche :
import com.groupdocs.search.Index;
public class SearchSetup {
public static void main(String[] args) {
// Specify the path to store index files
String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\HomophoneSearch";
// Create an instance of Index
Index index = new Index(indexFolder);
System.out.println("Index created successfully!");
}
}
Comment créer un index avec GroupDocs.Search Java
Créer l’index est aussi simple que de pointer le constructeur Index vers un dossier où la bibliothèque pourra stocker ses fichiers internes.
Étape 1 : Définir le chemin de l’index
String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\HomophoneSearch";
Remplacez YOUR_DOCUMENT_DIRECTORY par le chemin absolu sur votre machine.
Étape 2 : Instancier l’objet Index
Index index = new Index(indexFolder);
Cette ligne crée l’index qui contiendra ensuite tout le contenu recherchable.
Comment ajouter des documents à l’index
Une fois l’index créé, vous devez le nourrir avec les documents que vous souhaitez rechercher.
Étape 1 : Pointer vers vos documents source
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY";
Ce dossier doit contenir les fichiers (PDF, DOCX, TXT, etc.) que vous souhaitez indexer.
Étape 2 : Ajouter tous les fichiers du dossier
index.add(documentsFolder);
La méthode add parcourt le répertoire de façon récursive et indexe chaque fichier pris en charge. C’est l’opération principale qui ajoute des documents à l’index.
Activation de la recherche homophone
Maintenant que l’index est rempli, vous pouvez activer le support homophone.
Étape 1 : Créer SearchOptions
import com.groupdocs.search.SearchOptions;
SearchOptions options = new SearchOptions();
Étape 2 : Activer la recherche homophone
options.setUseHomophoneSearch(true);
Activer ce drapeau indique au moteur de prendre en compte les équivalents phonétiques lors du traitement des requêtes.
Applications pratiques
- Gestion de documents juridiques – Trouver les contrats qui mentionnent « lease » même si l’utilisateur tape « leas ».
- Analyse des retours clients – Capturer les variantes comme « price » et « prise » dans les réponses aux enquêtes.
- Systèmes de gestion de contenu – Améliorer la recherche du site en faisant correspondre « write » avec « right ».
Considérations de performance
- Reconstruisez régulièrement l’index après des mises à jour massives de documents.
- Surveillez l’utilisation de la mémoire ; les grands index peuvent bénéficier d’un indexation incrémentale.
- Suivez les meilleures pratiques Java (par ex., gestion appropriée des exceptions, utilisation de try‑with‑resources) pour garder l’application stable.
Conclusion
Vous savez maintenant comment créer un index, comment ajouter des documents à l’index, et comment activer la recherche homophone avec GroupDocs.Search pour Java. Ces capacités vous permettent de construire des expériences de recherche rapides et intelligentes sur n’importe quel référentiel de documents.
Prochaines étapes
- Expérimentez avec des analyseurs personnalisés pour affiner la tokenisation.
- Combinez la recherche à facettes avec le support homophone pour un filtrage plus riche.
- Explorez l’API REST GroupDocs.Search pour des scénarios multiplateformes.
Section FAQ
- Qu’est‑ce qu’un index dans le contexte de GroupDocs.Search ?
- Un index est une structure de données qui permet une recherche rapide de documents, similaire à un index dans un livre.
- Comment mettre à jour mon index avec de nouveaux documents ?
- Utilisez la méthode
index.add()pour ajouter de nouveaux documents ou ré‑indexer les existants.
- Utilisez la méthode
- GroupDocs.Search peut‑il gérer de gros volumes de données ?
- Oui, il est conçu pour l’évolutivité et peut gérer efficacement de grands ensembles de données.
- Qu’est‑ce que les homophones dans la fonctionnalité de recherche ?
- Les homophones sont des mots qui se prononcent de façon similaire mais peuvent avoir des significations différentes, par ex., « write » et « right ».
- Comment dépanner les erreurs d’indexation ?
- Vérifiez les chemins de fichiers, assurez‑vous que les documents sont accessibles, et examinez les fichiers de log pour des messages d’erreur spécifiques.
Ressources
- Documentation
- API Reference
- Download Latest Version
- GitHub Repository
- Free Support Forum
- Temporary License
Last Updated: 2026-01-26
Tested With: GroupDocs.Search 25.4 for Java
Author: GroupDocs