Dokumente zum Index hinzufügen: Fall‑sensitive Suche in Java mit GroupDocs meistern
Das Abrufen der richtigen Information aus einer riesigen Dokumentensammlung ist eine Kernanforderung moderner Anwendungen. In diesem Leitfaden lernen Sie wie man Dokumente zum Index hinzufügt und fall‑sensitive Suchen mit GroupDocs.Search für Java durchführt. Egal, ob Sie ein Rechtsdokument‑Repository, einen E‑Commerce‑Katalog oder ein Content‑Management‑System aufbauen – präzise Suchergebnisse halten Nutzer zufrieden und Ihre Daten vertrauenswürdig.
Schnellantworten
- Was ist der erste Schritt, um mit der Suche zu beginnen? Dokumente mit
index.add(...)zu einem Index hinzufügen. - Wie aktiviert man die fall‑sensitive Suche?
options.setUseCaseSensitiveSearch(true)setzen. - Kann ich über mehrere Verzeichnisse hinweg suchen? Ja –
index.add()für jedes einzuschließende Verzeichnis aufrufen. - Welche Methode ermöglicht die Suche mit Objekten?
SearchQuery.createWordQuery(...)verwenden. - Benötige ich eine Lizenz für Tests? Eine temporäre Lizenz ist für Testzwecke verfügbar.
Was bedeutet „Dokumente zum Index hinzufügen“?
Dokumente zum Index hinzuzufügen bedeutet, Ihre Quelldateien (PDFs, Word‑Dokumente, Klartext usw.) in GroupDocs.Search zu speisen, damit daraus eine durchsuchbare Datenstruktur aufgebaut wird. Sobald sie indiziert sind, kann die Engine schnelle Abfragen ausführen, einschließlich fall‑sensitiver Suchvorgänge.
Warum fall‑sensitive Suche in Java aktivieren?
- Exakte Begriff‑Übereinstimmung – unterscheidet „Apple“ (das Unternehmen) von „apple“ (die Frucht).
- Regulatorische Konformität – einige Branchen verlangen exakte Phrasen‑Übereinstimmung.
- Verbesserte Relevanz – Nutzer erwarten häufig fall‑spezifische Ergebnisse in technischen oder juristischen Kontexten.
Voraussetzungen
- JDK (empfohlen: Java 17 oder neuer)
- Maven für das Abhängigkeits‑Management
- Eine IDE wie IntelliJ IDEA oder Eclipse
- Grundlegende Kenntnisse in der Java‑Programmierung
GroupDocs.Search für Java einrichten
Fügen Sie zunächst das GroupDocs‑Repository und die Abhängigkeit zu Ihrer pom.xml hinzu:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Alternativ können Sie die neueste Version direkt von GroupDocs.Search for Java releases herunterladen.
Lizenzierung
Um mit einer Testversion zu starten, besuchen Sie GroupDocs und holen Sie sich eine temporäre Lizenz. Diese ermöglicht das Testen aller Funktionen ohne Einschränkungen.
Wie man Dokumente zum Index hinzufügt – Text‑Abfrage‑Suche
Schritt 1: Einen Index erstellen und Ihre Dokumente hinzufügen
Erzeugen Sie einen Ordner, in dem die Indexdateien gespeichert werden, und fügen Sie anschließend das Quellverzeichnis hinzu, das die zu durchsuchenden Dokumente enthält.
String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInTextForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index
Pro‑Tipp: Sie können
index.add()mehrfach aufrufen, um über mehrere Verzeichnisse hinweg in einem einzigen Index zu suchen.
Schritt 2: Fall‑sensitive Suche aktivieren
Konfigurieren Sie die Suchoptionen so, dass die Groß‑/Kleinschreibung berücksichtigt wird.
SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);
Schritt 3: Eine fall‑sensitive Text‑Abfrage ausführen
Führen Sie eine Abfrage aus, die „Advantages“ von „advantages“ unterscheidet.
String query = "Advantages";
SearchResult result = index.search(query, options);
// Output results
for (FoundDocument doc : result.getDocuments()) {
System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}
Die Schleife gibt den vollständigen Pfad jedes Dokuments aus, das den exakt groß‑/kleingeschriebenen Begriff enthält.
Wie man Dokumente zum Index hinzufügt – Objekt‑Abfrage‑Suche
Objekt‑Abfragen bieten mehr Flexibilität, insbesondere wenn mehrere Kriterien kombiniert werden sollen.
Schritt 1: Einen zweiten Index initialisieren (optional)
Falls Sie objektbasierte Suchen getrennt halten möchten, erstellen Sie einen weiteren Index‑Ordner.
String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInObjectForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index
Schritt 2: Die fall‑sensitive Option erneut verwenden
Die gleiche SearchOptions‑Instanz funktioniert auch für Objekt‑Abfragen.
SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);
Schritt 3: Eine Objekt‑Abfrage erstellen und ausführen
Erzeugen Sie ein Word‑Query‑Objekt und übergeben Sie es an die Such‑Engine.
SearchQuery query = SearchQuery.createWordQuery("Advantages");
SearchResult result = index.search(query, options);
// Output results
for (FoundDocument doc : result.getDocuments()) {
System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}
Die Verwendung von createWordQuery ermöglicht später die Kombination mit Phrase‑, Wildcard‑ oder Booleschen Abfragen für komplexere Szenarien.
Praktische Anwendungsfälle
- Rechtsdokumenten‑Management: Abrufen von fall‑spezifischen Gesetzen, bei denen die Großschreibung entscheidend ist.
- E‑Commerce‑Plattformen: Unterscheiden von Produkt‑SKUs wie „PRO‑X“ vs. „pro‑x“.
- Content‑Management‑Systeme (CMS): Sicherstellen, dass Autoren exakte Überschriften oder Tags finden.
Leistungs‑Überlegungen
- Index aktuell halten – neu hinzugefügte oder geänderte Dateien erneut indizieren.
- Speichernutzung überwachen – große Korpora profitieren von inkrementellem Indexieren und richtiger JVM‑Heap‑Größe.
- Java‑Garbage‑Collector nutzen –
Index‑Objekte freigeben, sobald sie nicht mehr benötigt werden.
Häufige Probleme und Lösungen
| Problem | Lösung |
|---|---|
useCaseSensitiveSearch scheint ignoriert zu werden | Stellen Sie sicher, dass Sie die neueste Version von GroupDocs.Search verwenden und dass der Index nach Änderung der Option neu aufgebaut wurde. |
| Keine Ergebnisse für einen bekannten Begriff | Prüfen Sie, ob die Groß‑/Kleinschreibung exakt übereinstimmt und das Dokument erfolgreich zum Index hinzugefügt wurde. |
| Suche in vielen Ordnern verlangsamt sich | Jeder Ordner einzeln mit index.add() hinzufügen und bei sehr großen Datenmengen das Index‑Sharding in Betracht ziehen. |
Häufig gestellte Fragen
F: Wie gehe ich mit großen Datensätzen in GroupDocs.Search um?
A: Nutzen Sie Index‑Partitionierung, passen Sie die JVM‑Speichereinstellungen an und führen Sie regelmäßig eine Index‑Komprimierung durch, um die Leistung zu optimieren.
F: Kann ich gleichzeitig über mehrere Verzeichnisse suchen?
A: Ja – index.add() für jedes gewünschte Verzeichnis aufrufen und anschließend eine einzelne Abfrage gegen den kombinierten Index ausführen.
F: Welche typischen Stolperfallen gibt es bei fall‑sensitiven Suchen?
A: Das Vergessen, den Index nach dem Aktivieren von useCaseSensitiveSearch neu zu bauen, oder die falsche Groß‑/Kleinschreibung im Abfrage‑String.
F: Wie kann ich Such‑Fehler diagnostizieren?
A: Prüfen Sie die von GroupDocs.Search erzeugten Log‑Dateien auf Stack‑Traces und stellen Sie sicher, dass alle Maven‑Abhängigkeiten korrekt aufgelöst wurden.
F: Eignet sich GroupDocs.Search für Echtzeit‑Anwendungen?
A: Mit geeigneten Indexierungs‑Strategien (inkrementelle Updates und In‑Memory‑Caching) kann es nahezu Echtzeit‑Suchergebnisse liefern.
Ressourcen
- Dokumentation: GroupDocs.Search Java Docs
- API‑Referenz: Java API Reference
- Download: Latest Releases
- GitHub‑Repository: GroupDocs.Search for Java
- Support‑Forum: GroupDocs Free Support
- Temporäre Lizenz: Acquire a Temporary License
Zuletzt aktualisiert: 2026-02-06
Getestet mit: GroupDocs.Search 25.4
Autor: GroupDocs