Dokumente zum Index hinzufügen: Fall‑sensitive Suche in Java mit GroupDocs meistern

Das Abrufen der richtigen Information aus einer riesigen Dokumentensammlung ist eine Kernanforderung moderner Anwendungen. In diesem Leitfaden lernen Sie wie man Dokumente zum Index hinzufügt und fall‑sensitive Suchen mit GroupDocs.Search für Java durchführt. Egal, ob Sie ein Rechtsdokument‑Repository, einen E‑Commerce‑Katalog oder ein Content‑Management‑System aufbauen – präzise Suchergebnisse halten Nutzer zufrieden und Ihre Daten vertrauenswürdig.

Schnellantworten

  • Was ist der erste Schritt, um mit der Suche zu beginnen? Dokumente mit index.add(...) zu einem Index hinzufügen.
  • Wie aktiviert man die fall‑sensitive Suche? options.setUseCaseSensitiveSearch(true) setzen.
  • Kann ich über mehrere Verzeichnisse hinweg suchen? Ja – index.add() für jedes einzuschließende Verzeichnis aufrufen.
  • Welche Methode ermöglicht die Suche mit Objekten? SearchQuery.createWordQuery(...) verwenden.
  • Benötige ich eine Lizenz für Tests? Eine temporäre Lizenz ist für Testzwecke verfügbar.

Was bedeutet „Dokumente zum Index hinzufügen“?

Dokumente zum Index hinzuzufügen bedeutet, Ihre Quelldateien (PDFs, Word‑Dokumente, Klartext usw.) in GroupDocs.Search zu speisen, damit daraus eine durchsuchbare Datenstruktur aufgebaut wird. Sobald sie indiziert sind, kann die Engine schnelle Abfragen ausführen, einschließlich fall‑sensitiver Suchvorgänge.

Warum fall‑sensitive Suche in Java aktivieren?

  • Exakte Begriff‑Übereinstimmung – unterscheidet „Apple“ (das Unternehmen) von „apple“ (die Frucht).
  • Regulatorische Konformität – einige Branchen verlangen exakte Phrasen‑Übereinstimmung.
  • Verbesserte Relevanz – Nutzer erwarten häufig fall‑spezifische Ergebnisse in technischen oder juristischen Kontexten.

Voraussetzungen

  • JDK (empfohlen: Java 17 oder neuer)
  • Maven für das Abhängigkeits‑Management
  • Eine IDE wie IntelliJ IDEA oder Eclipse
  • Grundlegende Kenntnisse in der Java‑Programmierung

GroupDocs.Search für Java einrichten

Fügen Sie zunächst das GroupDocs‑Repository und die Abhängigkeit zu Ihrer pom.xml hinzu:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Alternativ können Sie die neueste Version direkt von GroupDocs.Search for Java releases herunterladen.

Lizenzierung

Um mit einer Testversion zu starten, besuchen Sie GroupDocs und holen Sie sich eine temporäre Lizenz. Diese ermöglicht das Testen aller Funktionen ohne Einschränkungen.

Wie man Dokumente zum Index hinzufügt – Text‑Abfrage‑Suche

Schritt 1: Einen Index erstellen und Ihre Dokumente hinzufügen

Erzeugen Sie einen Ordner, in dem die Indexdateien gespeichert werden, und fügen Sie anschließend das Quellverzeichnis hinzu, das die zu durchsuchenden Dokumente enthält.

String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInTextForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index

Pro‑Tipp: Sie können index.add() mehrfach aufrufen, um über mehrere Verzeichnisse hinweg in einem einzigen Index zu suchen.

Schritt 2: Fall‑sensitive Suche aktivieren

Konfigurieren Sie die Suchoptionen so, dass die Groß‑/Kleinschreibung berücksichtigt wird.

SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);

Schritt 3: Eine fall‑sensitive Text‑Abfrage ausführen

Führen Sie eine Abfrage aus, die „Advantages“ von „advantages“ unterscheidet.

String query = "Advantages";
SearchResult result = index.search(query, options);

// Output results
for (FoundDocument doc : result.getDocuments()) {
    System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}

Die Schleife gibt den vollständigen Pfad jedes Dokuments aus, das den exakt groß‑/kleingeschriebenen Begriff enthält.

Wie man Dokumente zum Index hinzufügt – Objekt‑Abfrage‑Suche

Objekt‑Abfragen bieten mehr Flexibilität, insbesondere wenn mehrere Kriterien kombiniert werden sollen.

Schritt 1: Einen zweiten Index initialisieren (optional)

Falls Sie objektbasierte Suchen getrennt halten möchten, erstellen Sie einen weiteren Index‑Ordner.

String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInObjectForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index

Schritt 2: Die fall‑sensitive Option erneut verwenden

Die gleiche SearchOptions‑Instanz funktioniert auch für Objekt‑Abfragen.

SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);

Schritt 3: Eine Objekt‑Abfrage erstellen und ausführen

Erzeugen Sie ein Word‑Query‑Objekt und übergeben Sie es an die Such‑Engine.

SearchQuery query = SearchQuery.createWordQuery("Advantages");
SearchResult result = index.search(query, options);

// Output results
for (FoundDocument doc : result.getDocuments()) {
    System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}

Die Verwendung von createWordQuery ermöglicht später die Kombination mit Phrase‑, Wildcard‑ oder Booleschen Abfragen für komplexere Szenarien.

Praktische Anwendungsfälle

  • Rechtsdokumenten‑Management: Abrufen von fall‑spezifischen Gesetzen, bei denen die Großschreibung entscheidend ist.
  • E‑Commerce‑Plattformen: Unterscheiden von Produkt‑SKUs wie „PRO‑X“ vs. „pro‑x“.
  • Content‑Management‑Systeme (CMS): Sicherstellen, dass Autoren exakte Überschriften oder Tags finden.

Leistungs‑Überlegungen

  • Index aktuell halten – neu hinzugefügte oder geänderte Dateien erneut indizieren.
  • Speichernutzung überwachen – große Korpora profitieren von inkrementellem Indexieren und richtiger JVM‑Heap‑Größe.
  • Java‑Garbage‑Collector nutzenIndex‑Objekte freigeben, sobald sie nicht mehr benötigt werden.

Häufige Probleme und Lösungen

ProblemLösung
useCaseSensitiveSearch scheint ignoriert zu werdenStellen Sie sicher, dass Sie die neueste Version von GroupDocs.Search verwenden und dass der Index nach Änderung der Option neu aufgebaut wurde.
Keine Ergebnisse für einen bekannten BegriffPrüfen Sie, ob die Groß‑/Kleinschreibung exakt übereinstimmt und das Dokument erfolgreich zum Index hinzugefügt wurde.
Suche in vielen Ordnern verlangsamt sichJeder Ordner einzeln mit index.add() hinzufügen und bei sehr großen Datenmengen das Index‑Sharding in Betracht ziehen.

Häufig gestellte Fragen

F: Wie gehe ich mit großen Datensätzen in GroupDocs.Search um?
A: Nutzen Sie Index‑Partitionierung, passen Sie die JVM‑Speichereinstellungen an und führen Sie regelmäßig eine Index‑Komprimierung durch, um die Leistung zu optimieren.

F: Kann ich gleichzeitig über mehrere Verzeichnisse suchen?
A: Ja – index.add() für jedes gewünschte Verzeichnis aufrufen und anschließend eine einzelne Abfrage gegen den kombinierten Index ausführen.

F: Welche typischen Stolperfallen gibt es bei fall‑sensitiven Suchen?
A: Das Vergessen, den Index nach dem Aktivieren von useCaseSensitiveSearch neu zu bauen, oder die falsche Groß‑/Kleinschreibung im Abfrage‑String.

F: Wie kann ich Such‑Fehler diagnostizieren?
A: Prüfen Sie die von GroupDocs.Search erzeugten Log‑Dateien auf Stack‑Traces und stellen Sie sicher, dass alle Maven‑Abhängigkeiten korrekt aufgelöst wurden.

F: Eignet sich GroupDocs.Search für Echtzeit‑Anwendungen?
A: Mit geeigneten Indexierungs‑Strategien (inkrementelle Updates und In‑Memory‑Caching) kann es nahezu Echtzeit‑Suchergebnisse liefern.

Ressourcen


Zuletzt aktualisiert: 2026-02-06
Getestet mit: GroupDocs.Search 25.4
Autor: GroupDocs