Textsuche mit GroupDocs.Search für Java durchführen

Leistungsoptimierung

Wie man ein Suchnetzwerk mit GroupDocs.Search für Java implementiert und optimiert

Einleitung

In der heutigen datengetriebenen Welt ist die Fähigkeit, perform text search schnell über massive Dokumentensammlungen hinweg durchzuführen, ein Wettbewerbsvorteil. Egal, ob Sie ein internes Wissensdatenbank, ein Rechtsfall‑Repository oder einen E‑Commerce‑Produktkatalog aufbauen, ein gut abgestimmtes Suchnetzwerk kann die Benutzerzufriedenheit erheblich steigern. In diesem Leitfaden lernen Sie, wie Sie set up search network, create searchable index, optimize search performance und bei Bedarf sogar delete documents index durchführen – alles mit GroupDocs.Search für Java.

Was Sie lernen werden

  • Konfiguration eines Suchnetzwerks mit GroupDocs.Search
  • Bereitstellung von Knoten im Netzwerk
  • Effizientes Indexieren von Dokumenten (index documents java)
  • Durchführen von Textsuchen in Ihrem Netzwerk (perform text search)
  • Löschen bestimmter Dokumente aus dem Index (delete documents index)

Lassen Sie uns eintauchen, wie Sie diese Funktionen nutzen können, um ein optimiertes Sucherlebnis zu schaffen.

Schnelle Antworten

  • What is the main purpose of GroupDocs.Search for Java? Es bietet Volltextsuche über viele Dokumentformate hinweg.
  • How do I perform text search in a distributed environment? Ein Suchnetzwerk bereitstellen, Dokumente auf einem Master‑Knoten indexieren und dann jeden Knoten abfragen.
  • Can I delete documents from the index without rebuilding it? Ja, verwenden Sie die Delete‑API, um ausgewählte Dateien zu entfernen.
  • What Java version is required? JDK 8 oder höher.
  • Is a license needed for production? Eine gültige GroupDocs.Search‑Lizenz ist erforderlich; ein kostenloser Testzeitraum ist verfügbar.

Eine Textsuche bedeutet, einen Volltext‑Index abzufragen, um Dokumente zu erhalten, die die angegebenen Schlüsselwörter oder Phrasen enthalten. GroupDocs.Search erstellt einen invertierten Index, der diese Look‑ups extrem schnell macht, selbst bei Tausenden von Dateien.

Warum ein Suchnetzwerk einrichten?

Ein Suchnetzwerk verteilt Indexierungs‑ und Abfrage‑Workloads über mehrere Knoten, sodass Sie optimize search performance, horizontal skalieren und hohe Verfügbarkeit gewährleisten können. Diese Architektur ist ideal für Unternehmens‑Dokumentenrepositorien, bei denen Latenz und Durchsatz wichtig sind.

Voraussetzungen

  • Required Libraries: GroupDocs.Search for Java version 25.4 (latest).
  • Environment: Java JDK 8+, Maven.
  • Knowledge: Grundlegende Java‑Programmierung und Vertrautheit mit Netzwerk‑Konzepten.

Einrichtung von GroupDocs.Search für Java

Um zu beginnen, integrieren Sie GroupDocs.Search in Ihr Java‑Projekt mit dem folgenden Setup:

Maven‑Setup

Fügen Sie das Repository und die Abhängigkeit zu Ihrer pom.xml‑Datei hinzu:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

Direkter Download

Alternativ können Sie download the latest version directly from GroupDocs.

Lizenzbeschaffung

GroupDocs bietet eine kostenlose Testversion an, mit der Sie die Funktionen vor dem Kauf evaluieren können. Sie können eine temporäre Lizenz erhalten, indem Sie den Schritten auf ihrer purchase page folgen. Dies ermöglicht die volle Funktionalität während Ihrer Testphase.

Grundlegende Initialisierung und Einrichtung

Initialisieren Sie GroupDocs.Search in Ihrer Java‑Anwendung mit:

import com.groupdocs.search.*;

class SearchNetworkSetup {
    public static void main(String[] args) {
        Index index = new Index("path/to/index/directory");
        // Additional configuration can be set here.
    }
}

Implementierungsleitfaden

Konfiguration des Suchnetzwerks

Overview: Establish a base path and port for your search network, allowing nodes to communicate effectively.

Schritt 1: Basis‑Konfiguration definieren
import com.groupdocs.search.options.*;
import com.groupdocs.search.scaling.configuring.*;

String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104; // Change if necessary.
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
  • Parameters:
    • basePath: Directory path for network operations.
    • basePort: Port number used by the search network.
Schritt 2: Fehlersuche

Stellen Sie sicher, dass Ihr angegebener Port nicht durch Firewall‑Einstellungen blockiert ist oder bereits von einer anderen Anwendung verwendet wird. Passen Sie ihn bei Bedarf an, um Konflikte zu vermeiden.

Bereitstellung von Suchnetzwerk‑Knoten

Overview: Using your configuration, deploy nodes across your network for distributed indexing and searching.

import com.groupdocs.search.scaling.*;

String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);

// Nodes are now deployed and ready for further operations.
  • Key Configuration Options:
    • Base Path & Port: These values should match those used in your initial configuration to ensure consistency.

Dokumente indexieren (create searchable index)

Overview: Add documents to the search index efficiently using a master node.

import com.groupdocs.search.scaling.*;

String documentsPath = "YOUR_DOCUMENT_DIRECTORY/path/to/documents";
SearchNetworkNode masterNode = nodes[0];
IndexingDocuments.addDirectories(masterNode, documentsPath);
  • Purpose:
    • masterNode: The primary node managing document indexing.
    • documentsPath: Path to the directory containing documents.
Tipps zur Fehlersuche

Vergewissern Sie sich, dass Ihre Dokumentpfade korrekt und zugänglich sind. Stellen Sie sicher, dass die Berechtigungen das Lesen aus diesen Verzeichnissen erlauben.

Overview: Perform comprehensive text searches across your indexed network.

import com.groupdocs.search.scaling.*;

String query = "nulla";
SearchNetworkNode masterNode = nodes[0];
TextSearchInNetwork.searchAll(masterNode, query, false);
  • Parameters:
    • query: The text you’re searching for.
    • masterNode: Node conducting the search.

Dokumente aus dem Index löschen (delete documents index)

Overview: Remove specific documents from your index using their file paths.

import com.groupdocs.search.scaling.*;

SearchNetworkNode node = nodes[0];
String[] filePaths = {
    "YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.pdf",
    "YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.docx"
};
deleteDocuments(node, filePaths);

void deleteDocuments(SearchNetworkNode node, String... filePaths) {
    Indexer indexer = node.getIndexer();
    DeleteOptions options = new DeleteOptions();
    indexer.delete(filePaths, options);
}
  • Method Purpose:
    • node: The target node for deletion operations.
    • filePaths: Paths of documents to be removed from the index.
Fehlersuche

Stellen Sie sicher, dass die Dateipfade exakt sind und die Dateien in Ihrem Verzeichnis existieren. Bei anhaltenden Problemen prüfen Sie die Netzwerk‑Berechtigungen und die Konnektivität.

Praktische Anwendungen

  1. Unternehmens‑Dokumentenmanagement: Interne Wissensabfrage optimieren.
  2. Rechtsfallanalyse: Schnell relevante Falldateien über mehrere Repositorien hinweg finden.
  3. E‑Commerce‑Plattformen: Die Produktsuche beschleunigen, indem Beschreibungen und Bewertungen indexiert werden.
  4. Akademische Forschung: Große digitale Bibliotheken von Arbeiten und Abschlussarbeiten effizient durchsuchen.
  5. Kundensupport‑Systeme: Reaktionszeit verkürzen, indem Agenten sofort frühere Tickets durchsuchen können.

Leistungsüberlegungen

  • Indexierungsgeschwindigkeit optimieren: Neue Dokumente schrittweise während Nebenzeiten hinzufügen, um die Latenz gering zu halten.
  • Richtlinien zur Ressourcennutzung: CPU und Speicher überwachen, besonders beim Skalieren der Knotenzahl.
  • Java‑Speicherverwaltung: JVM‑Heap‑Einstellungen basierend auf Ihrer Arbeitslast anpassen (z. B. -Xmx2g für mittelgroße Indizes).

Fazit

Durch die Befolgung dieses Leitfadens haben Sie gelernt, wie Sie set up search network, create searchable index, perform text search und delete documents index mit GroupDocs.Search für Java nutzen. Diese Fähigkeiten ermöglichen eine schnelle, zuverlässige Dokumentenabfrage in verteilten Umgebungen.

Next Steps

  • Experimentieren Sie mit verschiedenen Knotenkonfigurationen, um das optimale Gleichgewicht für Ihre Arbeitslast zu finden.
  • Vertiefen Sie sich in erweiterte Indexierungsoptionen wie benutzerdefinierte Analyzer und Relevanz‑Feinabstimmung.
  • Erkunden Sie die Integration mit anderen GroupDocs‑Produkten für eine End‑zu‑End‑Dokumentenverarbeitung.

Häufig gestellte Fragen

Q: Was ist der primäre Anwendungsfall für GroupDocs.Search für Java?
A: Es bietet Volltextsuche über viele Dokumentformate hinweg, sodass Sie perform text search in großen Repositorien durchführen können.

Q: Wie kann ich die Suchgeschwindigkeit in einem großen Netzwerk verbessern?
A: Zusätzliche Knoten bereitstellen, den JVM‑Heap abstimmen und die Indexierung während Niedrigverkehrszeiten planen, um optimize search performance zu erreichen.

Q: Ist es möglich, ein einzelnes Dokument zu löschen, ohne die gesamte Sammlung neu zu indexieren?
A: Ja, verwenden Sie die delete documents index‑API wie im Code‑Beispiel gezeigt, um bestimmte Dateien zu entfernen.

Q: Benötige ich eine Lizenz für die Entwicklung?
A: Eine kostenlose Testlizenz reicht für Tests aus; für Produktionsumgebungen ist eine kommerzielle Lizenz erforderlich.

Q: Kann ich PDFs, Word‑Dateien und E‑Mails gemeinsam indexieren?
A: Absolut – GroupDocs.Search unterstützt von Haus aus ein breites Spektrum an Formaten.

Last Updated: 2026-01-16
Tested With: GroupDocs.Search for Java 25.4
Author: GroupDocs