Jak nakonfigurovat vyhledávání pomocí GroupDocs.Search v Javě

V dnešním rychle se rozvíjejícím digitálním světě může jak nakonfigurovat vyhledávání efektivně rozhodnout o úspěchu projektu. Ať už pracujete s tisíci smluv, výzkumných prací nebo interních zpráv, dobře navržená vyhledávací síť vám umožní během několika sekund najít správný dokument. Tento tutoriál vás provede konfigurací vyhledávací sítě, nasazením uzlů a povolením aktualizací vyhledávání v reálném čase s GroupDocs.Search pro Javu.

Rychlé odpovědi

  • Jaký je hlavní účel vyhledávací sítě? Rozdělit indexování a zpracování dotazů mezi více uzly pro škálovatelnost a rychlost.
  • Která verze knihovny je požadována? GroupDocs.Search for Java v25.4 nebo novější.
  • Potřebuji licenci? Bezplatná zkušební verze stačí pro hodnocení; pro produkční nasazení je vyžadována komerční licence.
  • Jak jsou řešeny aktualizace v reálném čase? Přihlášením k událostem uzlu, které se spouštějí při změnách indexování.
  • Mohu během provozu přidat nové složky s dokumenty? Ano — použijte metodu addDirectories indexeru.

Co znamená „jak nakonfigurovat vyhledávání“ v kontextu GroupDocs?

Konfigurace vyhledávání znamená nastavení vyhledávací sítě, která ví, kde se vaše dokumenty nacházejí, jak uzly komunikují a jak je koordinováno indexování. Jakmile je síť nakonfigurována, můžete přidávat nebo odebírat uzly bez výpadku, což zajišťuje nepřetržitý přístup k aktuálním výsledkům vyhledávání.

Proč používat GroupDocs.Search pro Javu?

  • Škálovatelnost: Rozdělit pracovní zátěž mezi více strojů.
  • Aktualizace v reálném čase: Okamžitě odrazit nově indexované soubory po celé síti.
  • Jednoduchá integrace: Jednoduché nastavení Maven a přehledná Java API.
  • Podniková úroveň: Zvládá velké korpusy a složité dotazové scénáře.

Předpoklady

  • Java Development Kit (JDK) 8+ nainstalován.
  • Maven pro správu závislostí.
  • Základní znalost Javy, Maven a konceptů vyhledávání.

Nastavení GroupDocs.Search pro Javu

Maven závislost

Přidejte úložiště a závislost do vašeho pom.xml:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

Přímé stažení: Knihovnu můžete také získat z GroupDocs.Search for Java releases.

Získání licence

  • Bezplatná zkušební verze: Získejte zkušební licenci pro vyzkoušení všech funkcí.
  • Dočasná licence: Požádejte o prodloužené zkušební období.
  • Komerční licence: Vyžadována pro produkční nasazení.

Basic Initialization

import com.groupdocs.search.Configuration;
// Initialize configuration with your document path and port
String basePath = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/Scaling/GettingDocumentsInNetwork/";
int basePort = 49112;

Configuration config = new Configuration(basePath, basePort);

Jak nakonfigurovat vyhledávací síť v Javě

Krok 1: Importovat požadované balíčky

import com.groupdocs.search.scaling.ConfiguringSearchNetwork;
import com.groupdocs.search.scaling.Configuration;

Krok 2: Konfigurovat síť

String basePath = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/Scaling/GettingDocumentsInNetwork/";
int basePort = 49112;

Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
  • Parametry: basePath ukazuje na složku s vašimi dokumenty; basePort je TCP port používaný pro komunikaci uzlů.

Nasazení uzlů vyhledávací sítě

Krok 1: Importovat balíček nasazení

import com.groupdocs.search.scaling.SearchNetworkDeployment;
import com.groupdocs.search.scaling.SearchNetworkNode;

Krok 2: Nasadit uzly

String[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
SearchNetworkNode masterNode = nodes[0]; // Designate the first node as the master node
  • Hlavní uzel: Koordinuje vyhledávání a indexování napříč všemi uzly.

Přihlášení k událostem uzlu pro aktualizace vyhledávání v reálném čase

Krok 1: Importovat balíček událostí

import com.groupdocs.search.scaling.SearchNetworkNodeEvents;

Krok 2: Přihlásit se k událostem hlavního uzlu

SearchNetworkNodeEvents.subscribe(masterNode);
  • Zpracování událostí: Umožňuje aktualizace vyhledávání v reálném čase kdykoli jsou dokumenty přidány, aktualizovány nebo odebrány.

Přidávání složek pro indexování

Krok 1: Importovat balíček indexeru

import com.groupdocs.search.examples.Utils;
import com.groupdocs.search.scaling.Indexer;

Krok 2: Přidat složky s dokumenty

Indexer indexer = masterNode.getIndexer();
indexer.addDirectories("YOUR_DOCUMENT_DIRECTORY/DocumentsPath");
  • Dynamické indexování: Přidejte tolik složek, kolik potřebujete; síť je automaticky indexuje.

Získávání indexovaných dokumentů

Krok 1: Importovat balíček vyhledávače

import com.groupdocs.search.scaling.Searcher;
import com.groupdocs.search.scaling.NetworkDocumentInfo;

Krok 2: Získat informace o dokumentu

Searcher searcher = masterNode.getSearcher();
int[] shardIndices = masterNode.getShardIndices();

for (int i = 0; i < shardIndices.length; i++) {
    int shardIndex = shardIndices[i];
    NetworkDocumentInfo[] infos = searcher.getIndexedDocuments(shardIndex);

    for (NetworkDocumentInfo info : infos) {
        int nodeIndex = masterNode.getNodeIndex(info.getShardIndex());
        String filePath = info.getDocumentInfo().getFilePath();

        // Retrieve and process document attributes
        String[] attributes = indexer.getAttributes(filePath);
        
        NetworkDocumentInfo[] items = searcher.getIndexedDocumentItems(info);
        for (NetworkDocumentInfo item : items) {
            // Process each indexed item
        }
    }
}
  • Správa shardů: Efektivně zpracovává velké datové sady rozdělením dokumentů mezi shardy.

Praktické aplikace

  1. Podniková správa dokumentů: Centralizovat vyhledávání napříč miliony souborů.
  2. Právnické firmy: Rychle najít soudní spisy, smlouvy a důkazy.
  3. Akademický výzkum: Indexovat časopisy a práce pro okamžité získání.

Úvahy o výkonu

  • Optimalizace indexování: Plánovat pravidelné obnovení indexu a odstraňovat zastaralá data.
  • Správa paměti: Monitorovat haldu JVM, zejména při práci s velkými shardy.
  • Plánování škálovatelnosti: Přidávejte uzly s růstem korpusu; síť automaticky vyvažuje zátěž.

Časté problémy a řešení

ProblémPříčinaŘešení
Uzly se nemohou připojitKonflikt portu nebo firewallZajistěte, aby basePort byl otevřený a nepoužívaný jinými službami
Index se neaktualizujeChybí přihlášení k událostemZavolejte SearchNetworkNodeEvents.subscribe(masterNode) po nasazení
Chyby nedostatku pamětiPříliš mnoho velkých shardů načtenýchZmenšete velikost shardu nebo zvýšte haldu JVM (-Xmx flag)

Často kladené otázky

Q: Mohu po spuštění sítě přidat nové složky?
A: Ano — použijte metodu indexer.addDirectories(); přihlášené události budou v reálném čase šířit aktualizace.

Q: Jak mohu sledovat stav uzlu?
A: Každý SearchNetworkNode poskytuje statusové API; integrujte je s vaším preferovaným monitorovacím nástrojem.

Q: Je možné spustit hlavní uzel na samostatném stroji?
A: Rozhodně. Jen zajistěte, aby všechny uzly používaly stejný basePort a mohly se navzájem dosáhnout po síti.

Q: Jaké formáty souborů jsou podporovány?
A: GroupDocs.Search podporuje PDF, Word, Excel, PowerPoint, prostý text a mnoho dalších formátů přímo z krabice.

Q: Musím po přidání nového uzlu síť restartovat?
A: Ne — uzly lze přidávat nebo odebírat dynamicky; hlavní uzel automaticky přerozdělí shardy.

Závěr

Nyní máte kompletní, krok‑za‑krokem pochopení jak nakonfigurovat vyhledávání pomocí GroupDocs.Search pro Javu, od počátečního nastavení po aktualizace v reálném čase a distribuované indexování. Použijte tyto vzory k vytvoření rychlých, škálovatelných a spolehlivých řešení vyhledávání dokumentů pro jakýkoli průmysl.


Poslední aktualizace: 2026-01-08
Testováno s: GroupDocs.Search for Java 25.4
Autor: GroupDocs