Jak nakonfigurovat vyhledávání pomocí GroupDocs.Search v Javě
V dnešním rychle se rozvíjejícím digitálním světě může jak nakonfigurovat vyhledávání efektivně rozhodnout o úspěchu projektu. Ať už pracujete s tisíci smluv, výzkumných prací nebo interních zpráv, dobře navržená vyhledávací síť vám umožní během několika sekund najít správný dokument. Tento tutoriál vás provede konfigurací vyhledávací sítě, nasazením uzlů a povolením aktualizací vyhledávání v reálném čase s GroupDocs.Search pro Javu.
Rychlé odpovědi
- Jaký je hlavní účel vyhledávací sítě? Rozdělit indexování a zpracování dotazů mezi více uzly pro škálovatelnost a rychlost.
- Která verze knihovny je požadována? GroupDocs.Search for Java v25.4 nebo novější.
- Potřebuji licenci? Bezplatná zkušební verze stačí pro hodnocení; pro produkční nasazení je vyžadována komerční licence.
- Jak jsou řešeny aktualizace v reálném čase? Přihlášením k událostem uzlu, které se spouštějí při změnách indexování.
- Mohu během provozu přidat nové složky s dokumenty? Ano — použijte metodu
addDirectoriesindexeru.
Co znamená „jak nakonfigurovat vyhledávání“ v kontextu GroupDocs?
Konfigurace vyhledávání znamená nastavení vyhledávací sítě, která ví, kde se vaše dokumenty nacházejí, jak uzly komunikují a jak je koordinováno indexování. Jakmile je síť nakonfigurována, můžete přidávat nebo odebírat uzly bez výpadku, což zajišťuje nepřetržitý přístup k aktuálním výsledkům vyhledávání.
Proč používat GroupDocs.Search pro Javu?
- Škálovatelnost: Rozdělit pracovní zátěž mezi více strojů.
- Aktualizace v reálném čase: Okamžitě odrazit nově indexované soubory po celé síti.
- Jednoduchá integrace: Jednoduché nastavení Maven a přehledná Java API.
- Podniková úroveň: Zvládá velké korpusy a složité dotazové scénáře.
Předpoklady
- Java Development Kit (JDK) 8+ nainstalován.
- Maven pro správu závislostí.
- Základní znalost Javy, Maven a konceptů vyhledávání.
Nastavení GroupDocs.Search pro Javu
Maven závislost
Přidejte úložiště a závislost do vašeho pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Přímé stažení: Knihovnu můžete také získat z GroupDocs.Search for Java releases.
Získání licence
- Bezplatná zkušební verze: Získejte zkušební licenci pro vyzkoušení všech funkcí.
- Dočasná licence: Požádejte o prodloužené zkušební období.
- Komerční licence: Vyžadována pro produkční nasazení.
Basic Initialization
import com.groupdocs.search.Configuration;
// Initialize configuration with your document path and port
String basePath = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/Scaling/GettingDocumentsInNetwork/";
int basePort = 49112;
Configuration config = new Configuration(basePath, basePort);
Jak nakonfigurovat vyhledávací síť v Javě
Krok 1: Importovat požadované balíčky
import com.groupdocs.search.scaling.ConfiguringSearchNetwork;
import com.groupdocs.search.scaling.Configuration;
Krok 2: Konfigurovat síť
String basePath = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/Scaling/GettingDocumentsInNetwork/";
int basePort = 49112;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
- Parametry:
basePathukazuje na složku s vašimi dokumenty;basePortje TCP port používaný pro komunikaci uzlů.
Nasazení uzlů vyhledávací sítě
Krok 1: Importovat balíček nasazení
import com.groupdocs.search.scaling.SearchNetworkDeployment;
import com.groupdocs.search.scaling.SearchNetworkNode;
Krok 2: Nasadit uzly
String[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
SearchNetworkNode masterNode = nodes[0]; // Designate the first node as the master node
- Hlavní uzel: Koordinuje vyhledávání a indexování napříč všemi uzly.
Přihlášení k událostem uzlu pro aktualizace vyhledávání v reálném čase
Krok 1: Importovat balíček událostí
import com.groupdocs.search.scaling.SearchNetworkNodeEvents;
Krok 2: Přihlásit se k událostem hlavního uzlu
SearchNetworkNodeEvents.subscribe(masterNode);
- Zpracování událostí: Umožňuje aktualizace vyhledávání v reálném čase kdykoli jsou dokumenty přidány, aktualizovány nebo odebrány.
Přidávání složek pro indexování
Krok 1: Importovat balíček indexeru
import com.groupdocs.search.examples.Utils;
import com.groupdocs.search.scaling.Indexer;
Krok 2: Přidat složky s dokumenty
Indexer indexer = masterNode.getIndexer();
indexer.addDirectories("YOUR_DOCUMENT_DIRECTORY/DocumentsPath");
- Dynamické indexování: Přidejte tolik složek, kolik potřebujete; síť je automaticky indexuje.
Získávání indexovaných dokumentů
Krok 1: Importovat balíček vyhledávače
import com.groupdocs.search.scaling.Searcher;
import com.groupdocs.search.scaling.NetworkDocumentInfo;
Krok 2: Získat informace o dokumentu
Searcher searcher = masterNode.getSearcher();
int[] shardIndices = masterNode.getShardIndices();
for (int i = 0; i < shardIndices.length; i++) {
int shardIndex = shardIndices[i];
NetworkDocumentInfo[] infos = searcher.getIndexedDocuments(shardIndex);
for (NetworkDocumentInfo info : infos) {
int nodeIndex = masterNode.getNodeIndex(info.getShardIndex());
String filePath = info.getDocumentInfo().getFilePath();
// Retrieve and process document attributes
String[] attributes = indexer.getAttributes(filePath);
NetworkDocumentInfo[] items = searcher.getIndexedDocumentItems(info);
for (NetworkDocumentInfo item : items) {
// Process each indexed item
}
}
}
- Správa shardů: Efektivně zpracovává velké datové sady rozdělením dokumentů mezi shardy.
Praktické aplikace
- Podniková správa dokumentů: Centralizovat vyhledávání napříč miliony souborů.
- Právnické firmy: Rychle najít soudní spisy, smlouvy a důkazy.
- Akademický výzkum: Indexovat časopisy a práce pro okamžité získání.
Úvahy o výkonu
- Optimalizace indexování: Plánovat pravidelné obnovení indexu a odstraňovat zastaralá data.
- Správa paměti: Monitorovat haldu JVM, zejména při práci s velkými shardy.
- Plánování škálovatelnosti: Přidávejte uzly s růstem korpusu; síť automaticky vyvažuje zátěž.
Časté problémy a řešení
| Problém | Příčina | Řešení |
|---|---|---|
| Uzly se nemohou připojit | Konflikt portu nebo firewall | Zajistěte, aby basePort byl otevřený a nepoužívaný jinými službami |
| Index se neaktualizuje | Chybí přihlášení k událostem | Zavolejte SearchNetworkNodeEvents.subscribe(masterNode) po nasazení |
| Chyby nedostatku paměti | Příliš mnoho velkých shardů načtených | Zmenšete velikost shardu nebo zvýšte haldu JVM (-Xmx flag) |
Často kladené otázky
Q: Mohu po spuštění sítě přidat nové složky?
A: Ano — použijte metodu indexer.addDirectories(); přihlášené události budou v reálném čase šířit aktualizace.
Q: Jak mohu sledovat stav uzlu?
A: Každý SearchNetworkNode poskytuje statusové API; integrujte je s vaším preferovaným monitorovacím nástrojem.
Q: Je možné spustit hlavní uzel na samostatném stroji?
A: Rozhodně. Jen zajistěte, aby všechny uzly používaly stejný basePort a mohly se navzájem dosáhnout po síti.
Q: Jaké formáty souborů jsou podporovány?
A: GroupDocs.Search podporuje PDF, Word, Excel, PowerPoint, prostý text a mnoho dalších formátů přímo z krabice.
Q: Musím po přidání nového uzlu síť restartovat?
A: Ne — uzly lze přidávat nebo odebírat dynamicky; hlavní uzel automaticky přerozdělí shardy.
Závěr
Nyní máte kompletní, krok‑za‑krokem pochopení jak nakonfigurovat vyhledávání pomocí GroupDocs.Search pro Javu, od počátečního nastavení po aktualizace v reálném čase a distribuované indexování. Použijte tyto vzory k vytvoření rychlých, škálovatelných a spolehlivých řešení vyhledávání dokumentů pro jakýkoli průmysl.
Poslední aktualizace: 2026-01-08
Testováno s: GroupDocs.Search for Java 25.4
Autor: GroupDocs