Proveďte vyhledávání textu pomocí GroupDocs.Search pro Java
Optimalizace výkonu
Jak implementovat a optimalizovat vyhledávací síť pomocí GroupDocs.Search pro Java
Úvod
V dnešním datově řízeném světě je schopnost provádět vyhledávání textu rychle napříč obrovskými kolekcemi dokumentů konkurenční výhodou. Ať už budujete interní znalostní bázi, úložiště právních případů nebo katalog produktů pro e‑commerce, dobře vyladěná vyhledávací síť může výrazně zlepšit spokojenost uživatelů. V tomto průvodci se naučíte, jak nastavit vyhledávací síť, vytvořit prohledávatelný index, optimalizovat výkon vyhledávání a dokonce odstranit index dokumentů, pokud je to potřeba – vše pomocí GroupDocs.Search pro Java.
Co se naučíte
- Konfigurace vyhledávací sítě pomocí GroupDocs.Search
- Nasazení uzlů v síti
- Efektivní indexování dokumentů (
index documents java) - Provádění textových vyhledávání napříč vaší sítí (
perform text search) - Odstraňování konkrétních dokumentů z indexu (
delete documents index)
Ponořme se do toho, jak můžete využít tyto funkce k vytvoření optimalizovaného vyhledávacího zážitku.
Rychlé odpovědi
- Jaký je hlavní účel GroupDocs.Search pro Java? Poskytuje full‑textové vyhledávání napříč mnoha formáty dokumentů.
- Jak provést vyhledávání textu v distribuovaném prostředí? Nasadíte vyhledávací síť, indexujete dokumenty na hlavním uzlu a poté dotazujete libovolný uzel.
- Mohu odstranit dokumenty z indexu bez jeho přestavby? Ano, použijte Delete API k odstranění vybraných souborů.
- Jaká verze Javy je požadována? JDK 8 nebo vyšší.
- Je pro produkci potřeba licence? Je vyžadována platná licence GroupDocs.Search; k dispozici je bezplatná zkušební verze.
Co je „perform text search“?
Provádění textového vyhledávání znamená dotazování full‑textového indexu za účelem získání dokumentů, které obsahují zadaná klíčová slova nebo fráze. GroupDocs.Search vytváří invertovaný index, který umožňuje tyto vyhledávání provádět extrémně rychle, i napříč tisíci soubory.
Proč nastavit vyhledávací síť?
Vyhledávací síť rozděluje úlohy indexování a dotazování mezi více uzlů, což vám umožní optimalizovat výkon vyhledávání, horizontálně škálovat a udržovat vysokou dostupnost. Tato architektura je ideální pro podnikovou úroveň úložišť dokumentů, kde jsou důležité latence a propustnost.
Požadavky
- Požadované knihovny: GroupDocs.Search pro Java verze 25.4 (nejnovější).
- Prostředí: Java JDK 8+, Maven.
- Znalosti: Základní programování v Javě a znalost síťových konceptů.
Nastavení GroupDocs.Search pro Java
Pro začátek integrujte GroupDocs.Search do svého Java projektu pomocí následujícího nastavení:
Maven nastavení
Přidejte repozitář a závislost do souboru pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Přímé stažení
Alternativně můžete stáhnout nejnovější verzi přímo od GroupDocs.
Získání licence
GroupDocs nabízí bezplatnou zkušební verzi, která vám umožní vyzkoušet funkce před zakoupením. Dočasnou licenci můžete získat podle kroků na jejich stránce nákupu. To vám během testovací fáze umožní plnou funkčnost.
Základní inicializace a nastavení
Inicializujte GroupDocs.Search ve své Java aplikaci pomocí:
import com.groupdocs.search.*;
class SearchNetworkSetup {
public static void main(String[] args) {
Index index = new Index("path/to/index/directory");
// Additional configuration can be set here.
}
}
Průvodce implementací
Konfigurace vyhledávací sítě
Přehled: Nastavte základní cestu a port pro vaši vyhledávací síť, aby uzly mohly efektivně komunikovat.
Krok 1: Definujte základní konfiguraci
import com.groupdocs.search.options.*;
import com.groupdocs.search.scaling.configuring.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104; // Change if necessary.
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
- Parametry:
basePath: Cesta ke složce pro operace sítě.basePort: Číslo portu používaného vyhledávací sítí.
Krok 2: Řešení problémů
Ujistěte se, že zvolený port není blokován nastavením firewallu ani používán jinou aplikací. Podle potřeby jej upravte, aby nedocházelo ke konfliktům.
Nasazení uzlů vyhledávací sítě
Přehled: Pomocí vaší konfigurace nasadíte uzly po celé síti pro distribuované indexování a vyhledávání.
import com.groupdocs.search.scaling.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
// Nodes are now deployed and ready for further operations.
- Klíčové konfigurační možnosti:
- Base Path & Port: Tyto hodnoty by měly odpovídat těm použitým v počáteční konfiguraci pro zajištění konzistence.
Indexování dokumentů (create searchable index)
Přehled: Přidejte dokumenty do vyhledávacího indexu efektivně pomocí hlavního uzlu.
import com.groupdocs.search.scaling.*;
String documentsPath = "YOUR_DOCUMENT_DIRECTORY/path/to/documents";
SearchNetworkNode masterNode = nodes[0];
IndexingDocuments.addDirectories(masterNode, documentsPath);
- Účel:
masterNode: Primární uzel spravující indexování dokumentů.documentsPath: Cesta ke složce obsahující dokumenty.
Tipy pro řešení problémů
Ověřte, že cesty k dokumentům jsou správné a přístupné. Ujistěte se, že oprávnění umožňují čtení z těchto složek.
Vyhledávání textu v síti (perform text search)
Přehled: Proveďte komplexní textová vyhledávání napříč vaším indexovaným sítí.
import com.groupdocs.search.scaling.*;
String query = "nulla";
SearchNetworkNode masterNode = nodes[0];
TextSearchInNetwork.searchAll(masterNode, query, false);
- Parametry:
query: Text, který hledáte.masterNode: Uzlu provádějícího vyhledávání.
Odstraňování dokumentů z indexu (delete documents index)
Přehled: Odstraňte konkrétní dokumenty z indexu pomocí jejich cest k souborům.
import com.groupdocs.search.scaling.*;
SearchNetworkNode node = nodes[0];
String[] filePaths = {
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.pdf",
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.docx"
};
deleteDocuments(node, filePaths);
void deleteDocuments(SearchNetworkNode node, String... filePaths) {
Indexer indexer = node.getIndexer();
DeleteOptions options = new DeleteOptions();
indexer.delete(filePaths, options);
}
- Účel metody:
node: Cílový uzel pro operace odstraňování.filePaths: Cesty k dokumentům, které mají být z indexu odstraněny.
Řešení problémů
Ujistěte se, že cesty k souborům jsou přesné a že soubory ve vašem adresáři existují. Pokud problémy přetrvávají, zkontrolujte síťová oprávnění a konektivitu.
Praktické aplikace
- Enterprise Document Management: Zefektivněte interní vyhledávání znalostí.
- Legal Case Analysis: Rychle najděte relevantní soubory případů napříč více úložišti.
- E‑commerce Platforms: Zvyšte rychlost vyhledávání produktů indexováním popisů a recenzí.
- Academic Research: Efektivně prohledávejte velké digitální knihovny článků a diplomových prací.
- Customer Support Systems: Snižte dobu odezvy tím, že umožníte operátorům okamžitě prohledávat staré tickety.
Úvahy o výkonu
- Optimalizujte rychlost indexování: Postupně přidávejte nové dokumenty během mimošpičkových hodin, aby byla latence nízká.
- Pokyny pro využití zdrojů: Sledujte CPU a paměť, zejména při škálování počtu uzlů.
- Správa paměti v Javě: Nastavte parametry haldy JVM podle zatížení (např.
-Xmx2gpro středně velké indexy).
Závěr
Podle tohoto průvodce jste se naučili, jak nastavit vyhledávací síť, vytvořit prohledávatelný index, provádět vyhledávání textu a odstraňovat index dokumentů pomocí GroupDocs.Search pro Java. Tyto možnosti umožňují rychlé a spolehlivé získávání dokumentů v distribuovaných prostředích.
Další kroky
- Experimentujte s různými konfiguracemi uzlů, abyste našli optimální rovnováhu pro své zatížení.
- Prozkoumejte pokročilé možnosti indexování, jako jsou vlastní analyzátory a ladění relevance.
- Prozkoumejte integraci s dalšími produkty GroupDocs pro kompletní zpracování dokumentů.
Často kladené otázky
Q: What is the primary use case for GroupDocs.Search for Java?
A: Poskytuje full‑textové vyhledávání napříč mnoha formáty dokumentů, což vám umožní provádět vyhledávání textu ve velkých úložištích.
Q: How can I improve search speed in a large network?
A: Nasadíte další uzly, vyladíte haldu JVM a naplánujete indexování během období nízkého provozu, abyste optimalizovali výkon vyhledávání.
Q: Is it possible to delete a single document without re‑indexing the whole collection?
A: Ano, použijte API delete documents index, jak je ukázáno v příkladu kódu, k odstranění konkrétních souborů.
Q: Do I need a license for development?
A: Bezplatná zkušební licence stačí pro testování; pro produkční nasazení je vyžadována komerční licence.
Q: Can I index PDFs, Word files, and emails together?
A: Rozhodně—GroupDocs.Search podporuje širokou škálu formátů přímo z krabice.
Poslední aktualizace: 2026-01-16
Testováno s: GroupDocs.Search for Java 25.4
Autor: GroupDocs