Přidání dokumentů do indexu a správa aliasů v GroupDocs.Search Java: Komplexní průvodce
V dnešním datově řízeném světě může schopnost add documents to index rychle a efektivně vyhledávat dokumenty poskytnout vašemu podniku skutečnou konkurenční výhodu. Ať už pracujete s tisíci smluv, produktovými katalogy nebo výzkumnými pracemi, GroupDocs.Search pro Java usnadňuje vytváření prohledávatelných indexů a jemné ladění dotazů pomocí slovníků aliasů.
Níže objevíte vše, co potřebujete k nastavení knihovny, add documents to index, správě aliasů a provádění výkonných vyhledávání – vše vysvětleno přátelským, krok‑za‑krokem stylem.
Rychlé odpovědi
- What is the first step to start using GroupDocs.Search? Přidejte Maven závislost a inicializujte objekt
Index. - How do I add documents to index? Zavolejte
index.add("<folder_path>")s adresářem, který obsahuje vaše soubory. - Can I create aliases for complex queries? Ano — použijte slovník aliasů k mapování krátkých tokenů na celé výrazy dotazu.
- Is it possible to export and import alias dictionaries? Rozhodně — použijte metody
exportDictionaryaimportDictionary. - What version of GroupDocs.Search is required? Verze 25.4 nebo novější (tutorial používá 25.4).
Co je „add documents to index“?
Přidání dokumentů do indexu znamená nahrání surových souborů (PDF, DOCX, TXT atd.) do GroupDocs.Search, aby knihovna mohla analyzovat jejich obsah a vytvořit prohledávatelnou datovou strukturu. Jakmile jsou indexovány, můžete spouštět rychlé full‑textové dotazy napříč všemi těmito dokumenty.
Proč spravovat aliasy?
Aliasům umožňují nahradit dlouhé, opakující se fragmenty dotazu krátkými, snadno zapamatovatelnými tokeny (např. @t → (gravida OR promotion)). To nejen zkracuje vaše vyhledávací řetězce, ale také zlepšuje čitelnost a údržbu, zejména když se dotazy stávají složitými.
Předpoklady
Než se pustíme dál, ujistěte se, že máte:
- GroupDocs.Search for Java ≥ 25.4.
- JDK (jakoukoli nedávnou verzi, např. 11+).
- IDE jako IntelliJ IDEA nebo Eclipse.
- Základní znalosti Javy a Maven.
Nastavení GroupDocs.Search pro Java
Použití Maven
Přidejte repozitář a závislost do vašeho pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Přímé stažení
Alternativně stáhněte nejnovější JAR z oficiální stránky:
GroupDocs.Search for Java releases.
Kroky získání licence
- Free Trial – vyzkoušejte všechny funkce bez závazku.
- Temporary License – požádejte o krátkodobý klíč pro hodnocení.
- Full Purchase – získejte trvalou licenci pro produkční použití.
Základní inicializace a nastavení
import com.groupdocs.search.Index;
public class GroupDocsSetup {
public static void main(String[] args) {
// Specify the directory to store indices
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";
// Create or open an index
Index index = new Index(indexFolder);
System.out.println("GroupDocs.Search setup complete.");
}
}
Průvodce implementací
Níže je kompletní průchod každou funkcí. Neváhejte nejprve přečíst vysvětlení a poté zkopírovat odpovídající blok kódu.
Vytvoření nebo otevření indexu
How to add documents to index – nejprve potřebujete aktivní instanci Index.
Krok 1: Import třídy Index
import com.groupdocs.search.Index;
Krok 2: Definujte, kde budou soubory indexu uloženy
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";
Krok 3: Vytvořte nový index nebo otevřete existující
Index index = new Index(indexFolder);
Přidání dokumentů do indexu
Nyní, když index existuje, pojďme add documents to index.
Krok 1: Odkaz na váš zdrojový adresář
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY/Documents";
Krok 2: Přidejte každý podporovaný soubor z tohoto adresáře
index.add(documentsFolder);
Tip: Spusťte tento krok vždy, když přijdou nové soubory. GroupDocs.Search indexuje pouze nový obsah a ponechá existující položky nedotčené.
Správa slovníku aliasů
Aliasům umožňují mapovat krátké tokeny na složité řetězce dotazů. Pokryjeme vymazání starých položek, přidání jednotlivých aliasů a add multiple aliases hromadně.
Vymazání existujících aliasů
if (index.getDictionaries().getAliasDictionary().getCount() > 0) {
index.getDictionaries().getAliasDictionary().clear();
}
Přidání jednotlivých aliasů
index.getDictionaries().getAliasDictionary().add("t", "(gravida OR promotion)");
index.getDictionaries().getAliasDictionary().add("e", "(viverra OR farther)");
Přidání více aliasů
AliasReplacementPair[] pairs = new AliasReplacementPair[] {
new AliasReplacementPair("d", "daterange(2017-01-01 ~~ 2019-12-31)"),
new AliasReplacementPair("n", "(400 ~~ 4000)")
};
index.getDictionaries().getAliasDictionary().addRange(pairs);
Dotazování na nahrazení aliasů
Můžete získat celý text pro jakýkoli alias, který jste definovali:
if (index.getDictionaries().getAliasDictionary().contains("e")) {
String replacement = index.getDictionaries().getAliasDictionary().getText("e");
}
Export a import slovníku aliasů
Export je užitečný pro zálohování nebo sdílení mezi prostředími.
Export aliasů
String fileName = "YOUR_OUTPUT_DIRECTORY/Aliases.dat";
index.getDictionaries().getAliasDictionary().exportDictionary(fileName);
Import aliasů
index.getDictionaries().getAliasDictionary().importDictionary(fileName);
Vyhledávání pomocí dotazů s aliasy
S nastavenými aliasy se vaše vyhledávací řetězce stávají mnohem čistšími:
String query = "@t OR @e";
SearchResult result = index.search(query);
Symbol @ říká GroupDocs.Search, aby před provedením vyhledávání nahradil token jeho úplným výrazem.
Praktické aplikace
| Scénář | Jak aliasy pomáhají |
|---|---|
| Správa právních dokumentů | Mapujte čísla případů (@case123) na složité Boolean výrazy, čímž urychlíte vyhledávání. |
| Vyhledávání produktů v e‑obchodu | Nahraďte běžné kombinace atributů (@sale) výrazem (discounted OR clearance). |
| Výzkumné databáze | Použijte @year2020 k rozšíření na filtr časového období napříč mnoha pracemi. |
Úvahy o výkonu
- Incremental Indexing: Přidávejte pouze nové nebo změněné soubory; vyhněte se úplnému přeindexování.
- JVM Tuning: Přidělte dostatek paměti haldy (
-Xmx4gpro velké korpusy). - Batch Alias Updates: Použijte
addRangek vložení mnoha aliasů najednou, čímž snížíte režii.
Závěr
Nyní víte, jak add documents to index, spravovat slovník aliasů a provádět efektivní vyhledávání pomocí GroupDocs.Search pro Java. Tyto techniky učiní vaše aplikace založené na vyhledávání rychlejšími, lépe udržovatelnými a snadnějšími pro koncové uživatele.
Další kroky: Experimentujte s vlastními analyzátory, prozkoumejte možnosti fuzzy vyhledávání a integrujte index do webové služby pro vyhledávání v reálném čase.
Často kladené otázky
Q: Jaký je hlavní přínos používání GroupDocs.Search pro Java?
A: Poskytuje výkonné, připravené k použití indexování a full‑textové vyhledávací možnosti, což vám umožní add documents to index rychle a dotazovat je s vysokým výkonem.
Q: Mohu použít GroupDocs.Search s databázemi?
A: Ano — extrahujte data z jakéhokoli zdroje (SQL, NoSQL, CSV) a vložte je do indexu pomocí stejných metod add.
Q: Jak aliasy zlepšují efektivitu vyhledávání?
A: Aliasům umožňují uložit složitou logiku dotazu jednou a znovu ji použít pomocí krátkých tokenů, čímž snižují čas parsování dotazu a minimalizují lidské chyby.
Q: Je možné aktualizovat existující alias bez přestavby celého slovníku?
A: Rozhodně — jednoduše zavolejte add se stejným klíčem; knihovna přepíše předchozí hodnotu.
Q: Co mám dělat, pokud moje vyhledávání vrací neočekávané výsledky?
A: Ověřte, že definice aliasů jsou správné, přeindexujte nově přidané dokumenty a zkontrolujte nastavení analyzátoru pro problémy s tokenizací.
Poslední aktualizace: 2026-01-03
Testováno s: GroupDocs.Search 25.4 pro Java
Autor: GroupDocs