Dodawanie dokumentów do indeksu i zarządzanie aliasami w GroupDocs.Search Java: Kompletny przewodnik
W dzisiejszym świecie napędzanym danymi, możliwość add documents to index szybko i efektywne ich przeszukiwanie może dać Twojej firmie prawdziwą przewagę konkurencyjną. Niezależnie od tego, czy masz do czynienia z tysiącami umów, katalogami produktów czy publikacjami naukowymi, GroupDocs.Search dla Javy ułatwia tworzenie przeszukiwalnych indeksów i precyzyjne dopasowywanie zapytań przy użyciu słowników aliasów.
Poniżej znajdziesz wszystko, co potrzebne, aby skonfigurować bibliotekę, add documents to index, zarządzać aliasami i uruchamiać potężne wyszukiwania — wszystko wyjaśnione w przyjaznym, krok‑po‑kroku stylu.
Szybkie odpowiedzi
- Jaki jest pierwszy krok, aby rozpocząć korzystanie z GroupDocs.Search? Dodaj zależność Maven i zainicjalizuj obiekt
Index. - Jak dodać dokumenty do indeksu? Wywołaj
index.add("<folder_path>")podając folder zawierający Twoje pliki. - Czy mogę tworzyć aliasy dla złożonych zapytań? Tak — użyj słownika aliasów, aby mapować krótkie tokeny na pełne wyrażenia zapytań.
- Czy można eksportować i importować słowniki aliasów? Oczywiście — użyj metod
exportDictionaryiimportDictionary. - Jakiej wersji GroupDocs.Search potrzebuję? Wersja 25.4 lub nowsza (tutorial używa wersji 25.4).
Co oznacza „add documents to index”?
Dodawanie dokumentów do indeksu oznacza wprowadzanie surowych plików (PDF, DOCX, TXT itp.) do GroupDocs.Search, aby biblioteka mogła przeanalizować ich zawartość i zbudować przeszukiwalną strukturę danych. Po zindeksowaniu możesz uruchamiać szybkie zapytania pełnotekstowe we wszystkich tych dokumentach.
Dlaczego zarządzać aliasami?
Aliasom można używać, aby zastępować długie, powtarzalne fragmenty zapytań krótkimi, łatwymi do zapamiętania tokenami (np. @t → (gravida OR promotion)). To nie tylko skraca Twoje ciągi wyszukiwania, ale także poprawia czytelność i utrzymanie, szczególnie gdy zapytania stają się złożone.
Wymagania wstępne
Zanim przejdziesz dalej, upewnij się, że masz:
- GroupDocs.Search for Java ≥ 25.4.
- JDK (dowolna aktualna wersja, np. 11+).
- IDE, takie jak IntelliJ IDEA lub Eclipse.
- Podstawową znajomość Javy i Maven.
Konfiguracja GroupDocs.Search dla Javy
Korzystanie z Maven
Dodaj repozytorium i zależność do swojego pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Bezpośrednie pobranie
Alternatywnie, pobierz najnowszy plik JAR z oficjalnej strony:
GroupDocs.Search for Java releases.
Kroki uzyskania licencji
- Free Trial – wypróbuj wszystkie funkcje bez zobowiązań.
- Temporary License – poproś o krótkoterminowy klucz do oceny.
- Full Purchase – uzyskaj stałą licencję do użytku produkcyjnego.
Podstawowa inicjalizacja i konfiguracja
import com.groupdocs.search.Index;
public class GroupDocsSetup {
public static void main(String[] args) {
// Specify the directory to store indices
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";
// Create or open an index
Index index = new Index(indexFolder);
System.out.println("GroupDocs.Search setup complete.");
}
}
Przewodnik implementacji
Poniżej pełny opis każdej funkcji. Najpierw przeczytaj wyjaśnienia, a potem skopiuj odpowiedni blok kodu.
Tworzenie lub otwieranie indeksu
Jak dodać dokumenty do indeksu – najpierw potrzebujesz aktywnej instancji Index.
Krok 1: Import klasy Index
import com.groupdocs.search.Index;
Krok 2: Określ, gdzie będą przechowywane pliki indeksu
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";
Krok 3: Utwórz nowy indeks lub otwórz istniejący
Index index = new Index(indexFolder);
Dodawanie dokumentów do indeksu
Teraz, gdy indeks istnieje, add documents to index.
Krok 1: Wskaż folder źródłowy
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY/Documents";
Krok 2: Dodaj każdy obsługiwany plik z tego folderu
index.add(documentsFolder);
Pro tip: Uruchamiaj ten krok za każdym razem, gdy pojawią się nowe pliki. GroupDocs.Search zaindeksuje tylko nową zawartość, pozostawiając istniejące wpisy nietknięte.
Zarządzanie słownikiem aliasów
Aliasom można mapować krótkie tokeny na złożone ciągi zapytań. Omówimy czyszczenie starych wpisów, dodawanie pojedynczych aliasów oraz add multiple aliases w trybie wsadowym.
Czyszczenie istniejących aliasów
if (index.getDictionaries().getAliasDictionary().getCount() > 0) {
index.getDictionaries().getAliasDictionary().clear();
}
Dodawanie pojedynczych aliasów
index.getDictionaries().getAliasDictionary().add("t", "(gravida OR promotion)");
index.getDictionaries().getAliasDictionary().add("e", "(viverra OR farther)");
Dodawanie wielu aliasów
AliasReplacementPair[] pairs = new AliasReplacementPair[] {
new AliasReplacementPair("d", "daterange(2017-01-01 ~~ 2019-12-31)"),
new AliasReplacementPair("n", "(400 ~~ 4000)")
};
index.getDictionaries().getAliasDictionary().addRange(pairs);
Zapytania o zamiany aliasów
Możesz pobrać pełny tekst dowolnego zdefiniowanego aliasu:
if (index.getDictionaries().getAliasDictionary().contains("e")) {
String replacement = index.getDictionaries().getAliasDictionary().getText("e");
}
Eksport i import słownika aliasów
Eksport jest przydatny do tworzenia kopii zapasowych lub udostępniania między środowiskami.
Eksport aliasów
String fileName = "YOUR_OUTPUT_DIRECTORY/Aliases.dat";
index.getDictionaries().getAliasDictionary().exportDictionary(fileName);
Import aliasów
index.getDictionaries().getAliasDictionary().importDictionary(fileName);
Wyszukiwanie przy użyciu zapytań aliasowych
Dzięki aliasom Twoje ciągi wyszukiwania stają się znacznie czytelniejsze:
String query = "@t OR @e";
SearchResult result = index.search(query);
Symbol @ informuje GroupDocs.Search, aby przed wykonaniem wyszukiwania zastąpił token jego pełnym wyrażeniem.
Praktyczne zastosowania
| Scenariusz | Jak aliasy pomagają |
|---|---|
| Zarządzanie dokumentami prawnymi | Mapuj numery spraw (@case123) na złożone klauzule Boolean, przyspieszając odzyskiwanie. |
| Wyszukiwanie produktów w e‑commerce | Zastąp typowe kombinacje atrybutów (@sale) wyrażeniem (discounted OR clearance). |
| Bazy danych badań | Użyj @year2020, aby rozwinąć do filtru zakresu dat w wielu publikacjach. |
Wskazówki dotyczące wydajności
- Indeksowanie przyrostowe: Dodawaj tylko nowe lub zmienione pliki; unikaj pełnego ponownego indeksowania.
- Dostosowanie JVM: Przydziel wystarczającą pamięć heap (
-Xmx4gdla dużych korpusów). - Wsadowa aktualizacja aliasów: Użyj
addRange, aby jednorazowo wstawić wiele aliasów, zmniejszając narzut.
Podsumowanie
Teraz wiesz, jak add documents to index, zarządzać słownikiem aliasów i wykonywać wydajne wyszukiwania przy użyciu GroupDocs.Search dla Javy. Te techniki sprawią, że Twoje aplikacje oparte na wyszukiwaniu będą szybsze, łatwiejsze w utrzymaniu i przyjaźniejsze dla użytkowników końcowych.
Kolejne kroki: Eksperymentuj z własnymi analizatorami, odkrywaj opcje wyszukiwania rozmytego i integruj indeks z usługą sieciową w celu zapytań w czasie rzeczywistym.
Najczęściej zadawane pytania
P: Jaka jest główna zaleta korzystania z GroupDocs.Search dla Javy?
O: Dostarcza potężne, gotowe do użycia funkcje indeksowania i pełnotekstowego wyszukiwania, umożliwiając szybkie add documents to index i wydajne zapytania.
P: Czy mogę używać GroupDocs.Search z bazami danych?
O: Tak — wyodrębnij dane z dowolnego źródła (SQL, NoSQL, CSV) i przekaż je do indeksu przy użyciu tych samych metod add.
P: Jak aliasy poprawiają wydajność wyszukiwania?
O: Aliasom można przechowywać złożoną logikę zapytań raz i ponownie używać krótkich tokenów, co skraca czas parsowania zapytań i minimalizuje błędy ludzkie.
P: Czy można zaktualizować istniejący alias bez przebudowywania całego słownika?
O: Oczywiście — po prostu wywołaj add z tym samym kluczem; biblioteka nadpisze poprzednią wartość.
P: Co zrobić, gdy wyniki wyszukiwania są nieoczekiwane?
O: Sprawdź poprawność definicji aliasów, ponownie zindeksuj nowo dodane dokumenty i zweryfikuj ustawienia analizatora pod kątem problemów z tokenizacją.
Ostatnia aktualizacja: 2026-01-03
Testowano z: GroupDocs.Search 25.4 dla Javy
Autor: GroupDocs