Dodawanie dokumentów do indeksu i scalanie w Javie przy użyciu GroupDocs.Search

W dzisiejszym szybkim środowisku cyfrowym, nauka jak dodawać dokumenty do indeksu w sposób efektywny jest niezbędna dla każdego rozwiązania document management java. Niezależnie od tego, czy obsługujesz umowy, faktury czy wewnętrzne raporty, dobrze zbudowany indeks pozwala na pobieranie informacji w milisekundach. Ten samouczek przeprowadzi Cię przez tworzenie indeksów, dodawanie dokumentów, konfigurowanie opcji scalania oraz nawet cancel merge operation, jeśli zajdzie taka potrzeba — wszystko przy użyciu GroupDocs.Search dla Javy.

Szybkie odpowiedzi

  • Co oznacza „add documents to index”? Informuje GroupDocs.Search, aby zeskanował folder i zapisał metadane wyszukiwalne dla każdego pliku.
  • Czy mogę zatrzymać długotrwałe scalanie? Tak — użyj obiektu Cancellation, aby cancel merge operation po upływie określonego czasu.
  • Czy potrzebna jest licencja? Bezpłatna wersja próbna lub tymczasowa licencja działa w celach testowych; licencja komercyjna odblokowuje pełne funkcje.
  • Jakiej wersji Javy wymaga? JDK 8 lub nowsza.
  • Czy to nadaje się do dużych zbiorów danych? Zdecydowanie — wystarczy monitorować pamięć i używać indeksowania przyrostowego.

Co oznacza „add documents to index” w GroupDocs.Search?

Dodawanie dokumentów do indeksu oznacza wprowadzenie kolekcji plików do GroupDocs.Search, aby biblioteka mogła analizować ich zawartość, wyodrębniać tokeny i budować strukturę danych umożliwiającą wyszukiwanie. Po zaindeksowaniu możesz wykonywać szybkie wyszukiwania pełnotekstowe we wszystkich dokumentach.

Dlaczego warto używać GroupDocs.Search w dokumentacji document management java?

  • Skalowalne indeksowanie – Obsługuje tysiące plików bez degradacji wydajności.
  • Bogate API – Oferuje precyzyjną kontrolę nad indeksowaniem, scalaniem i anulowaniem.
  • Obsługa wielu formatów – Działa z PDF‑ami, Wordem, Excelem i wieloma innymi formatami od razu po instalacji.

Wymagania wstępne

  • GroupDocs.Search for Java w wersji 25.4 lub nowszej.
  • Maven (lub ręczne pobranie JAR‑ów).
  • Podstawowa znajomość Javy oraz środowisko JDK 8+.

Konfiguracja GroupDocs.Search dla Javy

Instalacja Maven

Jeśli zarządzasz zależnościami przy pomocy Maven, dodaj repozytorium i zależność do swojego pom.xml:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Bezpośrednie pobranie

Alternatywnie, pobierz najnowszy JAR z oficjalnej strony: GroupDocs.Search for Java releases.

Uzyskanie licencji

  • Bezpłatna wersja próbna: Zarejestruj się na stronie GroupDocs, aby otrzymać licencję próbną.
  • Licencja tymczasowa: Złóż wniosek o tymczasowy klucz, jeśli potrzebujesz wydłużonej oceny.
  • Licencja komercyjna: Zakup w celu użycia produkcyjnego.

Po otrzymaniu pliku licencyjnego umieść go wcie i zainicjalizuj bibliotekę, jak pokazano później.

Przewodnik implementacji

Jak dodać dokumenty do indeksu – Tworzenie pierwszego indeksu

Najpierw utwórz pusty indeks, który będzie przechowywał Twoje dane wyszukiwalne.

import com.groupdocs.search.Index;

// Create an instance of the index at the specified path
Index index1 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index1");
  • Dlaczego: Ten krok tworzy kontener przechowywania, w którym zostaną zapisane zaindeksowaney.

Dodawanie dokumentów do indeksu

Teraz poinstruuj GroupDocs.Search, aby zeskanował folder i add documents to index.

index1.add("YOUR_DOCUMENT_DIRECTORY"); // Add documents from this directory
  • Dlaczego: Biblioteka odczytuje każdy plik, wyodrębnia tekst i zapisuje go w index1.

Tworzenie drugiego indeksu dla elastycznych przepływów pracy

Czasami potrzebne są oddzielne indeksy — na przykład, aby odizolować dane klienta.

Index index2 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index2");
index2.add("YOUR_DOCUMENT_DIRECTORY");
  • Dlaczego: Wiele indeksów pozwala zarządzać odrębnymi zestawami dokumentów i później je łączyć.

Jak skonfigurować opcje scalania i anulować operację scalania

Przed scaleniem możesz dopasować proces i nawet zatrzymać go, jeśli trwa zbyt długo.

import com.groupdocs.search.options.MergeOptions;
import com.groupdocs.search.options.Cancellation;

MergeOptions options = new MergeOptions();
options.setCancellation(new Cancellation()); // Initialize cancellation object
options.getCancellation().cancelAfter(5000); // Cancel merge operation after 5 seconds
  • Dlaczego: Cancellation daje kontrolę, aby cancel merge operation automatycznie, zapobiegając niekontrolowanym zadaniom.

Scalanie indeksów

Na koniec scal drugi indeks z głównym.

index1.merge(index2, options);
  • Dlaczego: Po tym wywołaniu index1 zawiera wszystkie dokumenty z obu źródeł, zapewniając jednolite doświadczenie wyszukiwania.

Praktyczne zastosowania w document management java

  • Kancelarie prawne: Konsolidacja akt spraw z wielu biur.
  • Instytucje finansowe: Scalanie kwartalnych raportów w jedną przeszukiwalną bazę.
  • Przedsiębiorstwa: Łączenie dokumentów HR, zgodności i polityk w wyszukiwanie na poziomie całej organizacji.

Wskazówki dotyczące wydajności

  • Indeksowanie przyrostowe: Dodawaj nowe pliki okresowo zamiast przebudowywać cały indeks.
  • Monitorowanie pamięci: Duże partie mogą zużywać RAM; rozważ przetwarzanie w mniejszych fragmentach.
  • Garbage collection: Niezwłocznie zwalniaj nieużywane obiekty Index, aby zwolnić zasoby.

Typowe problemy i rozwiązania

ProblemRozwiązanie
Nieprawidłowa ścieżka folderuZweryfikuj ścieżkę bezwzględną i upewnij się, że aplikacja ma uprawnienia odczytu.
Niewystarczająca pamięćZwiększ rozmiar sterty JVM (-Xmx) lub indeksuj pliki w partiach.
Anulowanie nie zostało wywołaneUpewnij się, że cancelAfter jest ustawione przed wywołaniem merge.
Nieobsługiwany format plikuZainstaluj dodatkowe wtyczki formatów z GroupDocs, jeśli to konieczne.

Najczęściej zadawane pytania

Q: Dlaczego miałbym tworzyć wiele indeksów zamiast jednego?
A: Oddzielne indeksy pozwalają izolować domeny danych, stosować różne polityki bezpieczeństwa i scalać je tylko wtedy, gdy jest to potrzebne, co poprawia wydajność i organizację.

Q: Czy mogę anulować operację indeksowania tak samo, jak anuluję scalanie?
A: Tak — użyj obiektu Cancellation z metodą add, aby zatrzymać długotrwałe zadania indeksowania.

Q: Jak zapewnić optymalną wydajność przy bardzo dużych zbiorach dokumentów?
A: Stosuj indeksowanie przyrostowe, monitoruj pamięć JVM i rozważ użycie dysków SSD dla katalogu indeksu.

Q: Co zrobić, gdy pojawią się błędy „Access denied”?
A: Sprawdź uprawnienia folderu dla użytkownika uruchamiającego proces Javy oraz upewnij się, że plik licencji jest czytelny.

Q: Czy GroupDocs.Search jest kompatybilny z innymi bibliotekami GroupDocs?
A: Absolutnie — możesz go zintegrować z GroupDocs.Viewer, GroupDocs.Conversion itp., tworząc pełny stos rozwiązań dokumentowych.

Podsumowanie

Korzystając z tego przewodnika, wiesz już, jak add documents to index, skonfigurować zachowanie scalania oraz bezpiecznie cancel merge operation, gdy zajdzie taka potrzeba — wszystko w ramach solidnego document management java workflow. Eksperymentuj z większymi zestawami danych, odkrywaj własne tokenizery lub łącz GroupDocs.Search z innymi produktami GroupDocs, aby zbudować naprawdę przedsiębiorstwowe rozwiązanie.

Zasoby


Ostatnia aktualizacja: 2026-01-03
Testowano z: GroupDocs.Search 25.4 for Java
Autor: GroupDocs