Dodawanie dokumentów do indeksu przy użyciu GroupDocsowanie tego procesu pozwala dostarcownikom końcowym. W tym przewodniku przeprowadzimy Cię przez konfigurację GroupDocs.Search dla Javy, tworzenie indeksu, dodawanie dokumentów, włączanie zaawansowanych funkcji wyszukiwania tekstu oraz optymalizację wydajności.

Szybkie odpowiedzi

  • What does “add documents to index” mean? Oznacza to ładowanie plików źródłowych do struktury danych, którą GroupDocs.Search może przeszukiwać.
  • Which library version is required? GroupDocs.Search for Java 25.4 (lub nowsza) obsługuje przedstawione tutaj funkcje.
  • Do I need a license? Darmowa wersja próbna działa w środowisku deweloperskim; licencja komercyjna jest wymagana w produkcji.
  • Can I search different word forms? Tak — włącz setUseWordFormsSearch(true) w SearchOptions.
  • Is Maven the only way to install? Nie, możesz również pobrać plik JAR bezpośrednio (zobacz link Direct Download).

Co oznacza „add documents to index”?

Dodawanie dokumentów do indeksu oznacza skanowanie plików źródłowych, wyodrębnianie tekstu możliwego do przeszukania i przechowywanie tych informacji w ustrukturyzowanym formacie umożliwiającym szybkie wyszukiwanie. GroupDocs.Search obsługuje wiele typów plików od razu, dzięki czemu możesz skupić się na logice biznesowej, a nie na parsowaniu.

Dlaczego warto używać zaawansowanych technik wyszukiwania tekstu w Javie?

Zaawansowane możliwości wyszukiwania tekstu w Javie — takie jak rozpoznawanie form wyrazów, dopasowanie przybliżone (fuzzy) i niestandardowe rankingowanie — pomagają użytkownikom znaleźć informacje, nawet gdy zapytania nie są dokładnym dopasowaniem. To zwiększa satysfakcję użytkowników i skraca czas poświęcany na poszukiwanie dokumentów.

Wymagania wstępne

  • Wymagane biblioteki: GroupDocs.Search for Java 25.4.
  • Konfiguracja środowiska: Java JDK 8 lub nowszy, Maven (lub ręczne obsługiwanie JAR).
  • Wymagania wiedzy: Podstawowa programowanie w Javie i zarządzanie zależnościami Maven.

Konfiguracja GroupDocs.Search dla Javy

Zanim napiszesz jakikolwiek kod, upewnij się, że biblioteka jest dostępna w Twoim projekcie.

Konfiguracja Maven

Dodaj następującą konfigurację do pliku pom.xml:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Bezpośrednie pobranie

Jeśli wolisz nie używać Maven, możesz pobrać najnowszy plik JAR z oficjalnej strony: GroupDocs.Search for Java releases.

Kroki uzyskania licencji

  1. Free Trial – przetestuj API bez kosztów.
  2. Temporary License – wydłuż okres próbny w celu dokładniejszego testowania.
  3. Purchase – uzyskaj licencję komercyjną do użytku produkcyjnego.

Przewodnik krok po kroku

1. Tworzenie i konfigurowanie indeksu

Indeks jest podstawą każdej rozwiązania wyszukiwania. Przechowuje tokenizowany tekst i metadane dla szybkiego odczytu.

Przegląd

Utworzymy folder na dysku, który będzie przechowywać pliki indeksu.

Code

import com.groupdocs.search.Index;

String indexFolder = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/SearchForDifferentWordForms";
Index index = new Index(indexFolder);

Explanation: Konstruktor Index wskazuje folder, w którym będą przechowywane wszystkie dane indeksu. Zastąp YOUR_DOCUMENT_DIRECTORY rzeczywistą ścieżką na swoim komputerze.

2. Jak dodać dokumenty do indeksu

Teraz, gdy indeks istnieje, musimy add documents to index, aby stały się przeszukiwalne.

Przegląd

GroupDocs.Search skanuje określony katalog i indeksuje każdy obsługiwany typ pliku, który znajdzie.

Code

String documentsFolder = "YOUR_DOCUMENT_DIRECTORY/DocumentsPath";
index.add(documentsFolder);

Explanation: Metoda add przetwarza folder rekurencyjnie, wyodrębnia tekst i zapisuje go w indeksie. Upewnij się, że ścieżka jest prawidłowa i że aplikacja ma uprawnienia do odczytu.

3. Konfiguracja opcji wyszukiwania dla form wyrazów

Aby wyszukiwania były tolerancyjne na odmiany gramatyczne (np. „wish”, “wished”, “wishes”), włącz wyszukiwanie form wyrazów.

Przegląd

Dostosujemy SearchOptions, aby włączyć tę funkcję.

Code

import com.groupdocs.search.SearchOptions;

SearchOptions options = new SearchOptions();
options.setUseWordFormsSearch(true); // Enables search for different grammatical variations of words.

Explanation: Ustawienie setUseWordFormsSearch(true) informuje silnik, aby rozszerzał zapytania o znane odmiany, zwiększając przywołanie (recall).

4. Wykonanie wyszukiwania

Po wypełnieniu indeksu i skonfigurowaniu opcji możemy teraz wykonać zapytanie.

Przegląd

Wyszukamy słowo „wished” i pobierzemy pasujące dokumenty.

Code

import com.groupdocs.search.SearchResult;

String query = "wished";
SearchResult result = index.search(query, options);

Explanation: Metoda search wykonujecony SearchResult, z których każde ma odniesienie do dokumentu oraz fragmenty tekst formatów wymienionych w dokumentacji GroupDocs.Search.

  • Performance slowness Praktyczne zastosowania
  1. Corporate Document Management – Szybko znajdź polityki, umowy lub podręczniki HR wśród tysięcy plików.
  2. Legal Research – Znajdź precedensy prawne, nawet gdy dokładne sformułowanie się róż form wyrazów.
  3. E‑commerce Catalogs – Pozwól klientom przeszukiwać opisy produktów używając różnorodnej terminologii.

Wskazówki dotyczące wydajności

  • Przeprowadzaj ponowne indeks Uży dla J responsywnych, bogatych w funkcje doświadczeń wyszukiwania w dowolnej kolekcji dokumentów.

Kolejne kroki

  • Eksperymentuj z dopasowaniem przybliżonym (fuzzy) i niestandardowym rankingiem.
  • Zintegruj moduł wyszukiwania z API REST dla konsumpcji po stronie front‑endu.
  • Zbadaj wsparcie wielojęzyczne, konfigurując analizatory specyficzne dla języka.

Najczęściej zadawane pytania

Q1: Jakie formaty obsługuje GroupDocs.Search?
A1: Obsługuje szeroką gamę formatów, w tym DOCX, PDF, PPTX, TXT i wiele innych. Zobacz ofic listę.

**Q2: Jak zaktualizować mój indeks o nowe dokumenty?.

**Q3: Czy mog SSD, zwiększ rozmiar sterty JVM i unikaj indeksowania niepotrzebnie dużych plików.

Q5: Gdzie mogę uzyskać pomoc od społeczności?
A5: Skorzystaj z oficjalnego forum wsparcia: GroupDocs Support Forum.

Zasoby


Ostatnia aktualizacja: 2026-01-24
Testowano z: GroupDocs.Search 25.4 for Java
Autor: GroupDocs