Добавление документов в индекс и управление псевдонимами в GroupDocs.Search Java: Полное руководство

В современном мире, управляемом данными, возможность add documents to index быстро и эффективно выполнять поиск может дать вашему бизнесу реальное конкурентное преимущество. Независимо от того, работаете ли вы с тысячами контрактов, каталогами продукции или научными статьями, GroupDocs.Search for Java упрощает создание поисковых индексов и тонкую настройку запросов с помощью словарей псевдонимов.

Ниже вы найдете всё, что нужно для настройки библиотеки, add documents to index, управления псевдонимами и выполнения мощных поисков — всё объяснено в дружелюбном пошаговом стиле.

Быстрые ответы

  • What is the first step to start using GroupDocs.Search? Добавьте Maven‑зависимость и инициализируйте объект Index.
  • How do I add documents to index? Вызовите index.add("<folder_path>"), указав папку, содержащую ваши файлы.
  • Can I create aliases for complex queries? Да — используйте словарь псевдонимов для сопоставления коротких токенов с полными выражениями запросов.
  • Is it possible to export and import alias dictionaries? Конечно — используйте методы exportDictionary и importDictionary.
  • What version of GroupDocs.Search is required? Версия 25.4 или новее (в руководстве используется 25.4).

Что такое “add documents to index”?

Добавление документов в индекс означает загрузку исходных файлов (PDF, DOCX, TXT и т.д.) в GroupDocs.Search, чтобы библиотека могла проанализировать их содержимое и построить структуру данных, пригодную для поиска. После индексации вы можете выполнять быстрые полнотекстовые запросы по всем этим документам.

Зачем управлять псевдонимами?

Псевдонимы позволяют заменять длинные, повторяющиеся фрагменты запросов короткими, запоминающимися токенами (например, @t(gravida OR promotion)). Это не только сокращает строки поиска, но и повышает читаемость и удобство поддержки, особенно когда запросы становятся сложными.

Предварительные требования

  • GroupDocs.Search for Java ≥ 25.4.
  • JDK (любая современная версия, например, 11+).
  • IDE, например IntelliJ IDEA или Eclipse.
  • Базовые знания Java и Maven.

Настройка GroupDocs.Search for Java

Использование Maven

Добавьте репозиторий и зависимость в ваш pom.xml:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

Прямое скачивание

Либо скачайте последнюю JAR‑файл с официального сайта:
GroupDocs.Search for Java releases.

Шаги получения лицензии

  1. Free Trial – исследуйте все функции без обязательств.
  2. Temporary License – запросите краткосрочный ключ для оценки.
  3. Full Purchase – получите постоянную лицензию для использования в продакшене.

Базовая инициализация и настройка

import com.groupdocs.search.Index;

public class GroupDocsSetup {
    public static void main(String[] args) {
        // Specify the directory to store indices
        String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";
        
        // Create or open an index
        Index index = new Index(indexFolder);
        
        System.out.println("GroupDocs.Search setup complete.");
    }
}

Руководство по реализации

Ниже представлено полное пошаговое руководство по каждой функции. Сначала ознакомьтесь с объяснениями, а затем скопируйте соответствующий блок кода.

Создание или открытие индекса

How to add documents to index – сначала вам нужен активный экземпляр Index.

Шаг 1: Импорт класса Index

import com.groupdocs.search.Index;

Шаг 2: Определите, где будут храниться файлы индекса

String indexFolder = "YOUR_DOCUMENT_DIRECTORY/Indexes/Index";

Шаг 3: Создайте новый индекс или откройте существующий

Index index = new Index(indexFolder);

Добавление документов в индекс

Теперь, когда индекс существует, давайте add documents to index.

Шаг 1: Укажите папку-источник

String documentsFolder = "YOUR_DOCUMENT_DIRECTORY/Documents";

Шаг 2: Добавьте каждый поддерживаемый файл из этой папки

index.add(documentsFolder);

Pro tip: Выполняйте этот шаг каждый раз, когда появляются новые файлы. GroupDocs.Search будет индексировать только новое содержимое, оставляя существующие записи без изменений.

Управление словарём псевдонимов

Псевдонимы позволяют сопоставлять короткие токены со сложными строками запросов. Мы рассмотрим очистку старых записей, добавление одиночных псевдонимов и add multiple aliases пакетно.

Очистка существующих псевдонимов

if (index.getDictionaries().getAliasDictionary().getCount() > 0) {
    index.getDictionaries().getAliasDictionary().clear();
}

Добавление одиночных псевдонимов

index.getDictionaries().getAliasDictionary().add("t", "(gravida OR promotion)");
index.getDictionaries().getAliasDictionary().add("e", "(viverra OR farther)");

Добавление нескольких псевдонимов

AliasReplacementPair[] pairs = new AliasReplacementPair[] {
    new AliasReplacementPair("d", "daterange(2017-01-01 ~~ 2019-12-31)"),
    new AliasReplacementPair("n", "(400 ~~ 4000)")
};
index.getDictionaries().getAliasDictionary().addRange(pairs);

Запрос замен псевдонимов

Вы можете получить полный текст любого определённого псевдонима:

if (index.getDictionaries().getAliasDictionary().contains("e")) {
    String replacement = index.getDictionaries().getAliasDictionary().getText("e");
}

Экспорт и импорт словаря псевдонимов

Экспорт удобен для резервного копирования или обмена между средами.

Экспорт псевдонимов

String fileName = "YOUR_OUTPUT_DIRECTORY/Aliases.dat";
index.getDictionaries().getAliasDictionary().exportDictionary(fileName);

Импорт псевдонимов

index.getDictionaries().getAliasDictionary().importDictionary(fileName);

Поиск с использованием запросов‑псевдонимов

С установленными псевдонимами ваши строки поиска становятся гораздо чище:

String query = "@t OR @e";
SearchResult result = index.search(query);

Символ @ указывает GroupDocs.Search заменить токен его полной выражением перед выполнением поиска.

Практические применения

СценарийКак помогают псевдонимы
Legal Document ManagementСопоставьте номера дел (@case123) со сложными булевыми условиями, ускоряя поиск.
E‑commerce Product SearchЗамените часто используемые комбинации атрибутов (@sale) на (discounted OR clearance).
Research DatabasesИспользуйте @year2020 для расширения до фильтра диапазона дат по множеству статей.

Соображения по производительности

  • Incremental Indexing: Добавляйте только новые или изменённые файлы; избегайте полной переиндексации.
  • JVM Tuning: Выделите достаточный объём памяти кучи (-Xmx4g для больших корпусов).
  • Batch Alias Updates: Используйте addRange для вставки множества псевдонимов за один раз, снижая нагрузку.

Заключение

Теперь вы знаете, как add documents to index, управлять словарём псевдонимов и выполнять эффективный поиск с помощью GroupDocs.Search for Java. Эти приёмы сделают ваши поисковые приложения быстрее, более поддерживаемыми и удобными для конечных пользователей.

Next steps: Поэкспериментируйте с пользовательскими анализаторами, изучите варианты нечёткого поиска и интегрируйте индекс в веб‑службу для запросов в реальном времени.

Часто задаваемые вопросы

Q: What is the primary benefit of using GroupDocs.Search for Java?
A: Он предоставляет мощные готовые к использованию возможности индексации и полнотекстового поиска, позволяя вам add documents to index быстро и выполнять запросы с высокой производительностью.

Q: Can I use GroupDocs.Search with databases?
A: Да — извлекайте данные из любого источника (SQL, NoSQL, CSV) и передавайте их в индекс с помощью тех же методов add.

Q: How do aliases improve search efficiency?
A: Псевдонимы позволяют один раз сохранить сложную логику запросов и повторно использовать её короткими токенами, сокращая время разбора запросов и минимизируя человеческие ошибки.

Q: Is it possible to update an existing alias without rebuilding the whole dictionary?
A: Конечно — просто вызовите add с тем же ключом; библиотека перезапишет предыдущее значение.

Q: What should I do if my search returns unexpected results?
A: Убедитесь, что определения псевдонимов корректны, переиндексируйте вновь добавленные документы и проверьте настройки анализатора на предмет проблем с токенизацией.


Последнее обновление: 2026-01-03
Тестировано с: GroupDocs.Search 25.4 for Java
Автор: GroupDocs