Как искать документы Java с помощью GroupDocs.Search

В цифровую эпоху возможность search documents java быстро является критически важной для бизнеса и разработчиков. Независимо от того, ищете ли вы в юридических контрактах требуется надёжное решение для быстрого нахождения релевантной информации. Этот учебник проведёт операций по различным форматам документов documents java?** GroupDocs.Search for Java.

  • Могу ли я highlight search terms java в результатах? Yes, the library can generate HTML with highlighted terms.
  • Do I need a license? A free trial is available; a full license is required for production. Any Java IDE such as IntelliJ IDEA, Eclipse, or VS Code.
  • **.xml`.

Что такое GroupDocs.Search for Java?

GroupDocs.Search — это Java SDK, который индексирует.). Он предоставляет расширенные возможности, такие как репозиториев документов.

Почему использовать Search Documents Java с GroupDocs.Search?

  • Speed: Индексированный поиск возвращает результаты за миллисекунды, даже для больших коллекций.
  • Flexibility: Поддерживает нечеткий поиск, логические операторы и запросы фраз.
  • **Highlighting:**евью.
  • Scalability: Работает с on‑premises, облачными или гибительные требования
  1. Java Development Kit (JDK) 8 или выше установлен.
  2. Maven (или ручное управление зависимостями).
  3. IDE, например IntelliJ IDEA, Eclipse или VS Code.
  4. Базовые знания Java и структуры проекта Maven.

Настройка GroupDocs.Search for Java

Установка через Maven

Добавьте репозиторий GroupDocs и зависимость в ваш pom.xml:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Прямое скачивание

Если вы предпочитаете не использовать Maven, скачайте последнюю JAR‑файл со официальной страницы релизов: GroupDocs.Search for Java releases.

Шаги получения лицензии

  • Free Trial: Начните с бесплатной пробной версии, чтобы изучить возможности.
  • Temporary License: Получите через официальный сайт GroupDocs.
  • Purchase: Для неограниченного использования в продакшене приобретите полную лицензию.

Базовая инициализация и настройка

Создайте папку индекса и создайте объект Index:

String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation";
Index index = new Index(indexFolder);

Как искать документы Java – Функция 1: Извлечение информации о результатах поиска

Обзор

Извлечение подробной информации (термины, фразы, количество вхождений) помогает создавать аналитические панели или генерировать отчёты о содержимом вашего набора документов.

Пошаговая реализация

Шаг 1: Создать индекс

String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
index.add(documentFolder);

Шаг 2: Настроить параметры поиска (включить нечеткий поиск)

SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

Шаг 3: Выполнить поиск

String query = "favourable OR \"ipsum dolor\"";
SearchResult result = index.search(query, options);

Шаг 4: Извлечь вхождения

for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    for (FoundDocumentField field : document.getFoundFields()) {
        if (field.getTerms() != null) {
            for (String term : field.getTerms()) {
                int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)];
                System.out.println("Term: " + term + ", Occurrences: " + occurrences);
            }
        }
        if (field.getTermSequences() != null) {
            for (String[] terms : field.getTermSequences()) {
                int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)];
                StringBuilder sequence = new StringBuilder();
                for (String term : terms) {
                    sequence.append(term).append(" ");
                }
                System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences);
            }
        }
    }
}

Функция 2: Подсветка Search Terms Java в документах

Обзор

Создание HTML‑файла с highlight search terms java, улучшая скорость обзора и совместную работу.

Пошаговая реализация

Ш уровнем сжатия

String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults";
IndexSettings settings = new IndexSettings();
settings.setTextStorageSettings(new TextStorageSettings(Compression.High));
Index index = new Index(indexFolder, settings);
index.add(documentFolder);

Шаг 2: Выполнить поиск и подсветить результаты

SearchResult result = index.search("solicitude");
if (result.getDocumentCount() > 0) {
    FoundDocument document = result.getFoundDocument(0);
    String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html";
    OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path);
    Highlighter highlighter = new DocumentHighlighter(outputAdapter);
    index.highlight(document, highlighter);
}

Практические применения

1 пункты в сотнях контрактов.
2. Academic Research – Извлекать ключевые фразы из научных статей для обзоров литературы.
3. Customer Support – Выявлять повторяющиеся проблемы в архиве электронных писем.
4. Content Management – Подсвечивать ключевые слова в статьях и блогах для SEO‑ по производительности

  • Compression: Высокое сжатие уменьшает объём хранилища, но может увеличить нагрузку на CPU; протестируйте для вашей нагрузки.
  • Memory Management: Индексируйте документы пакетами, чтобы снизить потреб поиска оставались точными.

Заключение

В этом руководстве мы продемонстрировали, как search documents java с помощью GroupDocs.Search, извлекать подробную информацию о результатах и highlight search terms java в HTML‑превью. Эти возможности позволяют создавать быстрые и удобные поисковые решения для любого репозитория документов.

Следующие шаги

  • Интегрировать подсвеченный HTML в ваш веб‑интерфейс.
  • Поэкспериментировать с дополнительными SearchOptions, такими как SynonymSearch или WildcardSearch.
  • Изучить справочник API GroupDocs.Search для продвинутых сценариев, например пользовательского ранжирования.

Часто задаваемые вопросы

Q: Что такое GroupDocs.Search?
A: Java SDK, который индексирует и ищет текст во множестве форматов документов, предоставляя такие функции, как нечеткий поиск и подсветка результатов.

Q: Как работает нечеткий поиск?
A: Он позволяет находить приближённые совпадения, допуская настраиваемое количество различий в символах, что полезно для обработки опечаток.

Q: Могу ли я использовать GroupDocs.Search без лицензии?
A: Да, доступна бесплатная пробная версия, но для продакшн‑развёртываний требуется полная лицензия.

Q: Какие форматы файлов поддерживаются?
A: PDF, DOCX, XLSX, PPTX, TXT и многие другие — см. официальную документацию для полного списка.

Q: Как отобразить подсвеченные результаты в веб‑приложении?
A: Сервисировать сгенерированный HTML‑файл (например, Highlighted.html) напрямую или внедрить его содержимое в веб‑страницу с помощью <iframe> или серверного рендеринга.


Last Updated: 2026-02-01
Tested With: GroupDocs.Search 25.4
Author: GroupDocs