Как искать документы Java с помощью GroupDocs.Search
В цифровую эпоху возможность search documents java быстро является критически важной для бизнеса и разработчиков. Независимо от того, ищете ли вы в юридических контрактах требуется надёжное решение для быстрого нахождения релевантной информации. Этот учебник проведёт операций по различным форматам документов documents java?** GroupDocs.Search for Java.
- Могу ли я highlight search terms java в результатах? Yes, the library can generate HTML with highlighted terms.
- Do I need a license? A free trial is available; a full license is required for production. Any Java IDE such as IntelliJ IDEA, Eclipse, or VS Code.
- **.xml`.
Что такое GroupDocs.Search for Java?
GroupDocs.Search — это Java SDK, который индексирует.). Он предоставляет расширенные возможности, такие как репозиториев документов.
Почему использовать Search Documents Java с GroupDocs.Search?
- Speed: Индексированный поиск возвращает результаты за миллисекунды, даже для больших коллекций.
- Flexibility: Поддерживает нечеткий поиск, логические операторы и запросы фраз.
- **Highlighting:**евью.
- Scalability: Работает с on‑premises, облачными или гибительные требования
- Java Development Kit (JDK) 8 или выше установлен.
- Maven (или ручное управление зависимостями).
- IDE, например IntelliJ IDEA, Eclipse или VS Code.
- Базовые знания Java и структуры проекта Maven.
Настройка GroupDocs.Search for Java
Установка через Maven
Добавьте репозиторий GroupDocs и зависимость в ваш pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Прямое скачивание
Если вы предпочитаете не использовать Maven, скачайте последнюю JAR‑файл со официальной страницы релизов: GroupDocs.Search for Java releases.
Шаги получения лицензии
- Free Trial: Начните с бесплатной пробной версии, чтобы изучить возможности.
- Temporary License: Получите через официальный сайт GroupDocs.
- Purchase: Для неограниченного использования в продакшене приобретите полную лицензию.
Базовая инициализация и настройка
Создайте папку индекса и создайте объект Index:
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
Как искать документы Java – Функция 1: Извлечение информации о результатах поиска
Обзор
Извлечение подробной информации (термины, фразы, количество вхождений) помогает создавать аналитические панели или генерировать отчёты о содержимом вашего набора документов.
Пошаговая реализация
Шаг 1: Создать индекс
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
index.add(documentFolder);
Шаг 2: Настроить параметры поиска (включить нечеткий поиск)
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));
Шаг 3: Выполнить поиск
String query = "favourable OR \"ipsum dolor\"";
SearchResult result = index.search(query, options);
Шаг 4: Извлечь вхождения
for (int i = 0; i < result.getDocumentCount(); i++) {
FoundDocument document = result.getFoundDocument(i);
for (FoundDocumentField field : document.getFoundFields()) {
if (field.getTerms() != null) {
for (String term : field.getTerms()) {
int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)];
System.out.println("Term: " + term + ", Occurrences: " + occurrences);
}
}
if (field.getTermSequences() != null) {
for (String[] terms : field.getTermSequences()) {
int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)];
StringBuilder sequence = new StringBuilder();
for (String term : terms) {
sequence.append(term).append(" ");
}
System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences);
}
}
}
}
Функция 2: Подсветка Search Terms Java в документах
Обзор
Создание HTML‑файла с highlight search terms java, улучшая скорость обзора и совместную работу.
Пошаговая реализация
Ш уровнем сжатия
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults";
IndexSettings settings = new IndexSettings();
settings.setTextStorageSettings(new TextStorageSettings(Compression.High));
Index index = new Index(indexFolder, settings);
index.add(documentFolder);
Шаг 2: Выполнить поиск и подсветить результаты
SearchResult result = index.search("solicitude");
if (result.getDocumentCount() > 0) {
FoundDocument document = result.getFoundDocument(0);
String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html";
OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path);
Highlighter highlighter = new DocumentHighlighter(outputAdapter);
index.highlight(document, highlighter);
}
Практические применения
1 пункты в сотнях контрактов.
2. Academic Research – Извлекать ключевые фразы из научных статей для обзоров литературы.
3. Customer Support – Выявлять повторяющиеся проблемы в архиве электронных писем.
4. Content Management – Подсвечивать ключевые слова в статьях и блогах для SEO‑ по производительности
- Compression: Высокое сжатие уменьшает объём хранилища, но может увеличить нагрузку на CPU; протестируйте для вашей нагрузки.
- Memory Management: Индексируйте документы пакетами, чтобы снизить потреб поиска оставались точными.
Заключение
В этом руководстве мы продемонстрировали, как search documents java с помощью GroupDocs.Search, извлекать подробную информацию о результатах и highlight search terms java в HTML‑превью. Эти возможности позволяют создавать быстрые и удобные поисковые решения для любого репозитория документов.
Следующие шаги
- Интегрировать подсвеченный HTML в ваш веб‑интерфейс.
- Поэкспериментировать с дополнительными
SearchOptions, такими какSynonymSearchилиWildcardSearch. - Изучить справочник API GroupDocs.Search для продвинутых сценариев, например пользовательского ранжирования.
Часто задаваемые вопросы
Q: Что такое GroupDocs.Search?
A: Java SDK, который индексирует и ищет текст во множестве форматов документов, предоставляя такие функции, как нечеткий поиск и подсветка результатов.
Q: Как работает нечеткий поиск?
A: Он позволяет находить приближённые совпадения, допуская настраиваемое количество различий в символах, что полезно для обработки опечаток.
Q: Могу ли я использовать GroupDocs.Search без лицензии?
A: Да, доступна бесплатная пробная версия, но для продакшн‑развёртываний требуется полная лицензия.
Q: Какие форматы файлов поддерживаются?
A: PDF, DOCX, XLSX, PPTX, TXT и многие другие — см. официальную документацию для полного списка.
Q: Как отобразить подсвеченные результаты в веб‑приложении?
A: Сервисировать сгенерированный HTML‑файл (например, Highlighted.html) напрямую или внедрить его содержимое в веб‑страницу с помощью <iframe> или серверного рендеринга.
Last Updated: 2026-02-01
Tested With: GroupDocs.Search 25.4
Author: GroupDocs