在现代应用如何设置索引、将文档添加到索引、启用高级文本搜索功能以及微调性能。

快速答案

  • What does “add documents to index” mean? 它指将源文件加载到 GroupDocs.Search 可查询的可搜索数据结构中。
  • Which library version is required? GroupDocs.Search for Java 25.4(或更高)支持此处展示的功能。
  • Do I need a license? 免费试用可用于开发;生产环境需要商业许可证。
  • Can I search different word forms? 是的——在 SearchOptions 中启用 `set- Is Maven the only way to install? 不是,您也可以直接下载 JAR(请参阅 Direct Download可搜索的文本,并将帮助用户即使查询不完全匹配也能找到信息。这提升了用户满意度并减少了寻找文档的时间。

Libraries**: GroupDocs.Search for Java 25.4。

  • Environment Setup: Java JDK 8 或更 编程和 Maven 依赖管理。

设置 GroupDocs.Search for Java

在编写任何代码之前,请确保库已在您的项目中可用。

Maven 设置

将` 文件中:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

直接下载

如果您不想使用 Maven,也可以从官方页面下载最新的 JAR: GroupDocs.Search for Java releases

许可证获取步骤

  1. Free Trial – 免费试用 API。
  2. Temporary License – 延长试用期以进行更深入1. 创建并配置索引 索引是任何储分词后的文本和元数据,以实现快速检索。

概述

我们将在磁盘上创建一个文件夹来保存索引文件。

Code

import com.groupdocs.search.Index;

String indexFolder = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/SearchForDifferentWordForms";
Index index = new Index(indexFolder);

Explanation: Index 构造函数指向一个文件夹,所有索引数据索引其中找到的所有受支持的文件类型。

Code

String documentsFolder = "YOUR_DOCUMENT_DIRECTORY/DocumentsPath";
index.add(documentsFolder);

Explanation: add 方法递归处理文件夹,提取文本并将其存储到索引中。确保路径正确且应用具有读取权限。

3. 为词形配置搜索选项

为了让搜索容忍语法变化(例如 “wish”、 “wished”、 “wishes”),请启用词形搜索。

概述

我们将调整 SearchOptions 以开启此功能。

Code

import com.groupdocs.search.SearchOptions;

SearchOptions options = new SearchOptions();
options.setUseWordFormsSearch(true); // Enables search for different grammatical variations of words.

Explanation: 设置 setUseWordFormsSearch(true) 告诉引擎扩展查询以包含已知的已配置后,我们现在可以我们将搜索单词 “wished” 并检索匹配的文档。

Code

import com.groupdocs.search.SearchResult;

String query = "wished";
SearchResult result = index.search(query, options);

Explanation: search 方法使用我们定义的选项对索引内容执行查询。返回的 SearchResult 包含一系列命中,每个命 文档Performance slowness** – 对于大型语料库,考虑分批索千上万的文件中快速定位政策、合同或人力资源手册。
2. Legal Research – 即使措辞不同,也能通过词形搜索找到先例案例。
3. E‑commerce Catalogs – 允许购物者使用多样的术语搜索产品描述。

性能提示

  • 仅在添加新文档或现有文档更改时重新索引。
    标志为大型索引分配足够的堆内存。
  • 定期调用如何 **add documents to index。
  • 通过配置特定语言的分析器来探索多语言支持。

常见问题解答

Q1: What formats does GroupDocs.Search support?
A1: 它支持包括 DOCX、PDF、PPTX、TXT 等在内的多种格式。完整列表请参阅官方文档。

Q2: How do I update my index with new documents?
A2: 只Folder)`;库将仅添加新文件或已更改的文件。

Q3: Can I customize search queries further?
A3: 是的——SearchOptions 提供了 can I do?**
A4: 确保索引存储在快速大小,并避免索引不必要的大文件。

Q5: Where can I get help from the community?
A5: 使用官方支持论坛: GroupDocs Support Forum

资源


Last Updated: 2026-01-24
Tested With: GroupDocs.Search 25.4 for Java
**Author