创建搜索索引 Java – 分面和复杂搜索

在 Java 中实现强大的 search experience 可能让人感到压力山大,尤其是当你需要 create search index Java 项目来处理大型文档集合时。幸运的是,GroupDocs.Search for Java 提供了丰富的 API,只需几行代码即可构建分面和复杂查询。在本教程中,你将了解如何设置库,create a search index Java,添加文档,并运行简单的分面搜索和复杂的多条件查询。

快速答案

  • What is a faceted search? 一种通过预定义类别(例如文件类型、日期)过滤结果的方式。
  • How do I create a search index Java? 初始化指向文件夹的 Index 对象并添加文档。
  • Can I combine multiple criteria? 是的——使用基于对象的查询或文本查询中的布尔运算符。
  • Do I need a license? 免费试用可用于开发;商业许可证可消除限制。
  • Which IDE works best? 任意 Java IDE(IntelliJ IDEA、Eclipse、NetBeans)均可正常使用。

什么是 “create search index java”?

在 Java 中创建搜索索引意味着构建一种可搜索的数据结构,用于存储文档元数据和内容,从而能够基于用户查询快速检索。使用 GroupDocs.Search,索引存放在磁盘上,可增量更新,并支持分面和复杂布尔逻辑等高级功能。

为什么在分面和复杂查询中使用 GroupDocs.Search?

  • Out‑of‑the‑box faceting – 按文件名、大小或自定义元数据等字段过滤。
  • Rich query language – 使用 AND/OR/NOT 运算符混合文本、短语和字段查询。
  • Scalable performance – 索引数百万文档,同时保持低搜索延迟。
  • Pure Java – 无本机依赖,适用于运行 JDK 8+ 的任何平台。

前置条件

在深入之前,请确保你具备以下条件:

  • JDK 8 or newer 已安装并在 IDE 中配置。
  • Maven(或 Gradle)用于依赖管理。
  • GroupDocs.Search for Java ≥ 25.4。
  • 对 Java 面向对象概念和 Maven 项目结构有基本了解。

设置 GroupDocs.Search for Java

Maven 设置

将仓库和依赖添加到你的 pom.xml 文件中:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

直接下载

或者,从官方发布页面下载最新的 JAR:
GroupDocs.Search for Java releases

获取许可证

解锁全部功能:

  1. Free trial – 适用于开发和测试。
  2. Temporary evaluation license – 延长试用限制。
  3. Commercial license – 消除生产使用的所有限制。

基本初始化和设置

以下代码片段展示了如何通过实例化 Indexcreate a search index Java

import com.groupdocs.search.Index;

public class SearchSetup {
    public static void main(String[] args) {
        String indexFolder = "YOUR_OUTPUT_DIRECTORY/AdvancedUsage/Searching/FacetedSearch/SimpleFacetedSearch";
        
        // Create an instance of Index – this creates the on‑disk index
        Index index = new Index(indexFolder);
        
        System.out.println("GroupDocs.Search initialized successfully!");
    }
}

索引准备好后,我们可以继续进行实际的分面和复杂查询。

如何 create search index java – 简单分面搜索

分面搜索让最终用户通过从预定义类别(分面)中选择值来缩小结果范围。以下是逐步演示。

步骤 1:创建索引

首先,将 Index 指向用于存储索引文件的文件夹。

import com.groupdocs.search.Index;

String indexFolder = "YOUR_OUTPUT_DIRECTORY/AdvancedUsage/Searching/FacetedSearch/SimpleFacetedSearch";
Index index = new Index(indexFolder);

步骤 2:向索引添加文档

告诉 GroupDocs.Search 你的源文档所在位置。所有支持的文件类型(PDF、DOCX、TXT 等)将自动被索引。

import com.groupdocs.search.Index;

String documentsFolder = "YOUR_DOCUMENT_DIRECTORY";

// Adding documents to the index
index.add(documentsFolder);

步骤 3:使用文本查询在 Content 字段执行搜索

快速文本查询按 content 字段过滤。语法 content: Pellentesque 将结果限制为正文中包含单词 Pellentesque 的文档。

import com.groupdocs.search.results.SearchResult;

String query1 = "content: Pellentesque";
SearchResult result1 = index.search(query1);

// Output search results
System.out.println("Documents found (query 1): " + result1.getDocumentCount());

步骤 4:使用对象查询执行搜索

基于对象的查询提供细粒度控制。这里我们构建一个词查询,将其包装在字段查询中并执行。

import com.groupdocs.search.SearchQuery;
import com.groupdocs.search.options.CommonFieldNames;

SearchQuery wordQuery = SearchQuery.createWordQuery("Pellentesque");
SearchQuery fieldQuery = SearchQuery.createFieldQuery(CommonFieldNames.Content, wordQuery);
SearchResult result2 = index.search(fieldQuery);

// Output search results
System.out.println("Documents found (query 2): " + result2.getDocumentCount());

如何 create search index java – 复杂查询搜索

复杂查询结合多个字段、布尔运算符和短语搜索。非常适用于电子商务过滤或法律文档检索等场景。

步骤 1:为复杂查询创建索引

复用相同的文件夹结构;你可以在简单和复杂场景之间共享索引。

String indexFolder = "YOUR_OUTPUT_DIRECTORY/AdvancedUsage/Searching/FacetedSearch/ComplexQuery";
Index index = new Index(indexFolder);
index.add(documentsFolder);

步骤 2:使用文本查询执行搜索

以下查询查找文件名为 lorem and ipsum or 内容包含任意两个精确短语的文件。

import com.groupdocs.search.results.SearchResult;

String query1 = "(filename: (lorem AND ipsum)) OR (content: (\"lectus eu aliquam\" OR \"dignissim turpis\"))";
SearchResult result1 = index.search(query1);

// Output search results
class SearchResult {
    public int getDocumentCount() {
        // Implementation here
        return 0; // Placeholder
    }
}
System.out.println("Documents found (complex text query): " + result1.getDocumentCount());

步骤 3:使用对象查询执行搜索

基于对象的构造与文本查询相对应,但提供类型安全和 IDE 辅助。

import com.groupdocs.search.SearchQuery;

SearchQuery word6Query = SearchQuery.createWordQuery("lorem");
SearchQuery word7Query = SearchQuery.createWordQuery("ipsum");

// Constructing AND, OR queries for filename field
SearchQuery andQuery = SearchQuery.createAndQuery(word6Query, word7Query);
SearchQuery filenameQuery = SearchQuery.createFieldQuery(CommonFieldNames.FileName, andQuery);

// Content search using OR query with phrases
SearchQuery phrase1Query = SearchQuery.createPhraseSearchQuery("lectus", "eu", "aliquam");
SearchQuery phrase2Query = SearchQuery.createPhraseSearchQuery("dignissim", "turpis");

SearchQuery contentQuery = SearchQuery.createFieldQuery(CommonFieldNames.Content, 
    SearchQuery.createOrQuery(phrase1Query, phrase2Query));

// Final root query combining filename and content queries
SearchQuery rootQuery = SearchQuery.createOrQuery(filenameQuery, contentQuery);
SearchResult result2 = index.search(rootQuery);

// Output search results
System.out.println("Documents found (complex object query): " + result2.getDocumentCount());

分面与复杂搜索的实际应用

场景分面如何帮助示例查询
电子商务目录按类别、价格、品牌过滤category: Electronics AND price:[100 TO 500]
法律文档库按案件号、司法管辖区缩小范围caseNumber: 2023-045 AND jurisdiction: "California"
研究档案结合作者、出版年份、关键词(author: "Doe") AND (year: 2022) AND (keywords: "machine learning")
企业内联网按文件类型和部门搜索filetype: pdf AND department: HR

常见陷阱与故障排除

  • Empty results – 验证文档是否成功添加(可使用 index.getDocumentCount() 检查)。
  • Stale index – 添加或删除文件后,调用 index.update() 以保持索引同步。
  • Incorrect field names – 使用 CommonFieldNames 常量(ContentFileName 等)避免拼写错误。
  • Performance bottlenecks – 对于庞大集合,考虑启用 index.setCacheSize() 或为索引文件夹使用专用 SSD。

常见问答

Q: Can I use GroupDocs.Search with Spring Boot?
A: 当然。只需添加 Maven 依赖,将索引配置为 Spring Bean,并在需要的地方注入即可。

Q: Does the library support custom metadata fields?
A: 是的——你可以在索引时添加用户自定义字段,然后在其上进行分面。

Q: How large can the index grow?
A: 索引基于磁盘,可处理数百万文档;只需确保足够的存储空间并监控缓存设置。

Q: Is there a way to rank results by relevance?
A: GroupDocs.Search 会自动为匹配项打分;你可以通过 SearchResult.getDocument(i).getScore() 获取分数。

Q: What happens if I index encrypted PDFs?
A: 添加文档时提供密码:index.add(filePath, password)

结论

现在,你应该已经能够熟练使用 GroupDocs.Search create a search index Java,添加文档,并构建简单的分面查询和复杂的布尔搜索。这些功能使你能够在各种应用中提供快速、准确且用户友好的搜索体验——从电子商务平台到企业知识库。

准备好下一步了吗?探索 GroupDocs.Search 的高级功能,如 highlightingsuggestionsreal‑time indexing,进一步提升应用的搜索能力。


最后更新: 2025-12-16
测试环境: GroupDocs.Search 25.4 for Java
作者: GroupDocs