如何使用 GroupDocs.Search for Java 將文件加入索引

在龐大的文件集合中搜尋可能相當具挑戰性,但 GroupDocs.Search for Java 讓 add documents to index 變得簡單,並能快速檢索。於本指南中,您將了解如何設定索引資料夾、將文件加入索引,以及 optimize search performance 於實務應用中。

快速解答

  • What is the first step? 透過 Maven 安裝 GroupDocs.Search 或下載程式庫。
  • How do I add documents to index? 初始化索引後呼叫 index.add(yourDocumentsFolder)
  • Which folder should store the index? 使用如 output 的專用資料夾,並以 new Index(indexFolder) 進行設定。
  • Can I improve search speed? 可以——定期維護索引,並在背景執行緒中執行索引建立。
  • Do I need a license? 測試可使用試用或臨時授權,正式環境則需完整授權。

什麼是「add documents to index」?

將文件加入索引即是處理來源檔案(PDF、DOCX、TXT 等),並將可搜尋的標記儲存於結構化資料庫中。此舉可在所有已索引內容上執行快速的全文查詢。

為何使用 GroupDocs.Search for Java?

  • High performance – 內建最佳化即使在百萬檔案下亦能保持低搜尋延遲。
  • Easy integration – 簡易 API 用於建立索引、加入文件與執行查詢。
  • Scalable architecture – 可於本地或雲端運作,且能透過同義詞或排序功能自訂。

前置條件

  • Java Development Kit (JDK) 8 或以上。
  • IDE 如 IntelliJ IDEA 或 Eclipse。
  • Maven 用於相依管理。
  • 具備基本的 Java 程式設計知識。

設定 GroupDocs.Search for Java

Maven 安裝

將以下內容加入您的 pom.xml 檔案:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

直接下載

或者,直接從 GroupDocs.Search for Java releases 下載最新版本。

取得授權

  1. Free Trial – 無需承諾即可探索所有功能。
  2. Temporary License – 在試用期之後延長測試。
  3. Purchase – 取得正式授權以供生產環境使用。

基本初始化

import com.groupdocs.search.Index;

public class InitializeGroupDocs {
    public static void main(String[] args) {
        // Create an index in the specified folder
        String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output";
        Index index = new Index(indexFolder);
        
        System.out.println("GroupDocs.Search initialized successfully.");
    }
}

如何將文件加入索引

步驟 1:設定索引資料夾與來源資料夾

String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\SynonymSearch";
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY"; // Replace with your actual document path

說明indexFolder 為儲存可搜尋索引的資料夾,而 documentsFolder 指向您想要 add documents to index 的檔案。

步驟 2:建立索引(設定索引資料夾)

Index index = new Index(indexFolder);

說明:此行會建立一個新的索引實例,並將資料寫入您先前設定的資料夾。

步驟 3:加入文件進行索引

index.add(documentsFolder);

說明add 方法會掃描 documentsFolder,並 add documents to index,使其內容可被搜尋。

疑難排解提示

  • Missing dependencies – 再次確認 pom.xml 中的 Maven 條目。
  • Invalid folder path – 確認 indexFolderdocumentsFolder 均已存在且 JVM 可存取。

實務應用

  1. Enterprise Document Management – 快速檢索合約、政策或人力資源檔案。
  2. Legal Research – 以最低延遲定位案件檔案與判例。
  3. Academic Libraries – 讓學者能在數千篇研究論文中搜尋。

效能考量

  • Optimize search performance 透過定期重建或合併索引段落來提升。
  • Resource Management – 監控堆積使用情況;若索引大量集合,請增加 JVM 記憶體。
  • Best Practices – 在獨立執行緒中執行索引,以保持主應用程式的回應性。

常見問題與解決方案

問題解決方案
大量索引期間的記憶體不足錯誤將來源資料夾拆分為較小的批次,分別進行索引。
搜尋返回過時結果大量更新後重新開啟 Index 物件,或在可用時呼叫 index.update()
授權未被識別確認授權檔案路徑正確,且授權版本與程式庫版本相符。

常見問答

Q: What is the minimum Java version required?
A: 建議使用 Java 8 或以上以獲得完整相容性。

Q: How can I handle very large document sets efficiently?
A: 使用批次處理、在背景執行緒中執行索引,並調整 JVM 記憶體設定。

Q: Can GroupDocs.Search be deployed in a cloud environment?
A: 可以,但需確保索引資料夾的儲存位置對所有實例皆可存取。

Q: What benefits does synonym search provide?
A: 它會擴展查詢詞彙至相關字詞,提升召回率而不犧牲精確度。

Q: Where can I find more advanced documentation?
A: 前往官方 API 參考文件 GroupDocs.Search API Reference

資源

依照上述步驟,您現在已了解如何 add documents to index、設定索引資料夾,並使用 GroupDocs.Search for Java optimize search performance。祝開發順利!


最後更新: 2026-01-03
測試環境: GroupDocs.Search 25.4 for Java
作者: GroupDocs