如何使用 GroupDocs.Search for Java 將文件加入索引
在龐大的文件集合中搜尋可能相當具挑戰性,但 GroupDocs.Search for Java 讓 add documents to index 變得簡單,並能快速檢索。於本指南中,您將了解如何設定索引資料夾、將文件加入索引,以及 optimize search performance 於實務應用中。
快速解答
- What is the first step? 透過 Maven 安裝 GroupDocs.Search 或下載程式庫。
- How do I add documents to index? 初始化索引後呼叫
index.add(yourDocumentsFolder)。 - Which folder should store the index? 使用如
output的專用資料夾,並以new Index(indexFolder)進行設定。 - Can I improve search speed? 可以——定期維護索引,並在背景執行緒中執行索引建立。
- Do I need a license? 測試可使用試用或臨時授權,正式環境則需完整授權。
什麼是「add documents to index」?
將文件加入索引即是處理來源檔案(PDF、DOCX、TXT 等),並將可搜尋的標記儲存於結構化資料庫中。此舉可在所有已索引內容上執行快速的全文查詢。
為何使用 GroupDocs.Search for Java?
- High performance – 內建最佳化即使在百萬檔案下亦能保持低搜尋延遲。
- Easy integration – 簡易 API 用於建立索引、加入文件與執行查詢。
- Scalable architecture – 可於本地或雲端運作,且能透過同義詞或排序功能自訂。
前置條件
- Java Development Kit (JDK) 8 或以上。
- IDE 如 IntelliJ IDEA 或 Eclipse。
- Maven 用於相依管理。
- 具備基本的 Java 程式設計知識。
設定 GroupDocs.Search for Java
Maven 安裝
將以下內容加入您的 pom.xml 檔案:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
直接下載
或者,直接從 GroupDocs.Search for Java releases 下載最新版本。
取得授權
- Free Trial – 無需承諾即可探索所有功能。
- Temporary License – 在試用期之後延長測試。
- Purchase – 取得正式授權以供生產環境使用。
基本初始化
import com.groupdocs.search.Index;
public class InitializeGroupDocs {
public static void main(String[] args) {
// Create an index in the specified folder
String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output";
Index index = new Index(indexFolder);
System.out.println("GroupDocs.Search initialized successfully.");
}
}
如何將文件加入索引
步驟 1:設定索引資料夾與來源資料夾
String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\SynonymSearch";
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY"; // Replace with your actual document path
說明:indexFolder 為儲存可搜尋索引的資料夾,而 documentsFolder 指向您想要 add documents to index 的檔案。
步驟 2:建立索引(設定索引資料夾)
Index index = new Index(indexFolder);
說明:此行會建立一個新的索引實例,並將資料寫入您先前設定的資料夾。
步驟 3:加入文件進行索引
index.add(documentsFolder);
說明:add 方法會掃描 documentsFolder,並 add documents to index,使其內容可被搜尋。
疑難排解提示
- Missing dependencies – 再次確認
pom.xml中的 Maven 條目。 - Invalid folder path – 確認
indexFolder與documentsFolder均已存在且 JVM 可存取。
實務應用
- Enterprise Document Management – 快速檢索合約、政策或人力資源檔案。
- Legal Research – 以最低延遲定位案件檔案與判例。
- Academic Libraries – 讓學者能在數千篇研究論文中搜尋。
效能考量
- Optimize search performance 透過定期重建或合併索引段落來提升。
- Resource Management – 監控堆積使用情況;若索引大量集合,請增加 JVM 記憶體。
- Best Practices – 在獨立執行緒中執行索引,以保持主應用程式的回應性。
常見問題與解決方案
| 問題 | 解決方案 |
|---|---|
| 大量索引期間的記憶體不足錯誤 | 將來源資料夾拆分為較小的批次,分別進行索引。 |
| 搜尋返回過時結果 | 大量更新後重新開啟 Index 物件,或在可用時呼叫 index.update()。 |
| 授權未被識別 | 確認授權檔案路徑正確,且授權版本與程式庫版本相符。 |
常見問答
Q: What is the minimum Java version required?
A: 建議使用 Java 8 或以上以獲得完整相容性。
Q: How can I handle very large document sets efficiently?
A: 使用批次處理、在背景執行緒中執行索引,並調整 JVM 記憶體設定。
Q: Can GroupDocs.Search be deployed in a cloud environment?
A: 可以,但需確保索引資料夾的儲存位置對所有實例皆可存取。
Q: What benefits does synonym search provide?
A: 它會擴展查詢詞彙至相關字詞,提升召回率而不犧牲精確度。
Q: Where can I find more advanced documentation?
A: 前往官方 API 參考文件 GroupDocs.Search API Reference。
資源
- 文件說明: GroupDocs Search for Java
- API 參考: GroupDocs Search API
- 下載: Latest Releases
- GitHub: GroupDocs.Search on GitHub
- 免費支援: GroupDocs Forum
- 臨時授權: Acquire a License
依照上述步驟,您現在已了解如何 add documents to index、設定索引資料夾,並使用 GroupDocs.Search for Java optimize search performance。祝開發順利!
最後更新: 2026-01-03
測試環境: GroupDocs.Search 25.4 for Java
作者: GroupDocs