如何使用 GroupDocs.Search 於 Java 搜尋文件
在數位時代,能夠快速 search documents java 對企業和開發者而言至關重要。無論是搜尋法律合約或學術論文,都需要一個強大的解決方案來快速找到相關資訊。本教學將指引您使用 GroupDocs.Search Java——一個專為跨各種文件格式的搜尋操作而設計的強大函式庫。
快速答覆
- 什麼函式庫可以協助 search documents java? GroupDocs.Search for Java.
- 我可以在結果中 highlight search terms java 嗎? 可以,函式庫能產生帶有突顯詞彙的 HTML。
- 我需要授權嗎? 可使用免費試用版;正式上線需購買完整授權。
- 哪一個 IDE 最適合? 任何 Java IDE,例如 IntelliJ IDEA、Eclipse 或 VS Code。
- 支援 Maven 嗎? 當然支援——只要在
pom.xml中加入儲存庫與相依性即可。
GroupDocs.Search for Java 是什麼?
GroupDocs.Search 是一套 Java SDK,可對多種文件類型(PDF、DOCX、XLSX 等)進行索引與文字搜尋。它提供模糊匹配、片語搜尋與結果突顯等進階功能,讓它成為建置可搜尋文件庫的理想選擇。
為何在 Java 中使用 GroupDocs.Search 進行文件搜尋?
- 速度: 索引搜尋可在毫秒內返回結果,即使是大型集合亦是如此。
- 彈性: 支援模糊搜尋、布林運算子與片語查詢。
- 突顯: 您可以直接在產生的 HTML 預覽中 highlight search terms java。
- 可擴充性: 可於本地、雲端或混合儲存解決方案中使用。
前置條件
- Java Development Kit (JDK) 8 或更高版本 已安裝。
- Maven(或手動相依性管理)。
- IDE 如 IntelliJ IDEA、Eclipse 或 VS Code。
- 具備 Java 與 Maven 專案結構的基本知識。
設定 GroupDocs.Search for Java
透過 Maven 安裝
將 GroupDocs 儲存庫與相依性加入您的 pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
直接下載
如果您不想使用 Maven,可從官方發佈頁面下載最新的 JAR 檔案:GroupDocs.Search for Java releases。
取得授權步驟
- Free Trial: 先使用免費試用版以探索功能。
- Temporary License: 可透過 GroupDocs 官方網站 取得。
- Purchase: 若需無限制的正式使用,請購買完整授權。
基本初始化與設定
建立索引資料夾並實例化 Index 物件:
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
如何在 Java 中搜尋文件 – 功能 1:擷取搜尋結果資訊
概觀
擷取詳細資訊(詞彙、片語、出現次數)有助於您建立內容的報告。
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
index.add(documentFolder);
步驟 2:設定搜尋選項(啟用模糊搜尋)
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));
步驟 3:執行搜尋
String query = "favourable OR \"ipsum dolor\"";
SearchResult result = index.search(query, options);
步驟 4:擷取出現次數
for (int i = 0; i < result.getDocumentCount(); i++) {
FoundDocument document = result.getFoundDocument(i);
for (FoundDocumentField field : document.getFoundFields()) {
if (field.getTerms() != null) {
for (String term : field.getTerms()) {
int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)];
System.out.println("Term: " + term + ", Occurrences: " + occurrences);
}
}
if (field.getTermSequences() != null) {
for (String[] terms : field.getTermSequences()) {
int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)];
StringBuilder sequence = new StringBuilder();
for (String term : terms) {
sequence.append(term).append(" ");
}
System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences);
}
}
}
}
功能 2:在文件中突顯搜尋詞彙(Java)
概觀
產生含有 highlight search terms java 的 HTML 檔案,可讓最終使用者即時看到匹配位置,提升審閱速度與協作效率。
步驟實作
步驟 1:使用高壓縮設定索引
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults";
IndexSettings settings = new IndexSettings();
settings.setTextStorageSettings(new TextStorageSettings(Compression.High));
Index index = new Index(indexFolder, settings);
index.add(documentFolder);
步驟 2:執行搜尋並突顯結果
SearchResult result = index.search("solicitude");
if (result.getDocumentCount() > 0) {
FoundDocument document = result.getFoundDocument(0);
String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html";
OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path);
Highlighter highlighter = new DocumentHighlighter(outputAdapter);
index.highlight(document, highlighter);
}
實務應用
- Legal Document Review – 快速在數百份合約中定位條款。
- Academic Research – 從研究論文中擷取關鍵片語以供文獻回顧。
- Customer Support – 辨識電子郵件檔案中的常見問題。
- Content Management – 在文章與部落格中突顯關鍵字,以進行 SEO 稽核。
效能考量
- Compression: 高壓縮可減少儲存空間,但可能增加 CPU 使用率;請依工作負載測試。
- Memory Management: 以批次方式索引文件,以降低記憶體佔用。
- Index Refresh: 定期重新索引變更的檔案,以確保搜尋結果的準確性。
結論
本指南示範了如何使用 GroupDocs.Search search documents java、擷取詳細的結果資訊,並在 HTML 預覽中 highlight search terms java。這些功能讓您能為任何文件庫打造快速、使用者友善的搜尋體驗。
後續步驟
- 將突顯的 HTML 整合至您的 Web UI。
- 嘗試使用其他
SearchOptions,如SynonymSearch或WildcardSearch。 - 探索 GroupDocs.Search API 參考文件,以應對自訂評分等進階情境。
常見問答
Q: 什麼是 GroupDocs.Search?
A: 一套 Java SDK,可對多種文件格式的文字進行索引與搜尋,提供模糊搜尋與結果突顯等功能。
Q: 模糊搜尋如何運作?
A: 它允許容忍可設定的字元差異數,以取得近似匹配,對處理拼寫錯誤非常有用。
Q: 可以在沒有授權的情況下使用 GroupDocs.Search 嗎?
A: 可以,提供免費試用版,但正式上線需購買完整授權。
Q: 支援哪些檔案格式?
A: PDF、DOCX、XLSX、PPTX、TXT,以及更多其他格式——請參閱官方文件以取得完整清單。
Q: 如何在 Web 應用程式中顯示突顯的結果?
A: 直接提供產生的 HTML 檔案(例如 Highlighted.html),或使用 <iframe> 或伺服器端渲染將其內容嵌入網頁。
最後更新: 2026-02-01
測試版本: GroupDocs.Search 25.4
作者: GroupDocs