使用 GroupDocs.Search for Java 建立搜尋索引 (Java)

歡迎閱讀本終極指南,了解如何使用 GroupDocs.Search for Java 建立 建立搜尋索引(Java) 應用程式。在本教學中,您還會發現如何 標示搜尋結果(Java),此功能可透過在文件內直接顯示匹配項目,大幅提升使用者體驗。無論您是構建小型內部工具或大型企業解決方案,都能找到在 PDF、Office、HTML 以及其他多種格式中索引、搜尋、標示與微調結果所需的一切。

快速概覽

  • Index diverse document types – PDFs、DOCX、PPTX、XLSX、HTML 等多種格式。
  • Run advanced queries – 支援 Boolean、模糊、通配符、片語、正規表達式以及分面搜尋。
  • Leverage language processing – 同義詞、拼寫檢查、同音詞偵測與自訂字典。
  • Integrate OCR – 從掃描影像中擷取文字,並納入可搜尋的索引。
  • Optimize performance – 控制記憶體使用量、索引大小與查詢回應時間。
  • Highlight results – 直接在原始文件或 HTML 預覽中顯示匹配項目。

以下您會找到精選的專屬教學,逐步說明這些功能的使用方式。

快速解答

  • 「highlight search results java」的功能是什麼? 它會在原始文件或產生的 HTML 預覽中,以視覺方式標記匹配的詞彙。
  • 哪個函式庫提供分面搜尋(Java)? GroupDocs.Search for Java 包含內建的分面搜尋支援。
  • 我可以使用相同的 API 實作 OCR(Java)嗎? 可以,OCR 引擎已整合,可透過單一設定啟用。
  • 在正式環境使用是否需要授權? 在試用期結束後,部署需要商業授權。
  • API 是否相容於 Java 17 及更高版本? 完全支援 Java 8 以上,並已在 Java 17 上測試。

什麼是「highlight search results java」?

在 Java 中標示搜尋結果是指以程式方式套用視覺提示(例如背景色或粗體樣式)於與使用者查詢相符的精確字詞或片語。此技術可協助使用者快速定位相關資訊,尤其在長文件中。

為何使用 GroupDocs.Search for Java?

  • Speed: 在數秒內索引與查詢數千份文件。
  • Versatility: 開箱即支援超過 150 種檔案格式。
  • Extensibility: 可在 API 內加入自訂字典、OCR 與分面搜尋(Java)。
  • Developer‑friendly: 簡潔流暢的 API,附有完整文件與範例專案。

前置條件

  • Java 8 或更新版本(建議使用 Java 17)
  • Maven 或 Gradle 進行相依管理
  • 有效的 GroupDocs.Search for Java 授權(提供試用版)

步驟說明

步驟 1:設定專案

建立 Maven / Gradle 專案,並加入 GroupDocs.Search 相依項目。將授權檔案放入 resources 資料夾中。

步驟 2:建立索引

實例化 Index 類別,指向用於儲存索引檔案的資料夾,並對每個欲加入搜尋的文件呼叫 add

步驟 3:啟用 OCR(實作 OCR Java)

若需索引掃描影像,請透過設定 OcrOptions 物件並將其附加至索引程序,以啟用 OCR 模組。

步驟 4:執行搜尋查詢

使用 SearchOptions 類別建構查詢。您可以結合 Boolean、模糊以及 分面搜尋(Java) 條件,以細化結果。

步驟 5:標示搜尋結果(Java)

取得 SearchResult 後,呼叫 Highlight 工具以產生原始文件或 HTML 預覽的標示版。API 允許您自訂標示顏色、CSS 類別與輸出格式。

步驟 6:檢視與最佳化

使用內建統計工具分析索引大小與查詢延遲。必要時調整記憶體設定或啟用壓縮。

常見問題與解決方案

  • No highlights appear: 確認已使用正確的 HighlightOptions 呼叫 Highlight 方法,且輸出格式支援樣式(例如 HTML)。
  • OCR misses text: 檢查已安裝 OCR 語言套件,且影像品質符合最低 DPI 要求(建議 300 dpi)。
  • Faceted search returns empty buckets: 確保在索引步驟中將用於分面的欄位以 Facet 類型索引。

常見問答

Q: 我可以將 faceted search java 與模糊匹配一起使用嗎?
A: 可以,您可以在 SearchOptions 建構器中串接分面過濾器與模糊查詢。

Q: 標示功能能在加密的 PDF 上運作嗎?
A: 僅在將文件加入索引時提供正確密碼才會生效。

Q: 索引大小到何程度會影響效能?
A: 此 API 為多 GB 索引設計;您可透過啟用壓縮與調整 maxMemoryUsage 設定進一步提升效能。

Q: 有辦法自訂標示顏色嗎?
A: 當然可以。使用 HighlightOptions.setColor(Color.YELLOW),或為 HTML 輸出提供自訂 CSS 類別。

Q: 本指南測試使用的 GroupDocs.Search 版本為何?
A: 範例已使用 GroupDocs.Search for Java 23.9 進行驗證。

相關主題您可能感興趣

Java 文件搜尋功能概覽

GroupDocs.Search for Java 提供完整的功能集合,協助您打造強大的搜尋應用程式:

  • Multi‑Format Support – 支援跨 PDF、DOCX、PPT、XLS、HTML 及其他多種文件類型的搜尋
  • Advanced Search Types – 支援 Boolean、模糊、通配符、片語、正規表達式以及 faceted search java 選項
  • Intelligent Indexing – 具備可設定選項的快速高效文件索引
  • Language Processing – 同義詞偵測、拼寫檢查與同音詞辨識
  • OCR Support – 從影像與掃描文件中擷取並搜尋文字(implement OCR java)
  • Performance Optimization – 可設定的記憶體使用與搜尋速度選項
  • Result Highlighting – 在原始文件中視覺化標示搜尋匹配項目(highlight search results java
  • Dictionary Support – 為特定術語與領域提供自訂字典
  • Distributed Search – 使用網路功能建構可擴展的分散式搜尋解決方案
  • Blazing Speed – 在數秒內處理與搜尋數千份文件

學習資源


最後更新: 2026-02-16
測試版本: GroupDocs.Search for Java 23.9
作者: GroupDocs