GroupDocs.Search を使用した Java のドキュメント検索方法
デおいて、search documents java を者にとって重要です。法的契約書や学術論文を検索する場合でも、関連情報を素早く見つけるための堅牢なソリューションが必要です。このチュートリアルでは、さまざまなドキュメント形式に対する検索操作専用 の使用方法をご案内します。
Quick Answers
リは何ですか?** GroupDocs.Search for Java.
- search terms java を結果でハイライトできますか? はい、ライブラリはですか?** 無料トライアルが利用可能です。製品環境ではフルライセンスが必要です。
- どの IDE が最適ですか? IntelliJ IDEA、Eclipse、VS Code などの任意の Java IDE が使用できます。
- **Maven はサジトリと依存関係を
pom.xmlに追加してください。
What is GroupDocs.Search for Java?
など多数のドキュメントタイプのテキストをインデックス化し検索できる Java SDK です。ファジーマッチング、フレーズ検索、結果ハイライトといった高度な機能を提供し、検索可能なドキュメントリポジトリの構築に最適です。
Why Use Search Documents Java with GroupDocs.Search?
- 速度: インデックス検索は、巨大なコレクションでもミリ秒単位で結果を返します。
- 柔軟性: ファジーをサポートします。
- ハイライト: 生成された HTML プレビューで highlight searchンプレミス、クラウド、ハイブリッドストレージJava Development Kit (JDK) 8 以上 がインストールされていること。
- Maven(または手動での依存関係管理)。
- IntelliJ IDEA、Eclipse、**VS ロジェクト構造の## Setting Up GroupDocs.Search for Java
###```xml
Direct Download
If you prefer not to use Maven, download the latest JAR from the official release page: GroupDocs.Search for Java releases.
License Acquisition Steps
- 無料トライアル: 機能を試すで開始します。
- 一時ライセンス: [GroupDocs の公式サイト](https://purchase.groupdocs.com/:**### Basic Initialization and Setup
Create an index folder and instantiate the
Indexobject:
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
How to Search Documents Extract Search Result Information
Overview
詳細な情報(用語、フレーズ、出現回数)を抽出することで、分析ダッシュボードの構築やドキュメントセットの内容に関するレポート作成が容易になります。
Step‑by‑Step Implementation
Step 1: Create an Index
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
index.add(documentFolder);
Step 2: Configure Search Options (Enable fuzzy search)
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));
Step 3: Execute the Search
String query = "favourable OR \"ipsum dolor\"";
SearchResult result = index.search(query, options);
Step 4: Extract Occurrences
for (int i = 0; i < result.getDocumentCount(); i++) {
FoundDocument document = result.getFoundDocument(i);
for (FoundDocumentField field : document.getFoundFields()) {
if (field.getTerms() != null) {
for (String term : field.getTerms()) {
int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)];
System.out.println("Term: " + term + ", Occurrences: " + occurrences);
}
}
if (field.getTermSequences() != null) {
for (String[] terms : field.getTermSequences()) {
int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)];
StringBuilder sequence = new StringBuilder();
for (String term : terms) {
sequence.append(term).append(" ");
}
System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences);
}
}
}
}
Feature ** をハイライトした HTML ファイルを生成することで、ボレーションが向上します。
Step‑by‑Step Implementation
Step 1: Set Up Index with High Compression
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults";
IndexSettings settings = new IndexSettings();
settings.setTextStorageSettings(new TextStorageSettings(Compression.High));
Index index = new Index(indexFolder, settings);
index.add(documentFolder);
Step 2: Perform Search and Highlight Results
SearchResult result = index.search("solicitude");
if (result.getDocumentCount() > 0) {
FoundDocument document = result.getFoundDocument(0);
String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html";
OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path);
Highlighter highlighter = new DocumentHighlighter(outputAdapter);
index.highlight(document, highlighter);
}
Practical Applications
- 法務文書レビュー – 数百件の契約書から条項を迅速に特定します。
2なフレーズを抽出します。
3.ーカイブで繰り返し発生する問題を特定します。 - コンテンツ管理 – 記事やブログのキーワードをハイライトし、SEO 監査に活用します。
Performance Considerations
- 圧縮: 高圧縮はストレージを削減しますが、CPU 使用率が上がる可能性があります。ワークロードでテスト処理でドキュメントをインデックスし、メモリ使用量を抑えます。
- インデックスのリフレッシュ: 変更されたファイルを定期的に再インデックスし、検索結果の正確性を保ちます。
Conclusion
このガイドでは、GroupDocs.Search を使用して search documents java を実行し、詳細な結果情報を抽出し、HTML プレビューで highlight search terms java をハイライトする方法を示しました。これらの機能により、あらゆるドキュメントリポジトリ向けに高速でユーザーフレンドリーな検索体験を構築できます。
Next Steps
- ハイライトされた HTML をウェブ UI に統合する。
SearchOptionsのSynonymSearchやWildcardSearchなどの追加オプスタムスコアリングなど高度なシナリオ向けに GroupDocs.Search API リファレンスを調査する。
Frequently Asked Questions
Q: GroupDocs.Search とは何ですか?
A: 多数のドキュメント形式のテキストをインデった機能を提供します。
Q: ファジー検索はどのように機能しますか?
A: 許容できる文字数の差異を設定でき、スペルミスなどの近似一致を許可します。
Q: ライセンスなしで GroupDocs.Search を使用できますか?
A: はい、無料トライアルは利用可能ですが、製品環境での使用にはフルライセンスが必要です。
Q: サポートされているファイル形式は何ですか?
A: PDF、DOCX、XLSX、PPTX、TXT など多数。完全な一覧は公式ドキュメントをご確認ください。
Q: Web アプリケーションでハイライト結果を表示するには?
A: 生成された HTML ファイル(例: `Highlighted.htmlーバーサイドレンダリングでページに埋め込んでください。
Last Updated: 2026-02-01
Tested With: GroupDocs.Search 25.4
Author: GroupDocs