Java 用 GroupDocs.Redaction を使用したドキュメントのテキストの赤字化方法

このガイドでは、GroupDocs.Redaction を使用して Java ベースのドキュメントで テキストを赤字化する方法 を紹介します。個人情報をマスクしたり、機密テキストをプレースホルダーに置き換える必要がある場合でも、以下の手順で完全な本番対応ソリューションを実装できます。チュートリアルの最後までに、プライバシーを保護し、コンプライアンスを遵守し、さまざまなファイル形式で自動的に赤字化できるようになります。

クイック回答

  • 使用されているライブラリは何ですか? GroupDocs.Redaction for Java
  • 個人情報をマスクできますか? Yes – use exact‑phrase redaction with replacement options.
  • バッチ処理はサポートされていますか? Absolutely, you can loop through multiple files with the same Redactor instance.
  • ライセンスは必要ですか? A free trial works for evaluation; a commercial license is required for production.
  • 必要な Java バージョンはどれですか? JDK 8 or higher.

「テキストを赤字化する方法」とは?

赤字化とは、機密データをドキュメントから永久に削除または隠すプロセスです。GroupDocs.Redaction を使用すると、特定の文字列をプログラムで検出し、安全なプレースホルダーに置き換えて、サニタイズされたファイルとして保存できます—すべて手動編集なしで実行できます。

なぜ Java 用 GroupDocs.Redaction を使用するのか?

  • 幅広いフォーマットサポート: DOCX、PDF、XLSX、PPTX など。
  • 高性能: 大容量ファイルやバッチ処理に最適化されています。
  • 拡張可能なコールバック: ロギングやカスタム処理のために赤字化イベントにフックできます。
  • コンプライアンス対応: GDPR、HIPAA、その他のプライバシー規制に準拠しています。

前提条件

  • Java Development Kit (JDK): バージョン 8 以上。
  • IDE: IntelliJ IDEA、Eclipse、または任意の Java 対応エディタ。
  • Maven: 依存関係管理に使用。
  • 基本的な Java 知識: クラス、メソッド、例外処理に慣れていること。

Java 用 GroupDocs.Redaction の設定

まず、ライブラリを Maven プロジェクトに追加します。

Maven 設定

リポジトリと依存関係を pom.xml ファイルに追加します:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/redaction/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-redaction</artifactId>
      <version>24.9</version>
   </dependency>
</dependencies>

直接ダウンロード

必要に応じて、最新の JAR を GroupDocs.Redaction for Java releases から取得してください。

ライセンス取得

Free Trial で開始し、拡張テスト用に Temporary License をリクエストするか、商用利用のために Commercial License を購入できます。

GroupDocs.Redaction を使用したドキュメントのテキスト赤字化方法

以下のセクションでは、個人情報をマスクし、機密テキストを置き換えるために必要な正確な手順を説明します。

手順 1: Redactor の初期化

処理対象のドキュメントを指す Redactor インスタンスを作成します。

import com.groupdocs.redaction.Redactor;
import com.groupdocs.redaction.options.LoadOptions;
import com.groupdocs.redaction.redactions.ExactPhraseRedaction;
import com.groupdocs.redaction.redactions.ReplacementOptions;

final Redactor redactor = new Redactor("YOUR_DOCUMENT_DIRECTORY/sample.docx", new LoadOptions());

手順 2: Exact‑Phrase Redaction の適用

ExactPhraseRedaction を使用して、たとえば “John Doe” のようなフレーズを検出し、安全なプレースホルダーに置き換えます。

redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[personal]"));
  • パラメータ:
    • "John Doe" – 赤字化する正確なテキスト。
    • ReplacementOptions("[personal]") – 元のコンテンツを置き換える文字列で、実質的に 個人情報をマスク します。

手順 3: 赤字化されたドキュメントの保存

変更を新しいファイルに保存するか、元のファイルに上書きします。

redactor.save();

手順 4: リソースのクリーンアップ

常に Redactor を閉じて、ネイティブリソースを解放してください。

finally {
    redactor.close();
}

カスタムコールバックで個人情報をマスクする方法

赤字化が発生した際に、(例: ロギング、条件付き置換など)より細かい制御が必要になることがあります。

コールバッククラスの作成

赤字化イベントを受け取るために IRedactionCallback を実装します。

class RedactionDump implements IRedactionCallback {
    @Override
    public void onRedacted(IRedaction redaction) {
        // Custom processing or logging for each redaction event.
    }
}

Redactor インスタンス化時にコールバックを使用する

RedactorSettings を介してコールバックを渡します。

final Redactor redactor = new Redactor("YOUR_DOCUMENT_DIRECTORY/sample.docx", new LoadOptions(), new RedactorSettings(new RedactionDump()));

実用的な活用例

  • Legal contracts: クライアント名、SSN、機密条項を自動的に非表示にします。
  • Medical records: 第三者と共有する前に、患者識別子などの 個人情報をマスク します。
  • Corporate communications: 外部配布前に内部プロジェクトコードなどの 機密テキストを置き換える

パフォーマンス上の考慮点

大容量または多数のファイルを処理する際は、以下のポイントに留意してください。

  • バッチ処理: ファイルのコレクションをループして、起動オーバーヘッドを削減します。
  • メモリ管理: 各ファイル処理後に Redactor を解放し、同時に多数のドキュメントをメモリに保持しないようにします。
  • プロファイリング: Java プロファイラ(例: VisualVM)を使用して、I/O や赤字化ロジックのボトルネックを特定します。

よくある質問

Q: GroupDocs.Redaction を使用して PDF からテキストを赤字化できますか?
A: はい、ライブラリは PDF、DOCX、XLSX、PPTX など多数のフォーマットをサポートしています。

Q: 赤字化は元に戻せますか?
A: いいえ。赤字化は元のコンテンツを永久に削除するため、元ファイルのバックアップを保持してください。

Q: 非常に大きなドキュメントを効率的に処理するにはどうすればよいですか?
A: チャンク単位で処理し、バッチモードを使用し、プロファイリングツールでメモリ使用量を監視します。

Q: 他にどのようなテキストフォーマットがサポートされていますか?
A: DOCX と PDF に加えて、TXT、RTF、XLSX、PPTX なども赤字化できます。

Q: GroupDocs.Redaction を既存のワークフローに統合できますか?
A: もちろんです。API は Web サービス、バックグラウンドジョブ、CI/CD パイプラインから呼び出すことができます。

リソース


最終更新日: 2026-02-26
テスト環境: GroupDocs.Redaction 24.9 for Java
作者: GroupDocs