JavaでGroupDocs.Viewerを使用してテキストレイヤー付きWordを画像に変換する

テキストを選択可能かつ検索可能な状態で Wordを画像に変換 する必要がありますか?DOCXを画像としてレンダリングすると、元のテキストが失われ、検索やコピー&ペーストができなくなることがよくあります。このチュートリアルでは、GroupDocs.Viewer for Java を使用して、Word文書を PNG 画像 テキストレイヤーを重ねた状態で レンダリングする方法を紹介します。このアプローチは 文書画像の鮮明さを向上 させるだけでなく、検索可能な画像 を生成し、ウェブポータルや CMS ソリューションで完璧に機能します。

GroupDocs.Viewer for Java を使用したテキストレイヤー付き画像として文書をレンダリング

クイック回答

  • 「Wordを画像に変換」とは何ですか? 各ページのラスタ画像(PNG)を作成し、元のテキストを隠しレイヤーに保持します。
  • なぜテキストレイヤーを追加するのですか? オーバーレイにより画像が検索可能かつ選択可能になり、アクセシビリティと SEO が向上します。
  • どのライブラリがこれを処理しますか? GroupDocs.Viewer for Java はテキスト抽出と画像レンダリングの組み込みサポートを提供します。
  • ライセンスは必要ですか? 開発には無料トライアルが利用でき、製品環境では有料ライセンスが必要です。
  • PDFでも同じコードを使用できますか? はい – 同じビューオプションが PDF、DOCX、その他多数の形式に適用されます。

テキストレイヤー付き「Wordを画像に変換」とは何ですか?

Wordファイルを画像に変換すると、通常はピクセルだけのビットマップが生成されます。extract text overlay を有効にすると、GroupDocs.Viewer は各画像の上に不可視のテキストレイヤーを追加し、ブラウザや検索エンジンがコンテンツを読み取れるようにします。

このタスクにGroupDocs.Viewerを使用する理由

  • 高品質 PNG 出力 元のレイアウトを保持します。
  • Extract text overlay が自動的に適用され、追加処理なしで検索可能な画像が得られます。
  • Simple API – 数行の Java コードで全パイプラインを処理します。
  • Broad format support – 同じアプローチが PDF、PPTX など多数の形式で機能します。

前提条件

  • Java Development Kit (JDK) がインストールされ、設定されていること。
  • 依存関係管理のための Maven。
  • Java のファイル操作と Maven プロジェクトに関する基本的な知識。

GroupDocs.Viewer for Java の設定

インストール情報

リポジトリと依存関係を pom.xml に挿入して、Maven プロジェクトに GroupDocs.Viewer を追加します。

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/viewer/java/</url>
   </repository>
</repositories>
<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-viewer</artifactId>
      <version>25.2</version>
   </dependency>
</dependencies>

ライセンス取得

まずは無料トライアルとして、ダウンロードページ から GroupDocs.Viewer をダウンロードしてください。製品環境で使用する場合は、ライセンスを購入するか、一時ライセンスページ から一時キーを取得してください。

基本的な初期化と設定

Maven の同期が完了したら、Viewer インスタンスを作成できます。このオブジェクトがレンダリングプロセスを駆動します。

Wordを画像に変換するステップバイステップガイド

手順 1: 出力ディレクトリの定義

まず、生成された PNG ファイルを保存する場所を Viewer に指示します。以下のコードは YOUR_OUTPUT_DIRECTORY というフォルダーを作成(または再利用)します。

Path outputDirectory = Paths.get("YOUR_OUTPUT_DIRECTORY");

プロのコツ: フォルダーを自動的に作成したい場合は Files.createDirectories(outputDirectory); を使用してください。

手順 2: ビューオプションの設定 (Configure View Options)

次に、レンダリングオプションを設定します。PngViewOptions を使用し、setExtractText(true) を有効にすることで、GroupDocs.Viewer に extract text overlay を実行させ、各画像に埋め込むよう指示します。

Path pageFilePathFormat = outputDirectory.resolve("page_{0}.png");
PngViewOptions viewOptions = new PngViewOptions(pageFilePathFormat);
viewOptions.setExtractText(true);  // Enable extracting text over the image

手順 3: ドキュメントのレンダリング (Convert Word to Image)

最後に、ソース DOCX を開き viewer.view(viewOptions) を呼び出します。try‑with‑resources ブロックにより、Viewer インスタンスが適切にクローズされることが保証されます。

try (Viewer viewer = new Viewer("YOUR_DOCUMENT_DIRECTORY/SAMPLE_DOCX")) {
    viewer.view(viewOptions);  // Perform rendering operation
}

コードの実行が完了すると、Word 文書の各ページが高解像度 PNG と不可視のテキストレイヤーとして出力され、インデックス作成や検索の準備が整います。

トラブルシューティングのヒント

  • File Not Found: SAMPLE_DOCX のパスを再確認してください。確実にするため絶対パスを使用します。
  • Permission Issues: Java プロセスが YOUR_OUTPUT_DIRECTORY に書き込みできることを確認してください。
  • Version Mismatch: pom.xml のバージョンがダウンロードしたライブラリと一致しているか確認してください。

実用的な活用例

  1. Web Portals: ユーザーが元ファイルをダウンロードせずに検索できる文書プレビューを表示します。
  2. Content Management Systems: アーカイブ目的で検索可能な画像スナップショットを保存します。
  3. Document Archiving: 軽量な画像バージョンを保持しつつ、全文検索を可能にします。

パフォーマンスに関する考慮点

  • Viewer オブジェクトは速やかに破棄してください(try‑with‑resources の例のように)。
  • 品質を重視する場合は PNG を選択し、帯域幅が問題になる場合は JPEG に切り替えます。
  • 同じ文書が繰り返しリクエストされる場合は、レンダリング済みページをキャッシュします。

よくある質問

Q: 大きな文書はどう処理すればよいですか?
A: ページを段階的にレンダリングし、バッチ処理後に各 Viewer インスタンスを解放してメモリ使用量を抑えます。

Q: 同じアプローチで PDF をレンダリングできますか?
A: はい、GroupDocs.Viewer は PDF をサポートしており、同じ setExtractText(true) フラグで検索可能な PDF 画像が生成されます。

Q: 出力でテキストレイヤーが表示されない場合はどうすればよいですか?
A: viewOptions.setExtractText(true) が設定されていることと、出力フォルダーに書き込み権限があることを確認してください。

Q: 他の画像形式はサポートされていますか?
A: PNG の他に、ビューオプションクラスを JpgViewOptionsBmpViewOptions に変更すれば使用できます。

Q: 詳細な API ドキュメントはどこで見つけられますか?
A: 公式ドキュメントに包括的な例と設定の詳細が掲載されています。

リソース


最終更新日: 2026-01-10
テスト環境: GroupDocs.Viewer 25.2 for Java
作者: GroupDocs