如何使用 GroupDocs.Parser 在 Java 中從 PDF 提取圖庫負責格式?** PNG(使用 ImageFormat.Png)。

  • 我可以一次處理多個 PDF 嗎? 可以——將程式碼與迴圈結合,以執行批次 PDF 圖像提取。
  • 我需要授權嗎? 免費試用或臨時授權可用於測試;正式環境需購買完整授權。
  • 需要哪個 Java 版本? JDK 8 或更高版本。

什麼是「從 PDF 提取圖像」?

從 PDF 提取圖像是指以程式方式定位 PDF 檔案中嵌入的每個點陣圖形,並將每個圖形匯出為單獨的圖像檔(例如 PNG、JPEG)。這讓您能在不需手動複製貼上的情況下重複使用視覺資產。

為什麼使用 GroupDocs.Parser for Java?

  • 高準確度 – 解析複雜的 PDF,包括具有分層圖形的檔案。
  • 效能優化 – 以低記憶體開銷處理大型文件。
  • 跨平台 – 可在任何支援 Java 的作業系統上執行。
  • 內建支援 批次 PDF 圖像提取,使大規模自動化變得簡單。

介紹

您是否曾需要從長篇 PDF 文件中提取所有嵌入的圖像,但發現傳統方法繁瑣?使用 GroupDocs.Parser for Java,這項工作變得簡單直觀。本完整教學將示範如何利用此強大函式庫的功能,高效自動化圖像提取。

您將學習

  • 設定與配置 GroupDocs.Parser for Java。
  • 使用 Java 從 PDF 文件提取圖像的步驟。
  • 大型文件效能優化的最佳實踐。
  • 如何 save pdf images png 以及執行 batch pdf image extraction 工作。

讓我們先了解在實作此解決方案前所需的前置條件。

前置條件

開始之前,請確保您具備以下項目:

必要函式庫

  • GroupDocs.Parser for Java:版本 25.5 或更新版本。

環境設定需求

  • 已在機器上安裝 Java Development Kit(JDK)。
  • 使用 IntelliJ IDEA 或 Eclipse 等 IDE 撰寫與執行 Java 程式碼。

知識前置條件

  • 具備 Java 程式概念的基本了解。
  • 熟悉 Maven 作為建置自動化工具會有幫助,但若採用直接下載方式則非必須。

具備上述前置條件後,讓我們繼續設定 GroupDocs.Parser for Java。

設定 GroupDocs.Parser for Java

要開始使用 GroupDocs.Parser,請透過 Maven 或直接下載方式將其加入專案。

Maven 設定

Add the following configuration to your pom.xml file:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/parser/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-parser</artifactId>
      <version>25.5</version>
   </dependency>
</dependencies>

直接下載

或者,直接從 GroupDocs.Parser for Java releases 下載最新版本。請依照以下步驟:

  1. 前往下載頁面。
  2. 選擇您想要的版本並下載。
  3. 將 JAR 檔案加入專案的建置路徑。

取得授權

  • 免費試用:使用免費試用授權以探索基本功能。
  • 臨時授權:取得臨時授權以在評估期間無限制使用擴充功能。
  • 購買:若需長期使用與進階功能,請考慮購買授權。

設定好 GroupDocs.Parser 後,我們即可使用 Java 從 PDF 文件中提取圖像。

如何使用 GroupDocs.Parser 從 PDF 提取圖像

概述

在本節中,我們將說明如何使用 GroupDocs.Parser 函式庫提取 PDF 文件中嵌入的圖像,並將其儲存為 PNG 檔案。

步驟說明實作

1️⃣ 初始化 Parser

使用您的 PDF 檔案路徑建立 Parser 實例。此物件可讓您存取各種解析功能:

String filePath = "YOUR_DOCUMENT_DIRECTORY/sample.pdf";
try (Parser parser = new Parser(filePath)) {
    // Use this parser object to extract images.
}

2️⃣ 提取圖像

呼叫 Parser 實例的 getImages() 方法。它會回傳 PageImageArea 物件的可疊代集合,每個物件代表 PDF 中的一張圖像:

Iterable<PageImageArea> images = parser.getImages();

3️⃣ 儲存圖像為 PNG

遍歷每個提取出的圖像,並使用指定的選項儲存。此處我們將輸出格式設定為 PNG,以滿足 save pdf images png 的需求:

ImageOptions options = new ImageOptions(ImageFormat.Png);
int imageNumber = 0;
for (PageImageArea image : images) {
    String outputFilePath = "YOUR_OUTPUT_DIRECTORY/image" + imageNumber + ".png";
    image.save(outputFilePath, options);
    imageNumber++;
}

參數說明

  • filePath – 您想要處理的 PDF 文件路徑。
  • ImageOptionsImageFormat.Png – 指示解析器將提取的點陣資料寫入 PNG 檔案。
  • outputFilePath – 每張儲存圖像的目標資料夾與檔名。

4️⃣ 批次 PDF 圖像提取(可選)

若要一次處理多個 PDF,將上述邏輯包裹在迴圈中,遍歷檔案路徑清單,即可實現 batch pdf image extraction,且僅需少量程式碼變更。

疑難排解提示

  • 確認檔案路徑正確且應用程式具備讀寫權限。
  • 確保 GroupDocs.Parser 已正確加入專案相依性。
  • 對於受密碼保護的 PDF,請在建立 Parser 實例時提供密碼。

透過上述步驟,您即可使用 GroupDocs.Parser for Java 可靠地 extract images from pdf 檔案。

實務應用

從 PDF 提取圖像有多種實務應用:

  1. 數位存檔 – 自動將組織文件中的所有視覺內容存檔,以供未來參考。
  2. 內容再利用 – 將圖像提取至網站相簿、簡報或行銷素材。
  3. 資料分析 – 使用從報告中提取的視覺資料增強分析流程。
  4. 機器學習 – 從 PDF 建立圖像資料集,以訓練電腦視覺模型。
  5. 文件管理系統 – 為圖像建立索引與標籤,以提升企業 DMS 解決方案的搜尋速度。

效能考量

處理大型 PDF 檔案時,請留意以下建議:

  • 記憶體管理 – 及時釋放 Parser 物件(使用 try‑with‑resources 可自動完成)。
  • 批次處理 – 將文件分批處理,而非逐一處理,以降低開銷。
  • 最佳化圖像格式 – 根據下游需求選擇 PNG(無失真品質)或 JPEG(較小檔案大小)。

結論

在本教學中,您已學會如何使用 GroupDocs.Parser for Java extract images from pdf 文件、如何 save pdf images png,以及如何將解決方案擴展至 batch pdf image extraction。此函式庫簡化了原本需要手動操作的工作,讓您能專注於更高層次的業務邏輯。

下一步

  • 嘗試其他輸出格式(JPEG、BMP)。
  • 將提取邏輯整合至 REST API,以支援即時處理。
  • 探索 GroupDocs.Parser 的其他功能,如文字提取或中繼資料解析。

常見問題

Q: 什麼是 GroupDocs.Parser for Java?
A: 這是一個 Java 函式庫,可解析並提取各種文件格式的文字、元資料與圖像。

Q: 我可以從受密碼保護的 PDF 提取圖像嗎?
A: 可以——在建立 Parser 實例時提供文件密碼,前提是您的授權允許此操作。

Q: 如何有效處理大型 PDF 檔案?
A: 使用 try‑with‑resources 釋放記憶體,將檔案分批處理,並選擇在品質與尺寸之間取得平衡的圖像格式。

Q: 是否對檔案大小或圖像數量有限制?
A: GroupDocs.Parser 支援大型檔案,但實際限制取決於系統記憶體與 CPU;建議使用具代表性的樣本進行測試。

Q: 我可以在哪裡找到更多資源或取得支援?
A: 瀏覽 GroupDocs documentation 並加入 free support forum


最後更新時間:2026-01-19
測試環境:GroupDocs.Parser 25.5 for Java
作者:GroupDocs