使用 Aspose 和 GroupDocs for .NET 實作 OCR 並將影像轉換為 PDF

介紹

還在為從圖像中提取文字或將圖像轉換為可搜尋的 PDF 文件而苦惱嗎?本指南將向您展示如何使用 Aspose.OCR for .NET 實作 OCR,以及如何使用 GroupDocs.Conversion for .NET 將影像轉換為 PDF,從而簡化您的文件工作流程。

在本教程中,我們將介紹:

  • 設定和使用 Aspose.OCR for .NET。
  • 使用 GroupDocs.Conversion 將影像檔案轉換為可搜尋的 PDF。
  • 這些技術的實際應用。
  • 處理大規模轉換的效能優化技巧。

讓我們先設定必要的先決條件。

先決條件

在開始之前,請確保您已:

所需的庫和版本

  • Aspose.OCR:用於從圖像中識別文字。
  • GroupDocs.轉換:將辨識出的影像資料轉換為PDF格式。

環境設定要求

  • 您的機器上安裝了 .NET Framework 4.6 或更高版本。
  • Visual Studio 2019 或更新版本,支援現代 .NET 應用程式。

知識前提

  • 對 C# 程式設計有基本的了解。
  • 熟悉在 .NET 環境中處理文件和流。

一旦您解決了這些先決條件,我們就可以繼續設定 .NET 的 GroupDocs.Conversion。

為 .NET 設定 GroupDocs.Conversion

透過 NuGet 套件管理器控制台或 .NET CLI 安裝庫:

NuGet 套件管理器控制台:

Install-Package GroupDocs.Conversion -Version 25.3.0

.NET CLI:

dotnet add package GroupDocs.Conversion --version 25.3.0

許可證獲取

您可以使用免費試用授權試用 GroupDocs.Conversion。如需臨時訪問,請申請 臨時執照。如果您發現該工具對您的業務需求有益,請考慮從其購買完整許可證 購買頁面.

基本初始化

要在 C# 中初始化 GroupDocs.Conversion,首先建立一個簡單的轉換設定:

using GroupDocs.Conversion;
using GroupDocs.Conversion.Options.Convert;

// 使用輸入檔案路徑初始化轉換器
Converter converter = new Converter("your-input-image.png");
PdfConvertOptions options = new PdfConvertOptions();
converter.Convert("output.pdf", options);

這段程式碼設定了從圖像到 PDF 的基本轉換。讓我們深入研究如何使用這些強大的工具來實現 OCR 和影像轉換。

實施指南

功能1:使用Aspose.OCR進行OCR影像識別

概述

識別圖像中的文字對於文件數位化至關重要。使用 Aspose.OCR,您可以有效率地從各種圖像格式中提取文字。

逐步實施

初始化OCR API 首先初始化 AsposeOcr 類別來利用其功能:

var api = new AsposeOcr();

準備處理影像 將圖像載入到記憶體流中,這對於使用 OCR 進行處理是必要的:

using (MemoryStream ms = new MemoryStream())
{
    imageStream.Position = 0;
    imageStream.CopyTo(ms);
}

偵測並識別文字區域 使用 DetectRectangles 尋找圖像中文字區域的方法,對於準確識別至關重要:

var detectedRectangles = api.DetectRectangles(ocrInput, AreasType.LINES, false).First();

對檢測到的區域進行識別 使用偵測到的區域,執行 OCR 來提取文字:

var result = api.Recognize(
    ocrInput,
    new RecognitionSettings
    {
        DetectAreasMode = DetectAreasMode.UNIVERSAL,
        RecognitionAreas = detectedRectangles.Rectangles
    }).First();

傳回辨識出的影像數據 最後將識別出的文字包裝成結構化格式:

return CreateRecognizedImageFromResult(result);
故障排除提示
  • 確保您的影像清晰且對比度高,以獲得更好的 OCR 準確度。
  • 優雅地處理異常以調試圖像處理中的問題。

功能 2:使用 GroupDocs.Conversion 將影像轉換為 PDF

概述

從圖像中識別出文字後,下一步就是將其轉換為可搜尋的 PDF。此功能使用 GroupDocs.Conversion 實現無縫整合。

逐步實施

定義輸出路徑和載入選項 設定檔案路徑並使用 OCR 配置載入選項:

string outputFolder = "YOUR_OUTPUT_DIRECTORY";
string outputFile = Path.Combine(outputFolder, "converted.pdf");

var imageLoadOptions = new RasterImageLoadOptions();
imageLoadOptions.SetOcrConnector(new OcrConnector());

初始化轉換器並轉換 使用轉換器將 OCR 處理後的影像轉換為 PDF:

using (Converter converter = new Converter("YOUR_DOCUMENT_DIRECTORY", (loadContext) => imageLoadOptions))
{
    PdfConvertOptions options = new PdfConvertOptions();
    converter.Convert(outputFile, options);
}
關鍵配置選項
  • Ocr連接器:將 OCR 結果整合到轉換過程中。
  • PdfConvertOptions:自訂頁面大小和邊距等設定。

實際應用

以下是這些技術在現實世界中可以發揮巨大作用的一些場景:

  1. 自動化發票處理:將掃描的發票轉換為可搜尋的 PDF,以便更輕鬆地提取和儲存資料。
  2. 檔案文件數位化:將舊文件轉換為數位格式,保存它們,同時可以透過搜尋功能存取文字。
  3. 增強文件管理系統(DMS):透過整合 OCR 功能來改進 DMS,以便快速索引和檢索文件內容。

性能考慮

處理大量影像或複雜佈局時,請考慮以下效能優化技巧:

  • 使用多線程同時處理多個圖像。
  • 透過在處理後及時釋放流來優化記憶體使用情況。
  • 調整識別設定以便更快地處理更簡單的文件。

結論

透過使用 Aspose.OCR 實現 OCR 並使用 GroupDocs.Conversion for .NET 轉換圖像,您可以自動從圖像中提取文本,並將結果無縫整合到 PDF 中。這些強大的工具不僅節省時間,還為高效管理文件工作流程開闢了新的可能性。

透過嘗試不同的圖片類型和轉換設置,進一步探索這些功能。如果您想擴展您的工具包,請查看以下資源以獲取更多資訊和支援。

常見問題部分

Q:我可以使用 Aspose.OCR 批次處理影像嗎? 答:是的,您可以使用 C# 中的循環或平行處理技術自動對多張影像進行 OCR 處理。

Q:GroupDocs.Conversion 支援哪些文件格式? 答:它支援多種格式,包括 DOCX、PPTX、XLSX 等。有關完整詳情,請參閱 API 參考.

Q:Aspose.OCR 的 OCR 準確度如何? 答:準確度取決於影像品質和文字複雜度。提高影像清晰度可以顯著改善結果。

Q:我可以在 GroupDocs.Conversion 中自訂 PDF 轉換設定嗎? 答:是的,您可以透過以下方式調整頁面大小和邊距等各種設置 PdfConvertOptions