使用 Aspose 和 GroupDocs for .NET 實作 OCR 並將影像轉換為 PDF

介紹

還在為從圖像中提取文字或將圖像轉換為可搜尋的 PDF 文件而苦惱嗎？本指南將向您展示如何使用 Aspose.OCR for .NET 實作 OCR，以及如何使用 GroupDocs.Conversion for .NET 將影像轉換為 PDF，從而簡化您的文件工作流程。

在本教程中，我們將介紹：

設定和使用 Aspose.OCR for .NET。
使用 GroupDocs.Conversion 將影像檔案轉換為可搜尋的 PDF。
這些技術的實際應用。
處理大規模轉換的效能優化技巧。

讓我們先設定必要的先決條件。

先決條件

在開始之前，請確保您已：

所需的庫和版本

Aspose.OCR：用於從圖像中識別文字。
GroupDocs.轉換：將辨識出的影像資料轉換為PDF格式。

環境設定要求

您的機器上安裝了 .NET Framework 4.6 或更高版本。
Visual Studio 2019 或更新版本，支援現代 .NET 應用程式。

知識前提

對 C# 程式設計有基本的了解。
熟悉在 .NET 環境中處理文件和流。

一旦您解決了這些先決條件，我們就可以繼續設定 .NET 的 GroupDocs.Conversion。

為 .NET 設定 GroupDocs.Conversion

透過 NuGet 套件管理器控制台或 .NET CLI 安裝庫：

NuGet 套件管理器控制台：

Install-Package GroupDocs.Conversion -Version 25.3.0

.NET CLI：

dotnet add package GroupDocs.Conversion --version 25.3.0

許可證獲取

您可以使用免費試用授權試用 GroupDocs.Conversion。如需臨時訪問，請申請臨時執照。如果您發現該工具對您的業務需求有益，請考慮從其購買完整許可證購買頁面.

基本初始化

要在 C# 中初始化 GroupDocs.Conversion，首先建立一個簡單的轉換設定：

using GroupDocs.Conversion;
using GroupDocs.Conversion.Options.Convert;

// 使用輸入檔案路徑初始化轉換器
Converter converter = new Converter("your-input-image.png");
PdfConvertOptions options = new PdfConvertOptions();
converter.Convert("output.pdf", options);

這段程式碼設定了從圖像到 PDF 的基本轉換。讓我們深入研究如何使用這些強大的工具來實現 OCR 和影像轉換。

實施指南

功能1：使用Aspose.OCR進行OCR影像識別

概述

識別圖像中的文字對於文件數位化至關重要。使用 Aspose.OCR，您可以有效率地從各種圖像格式中提取文字。

逐步實施

初始化OCR API 首先初始化 AsposeOcr 類別來利用其功能：

var api = new AsposeOcr();

準備處理影像 將圖像載入到記憶體流中，這對於使用 OCR 進行處理是必要的：

using (MemoryStream ms = new MemoryStream())
{
    imageStream.Position = 0;
    imageStream.CopyTo(ms);
}

偵測並識別文字區域 使用 DetectRectangles 尋找圖像中文字區域的方法，對於準確識別至關重要：

var detectedRectangles = api.DetectRectangles(ocrInput, AreasType.LINES, false).First();

對檢測到的區域進行識別 使用偵測到的區域，執行 OCR 來提取文字：

var result = api.Recognize(
    ocrInput,
    new RecognitionSettings
    {
        DetectAreasMode = DetectAreasMode.UNIVERSAL,
        RecognitionAreas = detectedRectangles.Rectangles
    }).First();

傳回辨識出的影像數據 最後將識別出的文字包裝成結構化格式：

return CreateRecognizedImageFromResult(result);

故障排除提示

確保您的影像清晰且對比度高，以獲得更好的 OCR 準確度。
優雅地處理異常以調試圖像處理中的問題。

功能 2：使用 GroupDocs.Conversion 將影像轉換為 PDF

概述

從圖像中識別出文字後，下一步就是將其轉換為可搜尋的 PDF。此功能使用 GroupDocs.Conversion 實現無縫整合。

逐步實施

定義輸出路徑和載入選項 設定檔案路徑並使用 OCR 配置載入選項：

string outputFolder = "YOUR_OUTPUT_DIRECTORY";
string outputFile = Path.Combine(outputFolder, "converted.pdf");

var imageLoadOptions = new RasterImageLoadOptions();
imageLoadOptions.SetOcrConnector(new OcrConnector());

初始化轉換器並轉換 使用轉換器將 OCR 處理後的影像轉換為 PDF：

using (Converter converter = new Converter("YOUR_DOCUMENT_DIRECTORY", (loadContext) => imageLoadOptions))
{
    PdfConvertOptions options = new PdfConvertOptions();
    converter.Convert(outputFile, options);
}

關鍵配置選項

Ocr連接器：將 OCR 結果整合到轉換過程中。
PdfConvertOptions：自訂頁面大小和邊距等設定。

實際應用

以下是這些技術在現實世界中可以發揮巨大作用的一些場景：

自動化發票處理：將掃描的發票轉換為可搜尋的 PDF，以便更輕鬆地提取和儲存資料。
檔案文件數位化：將舊文件轉換為數位格式，保存它們，同時可以透過搜尋功能存取文字。
增強文件管理系統（DMS）：透過整合 OCR 功能來改進 DMS，以便快速索引和檢索文件內容。

性能考慮

處理大量影像或複雜佈局時，請考慮以下效能優化技巧：

使用多線程同時處理多個圖像。
透過在處理後及時釋放流來優化記憶體使用情況。
調整識別設定以便更快地處理更簡單的文件。

結論

透過使用 Aspose.OCR 實現 OCR 並使用 GroupDocs.Conversion for .NET 轉換圖像，您可以自動從圖像中提取文本，並將結果無縫整合到 PDF 中。這些強大的工具不僅節省時間，還為高效管理文件工作流程開闢了新的可能性。

透過嘗試不同的圖片類型和轉換設置，進一步探索這些功能。如果您想擴展您的工具包，請查看以下資源以獲取更多資訊和支援。

常見問題部分

Q：我可以使用 Aspose.OCR 批次處理影像嗎？ 答：是的，您可以使用 C# 中的循環或平行處理技術自動對多張影像進行 OCR 處理。

Q：GroupDocs.Conversion 支援哪些文件格式？ 答：它支援多種格式，包括 DOCX、PPTX、XLSX 等。有關完整詳情，請參閱 API 參考.

Q：Aspose.OCR 的 OCR 準確度如何？ 答：準確度取決於影像品質和文字複雜度。提高影像清晰度可以顯著改善結果。

Q：我可以在 GroupDocs.Conversion 中自訂 PDF 轉換設定嗎？ 答：是的，您可以透過以下方式調整頁面大小和邊距等各種設置 PdfConvertOptions。