從 URL 載入文檔

介紹

在本教學中,我們將探討如何利用 GroupDocs.Parser for .NET 從文件中擷取文字。 GroupDocs.Parser 是一個功能強大的工具,用於從各種文件格式(例如 PDF、Word、Excel 等)中提取文字、元資料和其他資訊。我們將逐步介紹從 URL 載入文件並提取其文字內容的過程。

先決條件

在我們開始之前,請確保您已設定以下先決條件:

  1. Visual Studio:在您的系統上安裝 Visual Studio。
  2. GroupDocs.Parser for .NET:從下列位置下載並安裝 GroupDocs.Parser for .NET下載頁面.
  3. 對C#的基本了解:熟悉C#程式語言。

導入命名空間

首先在 C# 程式碼中包含必要的命名空間:

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

首先,我們將示範如何從 URL 載入文件並提取其文字內容。

第 1 步:指定文檔 URL

指定要從中提取文字的文檔的 URL:

Uri uri = new Uri("https://www.bu.edu/csmet/files/2021/03/Getting-Started-with-SQLite.pdf」);

步驟2:建立解析器實例

實例化Parser帶有文檔 URL 的類別:

using (Parser parser = new Parser(uri))
{
    //你的程式碼放在這裡
}

步驟 3:從文件中提取文本

在 - 的裡面using阻止、使用parser.GetText()從文件中提取文字:

using (TextReader reader = parser.GetText())
{
    //你的程式碼放在這裡
}

第 4 步:顯示提取的文本

讀取並列印從文件中提取的文字:

Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());

結論

在本教程中,我們介紹了使用 GroupDocs.Parser for .NET 從文件中提取文字的基礎知識。透過執行這些步驟,您可以輕鬆地將文件文字擷取功能整合到您的 C# 應用程式中。

常見問題解答

GroupDocs.Parser 是否相容於各種文件格式?

是的,GroupDocs.Parser 支援多種文件格式,包括 PDF、Word、Excel、PowerPoint 等。

我可以使用 GroupDocs.Parser 提取元資料和文字嗎?

是的,GroupDocs.Parser 允許您從文件中提取元資料、文字和其他資訊。

GroupDocs.Parser 是否有試用版?

是的,您可以從以下位置取得 GroupDocs.Parser 的免費試用版這裡.

在哪裡可以找到 GroupDocs.Parser 的文檔?

提供了 GroupDocs.Parser 的詳細文檔這裡.

如何獲得 GroupDocs.Parser 的技術支援?

您可以在 GroupDocs.Parser 論壇上尋求技術支援並提出問題這裡.