從 URL 載入文檔
介紹
在本教學中,我們將探討如何利用 GroupDocs.Parser for .NET 從文件中擷取文字。 GroupDocs.Parser 是一個功能強大的工具,用於從各種文件格式(例如 PDF、Word、Excel 等)中提取文字、元資料和其他資訊。我們將逐步介紹從 URL 載入文件並提取其文字內容的過程。
先決條件
在我們開始之前,請確保您已設定以下先決條件:
- Visual Studio:在您的系統上安裝 Visual Studio。
- GroupDocs.Parser for .NET:從下列位置下載並安裝 GroupDocs.Parser for .NET下載頁面.
- 對C#的基本了解:熟悉C#程式語言。
導入命名空間
首先在 C# 程式碼中包含必要的命名空間:
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
首先,我們將示範如何從 URL 載入文件並提取其文字內容。
第 1 步:指定文檔 URL
指定要從中提取文字的文檔的 URL:
Uri uri = new Uri("https://www.bu.edu/csmet/files/2021/03/Getting-Started-with-SQLite.pdf」);
步驟2:建立解析器實例
實例化Parser
帶有文檔 URL 的類別:
using (Parser parser = new Parser(uri))
{
//你的程式碼放在這裡
}
步驟 3:從文件中提取文本
在 - 的裡面using
阻止、使用parser.GetText()
從文件中提取文字:
using (TextReader reader = parser.GetText())
{
//你的程式碼放在這裡
}
第 4 步:顯示提取的文本
讀取並列印從文件中提取的文字:
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
結論
在本教程中,我們介紹了使用 GroupDocs.Parser for .NET 從文件中提取文字的基礎知識。透過執行這些步驟,您可以輕鬆地將文件文字擷取功能整合到您的 C# 應用程式中。
常見問題解答
GroupDocs.Parser 是否相容於各種文件格式?
是的,GroupDocs.Parser 支援多種文件格式,包括 PDF、Word、Excel、PowerPoint 等。
我可以使用 GroupDocs.Parser 提取元資料和文字嗎?
是的,GroupDocs.Parser 允許您從文件中提取元資料、文字和其他資訊。
GroupDocs.Parser 是否有試用版?
是的,您可以從以下位置取得 GroupDocs.Parser 的免費試用版這裡.
在哪裡可以找到 GroupDocs.Parser 的文檔?
提供了 GroupDocs.Parser 的詳細文檔這裡.
如何獲得 GroupDocs.Parser 的技術支援?
您可以在 GroupDocs.Parser 論壇上尋求技術支援並提出問題這裡.