名前でフィールドを取得

導入

このチュートリアルでは、GroupDocs.Parser for .NET を活用して、ドキュメントから価格やメールなどの特定のデータ フィールドを抽出する方法について説明します。この強力なライブラリは、ドキュメント解析タスクを簡素化し、さまざまなデータ抽出ニーズに最適です。

前提条件

チュートリアルに進む前に、次の前提条件を満たしていることを確認してください。

  • Visual Studio がシステムにインストールされています。
  • C# プログラミングの基礎知識。
  • GroupDocs.Parser for .NETをダウンロードしてインストールします。このリンク.

名前空間のインポート

まず、必要な名前空間を C# プロジェクトにインポートします。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

ステップ1: テンプレートフィールドを定義する

まず、データを抽出するためのテンプレート フィールドを定義します。この例では、価格とメールを取得するためのフィールドを作成します。

// 「価格」フィールドを定義する
TemplateField priceField = new TemplateField(
    new TemplateRegexPosition("\\$\\d+(.\\d+)?"),
    "Price");
//「メール」フィールドを定義する
TemplateField emailField = new TemplateField(
    new TemplateRegexPosition("[a-z]+\\@[a-z]+\\.[a-z]+"),
    "Email");
//テンプレートを作成する
Template template = new Template(new TemplateItem[] { priceField, emailField });

ステップ2: テンプレートを使用してドキュメントを解析する

次に、定義したテンプレートを使用してドキュメントを解析します。

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    //テンプレートに従ってドキュメントを解析する
    DocumentData data = parser.ParseByTemplate(template);
    //印刷価格
    Console.WriteLine("Prices:");
    foreach (FieldData field in data.GetFieldsByName("Price"))
    {
        PageTextArea area = field.PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
    //メールを印刷する
    Console.WriteLine("Emails:");
    foreach (FieldData field in data.GetFieldsByName("Email"))
    {
        PageTextArea area = field.PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

結論

このチュートリアルでは、GroupDocs.Parser for .NET を使用してドキュメントから特定のデータ フィールドを抽出する方法を学習しました。テンプレートを定義し、ライブラリの解析機能を利用することで、開発者はさまざまなドキュメント形式から価格や電子メールなどの構造化データを効率的に取得できます。

よくある質問

GroupDocs.Parser for .NET を使用してさまざまな種類のドキュメントを解析できますか?

はい、GroupDocs.Parser は PDF、DOCX、PPTX などのさまざまなドキュメント形式の解析をサポートしています。

GroupDocs.Parser は大規模なドキュメント処理に適していますか?

はい、GroupDocs.Parser はパフォーマンスが最適化されており、大量のドキュメントを効率的に処理できます。

GroupDocs.Parser を .NET アプリケーションに統合するにはどうすればよいですか?

Visual Studio プロジェクトでライブラリを参照し、必要な名前空間をインポートすることで、GroupDocs.Parser を簡単に統合できます。

GroupDocs.Parser は画像やメタデータの抽出をサポートしていますか?

はい、GroupDocs.Parser はドキュメントから画像、テキスト、メタデータを抽出するための API を提供します。

GroupDocs.Parser ユーザー向けのコミュニティ フォーラムはありますか?

はい、GroupDocs.Parserフォーラムでヘルプを求めたり、他のユーザーと交流したりできます。ここ.