正規表現で Excel ドキュメント内のテキストを検索する

導入

このチュートリアルでは、GroupDocs.Parser for .NET を利用して、正規表現を使用して Excel ドキュメント内の特定のテキスト パターンを検索する方法について説明します。GroupDocs.Parser は、開発者が Excel などのスプレッドシートを含むさまざまなドキュメント形式からテキストとメタデータを抽出できるようにする強力なライブラリです。正規表現を活用することで、高度なテキスト検索を効率的に実行できます。

前提条件

始める前に、次の設定がされていることを確認してください。

  1. Visual Studio: .NET 開発用の Visual Studio または互換性のある他の IDE をインストールします。
  2. GroupDocs.Parser for .NET: ライブラリをダウンロードしてインストールします。ここ.
  3. サンプル Excel ファイル: 検索するテキストを含むサンプル Excel ファイルを準備します。

名前空間のインポート

まず、プロジェクトで GroupDocs.Parser を使用するために必要な名前空間を含めます。

using System;
using System.Collections.Generic;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

ステップ1: パーサークラスのインスタンスを作成する

まず、Parserクラスに、Excel ドキュメントへのパスをパラメーターとして渡します。

//Parserクラスのインスタンスを作成する
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    //コードはここに続きます...
}

ステップ2: 正規表現検索を実行する

以内usingブロックでは、正規表現パターンを使用してテキスト検索を実行します。

//大文字と小文字を区別した正規表現で検索する
IEnumerable<SearchResult> searchResults = parser.Search("\\sthe\\s", new SearchOptions(true, false, true));
  • 正規表現パターンの説明:
    • \\sthe\\s: この正規表現パターンは、空白で囲まれた単語「the」(大文字と小文字を区別)を検索します。

ステップ3: 検索結果を反復処理する

次に、検索結果を反復処理して、一致する各出現箇所にアクセスします。

//検索結果を反復処理する
foreach (SearchResult result in searchResults)
{
    //位置と見つかったテキストを印刷する
    Console.WriteLine($"At {result.Position}: {result.Text}");
}
  • 出力:
    • このループは、指定されたテキスト パターンの各出現箇所と、そのドキュメント内の位置を出力します。

結論

このチュートリアルでは、GroupDocs.Parser for .NET を使用して Excel ドキュメント内で正規表現検索を実行する方法を学習しました。これらの手順に従うことで、高度なテキスト検索機能を .NET アプリケーションに効率的に統合できます。

よくある質問

GroupDocs.Parser は Excel 以外のドキュメント形式からデータを抽出できますか?

はい、GroupDocs.Parser は、Word、PDF、PowerPoint など、さまざまなドキュメント形式をサポートしています。

GroupDocs.Parser の無料トライアルはありますか?

はい、無料トライアルはここからダウンロードできます。ここ.

GroupDocs.Parser に関するサポートや質問はどこで受けられますか?

訪問GroupDocs.Parser フォーラムサポートとディスカッションのため。

GroupDocs.Parser のライセンスを購入するにはどうすればよいですか?

ライセンスは以下から購入できますここ.

テスト目的で一時ライセンスを取得できますか?

はい、臨時免許証を取得できますここ.