Extraia texto da planilha Excel no modo Raw

Introdução

Neste tutorial, exploraremos como extrair texto de planilhas do Excel usando GroupDocs.Parser for .NET em modo bruto. GroupDocs.Parser é uma API poderosa que permite aos desenvolvedores trabalhar com vários formatos de documentos, incluindo arquivos Excel, para extração e análise de texto. Analisaremos os pré-requisitos, importaremos namespaces e detalharemos cada etapa para demonstrar o processo de extração de texto de planilhas do Excel.

Pré-requisitos

Antes de começar, certifique-se de ter os seguintes pré-requisitos configurados:

  • Visual Studio: instale o IDE do Visual Studio em sua máquina.
  • GroupDocs.Parser para .NET: Baixe e instale GroupDocs.Parser dopágina de download.
  • Arquivo Excel de amostra: prepare um arquivo Excel de amostra que você usará para extração de texto.

Importar namespaces

Comece importando os namespaces necessários para seu projeto C# para acessar as funcionalidades do GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Etapa 1: crie uma instância da classe analisador

Primeiro, crie uma instância doParser class fornecendo o caminho para seu arquivo Excel de amostra:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Seu código para extração de texto irá aqui
}

Etapa 2: Obtenha informações do documento

Recuperar informações do documento usando oGetDocumentInfo() método:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Etapa 3: iterar nas planilhas

Percorra cada planilha do arquivo Excel:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Seu código para extração de texto de cada planilha irá aqui
}

Etapa 4: Extraia o texto de cada planilha

Extraia o texto de cada folha usando umTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Conclusão

Neste tutorial, abordamos como extrair texto de planilhas do Excel usando GroupDocs.Parser for .NET. Seguindo as etapas descritas acima, você pode recuperar com eficiência dados de texto de arquivos Excel para processamento ou análise adicional em seus aplicativos .NET.

Perguntas frequentes

O GroupDocs.Parser pode extrair texto de outros formatos de documento?

Sim, GroupDocs.Parser oferece suporte a uma ampla variedade de formatos de documentos, incluindo Word, PDF, PowerPoint e muito mais.

O GroupDocs.Parser é adequado para processar arquivos grandes do Excel?

Sim, GroupDocs.Parser foi projetado para lidar com documentos grandes com eficiência.

Onde posso encontrar mais documentação sobre GroupDocs.Parser?

Você pode consultar odocumentação para obter informações detalhadas e exemplos.

Como posso obter uma licença temporária para GroupDocs.Parser?

Visitaesse link para solicitar uma licença temporária.

O GroupDocs.Parser oferece suporte ao cliente?

Sim, você pode procurar assistência ou fazer perguntas no siteFórum GroupDocs.