Extraheer tekst uit Excel-blad in Raw-modus

Invoering

In deze zelfstudie onderzoeken we hoe u tekst uit Excel-werkbladen kunt extraheren met GroupDocs.Parser voor .NET in de onbewerkte modus. GroupDocs.Parser is een krachtige API waarmee ontwikkelaars met verschillende documentformaten kunnen werken, waaronder Excel-bestanden, voor tekstextractie en -analyse. We doorlopen de vereisten, importeren naamruimten en splitsen elke stap op om het proces van het extraheren van tekst uit Excel-bladen te demonstreren.

Vereisten

Voordat u aan de slag gaat, moet u ervoor zorgen dat u aan de volgende vereisten voldoet:

  • Visual Studio: Installeer Visual Studio IDE op uw computer.
  • GroupDocs.Parser voor .NET: Download en installeer GroupDocs.Parser van dedownloadpagina.
  • Voorbeeld van een Excel-bestand: maak een voorbeeld van een Excel-bestand dat u gaat gebruiken voor tekstextractie.

Naamruimten importeren

Begin met het importeren van de benodigde naamruimten in uw C#-project om toegang te krijgen tot de functionaliteiten van GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Stap 1: Maak een exemplaar van de parserklasse

Maak eerst een exemplaar van deParser klasse door het pad naar uw voorbeeld-Excel-bestand op te geven:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Uw code voor tekstextractie komt hier terecht
}

Stap 2: Documentinformatie ophalen

Haal documentinformatie op met behulp van deGetDocumentInfo() methode:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Stap 3: Herhaal de werkbladen

Loop door elk blad in het Excel-bestand:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Uw code voor tekstextractie uit elk blad komt hier terecht
}

Stap 4: Extraheer tekst uit elk blad

Extraheer tekst uit elk blad met behulp van aTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Conclusie

In deze zelfstudie hebben we besproken hoe u tekst uit Excel-werkbladen kunt extraheren met GroupDocs.Parser voor .NET. Door de hierboven beschreven stappen te volgen, kunt u op efficiënte wijze tekstgegevens uit Excel-bestanden ophalen voor verdere verwerking of analyse in uw .NET-applicaties.

Veelgestelde vragen

Kan GroupDocs.Parser tekst extraheren uit andere documentformaten?

Ja, GroupDocs.Parser ondersteunt een breed scala aan documentformaten, waaronder Word, PDF, PowerPoint en meer.

Is GroupDocs.Parser geschikt voor het verwerken van grote Excel-bestanden?

Ja, GroupDocs.Parser is ontworpen om grote documenten efficiënt te verwerken.

Waar kan ik meer documentatie over GroupDocs.Parser vinden?

U kunt verwijzen naar dedocumentatie voor gedetailleerde informatie en voorbeelden.

Hoe kan ik een tijdelijke licentie voor GroupDocs.Parser verkrijgen?

Bezoekdeze link een tijdelijke vergunning aanvragen.

Biedt GroupDocs.Parser klantenondersteuning?

Ja, u kunt hulp zoeken of vragen stellen via deGroupDocs-forum.