Extraheer tekst uit Excel-blad in Raw-modus
Invoering
In deze zelfstudie onderzoeken we hoe u tekst uit Excel-werkbladen kunt extraheren met GroupDocs.Parser voor .NET in de onbewerkte modus. GroupDocs.Parser is een krachtige API waarmee ontwikkelaars met verschillende documentformaten kunnen werken, waaronder Excel-bestanden, voor tekstextractie en -analyse. We doorlopen de vereisten, importeren naamruimten en splitsen elke stap op om het proces van het extraheren van tekst uit Excel-bladen te demonstreren.
Vereisten
Voordat u aan de slag gaat, moet u ervoor zorgen dat u aan de volgende vereisten voldoet:
- Visual Studio: Installeer Visual Studio IDE op uw computer.
- GroupDocs.Parser voor .NET: Download en installeer GroupDocs.Parser van dedownloadpagina.
- Voorbeeld van een Excel-bestand: maak een voorbeeld van een Excel-bestand dat u gaat gebruiken voor tekstextractie.
Naamruimten importeren
Begin met het importeren van de benodigde naamruimten in uw C#-project om toegang te krijgen tot de functionaliteiten van GroupDocs.Parser:
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Stap 1: Maak een exemplaar van de parserklasse
Maak eerst een exemplaar van deParser
klasse door het pad naar uw voorbeeld-Excel-bestand op te geven:
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
// Uw code voor tekstextractie komt hier terecht
}
Stap 2: Documentinformatie ophalen
Haal documentinformatie op met behulp van deGetDocumentInfo()
methode:
IDocumentInfo documentInfo = parser.GetDocumentInfo();
Stap 3: Herhaal de werkbladen
Loop door elk blad in het Excel-bestand:
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
//Uw code voor tekstextractie uit elk blad komt hier terecht
}
Stap 4: Extraheer tekst uit elk blad
Extraheer tekst uit elk blad met behulp van aTextReader
:
using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
Console.WriteLine(reader.ReadToEnd());
}
Conclusie
In deze zelfstudie hebben we besproken hoe u tekst uit Excel-werkbladen kunt extraheren met GroupDocs.Parser voor .NET. Door de hierboven beschreven stappen te volgen, kunt u op efficiënte wijze tekstgegevens uit Excel-bestanden ophalen voor verdere verwerking of analyse in uw .NET-applicaties.
Veelgestelde vragen
Kan GroupDocs.Parser tekst extraheren uit andere documentformaten?
Ja, GroupDocs.Parser ondersteunt een breed scala aan documentformaten, waaronder Word, PDF, PowerPoint en meer.
Is GroupDocs.Parser geschikt voor het verwerken van grote Excel-bestanden?
Ja, GroupDocs.Parser is ontworpen om grote documenten efficiënt te verwerken.
Waar kan ik meer documentatie over GroupDocs.Parser vinden?
U kunt verwijzen naar dedocumentatie voor gedetailleerde informatie en voorbeelden.
Hoe kan ik een tijdelijke licentie voor GroupDocs.Parser verkrijgen?
Bezoekdeze link een tijdelijke vergunning aanvragen.
Biedt GroupDocs.Parser klantenondersteuning?
Ja, u kunt hulp zoeken of vragen stellen via deGroupDocs-forum.