Çıkarılan Verilerde Tablolarla Çalışmak

giriiş

Bu öğreticide, GroupDocs.Parser for .NET’in belgelerdeki tablolardan veri ayıklamak için nasıl kullanılacağını keşfedeceğiz. GroupDocs.Parser, geliştiricilerin PDF, DOCX, XLSX ve daha fazlası gibi çeşitli dosya formatlarından metni, meta verileri ve yapılandırılmış içeriği ayrıştırıp çıkarmasına olanak tanıyan güçlü bir araçtır. Özellikle, önceden tanımlanmış şablonları kullanarak tablo verilerini verimli bir şekilde çıkarmaya odaklanacağız.

Önkoşullar

Başlamadan önce aşağıdakilerin yerinde olduğundan emin olun:

  • Makinenizde Visual Studio yüklü.
  • C# ve .NET çerçevesine ilişkin temel anlayış.
  • NuGet paket yöneticisi aracılığıyla yüklenen GroupDocs.Parser kitaplığı.

Ad Alanlarını İçe Aktar

GroupDocs.Parser ve ilgili işlevlerle çalışmak için gerekli ad alanlarını içe aktararak başlayın.

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

1. Adım: Tablo Şablonu Oluşturun

Tablolardan veri çıkarmak için öncelikle çıkarmak istediğiniz tablonun yapısını temsil eden bir şablon tanımlayın. Belge içindeki tablonun konumunu ve boyutlarını belirtin.

// Tablo parametrelerini tanımlayın (konum ve boyut)
TemplateTableParameters parameters = new TemplateTableParameters(new Rectangle(new Point(35, 320), new Size(530, 55)), null);
// Parametrelerle tablo şablonu oluşturma
TemplateTable table = new TemplateTable(parameters, "Details", null);

Adım 2: Bir Şablon Tanımlayın

Tanımladığınız tablo şablonunu içeren bir şablon oluşturun. Bu şablon, ayrıştırıcıya tablo verilerini çıkarırken nelere dikkat etmesi gerektiği konusunda rehberlik edecektir.

// Tabloyla bir şablon oluşturun
Template template = new Template(new TemplateItem[] { table });

Adım 3: Belgeyi Ayrıştırın ve Tablo Verilerini Çıkarın

Tanımladığınız şablonu kullanarak belirli bir belgeyi ayrıştırmak için GroupDocs.Parser’daki Parser sınıfını kullanın.

// Örnek dosyanızın yolunu belirtin
string filePath = "YourSampleFile.pdf";
// Ayrıştırıcı sınıfının bir örneğini oluşturun
using (Parser parser = new Parser(filePath))
{
    // Belgeyi şablona göre ayrıştırın
    DocumentData data = parser.ParseByTemplate(template);
    // Çıkarılan tüm veriler üzerinde yineleme yapın
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // Çıkarılan alanın bir tablo olup olmadığını kontrol edin
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // Tablo satırları üzerinde yineleme
        for (int row = 0; row < area.RowCount; row++)
        {
            // Tablo sütunları üzerinde yineleme
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // Hücre değerini alın
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // Hücre değerini yazdırın (veya boşsa boş dize)
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // Sütunlar arasında sekme boşluğu yazdırma
                if (column > 0)
                {
                    Console.Write("\t");
                }
            }
            // Her satırı yazdırdıktan sonra sonraki satıra geçin
            Console.WriteLine();
        }
    }
}

Çözüm

Bu öğreticide, tablo verilerini belgelerden ayıklamak için GroupDocs.Parser for .NET’in nasıl kullanılacağını araştırdık. Geliştiriciler, şablonları tanımlayarak ve ayrıştırma yöntemlerini kullanarak, çeşitli dosya formatlarından tablolar gibi yapılandırılmış verileri verimli bir şekilde çıkarabilirler.

SSS’ler

GroupDocs.Parser tüm belge formatlarıyla uyumlu mu?

Evet, GroupDocs.Parser, PDF, DOCX, XLSX, PPTX ve daha fazlasını içeren çok çeşitli dosya formatlarını destekler.

Bir belgedeki belirli bölgelerden veri çıkarabilir miyim?

Kesinlikle, bir belgedeki belirli alanları (tablolar gibi) hedef alan şablonları çıkartmak üzere tanımlayabilirsiniz.

GroupDocs.Parser büyük belgeler için uygun mudur?

Evet, GroupDocs.Parser büyük belgeleri verimli bir şekilde işleyecek şekilde optimize edilmiştir ve geliştiricilerin verileri sorunsuz bir şekilde çıkarmasına olanak tanır.

GroupDocs.Parser, yapılandırılmış verilerin yanı sıra metin çıkarmayı da destekliyor mu?

Evet, yapılandırılmış veri çıkarmaya (tablolar gibi) ek olarak GroupDocs.Parser, belgelerden düz metin ve meta veriler çıkarabilir.

GroupDocs.Parser entegrasyonuyla ilgili nasıl destek veya yardım alabilirim?

Destek ve tartışmalar için GroupDocs topluluk forumunu ziyaret edinBurada.