Adicionar Documentos ao Índice com GroupDocs.Search para Java

Neste tutorial você descobrirá como adicionar documentos ao índice e criar uma solução de busca altamente escalável usando GroupDocs.Search para Java. Vamos percorrer a configuração de uma rede de busca, a implantação de nós e o tratamento de eventos para que sua aplicação possa processar grandes coleções de documentos de forma eficiente em vários servidores.

Respostas Rápidas

  • O que significa “adicionar documentos ao índice”? Significa inserir
    Uma licença de teste temporária está disponível; uma licença comercial é necessária para produção.
  • Posso escalar horizontalmente? Sim—implantando várias instâncias de SearchNetworkNode.
  • Qual versão do Java é necessária? JDK 8 ou superior.

O que é adicionar documentos ao índice?

Adicionar documentos ao índice é o processo de alimentar seus arquivos de origem (PDFs, documentos Word, etc.) ao mecanismo GroupDocs.Search para que seumazena dados de frequência de termos, permitindo recuperação rápida durante as consultas.

Por que usar GroupDocs.Search para Javaporta uma ampla variedade de formatos de documento prontamente.

Pré‑requisitos

  • Java Development Kit (JDK) 8+ instalado.
  • Maven para gerenciamento de dependências.
  • Familiaridade básica com Java e a estrutura de projetos Maven.

Bibliotecas, Versões e Dependências Necessárias

Para implementar GroupDocs.Search para Java, inclua o seguinte em seu projeto Maven:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Alternativamente, faça o download da versão mais recente em GroupDocs.Search for Java releases.

Requisitos de Configuração do Ambiente

  • JDK 8 ou superior instalado em seu sistema.
  • Maven instalado e configurado, caso esteja usando um projeto Maven.

Pré‑requisitos de Conhecimento

  • Compreensão básica de programação Java.
  • Familiaridade com o gerenciamento de dependências no Maven.

Configurando GroupDocs.Search para Java

  1. Configuração do Maven: Adicione o repositório e a dependência conforme mostrado acima no seu arquivo pom.xml.
  2. Download Direto: Alternativamente, faça o download da biblioteca em GroupDocs Search Java releases.

Aquisição de Licença

  • Obtenha uma licença de teste gratuita ou temporária visitando o site da GroupDocs.
  • Para acesso completo e suporte, considere a compra de uma licença comercial.

Inicialização Básica

Inicialize o GroupDocs.Search em sua aplicação Java:

import com.groupdocs.search.*;

public class SearchSetup {
    public static void main(String[] args) {
        // Initialize an index
        Index index = new Index("path/to/index/directory");

        // Add documents to the index
        index.add("path/to/documents");
        
        System.out.println("GroupDocs.Search setup complete.");
    }
}

Como adicionar documentos ao índice em uma Rede de Busca

Quando você **adiciona documentos ao a carga de trabalho é distribuída automaticamente entre os nós disponíveis, melhorando o throughput e a tolerância a falhas.

Recurso 1: Configurar Rede de Busca

Visão Geral

Configurar uma rede de busca envolve definir nós para gerenciar e distribuir tarefas de busca de forma eficiente.

Etapa 1: Definir Caminho Base e Porta
String basePath = "YOUR_DOCUMENT_DIRECTORY/AdvancedUsage/Scaling/SearchNetworkNodeEvents/";
int basePort = 49140; // Change if necessary due to busy port issues
Etapa 2: Configurar a Rede
import com.groupdocs.search.scaling.*;
import com.groupdocs.search.scaling.configuring.*;

Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);

Recurso 2: Implantar Nós da Rede de Busca

Visão Geral

Implante nós para distribuir e manipular operações de busca em sua rede.

Etapa 1: Implantar Nós Usando Configuração
import com.groupdocs.search.scaling.*;

SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);

Recurso 3: Inscrever‑se em Eventos de Nó

Visão Geral

Inscrever‑se em eventos de nó permite monitorar e responder a várias ações dentro da rede de busca.

Etapa 1: Definir Método de Inscrição
import com.groupdocs.search.events.*;
import com.groupdocs.search.scaling.events.*;

public static void subscribe(SearchNetworkNode node) {
    // Subscribe to IndexingCompleted event
    node.getEvents().IndexingCompleted.add(new EventHandler() {
        @Override
        public void invoke(Object s, EventArgs e) {
            System.out.println("Indexing completed.");
        }
    });

    // Additional events can be subscribed similarly...
}
Etapa 2: Usar o Método de Inscrição
SearchNetworkNode masterNode = nodes[0];
subscribe(masterNode);

Encerramento de Nós

Garanta que você feche todos os nós implantados após o uso:

for (SearchNetworkNode node : nodes) {
    node.close();
}

Aplicações Práticas

  1. Soluções de Busca Corporativa – Implemente uma rede de busca para lidar com buscas de documentos em grande escala em vários servidores.
  2. Plataformas de E‑commerce – Aprimore as capacidades de busca de produtos distribuindo tarefas de indexação entre vários nós.
  3. Sistemas de Gerenciamento de Conteúdo (CMS) – Melhore o desempenho da recuperação e atualização de conteúdo em ambientes CMS.

Considerações de Desempenho

  • Otimize a implantação de nós com base nos recursos do seu sistema.
  • Monitore regularmente o uso de memória para prevenir vazamentos, especialmente ao lidar com grandes volumes de dados.
  • Utilize as configurações para ajustar finamente as operações de indexação e busca, obtendo maior eficiência.

Problemas Comuns e Soluções

| Problema | Causa Típica | Solução | |———-|————–|——— Nó inac | Abra as portas necessárias e verifique a conectividade | | Índice não atualiza | Caminho do documento incorreto | Verifique se basePath aponta para o diretório correto | | Alto consumo de memória | Indexação em lote grande | Indexe documentos em lotes menores ou aumente o tamanho do heap |

Perguntas Frequentes

P: Como lidar com conflitos de porta ao implantar nós?
R: Altere a variável basePort no seu código de configuração para uma porta disponível.

P: O GroupDocs.Search pode ser usado para indexação em tempo real?
R: Sim, ele suporta indexação em tempo real com as configurações adequadas.

P: Quais são alguns problemas comuns durante a implantação de nós?
R: Conectividade de rede e configurações de caminho incorretas são causas frequentes. Certifique‑se de que todos os caminhos e portas estejam configurados corretamente.

P: É possível adicionar documentos ao índice após a rede estar em execução?
R: Absolutamente. Você pode chamar index.add(...) em qualquer nó, e a rede distribuirá a nova carga de trabalho automaticamente.

P: Preciso de licença para testes de desenvolvimento?
R: Uma licença de teste temporária é suficiente para testes; uma licença comercial é necessária para uso em produção.

Recursos

Seguindo este guia, você poderá adicionar documentos ao índice e gerenciar uma rede de busca robusta e escalável usando GroupDocs.Search para Java. Boa codificação!


Última atualização: 2026-01-24
Testado com: GroupDocs.Search 25.4 para Java
Autor: GroupDocs