Realizar Busca de Texto com GroupDocs.Search para Java
Otimização de Desempenho
Como Implementar e Otimizar uma Rede de Busca com GroupDocs.Search para Java
Introdução
No mundo orientado a dados de hoje, a capacidade de perform text search rapidamente em coleções massivas de documentos é uma vantagem competitiva. Seja construindo uma base de conhecimento interna, um repositório de casos jurídicos ou um catálogo de produtos de e‑commerce, uma rede de busca bem afinada pode melhorar drasticamente a satisfação do usuário. Neste guia você aprenderá a set up search network, create searchable index, optimize search performance e até delete documents index quando necessário — tudo usando o GroupDocs.Search para Java.
O que você aprenderá
- Configurando uma rede de busca com GroupDocs.Search
- Implantando nós na rede
- Indexando documentos de forma eficiente (
index documents java) - Realizando buscas de texto em sua rede (
perform text search) - Excluindo documentos específicos do índice (
delete documents index)
Vamos mergulhar em como você pode aproveitar esses recursos para criar uma experiência de busca otimizada.
Respostas Rápidas
- Qual é o principal objetivo do GroupDocs.Search para Java? Ele fornece busca em texto completo em diversos formatos de documentos.
- Como faço busca de texto em um ambiente distribuído? Implante uma rede de busca, indexe documentos em um nó mestre e, em seguida, consulte qualquer nó.
- Posso excluir documentos do índice sem reconstruí‑lo? Sim, use a API Delete para remover arquivos selecionados.
- Qual versão do Java é necessária? JDK 8 ou superior.
- É necessária uma licença para produção? É necessária uma licença válida do GroupDocs.Search; uma avaliação gratuita está disponível.
O que é “perform text search”?
Realizar busca de texto significa consultar um índice de texto completo para recuperar documentos que contenham as palavras‑chave ou frases especificadas. O GroupDocs.Search cria um índice invertido que torna essas consultas extremamente rápidas, mesmo em milhares de arquivos.
Por que configurar uma rede de busca?
Uma rede de busca distribui as cargas de trabalho de indexação e consulta entre múltiplos nós, permitindo que você optimize search performance, escale horizontalmente e mantenha alta disponibilidade. Essa arquitetura é ideal para repositórios de documentos corporativos onde latência e taxa de transferência são importantes.
Pré‑requisitos
- Bibliotecas necessárias: GroupDocs.Search para Java versão 25.4 (mais recente).
- Ambiente: Java JDK 8+, Maven.
- Conhecimento: Programação Java básica e familiaridade com conceitos de rede.
Configurando o GroupDocs.Search para Java
Para começar, integre o GroupDocs.Search ao seu projeto Java usando a configuração a seguir:
Configuração Maven
Adicione o repositório e a dependência ao seu arquivo pom.xml:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Download Direto
Alternativamente, você pode baixar a versão mais recente diretamente da GroupDocs.
Aquisição de Licença
A GroupDocs oferece uma avaliação gratuita, que permite avaliar seus recursos antes da compra. Você pode obter uma licença temporária seguindo os passos na página de compra. Isso habilitará a funcionalidade completa durante sua fase de testes.
Inicialização e Configuração Básicas
Inicialize o GroupDocs.Search em sua aplicação Java com:
import com.groupdocs.search.*;
class SearchNetworkSetup {
public static void main(String[] args) {
Index index = new Index("path/to/index/directory");
// Additional configuration can be set here.
}
}
Guia de Implementação
Configurando a Rede de Busca
Visão geral: Defina um caminho base e uma porta para sua rede de busca, permitindo que os nós se comuniquem efetivamente.
Etapa 1: Definir Configuração Base
import com.groupdocs.search.options.*;
import com.groupdocs.search.scaling.configuring.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104; // Change if necessary.
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
- Parâmetros:
basePath: Caminho do diretório para operações de rede.basePort: Número da porta usada pela rede de busca.
Etapa 2: Solução de Problemas
Certifique-se de que a porta especificada não esteja bloqueada por configurações de firewall ou sendo usada por outra aplicação. Ajuste conforme necessário para evitar conflitos.
Implantando Nós da Rede de Busca
Visão geral: Usando sua configuração, implante nós em sua rede para indexação e busca distribuídas.
import com.groupdocs.search.scaling.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
// Nodes are now deployed and ready for further operations.
- Opções de Configuração Principais:
- Base Path & Port: Esses valores devem corresponder aos usados na sua configuração inicial para garantir consistência.
Indexando Documentos (create searchable index)
Visão geral: Adicione documentos ao índice de busca de forma eficiente usando um nó mestre.
import com.groupdocs.search.scaling.*;
String documentsPath = "YOUR_DOCUMENT_DIRECTORY/path/to/documents";
SearchNetworkNode masterNode = nodes[0];
IndexingDocuments.addDirectories(masterNode, documentsPath);
- Objetivo:
masterNode: O nó principal que gerencia a indexação de documentos.documentsPath: Caminho para o diretório que contém os documentos.
Dicas de Solução de Problemas
Verifique se os caminhos dos documentos estão corretos e acessíveis. Garanta que as permissões permitam leitura desses diretórios.
Buscando Texto na Rede (perform text search)
Visão geral: Realize buscas de texto abrangentes em sua rede indexada.
import com.groupdocs.search.scaling.*;
String query = "nulla";
SearchNetworkNode masterNode = nodes[0];
TextSearchInNetwork.searchAll(masterNode, query, false);
- Parâmetros:
query: O texto que você está buscando.masterNode: Nó que realiza a busca.
Excluindo Documentos do Índice (delete documents index)
Visão geral: Remova documentos específicos do seu índice usando seus caminhos de arquivo.
import com.groupdocs.search.scaling.*;
SearchNetworkNode node = nodes[0];
String[] filePaths = {
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.pdf",
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.docx"
};
deleteDocuments(node, filePaths);
void deleteDocuments(SearchNetworkNode node, String... filePaths) {
Indexer indexer = node.getIndexer();
DeleteOptions options = new DeleteOptions();
indexer.delete(filePaths, options);
}
- Objetivo do Método:
node: O nó alvo para operações de exclusão.filePaths: Caminhos dos documentos a serem removidos do índice.
Solução de Problemas
Certifique-se de que os caminhos dos arquivos estejam precisos e que os arquivos existam no seu diretório. Se os problemas persistirem, verifique as permissões de rede e a conectividade.
Aplicações Práticas
- Gerenciamento de Documentos Corporativos: Otimize a recuperação de conhecimento interno.
- Análise de Casos Jurídicos: Localize rapidamente arquivos de casos relevantes em múltiplos repositórios.
- Plataformas de E‑commerce: Aumente a velocidade de busca de produtos indexando descrições e avaliações.
- Pesquisa Acadêmica: Pesquise eficientemente grandes bibliotecas digitais de artigos e teses.
- Sistemas de Suporte ao Cliente: Reduza o tempo de resposta permitindo que agentes busquem tickets anteriores instantaneamente.
Considerações de Desempenho
- Otimizar Velocidade de Indexação: Adicione documentos novos incrementalmente durante horários de baixa demanda para manter a latência baixa.
- Diretrizes de Uso de Recursos: Monitore CPU e memória, especialmente ao escalar o número de nós.
- Gerenciamento de Memória Java: Ajuste as configurações de heap da JVM com base na sua carga de trabalho (por exemplo,
-Xmx2gpara índices de tamanho médio).
Conclusão
Ao seguir este guia você aprendeu como set up search network, create searchable index, perform text search e delete documents index usando o GroupDocs.Search para Java. Essas capacidades permitem recuperação de documentos rápida e confiável em ambientes distribuídos.
Próximos Passos
- Experimente diferentes configurações de nós para encontrar o equilíbrio ideal para sua carga de trabalho.
- Aprofunde-se em opções avançadas de indexação, como analisadores personalizados e ajuste de relevância.
- Explore a integração com outros produtos GroupDocs para processamento de documentos de ponta a ponta.
Perguntas Frequentes
Q: Qual é o caso de uso principal do GroupDocs.Search para Java?
A: Ele fornece busca em texto completo em diversos formatos de documentos, permitindo que você perform text search em grandes repositórios.
Q: Como posso melhorar a velocidade de busca em uma rede grande?
A: Implante nós adicionais, ajuste o heap da JVM e agende a indexação durante períodos de baixo tráfego para optimize search performance.
Q: É possível excluir um único documento sem reindexar toda a coleção?
A: Sim, use a API delete documents index conforme mostrado no exemplo de código para remover arquivos específicos.
Q: Preciso de uma licença para desenvolvimento?
A: Uma licença de avaliação gratuita é suficiente para testes; uma licença comercial é necessária para implantações em produção.
Q: Posso indexar PDFs, arquivos Word e e‑mails juntos?
A: Absolutamente — o GroupDocs.Search suporta uma ampla variedade de formatos prontamente.
Última atualização: 2026-01-16
Testado com: GroupDocs.Search para Java 25.4
Autor: GroupDocs