.

Let’s write.

Java Full Text Search: Build Index with GroupDocs.Search

Dalam aplikasi yang didorong oleh data saat ini, java full text search adalah tulang punggung setiap sistem yang perlu menemukan informasi dengan cepat di seluruh koleksi dokumen yang besar. Dengan memanfaatkan GroupDocs.Search for Java, Anda dapat membuat indeks pencarian yang kuat, menyempurnakan kamus alfabet, dan secara dramatis meningkatkan relevansi kueri Anda ketika search documents java. Panduan ini membawa Anda melalui setiap langkah—dari menyiapkan pustaka hingga menyesuaikan penanganan karakter—sehingga Anda dapat memberikan hasil pencarian yang cepat dan akurat dalam proyek Java Anda.

Quick Answers

  • What is “java full text search”? Itu adalah proses membangun indeks yang memungkinkan kueri teks cepat di banyak file dalam aplikasi Java.
  • Which library handles this out‑of‑the‑box? GroupDocs.Search for Java menyediakan indeksasi siap pakai, manajemen kamus, dan eksekusi kueri.
  • Do I need a license? Versi percobaan gratis sangat cocok untuk evaluasi; lisensi penuh diperlukan untuk penyebaran produksi.
  • Can I customize character handling? Tentu saja—gunakan kamus alfabet untuk mendefinisikan tipe karakter khusus.
  • Is Maven mandatory? Maven mempermudah penanganan dependensi, tetapi Anda juga dapat mengunduh JAR secara langsung.

What is java full text search and why manage an alphabet dictionary?

Sebuah indeks java full text search menyimpan representasi tokenisasi dari dokumen Anda, memungkinkan pencarian instan kata atau frasa. Kamus alfabet memberi tahu mesin cara memperlakukan setiap karakter (huruf, digit, simbol), yang secara langsung memengaruhi tokenisasi dan relevansi pencarian—terutama untuk simbol khusus atau aturan bahasa tertentu.

  • Speed: Indeks disimpan di disk dan dimuat secara efisien, memberikan waktu kueri kurang dari satu detik.
  • Flexibility: Kontrol penuh atas tipe karakter memungkinkan Anda menangani tanda hubung, apostrof, atau skrip non‑Latin.
  • Scalability: Bekerja dengan ribuan dokumen tanpa mengorbankan kinerja.
  • Ease of Integration: Pengaturan Maven sederhana atau unduhan langsung membuat Anda dapat mulai dengan cepat.

Prerequisites

Required Libraries, Versions, and Dependencies

  • GroupDocs.Search for Java (rilisan terbaru).
  • Pengetahuan dasar pengembangan Java.

Environment Setup Requirements

Pastikan Anda memiliki lingkungan yang kompatibel dengan Maven. Jika Maven belum terpasang, unduh dari situs resmi: Apache Maven.

Knowledge Prerequisites

Familiaritas dengan sintaks Java dan I/O file akan membantu, tetapi panduan langkah‑demi‑langkah di bawah ini mencakup semua yang Anda perlukan.

Setting Up GroupDocs.Search for Java

Maven Configuration

Tambahkan repositori dan dependensi ke file pom.xml Anda:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Direct Download

Jika Anda lebih memilih tidak menggunakan Maven, dapatkan JAR terbaru dari halaman rilis resmi: GroupDocs.Search for Java releases.

License Acquisition Steps

  1. Free Trial – Mulai dengan percobaan untuk menjelajahi semua fitur.
  2. Temporary License – Minta kunci sementara untuk pengujian yang diperpanjang.
  3. Full License – Beli lisensi produksi untuk penggunaan tak terbatas.

Basic Initialization and Setup

Buat instance Index yang menunjuk ke folder tempat indeks pencarian akan disimpan:

import com.groupdocs.search.*;

public class SearchIndexSetup {
    public static void main(String[] args) {
        String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\Index";
        Index index = new Index(indexFolder);
    }
}

Implementation Guide

Berikut adalah walkthrough lengkap dari operasi paling umum yang akan Anda lakukan saat membangun solusi java full text search.

Creating or Opening an Index

Inisialisasi indeks baru atau buka yang sudah ada:

import com.groupdocs.search.*;

String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\Index";
Index index = new Index(indexFolder);
  • Parameters: indexFolder – path tempat file‑file indeks berada.
  • Purpose: Menyiapkan lingkungan pencarian untuk proses indeksasi dan kueri selanjutnya.

Exporting the Alphabet Dictionary to a File

Simpan kamus alfabet saat ini sehingga Anda dapat menggunakannya kembali atau menganalisisnya nanti:

import com.groupdocs.search.dictionaries.*;

String fileName = "YOUR_OUTPUT_DIRECTORY\\Alphabet.dat";
index.getDictionaries().getAlphabet().exportDictionary(fileName);
  • Parameters: fileName – file tujuan untuk kamus yang diekspor.

Clearing the Alphabet Dictionary

Reset kamus ke keadaan default sebelum menerapkan aturan khusus:

import com.groupdocs.search.dictionaries.*;

if (index.getDictionaries().getAlphabet().getCount() > 0) {
    index.getDictionaries().getAlphabet().clear();
}
  • Purpose: Menghapus semua tipe karakter yang telah didefinisikan sebelumnya.

Importing the Alphabet Dictionary from a File

Pulihkan konfigurasi kamus yang sebelumnya disimpan:

import com.groupdocs.search.dictionaries.*;

index.getDictionaries().getAlphabet().importDictionary(fileName);
  • Parameters: fileName – path ke file .dat yang berisi kamus.

Setting Character Type in Alphabet Dictionary

Sesuaikan cara karakter tertentu diperlakukan selama tokenisasi:

import com.groupdocs.search.dictionaries.*;

if (index.getDictionaries().getAlphabet().getCharacterType('-') != CharacterType.Blended) {
    index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
}
  • Parameters: Karakter ('-') dan CharacterType baru (misalnya Blended).
  • Why it matters: Menyesuaikan tipe karakter meningkatkan relevansi pencarian untuk istilah ber‑tanda hubung, ID, atau simbol khusus.

Indexing Documents from a Folder

Tambahkan semua file dalam sebuah direktori ke indeks pencarian:

import com.groupdocs.search.*;

String documentsFolder = "YOUR_DOCUMENT_DIRECTORY";
index.add(documentsFolder);
  • Parameters: documentsFolder – folder yang berisi dokumen yang ingin Anda indeks.

Searching in an Index

Jalankan kueri dan dapatkan hasil yang cocok:

import com.groupdocs.search.results.*;

String query = "Elliot-Murray-Kynynmound";
SearchResult result = index.search(query);
  • Parameters: query – teks yang Anda cari.
  • Result: Objek SearchResult yang berisi dokumen yang cocok dan cuplikan.
  • Content Management Systems (CMS): Mempercepat pengambilan artikel dan aset.
  • Legal Document Repositories: Menemukan klausul atau referensi kasus dengan cepat.
  • Research Libraries: Mengindeks ribuan makalah untuk pencarian kata kunci instan.
  • E‑commerce Catalogs: Meningkatkan pencarian produk dengan tokenisasi khusus.
  • Customer Support Portals: Memungkinkan agen menemukan tiket atau artikel basis pengetahuan yang relevan dengan cepat.

Performance Considerations

  • Incremental Updates: Hanya indeks ulang file baru atau yang berubah untuk menjaga indeks tetap segar tanpa rebuild penuh.
  • Query Optimization: Jaga kueri tetap singkat; hindari pencarian wildcard yang terlalu luas.
  • Resource Monitoring: Pantau penggunaan memori selama indeksasi batch besar—sesuaikan ukuran heap JVM bila diperlukan.
  • Dictionary Size: Ekspor/impor kamus alfabet hanya saat Anda memodifikasinya; I/O yang tidak perlu dapat memperlambat proses start‑up.

Frequently Asked Questions

Q: What are the prerequisites for using GroupDocs.Search?
A: Install Java, Maven (or download the JAR), and add the GroupDocs.Search dependency.

Q: How do I obtain a license for production use?
A: Start with a free trial, request a temporary key for extended testing, then purchase a full license from the GroupDocs portal.

Q: Can I customize character types in the alphabet dictionary?
A: Yes—use setRange to assign custom CharacterType values to any character or range.

Q: Is it possible to export and import the alphabet dictionary?
A: Absolutely—use exportDictionary and importDictionary methods to persist or share dictionary configurations.

Q: Which version was this guide tested with?
A: The examples were verified with GroupDocs.Search for Java version 25.4.


Last Updated: 2026-02-21
Tested With: GroupDocs.Search for Java 25.4
Author: GroupDocs