.

Now produce final markdown with translations.

Be careful to preserve code block placeholders exactly: ```xml repository.groupdocs.com GroupDocs Repository https://releases.groupdocs.com/search/java/

com.groupdocs groupdocs-search 25.4 ``` etc.

Also preserve any markdown formatting like blockquotes >.

Let’s craft final answer.# Pencarian Teks Penuh Java dengan GroupDocs.Search

Pendahuluan

Jika Anda sedang berjuang dengan full text search java di antara banyak file, Anda tidak sendirian. Memindai PDF, dokumen Word, atau spreadsheet secara manual dengan cepat menjadi hambatan. Untungnya, GroupDocs.Search untuk Java memungkinkan Anda mengotomatisasi proses tersebut, memberikan hasil yang cepat dan akurat untuk jenis dokumen apa pun. Dalam tutorial ini kami akan membahas semua yang Anda perlukan untuk memulai—dari menyiapkan perpustakaan hingga menambahkan dokumen ke indeks, menyusun pernyataan boolean query java, dan optimizing search performance. Pada akhir tutorial, Anda akan memiliki implementasi full text search java yang solid dan siap produksi dalam aplikasi Anda.

Jawaban Cepat

  • What is full text search java? Teknik yang mengindeks teks mentah dokumen sehingga Anda dapat menanyakan kata atau frasa apa pun secara instan.
  • Which library supports multiple formats? GroupDocs.Search untuk Java menangani PDF, DOCX, XLSX, dan banyak lagi.
  • How do I add documents to index? Gunakan metode index.add() dengan jalur atau DocumentFilter khusus.
  • Can I run Boolean queries? Ya—gabungkan istilah dengan AND, OR, NOT untuk hasil yang tepat.
  • How do I improve performance? Perbarui indeks secara teratur, aktifkan caching, dan aktifkan pencarian fonetik hanya bila diperlukan.

Apa itu Full Text Search Java?

Full text search java adalah proses memindai seluruh konten teks dokumen, menyimpannya dalam indeks yang efisien, dan kemudian memungkinkan kueri kata kunci atau frasa secara cepat. Berbeda dengan pencarian nama file sederhana, pencarian ini melihat ke dalam file, menjadikannya ideal untuk sistem manajemen dokumen, portal dukungan, dan skenario apa pun di mana pengguna perlu menemukan informasi dengan cepat.

Mengapa Menggunakan GroupDocs.Search untuk Java?

  • Multi‑format support – Word, PDF, Excel, PowerPoint, dan lainnya.
  • Scalable indexing – Menangani jutaan file dengan jejak memori yang rendah.
  • Advanced query language – Pencarian Boolean, fuzzy, dan fonetik tersedia langsung.
  • Easy integration – Dependensi Maven yang sederhana dan API yang mudah dipahami.

Prasyarat

Sebelum kita melanjutkan, pastikan Anda memiliki:

  • Java 8+ (Java 11 atau yang lebih baru disarankan).
  • Maven untuk manajemen dependensi.
  • Lisensi GroupDocs.Search (versi percobaan gratis dapat digunakan untuk pengembangan).

Perpustakaan dan Dependensi yang Diperlukan

Tambahkan repositori dan dependensi ke pom.xml Anda:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Pengaturan Lingkungan

  • Instal JDK (versi 8 atau lebih baru).
  • Gunakan IDE seperti IntelliJ IDEA atau Eclipse.

Prasyarat Pengetahuan

  • Pemrograman Java dasar.
  • Familiaritas dengan pom.xml Maven.

Menyiapkan GroupDocs.Search untuk Java

Anda dapat menambahkan perpustakaan melalui Maven (seperti di atas) atau dengan mengunduh JAR secara langsung.

Unduhan Langsung (jika Anda lebih suka penyiapan manual)

Unduh paket terbaru dari GroupDocs.Search for Java releases.

Langkah-langkah Akuisisi Lisensi

  1. Free Trial – Daftar dan terima kunci sementara.
  2. Temporary License – Minta kunci jangka panjang untuk pengujian lanjutan.
  3. Purchase – Tingkatkan ke lisensi komersial penuh ketika Anda siap.

Inisialisasi dan Penyiapan Dasar

Buat folder indeks di disk dan verifikasi bahwa perpustakaan dimuat dengan benar:

import com.groupdocs.search.Index;

public class SearchSetup {
    public static void main(String[] args) {
        // Initialize an index in the specified directory
        Index index = new Index("C:\\MyIndex");
        
        System.out.println("GroupDocs.Search initialized!");
    }
}

Pro tip: Simpan direktori indeks pada penyimpanan SSD yang cepat untuk latensi kueri terbaik.

Panduan Implementasi

Menambahkan Dokumen ke Indeks

Why this matters: Tidak ada hasil pencarian tanpa konten yang diindeks. Di bawah ini kami menunjukkan cara menambahkan seluruh folder atau memfilter tipe file tertentu.

Langkah 1: Buat Indeks

Index index = new Index("C:\\MyIndex");

Langkah 2: Tambahkan Dokumen (add documents to index)

Anda dapat mengindeks semua yang ada di sebuah folder atau membatasi pada ekstensi tertentu:

index.add("C:\\Documents\\*.*"); // Adds all documents from the specified directory
// For specific file types, use:
index.add("C:\\Reports", new DocumentFilter() {
    @Override
    public boolean accept(String fileName) {
        return fileName.endsWith(".pdf") || fileName.endsWith(".docx");
    }
});

Explanation:

  • Index mewakili basis data yang dapat dicari.
  • add() memasukkan file; wildcard *.* mengambil semua file, sementara DocumentFilter memungkinkan Anda menyesuaikan langkah add documents to index.

Melakukan Pencarian (search documents java)

Sekarang indeks berisi data, Anda dapat melakukan kueri.

Langkah 1: Buat Query

String query = "GroupDocs";

Langkah 2: Jalankan Pencarian

SearchResult result = index.search(query);
System.out.println("Documents found: " + result.getDocumentCount());

Explanation:

  • search() menjalankan kueri terhadap indeks.
  • getDocumentCount() memberi tahu berapa banyak dokumen yang cocok—berguna untuk pemeriksaan cepat.

Teknik Query Lanjutan (boolean query java)

Untuk kontrol yang tepat, gabungkan istilah dengan logika Boolean.

Query Boolean

String booleanQuery = "GroupDocs AND Java";
SearchResult booleanResult = index.search(booleanQuery);

Pencarian Fonetik (opsional untuk pencocokan fuzzy)

When to use: Aktifkan pencarian fonetik hanya jika pengguna sering salah eja istilah; jika tidak, biarkan dinonaktifkan untuk optimize search performance.

Masalah Umum dan Solusinya

ProblemWhy it HappensFix
Missing DocumentsJalur file salah atau izin tidak cukupVerifikasi jalur dan berikan akses baca
Slow QueriesIndeks besar tanpa caching atau pencarian fonetik yang tidak diperlukanAktifkan caching, nonaktifkan pencarian fonetik, dan pertimbangkan memecah indeks
Out‑of‑Memory ErrorsUkuran indeks melebihi heap JVMTingkatkan -Xmx atau gunakan indeks inkremental

Aplikasi Praktis

GroupDocs.Search bersinar dalam skenario dunia nyata:

  1. Content Management Systems – Menyediakan pencarian teks penuh instan di seluruh artikel, PDF, dan media.
  2. Customer Support Portals – Agen dapat menemukan manual atau kebijakan yang relevan dalam hitungan detik.
  3. Enterprise Document Repositories – Mencari di antara kontrak, laporan, dan dokumen kepatuhan tanpa memindahkan data ke basis data terpisah.

Pertimbangan Kinerja

Mengoptimalkan Kinerja Pencarian

  • Incremental Indexing: Tambahkan atau perbarui hanya file yang berubah alih-alih membangun ulang seluruh indeks.
  • Caching: Simpan hasil kueri yang sering dipakai di memori.
  • Resource Monitoring: Sesuaikan heap JVM (-Xmx2g dll.) berdasarkan ukuran indeks.

Pedoman Penggunaan Sumber Daya

  • Simpan folder indeks pada disk yang cepat.
  • Pantau CPU dan memori selama proses indeks bulk; operasi batch dapat diatur kecepatannya untuk menghindari lonjakan.

Praktik Terbaik untuk Manajemen Memori Java

  • Gunakan try-with-resources saat bekerja dengan stream.
  • Set nilai null pada objek besar setelah selesai digunakan untuk membantu garbage collection.

Kesimpulan

Anda kini memiliki implementasi full text search java yang lengkap dan siap produksi menggunakan GroupDocs.Search. Dari menyiapkan perpustakaan, adding documents to index, menyusun pernyataan boolean query java, hingga optimizing search performance, setiap langkah telah dibahas.

Langkah Selanjutnya

Jelajahi fitur yang lebih mendalam seperti analyzer khusus, kamus sinonim, dan integrasi penyimpanan cloud dengan memeriksa documentation resmi.


Pertanyaan yang Sering Diajukan

Q: Format file apa saja yang didukung oleh GroupDocs.Search?
A: Ia menangani Word, PDF, Excel, PowerPoint, HTML, TXT, dan banyak lagi.

Q: Bagaimana cara menangani dataset besar?
A: Bagi menjadi beberapa indeks, perbarui secara inkremental, dan aktifkan caching hasil.

Q: Apakah GroupDocs.Search dapat dijalankan di lingkungan cloud?
A: Ya, Anda dapat mengarahkan folder indeks ke penyimpanan cloud yang dipasang (misalnya Azure Blob, AWS S3 melalui driver sistem file).

Q: Apa keunggulan GroupDocs.Search dibandingkan perpustakaan lain?
A: Dukungan multi‑format, query Boolean/fonetik bawaan, dan API Java yang ringan menjadikannya pilihan yang serbaguna.

Q: Bagaimana cara mengatasi masalah kinerja?
A: Tinjau pengaturan indeks, nonaktifkan fitur yang tidak diperlukan seperti pencarian fonetik, dan pantau penggunaan memori/CPU JVM.


Last Updated: 2026-02-11
Tested With: GroupDocs.Search 25.4
Author: GroupDocs

Resources