Cara Mengindeks Dokumen dengan GroupDocs.Search untuk Java

Dalam dunia yang didorong oleh data saat ini, cara mengindeks dokumen secara efisien adalah keterampilan penting bagi setiap pengembang Java yang menangani koleksi file besar. Baik Anda menangani kontrak hukum, laporan keuangan, atau laporan internal, kemampuan untuk dengan cepat menemukan informasi yang tepat dapat menghemat berjam‑jam kerja manual. Dalam tutorial ini Anda akan belajar cara mengindeks dokumen menggunakan pustaka GroupDocs.Search, kemudian melakukan kueri berbasis teks maupun berbasis objek pada indeks yang dibuat. Mari kita mulai!

Jawaban Cepat

  • Apa langkah pertama untuk mengindeks dokumen? Inisialisasi objek Index yang menunjuk ke folder tempat indeks akan disimpan.
  • Metode mana yang menambahkan dokumen ke indeks? Gunakan index.add("PATH_TO_DOCUMENTS").
  • Bisakah saya mencari rentang numerik? Ya, dengan kueri teks seperti "400 ~~ 4000" atau kueri objek melalui SearchQuery.createNumericRangeQuery.
  • Apakah saya memerlukan lisensi? Versi percobaan gratis tersedia; lisensi komersial membuka semua fitur.
  • Versi Java apa yang diperlukan? JDK 8 atau yang lebih tinggi.

Apa itu “cara mengindeks dokumen” dengan GroupDocs.Search?

Mengindeks dokumen berarti memindai konten file dalam sebuah folder dan menyimpan token yang dapat dicari di folder indeks khusus. Langkah pra‑pemrosesan ini memungkinkan pencarian yang sangat cepat kemudian, karena pustaka mencari di indeks yang telah dipersiapkan bukan pada file mentah setiap kali.

Mengapa menggunakan GroupDocs.Search untuk Java?

  • Kinerja: Pencarian berjalan dalam milidetik bahkan pada ribuan file.
  • Dukungan format: Menangani PDF, Word, Excel, PowerPoint, dan banyak lagi.
  • Fleksibilitas: Mendukung kueri teks biasa, rentang numerik, dan kueri objek kompleks.
  • Skalabilitas: Mudah memperbarui indeks dengan menambahkan dokumen baru tanpa harus membangun ulang dari awal.

Prasyarat

  • Maven terpasang untuk manajemen dependensi.
  • IDE seperti IntelliJ IDEA atau Eclipse.
  • Pengetahuan dasar Java (konsep OOP, penanganan pengecualian).

Menyiapkan GroupDocs.Search untuk Java

Pengaturan Maven

Tambahkan repositori dan dependensi ke pom.xml Anda:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/search/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>25.4</version>
   </dependency>
</dependencies>

Unduhan Langsung

Anda juga dapat mengunduh JAR terbaru dari GroupDocs.Search for Java releases.

Langkah-langkah Akuisisi Lisensi

  1. Free Trial – jelajahi pustaka tanpa biaya.
  2. Temporary License – minta kunci jangka pendek untuk evaluasi yang lebih lama.
  3. Purchase – dapatkan lisensi penuh untuk penggunaan produksi.

Inisialisasi dan Pengaturan Dasar

Untuk menambahkan dokumen ke indeks, pertama Anda membuat objek Index yang menunjuk ke folder tempat file indeks akan disimpan:

import com.groupdocs.search.Index;

// Initialize the index by specifying a directory path
Index index = new Index("YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\NumericRangeSearch");

Baris ini membuat (atau membuka) sebuah indeks yang siap menerima dokumen.

Panduan Implementasi

Membuat dan Mengindeks Dokumen

Cara menambahkan dokumen ke indeks

Metode add memindai sebuah folder dan menyimpan data yang dapat dicari untuk setiap file.

import com.groupdocs.search.Index;

// Initialize an index at the specified path
Index index = new Index("YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\NumericRangeSearch");

// Add documents from a directory for indexing
index.add("YOUR_DOCUMENT_DIRECTORY");
  • Parameter: String path menunjuk ke folder yang berisi file yang ingin Anda indeks.
  • Tujuan: Setelah langkah ini, indeks berisi token dari semua tipe dokumen yang didukung, memungkinkan pencarian cepat.

Pencarian Kueri Teks

Cara melakukan pencarian rentang numerik berbasis teks

Anda dapat mencari menggunakan string sederhana yang mendefinisikan rentang.

import com.groupdocs.search.*;
import com.groupdocs.search.results.*;

// Define a query for numeric values within a specific range
String query1 = "400 ~~ 4000";

// Execute text-based search on indexed data
SearchResult result1 = index.search(query1);
  • Parameter: String kueri "400 ~~ 4000" memberi tahu mesin untuk menemukan angka antara 400 dan 4000.
  • Nilai Kembali: SearchResult menyimpan daftar dokumen yang cocok dan sorotan.

Pencarian Kueri Objek

Cara menggunakan kueri objek untuk rentang numerik

Kueri berbasis objek memberi Anda kontrol programatik atas kriteria pencarian.

import com.groupdocs.search.*;
import com.groupdocs.search.results.*;

// Create a numeric range query object
SearchQuery query2 = SearchQuery.createNumericRangeQuery(400, 4000);

// Perform search using the query object
SearchResult result2 = index.search(query2);
  • Parameter: createNumericRangeQuery menerima integer awal dan akhir.
  • Tujuan: Metode ini ideal ketika Anda perlu menggabungkan beberapa kondisi atau membangun kueri secara dinamis.

Aplikasi Praktis

Berikut beberapa skenario dunia nyata di mana cara mengindeks dokumen menjadi pengubah permainan:

  1. Manajemen Dokumen Hukum – temukan klausul, nomor kasus, atau tanggal di antara ribuan kontrak.
  2. Pelaporan Keuangan – tarik transaksi yang berada dalam rentang uang tertentu.
  3. Pelacakan Inventaris – temukan item berdasarkan nomor seri, kode batch, atau rentang SKU.

Mengintegrasikan GroupDocs.Search dengan basis data, penyimpanan cloud, atau antrian pesan dapat lebih mengotomatisasi alur kerja dokumen.

Pertimbangan Kinerja

  • Pembaruan Indeks Reguler: Jalankan kembali index.add untuk file baru agar indeks tetap segar.
  • Manajemen Sumber Daya: Pantau penggunaan heap; indeks besar mendapat manfaat dari pengaturan garbage‑collection JVM yang disesuaikan.
  • Optimasi Kueri: Gunakan kueri objek untuk filter kompleks guna mengurangi pemindaian yang tidak perlu.

Masalah Umum dan Solusinya

IssueWhy It HappensFix
Pencarian tidak menghasilkan hasilIndeks belum dibangun atau jalur folder tidak tepatVerifikasi index.add dijalankan pada direktori yang benar dan bahwa folder indeks dapat ditulisi.
OutOfMemoryError selama pengindeksanFile sangat besar atau heap tidak cukupTingkatkan nilai JVM -Xmx atau indeks file dalam batch yang lebih kecil.
Format file tidak didukungTipe file tidak dikenali oleh GroupDocs.SearchPastikan ekstensi file termasuk dalam daftar yang didukung (PDF, DOCX, XLSX, dll.).

Pertanyaan yang Sering Diajukan

Q: Bagaimana cara memperbarui indeks yang ada dengan dokumen baru?
A: Panggil index.add("NEW_DOCUMENT_PATH") lagi; pustaka menggabungkan entri baru tanpa membuat ulang seluruh indeks.

Q: Apakah GroupDocs.Search dapat menangani berbagai format file?
A: Ya, ia mendukung PDF, Word, Excel, PowerPoint, teks biasa, dan banyak format umum lainnya.

Q: Apa persyaratan sistem untuk menggunakan GroupDocs.Search?
A: Runtime Java 8+, RAM yang cukup (minimal 2 GB untuk koleksi sedang), serta akses baca/tulis ke folder indeks.

Q: Bagaimana cara mengatasi masalah performa pencarian?
A: Pastikan indeks terbaru, profilkan kueri Anda, dan tinjau pengaturan memori JVM. Mengurangi jumlah bidang yang diindeks juga dapat meningkatkan kecepatan.

Q: Apakah ada cara untuk mencari dengan sinonim atau pencocokan fuzzy?
A: Ya, GroupDocs.Search menyediakan kamus sinonim dan opsi pencarian fuzzy yang dapat diaktifkan melalui kelas SearchOptions.

Kesimpulan

Anda kini memiliki pemahaman yang kuat tentang cara mengindeks dokumen menggunakan GroupDocs.Search untuk Java, cara menambahkan dokumen ke indeks, dan cara menjalankan kueri berbasis teks maupun berbasis objek. Dengan mengintegrasikan teknik ini, aplikasi Java Anda akan memberikan pengalaman pencarian yang cepat dan akurat di seluruh repositori dokumen apa pun.

Siap untuk langkah selanjutnya? Jelajahi pencarian berfaset, penanganan sinonim, atau integrasikan indeks dengan REST API untuk menampilkan kemampuan pencarian ke layanan lain.


Terakhir Diperbarui: 2026-02-06
Diuji Dengan: GroupDocs.Search 25.4 for Java
Penulis: GroupDocs