Cara Mencari Dokumen Java dengan GroupDocs.Search
Di era digital, kemampuan untuk search documents java dengan cepat sangat penting bagi bisnis dan pengembang. Baik Anda mencari melalui kontrak hukum maupun makalah akadem membimbing Anda menggunakan GroupDocs.Search Java—sebuah perpustakaan kuat yang dirancang khusus untuk operasi pencarian di berbagai format dokumen.
Jawaban Cepat
- Library apa yang membantu search documents java? GroupDocs.Search for Java.
- Bisakah saya menyorot search terms java dalam hasil?erlukan lisensi? Versi percobaan gratis tersedia; lisensi penuh diperlukan untuk produksi.
- IDE mana yang paling cocok? IDE Java apa pun seperti IntelliJ IDEA, Eclipse, atau VS Code.
- Apakah Maven didukung? Tentu – tambahkan repositori dan dependensi ke
pom.xmlAnda.
Apa itu GroupDocs.Search untuk Java?
GroupDocs.Search adalah Java SDK yang mengindeks dan mencari teks di banyak jenis dokumen (PDF, DOCX, XLSX, dll.). Ia menyediakan fitur lanjutan seperti pencocokan fuzzy, pencarian frasa, dan penyorotan hasil, menjadikannya ideal untuk membangun repositori dokumen yang dapat dicari.
Mengapa Menggunakan Search Documents Java dengan GroupDocs.Search?
- Speed: Pencarian terindeks mengembalikan hasil dalam milidetik, bahkan untuk koleksi besar.
- Flexibility: Mendukung pencarian fuzzy, operator Boolean, dan kueri frasa.
- Highlighting: Anda dapat highlight search terms java langsung dalam pratinjau HTML yang dihasilkan.
- Scalability: Bekerja dengan on‑premises, cloud, atau solusi penyimpanan hybrid.
Prasyarat
- Java Development Kit (JDK) 8 atau lebih tinggi terpasang.
- Maven (atau manajemen dependensi manual).
- Sebuah IDE seperti IntelliJ IDEA, Eclipse, atau VS Code.
- Pengetahuan dasar tentang Java dan struktur proyek Maven.
Menyiapkan GroupDocs.Search untuk Java
Instalasi via Maven
Tambahkan repositori GroupDocs dan dependensi ke pom.xml Anda:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Unduh Langsung
Jika Anda lebih memilih tidak menggunakan Maven, unduh JAR terbaru dari halaman rilis resmi: GroupDocs.Search for Java releases.
Langkah-langkah Akuisisi Lisensi
- Free Trial: Mulai dengan percobaan gratis untuk menjelajahi fitur.
- Temporary License: Dapatkan melalui GroupDocs’ official site.
- Purchase: Untuk penggunaan produksi tak terbatas, beli lisensi penuh.
Inisialisasi dan Penyiapan Dasar
Buat folder indeks dan buat instance objek Index:
String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
Cara Mencari Dokumen Java – Fitur 1: Mengekstrak Informasi Hasil Pencarian
Gambaran Umum
Mengekstrak informasi detail (istilah, frasa, jumlah kemunculan) membantu Anda membangun dasbor analitik atau menghasilkan laporan tentang konten kumpulan dokumen Anda.
Implementasi Langkah‑per‑Langkah
Langkah 1: Buat Indeks
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation";
Index index = new Index(indexFolder);
index.add(documentFolder);
Langkah 2: Konfigurasikan Opsi Pencarian (Aktifkan pencarian fuzzy)
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));
Langkah 3: Jalankan Pencarian
String query = "favourable OR \"ipsum dolor\"";
SearchResult result = index.search(query, options);
Langkah 4: Ekstrak Kemunculan
for (int i = 0; i < result.getDocumentCount(); i++) {
FoundDocument document = result.getFoundDocument(i);
for (FoundDocumentField field : document.getFoundFields()) {
if (field.getTerms() != null) {
for (String term : field.getTerms()) {
int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)];
System.out.println("Term: " + term + ", Occurrences: " + occurrences);
}
}
if (field.getTermSequences() != null) {
for (String[] terms : field.getTermSequences()) {
int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)];
StringBuilder sequence = new StringBuilder();
for (String term : terms) {
sequence.append(term).append(" ");
}
System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences);
}
}
}
}
Fitur 2: Menyorot Search Terms Java dalam Dokumen
Gambaran Umum
Membuat file HTML dengan highlight search terms java memungkinkan pengguna akhir melihat secara langsung di mana kecocokan muncul, meningkatkan kecepatan tinjauan dan kolaborasi.
Implementasi Langkah‑per‑Langkah
Langkah 1: Siapkan Indeks dengan Kompresi Tinggi
String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults";
IndexSettings settings = new IndexSettings();
settings.setTextStorageSettings(new TextStorageSettings(Compression.High));
Index index = new Index(indexFolder, settings);
index.add(documentFolder);
Langkah 2: Lakukan Pencarian dan Sorot Hasil
SearchResult result = index.search("solicitude");
if (result.getDocumentCount() > 0) {
FoundDocument document = result.getFoundDocument(0);
String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html";
OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path);
Highlighter highlighter = new DocumentHighlighter(outputAdapter);
index.highlight(document, highlighter);
}
Aplikasi Praktis
- Legal Document Review – Cepat temukan klausa di ratusan kontrak.
- Academic Research – Ekstrak frasa kunci dari makalah penelitian untuk tinjauan literatur.
- Customer Support – Identifikasi masalah berulang dalam arsip email.
- Content Management – Sorot kata kunci dalam artikel dan blog untuk audit SEO.
Pertimbangan Kinerja
- Compression: Kompresi tinggi mengurangi penyimpanan tetapi dapat meningkatkan penggunaan CPU; uji untuk beban kerja Anda.
- Memory Management: Indeks dokumen dalam batch untuk menjaga jejak memori tetap rendah.
- Index Refresh: Lakukan re‑indeks file yang berubah secara teratur untuk menjaga keakuratan hasil pencarian.
Kesimpulan
Dalam panduan ini kami menunjukkan cara search documents java menggunakan GroupDocs.Search, mengekstrak informasi hasil detail, dan highlight search terms java dalam pratinjau HTML. Kemampuan ini memungkinkan Anda membangun pengalaman pencarian yang cepat dan ramah pengguna untuk repositori dokumen apa pun.
Langkah Selanjutnya
- Integrasikan HTML yang disorot ke dalam UI web Anda.
- Bereksperimen dengan
SearchOptionstambahan sepertiSynonymSearchatauWildcardSearch. - Jelajahi referensi API GroupDocs.Search untuk skenario lanjutan seperti penilaian khusus.
Pertanyaan yang Sering Diajukan
Q: Apa itu GroupDocs.Search?
A: Java SDK yang mengindeks dan mencari teks di banyak format dokumen, menawarkan fitur seperti pencarian fuzzy dan penyorotan hasil.
Q: Bagaimana cara kerja pencarian fuzzy?
A: Ia memungkinkan kecocokan perkiraan dengan menoleransi sejumlah perbedaan karakter yang dapat dikonfigurasi, berguna untuk menangani kesalahan ketik.
Q: Bisakah saya menggunakan GroupDocs.Search tanpa lisensi?
A: Ya, percobaan gratis tersedia, tetapi lisensi penuh diperlukan untuk penerapan produksi.
Q: Format file apa yang didukung?
A: PDF, DOCX, XLSX, PPTX, TXT, dan banyak lagi—periksa dokumen resmi untuk daftar lengkapnya.
Q: Bagaimana cara menampilkan hasil yang disorot dalam aplikasi web?
A: Sajikan file HTML yang dihasilkan (mis., Highlighted.html) secara langsung atau sematkan kontennya ke halaman web menggunakan <iframe> atau rendering:** 2026-02Penulis:** GroupDocs