Buat indeks dokumen java untuk file yang dilindungi kata sandi dengan GroupDocs.Search
Di perusahaan modern, melindungi data sensitif dengan kata sandi sangat penting, tetapi seringkali membuat sulit untuk create document index java untuk pengambilan cepat. Tutorial ini menunjukkan secara tepat cara membangun indeks yang dapat dicari dari file yang dilindungi kata sandi menggunakan GroupDocs.Search untuk Java, sambil menjaga alur kerja Anda tetap aman dan efisien.
Jawaban Cepat
- Apa yang dibahas dalam tutorial ini? Mengindeks dokumen yang dilindungi kata sandi dengan kamus kata sandi dan pendengar acara.
- Pustaka mana yang diperlukan? GroupDocs.Search for Java (versi terbaru).
- Apakah saya memerlukan lisensi? Lisensi percobaan gratis sementara tersedia untuk evaluasi.
- Bisakah saya mengindeks tipe file lain? Ya, GroupDocs.Search mendukung banyak format seperti PDF, DOCX, XLSX, dll.
- Versi Java apa yang dibutuhkan? JDK 8 atau lebih baru.
Apa itu “create document index java”?
Membuat indeks dokumen di Java berarti membangun struktur data yang dapat dicari yang memetakan istilah ke file tempat istilah tersebut muncul. Dengan GroupDocs.Search, proses ini dapat secara otomatis menangani dokumen terenkripsi, sehingga Anda tidak perlu membuka kunci setiap file secara manual.
Mengapa menggunakan GroupDocs.Search untuk file yang dilindungi kata sandi?
- Zero‑touch unlocking – menyediakan kata sandi sekali saja melalui kamus atau penangan acara.
- High performance – mesin pengindeksan yang dioptimalkan yang dapat menangani jutaan dokumen.
- Rich query language – mendukung operator Boolean, wildcard, dan pencarian fuzzy.
- Cross‑format support – bekerja dengan lebih dari 100 tipe file secara langsung.
Prasyarat
- Java Development Kit (JDK) 8+ – terinstal dan dikonfigurasi di PATH Anda.
- IDE – IntelliJ IDEA, Eclipse, atau editor yang kompatibel dengan Java.
- Maven – untuk manajemen dependensi.
- GroupDocs.Search for Java – tambahkan pustaka melalui Maven (lihat di bawah).
Menyiapkan GroupDocs.Search untuk Java
Menggunakan Maven
Add the repository and dependency to your pom.xml file:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Unduhan Langsung
Sebagai alternatif, Anda dapat mengunduh versi terbaru langsung dari GroupDocs.Search for Java releases.
Untuk memulai dengan lisensi percobaan, kunjungi halaman lisensi sementara GroupDocs dan ikuti instruksi untuk mendapatkan percobaan gratis Anda.
Cara membuat document index java menggunakan GroupDocs.Search
Berikut dua pendekatan praktis. Keduanya memungkinkan Anda create document index java sambil menangani kata sandi secara otomatis.
Pendekatan 1 – Pengindeksan Menggunakan Kamus Kata Sandi
Gambaran Umum
Simpan kata sandi dokumen dalam kamus sehingga mesin dapat membuka file secara langsung.
Langkah 1: Tentukan Indeks dan Folder Dokumen
String indexFolder = "YOUR_OUTPUT_DIRECTORY/IndexUsingPasswordDictionary";
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY"; // Path to password‑protected documents
Langkah 2: Buat Indeks
// Initialize the Index object in the specified directory
Index index = new Index(indexFolder);
Langkah 3: Tambahkan Kata Sandi Dokumen
// Add passwords for specific files using their absolute paths
String path1 = new File(documentsFolder + "/English.docx").getAbsolutePath();
index.getDictionaries().getDocumentPasswords().add(path1, "123456");
String path2 = new File(documentsFolder + "/Lorem ipsum.docx").getAbsolutePath();
index.getDictionaries().getDocumentPasswords().add(path2, "123456");
Langkah 4: Indeks Dokumen
// Automatically retrieve passwords from the dictionary during indexing
index.add(documentsFolder);
Langkah 5: Cari di Indeks
String query = "ipsum OR increasing";
SearchResult result = index.search(query);
// Handle search results (e.g., display or process them)
Tip: Jika Anda memiliki banyak file, pertimbangkan memuat kata sandi dari penyimpanan aman (database, Azure Key Vault, dll.) alih-alih menuliskannya secara hard‑code.
Pemecahan Masalah
- Pastikan setiap kata sandi cocok dengan kata sandi perlindungan sebenarnya pada file.
- Periksa kembali jalur file; jalur yang salah memicu
FileNotFoundException.
Pendekatan 2 – Pengindeksan Menggunakan Pendengar Acara untuk Persyaratan Kata Sandi
Gambaran Umum
Berikan kata sandi secara dinamis ketika mesin memicu acara password‑required.
Langkah 1: Tentukan Indeks dan Folder Dokumen
String indexFolder = "YOUR_OUTPUT_DIRECTORY/IndexUsingPasswordEvent";
String documentsFolder = "YOUR_DOCUMENT_DIRECTORY"; // Path to password‑protected documents
Langkah 2: Buat Indeks
// Initialize the Index object in the specified directory
Index index = new Index(indexFolder);
Langkah 3: Langganan ke Acara Password‑Required
index.getEvents().PasswordRequired.add(new EventHandler<PasswordRequiredEventArgs>() {
@Override
public void invoke(Object sender, PasswordRequiredEventArgs args) {
// Provide password for DOCX files when needed
if (args.getDocumentFullPath().endsWith(".docx")) {
args.setPassword("123456");
}
}
});
Langkah 4: Indeks Dokumen
// The event handler will supply passwords as required during indexing
index.add(documentsFolder);
Langkah 5: Cari di Indeks
String query = "ipsum OR increasing";
SearchResult result = index.search(query);
// Handle search results (e.g., display or process them)
Pemecahan Masalah
- Pastikan penangan acara mencakup semua ekstensi file yang perlu Anda indeks.
- Uji dengan beberapa file contoh terlebih dahulu untuk memastikan kata sandi diterapkan.
Aplikasi Praktis
- Enterprise Document Management: Automasi pengindeksan kontrak rahasia, file HR, dan laporan keuangan.
- Legal Archives: Dengan cepat mengambil file kasus sambil tetap mengenkripsi saat disimpan.
- Healthcare Records: Indeks PDF pasien dan dokumen Word tanpa mengekspos PHI.
Pertimbangan Kinerja
- Memory Allocation: Alokasikan memori heap yang cukup (
-Xmx2gatau lebih tinggi) untuk batch besar. - Parallel Indexing: Gunakan
index.addAsync(...)atau jalankan beberapa thread pengindeksan untuk throughput yang lebih cepat. - Index Maintenance: Secara berkala panggil
index.optimize()untuk memadatkan indeks dan meningkatkan kecepatan kueri.
Pertanyaan yang Sering Diajukan
Q: Bagaimana saya menangani format file yang berbeda?
A: GroupDocs.Search mendukung PDF, DOCX, XLSX, PPTX, dan banyak lagi. Instal plugin format yang sesuai jika diperlukan.
Q: Apa yang terjadi jika kata sandi salah?
A: Dokumen akan dilewati, dan peringatan dicatat. Periksa kembali kamus kata sandi atau logika penangan acara Anda.
Q: Bisakah saya mengindeks file yang disimpan di cloud?
A: Ya, tetapi mereka harus diunduh ke folder sementara lokal terlebih dahulu, karena mesin bekerja dengan jalur sistem file.
Q: Bagaimana saya dapat meningkatkan relevansi pencarian?
A: Sesuaikan pengaturan skor melalui IndexOptions, gunakan sinonim, dan manfaatkan sintaks kueri lanjutan (field:term~ untuk pencocokan fuzzy).
Q: Apa yang harus saya lakukan jika pengindeksan gagal untuk beberapa file?
A: Tinjau output log; penyebab umum adalah kata sandi yang hilang, file rusak, atau format yang tidak didukung.
Sumber Daya
- Dokumentasi GroupDocs.Search
- Referensi API
- Unduh GroupDocs.Search
- Repositori GitHub
- Forum Dukungan Gratis
- Informasi Lisensi Sementara
Dengan mengikuti panduan ini, Anda kini tahu cara create document index java untuk file yang dilindungi kata sandi, meningkatkan keamanan dan kemampuan penemuan dalam aplikasi Anda.
Terakhir Diperbarui: 2026-01-06
Diuji Dengan: GroupDocs.Search 25.4 untuk Java
Penulis: GroupDocs