Προσθήκη εγγράφων στο ευρετήριο: Κατάκτηση αναζητήσεων με διάκριση πεζών‑κεφαλαίων σε Java με το GroupDocs

Η ανάκτηση του σωστού κομματιού πληροφορίας από μια τεράστια συλλογή εγγράφων αποτελεί βασική απαίτηση για τις σύγχρονες εφαρμογές. Σε αυτόν τον οδηγό, θα μάθετε πώς να προσθέτετε έγγραφα στο ευρετήριο και να εκτελείτε αναζητήσεις με διάκριση πεζών‑κεφαλαίων χρησιμοποιώντας το GroupDocs.Search για Java. Είτε δημιουργείτε μια αποθήκη νομικών εγγράφων, έναν κατάλογο e‑commerce, είτε ένα σύστημα διαχείρισης περιεχομένου, τα ακριβή αποτελέσματα αναζήτησης κρατούν τους χρήστες ευχαριστημένους και τα δεδομένα σας αξιόπιστα.

Γρήγορες Απαντήσεις

  • Ποιο είναι το βασικό βήμα για να ξεκινήσετε την αναζήτηση; Προσθέστε έγγραφα σε ένα ευρετήριο με index.add(...).
  • Πώς ενεργοποιείται η αναζήτηση με διάκριση πεζών‑κεφαλαίων; Ορίστε options.setUseCaseSensitiveSearch(true).
  • Μπορώ να αναζητήσω σε πολλαπλούς φακέλους; Ναι – καλέστε index.add() για κάθε φάκελο που θέλετε να συμπεριλάβετε.
  • Ποια μέθοδος επιτρέπει την αναζήτηση με αντικείμενα; Χρησιμοποιήστε SearchQuery.createWordQuery(...).
  • Χρειάζομαι άδεια για δοκιμές; Διατίθεται προσωρινή άδεια για δοκιμαστικούς σκοπούς.

Τι σημαίνει «προσθήκη εγγράφων στο ευρετήριο»;

Η προσθήκη εγγράφων σε ένα ευρετήριο σημαίνει την τροφοδοσία των αρχικών αρχείων σας (PDF, Word, απλό κείμενο κ.λπ.) στο GroupDocs.Search ώστε να δημιουργήσει μια δομή δεδομένων αναζητήσιμη. Μόλις γίνει η ευρετηρίαση, η μηχανή μπορεί να εκτελεί γρήγορα ερωτήματα, συμπεριλαμβανομένων και των ερωτημάτων με διάκριση πεζών‑κεφαλαίων.

Γιατί να ενεργοποιήσετε την αναζήτηση με διάκριση πεζών‑κεφαλαίων σε Java;

  • Ακριβής αντιστοίχηση όρων – διαχωρίστε το “Apple” (η εταιρεία) από το “apple” (το φρούτο).
  • Κανονιστική συμμόρφωση – ορισμένες βιομηχανίες απαιτούν ακριβή αντιστοίχηση φράσεων.
  • Βελτιωμένη συνάφεια – οι χρήστες συχνά αναμένουν αποτελέσματα με συγκεκριμένη κεφαλοποίηση σε τεχνικά ή νομικά πλαίσια.

Προαπαιτούμενα

  • JDK (συνιστάται Java 17 ή νεότερη)
  • Maven για διαχείριση εξαρτήσεων
  • Ένα IDE όπως IntelliJ IDEA ή Eclipse
  • Βασική εξοικείωση με τον προγραμματισμό σε Java

Ρύθμιση του GroupDocs.Search για Java

Πρώτα, προσθέστε το αποθετήριο και την εξάρτηση του GroupDocs στο pom.xml σας:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

Εναλλακτικά, μπορείτε να κατεβάσετε την πιο πρόσφατη έκδοση απευθείας από GroupDocs.Search for Java releases.

Άδεια

Για να ξεκινήσετε με μια δοκιμαστική έκδοση, επισκεφθείτε το GroupDocs για να αποκτήσετε μια προσωρινή άδεια. Αυτό θα σας επιτρέψει να δοκιμάσετε όλες τις λειτουργίες χωρίς περιορισμούς.

Πώς να προσθέσετε έγγραφα στο ευρετήριο – Αναζήτηση κειμένου

Βήμα 1: Δημιουργία ευρετηρίου και προσθήκη εγγράφων

Δημιουργήστε έναν φάκελο όπου θα αποθηκευτούν τα αρχεία του ευρετηρίου, στη συνέχεια προσθέστε τον φάκελο πηγής που περιέχει τα έγγραφα που θέλετε να αναζητήσετε.

String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInTextForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index

Συμβουλή: Μπορείτε να καλέσετε index.add() πολλές φορές για αναζήτηση σε πολλαπλούς φακέλους μέσα σε ένα ενιαίο ευρετήριο.

Βήμα 2: Ενεργοποίηση αναζήτησης με διάκριση πεζών‑κεφαλαίων

Ρυθμίστε τις επιλογές αναζήτησης ώστε να λαμβάνουν υπόψη τη διαφορά μεταξύ πεζών και κεφαλαίων.

SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);

Βήμα 3: Εκτέλεση ερωτήματος κειμένου με διάκριση πεζών‑κεφαλαίων

Τρέξτε ένα ερώτημα που διακρίνει το “Advantages” από το “advantages”.

String query = "Advantages";
SearchResult result = index.search(query, options);

// Output results
for (FoundDocument doc : result.getDocuments()) {
    System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}

Ο βρόχος εκτυπώνει τη πλήρη διαδρομή κάθε εγγράφου που περιέχει τον ακριβή όρο με τη σωστή κεφαλοποίηση.

Πώς να προσθέσετε έγγραφα στο ευρετήριο – Αναζήτηση αντικειμένων

Οι ερωτήσεις αντικειμένων προσφέρουν μεγαλύτερη ευελιξία, ειδικά όταν χρειάζεται να συνδυάσετε πολλαπλά κριτήρια.

Βήμα 1: Αρχικοποίηση δεύτερου ευρετηρίου (προαιρετικό)

Αν προτιμάτε να διατηρείτε τις αναζητήσεις με αντικείμενα ξεχωριστά, δημιουργήστε έναν άλλο φάκελο ευρετηρίου.

String indexFolder = YOUR_OUTPUT_DIRECTORY + "/CaseSensitiveSearch/QueryInObjectForm";
Index index = new Index(indexFolder);
index.add(YOUR_DOCUMENT_DIRECTORY); // Add documents to the index

Βήμα 2: Επανάχρηση της επιλογής διάκρισης πεζών‑κεφαλαίων

Η ίδια παρουσία SearchOptions λειτουργεί και για ερωτήσεις αντικειμένων.

SearchOptions options = new SearchOptions();
options.setUseCaseSensitiveSearch(true);

Βήμα 3: Δημιουργία και εκτέλεση ερώτησης αντικειμένου

Δημιουργήστε ένα αντικείμενο ερώτησης λέξης και περάστε το στη μηχανή αναζήτησης.

SearchQuery query = SearchQuery.createWordQuery("Advantages");
SearchResult result = index.search(query, options);

// Output results
for (FoundDocument doc : result.getDocuments()) {
    System.out.println("Document: " + doc.getDocumentInfo().getFilePath());
}

Η χρήση του createWordQuery σας επιτρέπει αργότερα να το συνδυάσετε με φράσεις, μπαλαντέρ ή Boolean ερωτήματα για πιο σύνθετα σενάρια.

Πρακτικές Εφαρμογές

  • Διαχείριση νομικών εγγράφων: Ανάκτηση ειδικών άρθρων όπου η κεφαλοποίηση έχει σημασία.
  • Πλατφόρμες e‑commerce: Διάκριση SKU προϊόντων όπως “PRO‑X” έναντι “pro‑x”.
  • Συστήματα διαχείρισης περιεχομένου (CMS): Διασφάλιση ότι οι συγγραφείς βρίσκουν ακριβείς τίτλους ή ετικέτες.

Σκέψεις για την Απόδοση

  • Διατηρήστε το ευρετήριο ενημερωμένο – επαναευρετηριάστε όταν προστεθούν νέα αρχεία ή αλλάξουν υπάρχοντα.
  • Παρακολουθήστε τη χρήση μνήμης – μεγάλα σύνολα ωφελούνται από την επαναληπτική ευρετηρίαση και τη σωστή ρύθμιση του heap της JVM.
  • Εκμεταλλευτείτε τον garbage collector της Java – απελευθερώστε αντικείμενα Index όταν δεν χρειάζονται πια.

Συχνά Προβλήματα και Λύσεις

ΠρόβλημαΛύση
useCaseSensitiveSearch φαίνεται να αγνοείταιΒεβαιωθείτε ότι χρησιμοποιείτε την πιο πρόσφατη έκδοση του GroupDocs.Search και ότι το ευρετήριο ξαναδημιουργήθηκε μετά την αλλαγή της επιλογής.
Δεν επιστρέχονται αποτελέσματα για γνωστό όροΕλέγξτε ότι η κεφαλοποίηση του όρου ταιριάζει ακριβώς και ότι το έγγραφο προστέθηκε επιτυχώς στο ευρετήριο.
Η αναζήτηση σε πολλούς φακέλους επιβραδύνειΠροσθέστε κάθε φάκελο ξεχωριστά με index.add() και εξετάστε το ενδεχόμενο διαίρεσης του ευρετηρίου σε shards για πολύ μεγάλα σύνολα δεδομένων.

Συχνές Ερωτήσεις

Ε: Πώς διαχειρίζομαι μεγάλα σύνολα δεδομένων με το GroupDocs.Search;
Α: Χρησιμοποιήστε κατατμήσεις ευρετηρίου, ρυθμίστε τις παραμέτρους μνήμης της JVM και περιοδικά συμπιέστε το ευρετήριο για βέλτιστη απόδοση.

Ε: Μπορώ να αναζητήσω σε πολλαπλούς φακέλους ταυτόχρονα;
Α: Ναι – καλέστε index.add() για κάθε φάκελο που θέλετε να συμπεριλάβετε, στη συνέχεια εκτελέστε ένα ενιαίο ερώτημα στο συνδυασμένο ευρετήριο.

Ε: Ποια είναι τα κοινά λάθη κατά τη ρύθμιση αναζητήσεων με διάκριση πεζών‑κεφαλαίων;
Α: Η παράλειψη επαναδημιουργίας του ευρετηρίου μετά την ενεργοποίηση του useCaseSensitiveSearch, ή η χρήση λανθασμένης κεφαλοποίησης στη συμβολοσειρά ερωτήματος.

Ε: Πώς μπορώ να εντοπίσω σφάλματα αναζήτησης;
Α: Ελέγξτε τα αρχεία καταγραφής που δημιουργεί το GroupDocs.Search για stack traces και βεβαιωθείτε ότι όλες οι εξαρτήσεις Maven έχουν επιλυθεί σωστά.

Ε: Είναι το GroupDocs.Search κατάλληλο για εφαρμογές σε πραγματικό χρόνο;
Α: Με τις κατάλληλες στρατηγικές ευρετηρίασης (αυξομολόγητες ενημερώσεις και caching στη μνήμη), μπορεί να παρέχει σχεδόν άμεσες απαντήσεις αναζήτησης.

Πόροι


Τελευταία ενημέρωση: 2026-02-06
Δοκιμασμένο με: GroupDocs.Search 25.4
Συγγραφέας: GroupDocs