Perform Text Search with GroupDocs.Search for Java
Performance Optimization
How to Implement and Optimize a Search Network with GroupDocs.Search for Java
Introduction
Στον σημερινό κόσμο που βασίζεται στα δεδομένα, η δυνατότητα perform text search γρήγορα σε τεράστιες συλλογές εγγράφων αποτελεί ανταγωνιστικό πλεονέκτημα. Είτε δημιουργείτε μια εσωτερική βάση γνώσης, ένα αποθετήριο νομικών υποθέσεων, είτε έναν κατάλογο προϊόντων ηλεκτρονικού εμπορίου, ένα καλά ρυθμισμένο δίκτυο αναζήτησης μπορεί να βελτιώσει δραματικά την ικανοποίηση των χρηστών. Σε αυτόν τον οδηγό θα μάθετε πώς να set up search network, create searchable index, optimize search performance, και ακόμη delete documents index όταν χρειάζεται — όλα χρησιμοποιώντας το GroupDocs.Search για Java.
What You’ll Learn
- Διαμόρφωση δικτύου αναζήτησης με το GroupDocs.Search
- Ανάπτυξη κόμβων εντός του δικτύου
- Αποτελεσματική δημιουργία ευρετηρίου εγγράφων (
index documents java) - Εκτέλεση αναζητήσεων κειμένου σε όλο το δίκτυό σας (
perform text search) - Διαγραφή συγκεκριμένων εγγράφων από το ευρετήριο (
delete documents index)
Ας εμβαθύνουμε στο πώς μπορείτε να αξιοποιήσετε αυτές τις δυνατότητες για να δημιουργήσετε μια βελτιστοποιημένη εμπειρία αναζήτησης.
Quick Answers
- What is the main purpose of GroupDocs.Search for Java? Παρέχει full‑text search σε πολλές μορφές εγγράφων.
- How do I perform text search in a distributed environment? Αναπτύξτε ένα δίκτυο αναζήτησης, δημιουργήστε ευρετήριο εγγράφων σε έναν master node, και στη συνέχεια ερωτήστε οποιονδήποτε κόμβο.
- Can I delete documents from the index without rebuilding it? Ναι, χρησιμοποιήστε το Delete API για να αφαιρέσετε επιλεγμένα αρχεία.
- What Java version is required? JDK 8 ή νεότερο.
- Is a license needed for production? Απαιτείται έγκυρη άδεια GroupDocs.Search· διατίθεται δωρεάν δοκιμή.
What is “perform text search”?
Η εκτέλεση αναζήτησης κειμένου σημαίνει την ερώτηση ενός full‑text index για την ανάκτηση εγγράφων που περιέχουν τις καθορισμένες λέξεις-κλειδιά ή φράσεις. Το GroupDocs.Search δημιουργεί ένα inverted index που καθιστά αυτές τις αναζητήσεις εξαιρετικά γρήγορες, ακόμη και σε χιλιάδες αρχεία.
Why set up a search network?
Ένα δίκτυο αναζήτησης διανέμει τις εργασίες δημιουργίας ευρετηρίου και ερωτήσεων σε πολλούς κόμβους, επιτρέποντάς σας να optimize search performance, να κλιμακώσετε οριζόντια και να διατηρήσετε υψηλή διαθεσιμότητα. Αυτή η αρχιτεκτονική είναι ιδανική για αποθετήρια εγγράφων επιπέδου επιχείρησης όπου η καθυστέρηση και η διαπερατότητα έχουν σημασία.
Prerequisites
- Required Libraries: GroupDocs.Search for Java έκδοση 25.4 (τελευταία).
- Environment: Java JDK 8+, Maven.
- Knowledge: Βασικός προγραμματισμός Java και εξοικείωση με έννοιες δικτύου.
Setting Up GroupDocs.Search for Java
Για να ξεκινήσετε, ενσωματώστε το GroupDocs.Search στο Java έργο σας χρησιμοποιώντας την παρακάτω ρύθμιση:
Maven Setup
Προσθέστε το αποθετήριο και την εξάρτηση στο αρχείο pom.xml σας:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
Direct Download
Εναλλακτικά, μπορείτε να κατεβάσετε την τελευταία έκδοση απευθείας από το GroupDocs.
License Acquisition
Το GroupDocs προσφέρει δωρεάν δοκιμή, που σας επιτρέπει να αξιολογήσετε τις δυνατότητές του πριν από την αγορά. Μπορείτε να αποκτήσετε προσωρινή άδεια ακολουθώντας τα βήματα στη σελίδα αγοράς. Αυτό θα ενεργοποιήσει πλήρη λειτουργικότητα κατά τη φάση δοκιμών.
Basic Initialization and Setup
Αρχικοποιήστε το GroupDocs.Search στην Java εφαρμογή σας με:
import com.groupdocs.search.*;
class SearchNetworkSetup {
public static void main(String[] args) {
Index index = new Index("path/to/index/directory");
// Additional configuration can be set here.
}
}
Implementation Guide
Configuring the Search Network
Overview: Καθορίστε μια βασική διαδρομή και θύρα για το δίκτυο αναζήτησης, επιτρέποντας στους κόμβους να επικοινωνούν αποτελεσματικά.
Step 1: Define Base Configuration
import com.groupdocs.search.options.*;
import com.groupdocs.search.scaling.configuring.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104; // Change if necessary.
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
- Parameters:
basePath: Διαδρομή καταλόγου για λειτουργίες δικτύου.basePort: Αριθμός θύρας που χρησιμοποιείται από το δίκτυο αναζήτησης.
Step 2: Troubleshooting
Βεβαιωθείτε ότι η καθορισμένη θύρα δεν είναι μπλοκαρισμένη από ρυθμίσεις τείχους προστασίας ή χρησιμοποιείται από άλλη εφαρμογή. Προσαρμόστε την ανάλογα για να αποφύγετε συγκρούσεις.
Deploying Search Network Nodes
Overview: Χρησιμοποιώντας τη διαμόρφωσή σας, αναπτύξτε κόμβους στο δίκτυό σας για κατανεμημένη δημιουργία ευρετηρίου και αναζήτηση.
import com.groupdocs.search.scaling.*;
String basePath = "YOUR_DOCUMENT_DIRECTORY/output/AdvancedUsage/Scaling/DeletingDocuments/";
int basePort = 49104;
Configuration configuration = ConfiguringSearchNetwork.configure(basePath, basePort);
SearchNetworkNode[] nodes = SearchNetworkDeployment.deploy(basePath, basePort, configuration);
// Nodes are now deployed and ready for further operations.
- Key Configuration Options:
- Base Path & Port: Αυτές οι τιμές πρέπει να ταιριάζουν με αυτές που χρησιμοποιήθηκαν στην αρχική διαμόρφωση για διασφάλιση συνέπειας.
Indexing Documents (create searchable index)
Overview: Προσθέστε έγγραφα στο ευρετήριο αναζήτησης αποδοτικά χρησιμοποιώντας έναν master node.
import com.groupdocs.search.scaling.*;
String documentsPath = "YOUR_DOCUMENT_DIRECTORY/path/to/documents";
SearchNetworkNode masterNode = nodes[0];
IndexingDocuments.addDirectories(masterNode, documentsPath);
- Purpose:
masterNode: Ο κύριος κόμβος που διαχειρίζεται τη δημιουργία ευρετηρίου εγγράφων.documentsPath: Διαδρομή προς τον κατάλογο που περιέχει τα έγγραφα.
Troubleshooting Tips
Επαληθεύστε ότι οι διαδρομές των εγγράφων είναι σωστές και προσβάσιμες. Βεβαιωθείτε ότι τα δικαιώματα επιτρέπουν ανάγνωση από αυτούς τους καταλόγους.
Searching Text in Network (perform text search)
Overview: Εκτελέστε ολοκληρωμένες αναζητήσεις κειμένου σε όλο το ευρετηριασμένο δίκτυό σας.
import com.groupdocs.search.scaling.*;
String query = "nulla";
SearchNetworkNode masterNode = nodes[0];
TextSearchInNetwork.searchAll(masterNode, query, false);
- Parameters:
query: Το κείμενο που αναζητάτε.masterNode: Κόμβος που εκτελεί την αναζήτηση.
Deleting Documents from Index (delete documents index)
Overview: Αφαιρέστε συγκεκριμένα έγγραφα από το ευρετήριο χρησιμοποιώντας τις διαδρομές αρχείων τους.
import com.groupdocs.search.scaling.*;
SearchNetworkNode node = nodes[0];
String[] filePaths = {
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.pdf",
"YOUR_DOCUMENT_DIRECTORY/Lorem ipsum.docx"
};
deleteDocuments(node, filePaths);
void deleteDocuments(SearchNetworkNode node, String... filePaths) {
Indexer indexer = node.getIndexer();
DeleteOptions options = new DeleteOptions();
indexer.delete(filePaths, options);
}
- Method Purpose:
node: Ο στόχος κόμβος για τις λειτουργίες διαγραφής.filePaths: Διαδρομές εγγράφων που θα αφαιρεθούν από το ευρετήριο.
Troubleshooting
Βεβαιωθείτε ότι οι διαδρομές αρχείων είναι ακριβείς και ότι τα αρχεία υπάρχουν στον κατάλογό σας. Εάν τα προβλήματα παραμένουν, ελέγξτε τα δικαιώματα δικτύου και τη συνδεσιμότητα.
Practical Applications
- Enterprise Document Management: Βελτιστοποίηση της εσωτερικής ανάκτησης γνώσης.
- Legal Case Analysis: Γρήγορη εντόπιση σχετικών αρχείων υποθέσεων σε πολλαπλά αποθετήρια.
- E‑commerce Platforms: Ενίσχυση της ταχύτητας αναζήτησης προϊόντων μέσω ευρετηρίου περιγραφών και κριτικών.
- Academic Research: Αποτελεσματική αναζήτηση μεγάλων ψηφιακών βιβλιοθηκών ερευνητικών εργασιών και διπλωματικών.
- Customer Support Systems: Μείωση του χρόνου απόκρισης επιτρέποντας στους πράκτορες να αναζητούν άμεσα παλαιότερα αιτήματα.
Performance Considerations
- Optimize Indexing Speed: Προσθέστε σταδιακά νέα έγγραφα κατά τις ώρες χαμηλής κίνησης για να διατηρήσετε τη λανθάνουσα χαμηλή.
- Resource Usage Guidelines: Παρακολουθήστε την CPU και τη μνήμη, ειδικά όταν κλιμακώνετε τον αριθμό των κόμβων.
- Java Memory Management: Ρυθμίστε τις ρυθμίσεις heap του JVM ανάλογα με το φορτίο εργασίας (π.χ.,
-Xmx2gγια ευρετήρια μεσαίου μεγέθους).
Conclusion
Ακολουθώντας αυτόν τον οδηγό, έχετε μάθει πώς να set up search network, create searchable index, perform text search, και delete documents index χρησιμοποιώντας το GroupDocs.Search για Java. Αυτές οι δυνατότητες επιτρέπουν γρήγορη, αξιόπιστη ανάκτηση εγγράφων σε κατανεμημένα περιβάλλοντα.
Next Steps
- Δοκιμάστε διαφορετικές διαμορφώσεις κόμβων για να βρείτε την βέλτιστη ισορροπία για το φορτίο εργασίας σας.
- Βυθιστείτε περισσότερο σε προχωρημένες επιλογές ευρετηρίου όπως προσαρμοσμένοι αναλυτές και ρύθμιση σχετικότητας.
- Εξερευνήστε την ενσωμάτωση με άλλα προϊόντα του GroupDocs για ολοκληρωμένη επεξεργασία εγγράφων.
Frequently Asked Questions
Q: Ποια είναι η κύρια περίπτωση χρήσης του GroupDocs.Search για Java;
A: Παρέχει full‑text search σε πολλές μορφές εγγράφων, επιτρέποντάς σας να perform text search σε μεγάλες αποθήκες.
Q: Πώς μπορώ να βελτιώσω την ταχύτητα αναζήτησης σε ένα μεγάλο δίκτυο;
A: Αναπτύξτε επιπλέον κόμβους, ρυθμίστε το heap του JVM, και προγραμματίστε τη δημιουργία ευρετηρίου κατά τις περιόδους χαμηλής κίνησης για να optimize search performance.
Q: Είναι δυνατόν να διαγράψετε ένα μόνο έγγραφο χωρίς να επαναδημιουργήσετε το ευρετήριο ολόκληρης της συλλογής;
A: Ναι, χρησιμοποιήστε το API delete documents index όπως φαίνεται στο παράδειγμα κώδικα για να αφαιρέσετε συγκεκριμένα αρχεία.
Q: Χρειάζομαι άδεια για ανάπτυξη;
A: Μια άδεια δωρεάν δοκιμής είναι επαρκής για δοκιμές· απαιτείται εμπορική άδεια για παραγωγικές εγκαταστάσεις.
Q: Μπορώ να ευρετηριάσω PDFs, αρχεία Word και email μαζί;
A: Απόλυτα—το GroupDocs.Search υποστηρίζει ευρεία γκάμα μορφών έτοιμη για χρήση.
Τελευταία Ενημέρωση: 2026-01-16
Δοκιμή Με: GroupDocs.Search for Java 25.4
Συγγραφέας: GroupDocs