इंडेक्स में दस्तावेज़ जोड़ें और जावा में GroupDocs.Search का उपयोग करके मर्ज करें
आज के तेज़-तर्रार डिजिटल माहौल में, how to add documents to index सीखना किसी भी document management java समाधान के लिए आवश्यक है। चाहे आप अनुबंध, चालान, या आंतरिक रिपोर्ट संभाल रहे हों, एक सुव्यवस्थित इंडेक्स आपको मिलीसेकंड में जानकारी पुनः प्राप्त करने की सुविधा देता है। यह ट्यूटोरियल आपको इंडेक्स बनाने, दस्तावेज़ जोड़ने, मर्ज विकल्प कॉन्फ़िगर करने, और आवश्यकता पड़ने पर cancel merge operation को रद्द करने तक ले जाता है—सभी GroupDocs.Search for Java के साथ।
त्वरित उत्तर
- What does “add documents to index” mean? यह GroupDocs.Search को एक फ़ोल्डर स्कैन करने और प्रत्येक फ़ाइल के लिए खोज योग्य मेटाडेटा संग्रहीत करने के लिए बताता है।
- Can I stop a long merge? हाँ—
Cancellationऑब्जेक्ट का उपयोग करके cancel merge operation को टाइमआउट के बाद रद्द किया जा सकता है। - Do I need a license? परीक्षण के लिए एक फ्री ट्रायल या टेम्पररी लाइसेंस काम करता है; एक कमर्शियल लाइसेंस सभी फीचर अनलॉक करता है।
- Which Java version is required? JDK 8 या उससे नया।
- Is this suitable for large datasets? बिल्कुल—सिर्फ मेमोरी मॉनिटर करें और इन्क्रीमेंटल इंडेक्सिंग का उपयोग करें।
GroupDocs.Search में “add documents to index” क्या है?
इंडेक्स में दस्तावेज़ जोड़ना का मतलब है फ़ाइलों के संग्रह को GroupDocs.Search में फीड करना ताकि लाइब्रेरी उनकी सामग्री का विश्लेषण कर सके, टोकन निकाल सके, और एक खोज योग्य डेटा संरचना बना सके। एक बार इंडेक्स बन जाने पर, आप सभी दस्तावेज़ों में तेज़ फुल‑टेक्स्ट सर्च कर सकते हैं।
document management java के लिए GroupDocs.Search क्यों उपयोग करें?
- Scalable indexing – हजारों फ़ाइलों को बिना प्रदर्शन घटाए संभालता है।
- Rich API – इंडेक्सिंग, मर्जिंग, और कैंसलेशन पर फाइन‑ग्रेन कंट्रोल प्रदान करता है।
- Cross‑format support – PDFs, Word, Excel, और कई अन्य फ़ॉर्मेट्स के साथ बॉक्स से बाहर काम करता है।
पूर्वापेक्षाएँ
- GroupDocs.Search for Java version 25.4 या बाद का।
- Maven (या मैन्युअल JAR डाउनलोड)।
- बेसिक जावा नॉलेज और JDK 8+ एनवायरनमेंट।
GroupDocs.Search for Java सेटअप करना
Maven इंस्टॉलेशन
यदि आप Maven के साथ डिपेंडेंसीज़ मैनेज करते हैं, तो अपने pom.xml में रिपॉजिटरी और डिपेंडेंसी जोड़ें:
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/search/java/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>25.4</version>
</dependency>
</dependencies>
डायरेक्ट डाउनलोड
वैकल्पिक रूप से, आधिकारिक साइट से नवीनतम JAR डाउनलोड करें: GroupDocs.Search for Java releases.
लाइसेंस प्राप्ति
- Free Trial: GroupDocs वेबसाइट पर साइन अप करके ट्रायल लाइसेंस प्राप्त करें।
- Temporary License: यदि आपको विस्तारित मूल्यांकन चाहिए तो टेम्पररी की के लिए अप्लाई करें।
- Commercial License: प्रोडक्शन उपयोग के लिए खरीदें।
लाइसेंस फ़ाइल मिलने के बाद, उसे अपने प्रोजेक्ट में रखें और लाइब्रेरी को बाद में दिखाए गए अनुसार इनिशियलाइज़ करें।
इम्प्लीमेंटेशन गाइड
कैसे दस्तावेज़ को इंडेक्स में जोड़ें – पहला इंडेक्स बनाना
पहले, एक खाली इंडेक्स बनाएं जो आपके खोज योग्य डेटा को रखेगा।
import com.groupdocs.search.Index;
// Create an instance of the index at the specified path
Index index1 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index1");
- Why: यह स्टेप एक स्टोरेज कंटेनर सेट करता है जहाँ इंडेक्स्ड टोकन सेव होंगे।
इंडेक्स में दस्तावेज़ जोड़ना
अब GroupDocs.Search को बताएं कि वह एक फ़ोल्डर स्कैन करे और add documents to index करे।
index1.add("YOUR_DOCUMENT_DIRECTORY"); // Add documents from this directory
- Why: लाइब्रेरी प्रत्येक फ़ाइल पढ़ती है, टेक्स्ट निकालती है, और उसे
index1में स्टोर करती है।
लचीले वर्कफ़्लो के लिए दूसरा इंडेक्स बनाना
कभी-कभी आपको अलग-अलग इंडेक्स की जरूरत होती है—उदाहरण के लिए, क्लाइंट के डेटा को अलग रखने के लिए।
Index index2 = new Index("YOUR_DOCUMENT_DIRECTORY\\\\Index2");
index2.add("YOUR_DOCUMENT_DIRECTORY");
- Why: कई इंडेक्स आपको अलग-अलग दस्तावेज़ सेट मैनेज करने और बाद में उन्हें कॉम्बाइन करने की सुविधा देते हैं।
मर्ज विकल्प कॉन्फ़िगर करना और cancel merge operation को रद्द करना
मर्ज करने से पहले, आप प्रोसेस को फाइन‑ट्यून कर सकते हैं और यदि यह बहुत लंबा चलता है तो इसे रोक भी सकते हैं।
import com.groupdocs.search.options.MergeOptions;
import com.groupdocs.search.options.Cancellation;
MergeOptions options = new MergeOptions();
options.setCancellation(new Cancellation()); // Initialize cancellation object
options.getCancellation().cancelAfter(5000); // Cancel merge operation after 5 seconds
- Why:
Cancellationआपको स्वचालित रूप से cancel merge operation करने का कंट्रोल देता है, जिससे अनियंत्रित टास्क नहीं चलेंगे।
इंडेक्स को मर्ज करना
अंत में, सेकेंडरी इंडेक्स को प्राइमरी में मर्ज करें।
index1.merge(index2, options);
- Why: इस कॉल के बाद,
index1में दोनों स्रोतों के सभी दस्तावेज़ होते हैं, जिससे आपको एकीकृत सर्च अनुभव मिलता है।
Document Management Java के व्यावहारिक उपयोग
- Legal firms: कई ऑफिसों से केस फ़ाइलें कंसॉलिडेट करें।
- Financial institutions: क्वार्टरली रिपोर्ट्स को एक सिंगल सर्चेबल रिपॉजिटरी में मर्ज करें।
- Enterprises: एचआर, कंप्लायंस, और पॉलिसी दस्तावेज़ों को एंटरप्राइज़‑वाइड सर्च के लिए कॉम्बाइन करें।
प्रदर्शन संबंधी विचार
- Incremental indexing: पूरे इंडेक्स को रीबिल्ड करने के बजाय समय-समय पर नई फ़ाइलें जोड़ें।
- Memory monitoring: बड़े बैच RAM खा सकते हैं; छोटे चंक्स में प्रोसेस करने पर विचार करें।
- Garbage collection: अनयूज़्ड
Indexऑब्जेक्ट्स को तुरंत रिलीज़ करें ताकि रिसोर्स फ्री हो सके।
सामान्य समस्याएँ और समाधान
| समस्या | समाधान |
|---|---|
| Incorrect folder path | एब्सोल्यूट पाथ को वेरिफ़ाई करें और सुनिश्चित करें कि एप्लिकेशन के पास रीड परमिशन है। |
| Insufficient memory | JVM हीप (-Xmx) बढ़ाएँ या फ़ाइलों को बैच में इंडेक्स करें। |
| Cancellation not triggered | merge कॉल करने से पहले cancelAfter सेट है यह सुनिश्चित करें। |
| Unsupported file format | यदि आवश्यक हो तो GroupDocs से अतिरिक्त फ़ॉर्मेट प्लगइन्स इंस्टॉल करें। |
अक्सर पूछे जाने वाले प्रश्न
Q: Why would I create multiple indexes instead of a single one?
A: अलग-अलग इंडेक्स आपको डेटा डोमेन्स को अलग करने, विभिन्न सुरक्षा नीतियों को लागू करने, और आवश्यकता पड़ने पर ही मर्ज करने की सुविधा देते हैं, जिससे प्रदर्शन और संगठन में सुधार होता है।
Q: Can I cancel an indexing operation the same way I cancel a merge?
A: हाँ—Cancellation ऑब्जेक्ट को add मेथड के साथ उपयोग करके लंबी‑चलती इंडेक्सिंग टास्क को रोक सकते हैं।
Q: How do I ensure optimal performance with very large document collections?
A: इन्क्रीमेंटल इंडेक्सिंग करें, JVM मेमोरी मॉनिटर करें, और इंडेक्स डायरेक्टरी के लिए SSD स्टोरेज उपयोग करने पर विचार करें।
Q: What should I do if I receive “Access denied” errors?
A: जावा प्रोसेस चलाने वाले यूज़र की फ़ोल्डर परमिशन चेक करें और लाइसेंस फ़ाइल रीडेबल है यह सुनिश्चित करें।
Q: Is GroupDocs.Search compatible with other GroupDocs libraries?
A: बिल्कुल—आप इसे GroupDocs.Viewer, GroupDocs.Conversion आदि के साथ इंटीग्रेट कर सकते हैं एक फुल‑स्टैक डॉक्यूमेंट सॉल्यूशन के लिए।
निष्कर्ष
इस गाइड को फॉलो करके अब आप जानते हैं कि कैसे add documents to index किया जाता है, मर्ज व्यवहार को कॉन्फ़िगर किया जाता है, और आवश्यकता पड़ने पर सुरक्षित रूप से cancel merge operation किया जाता है—सभी एक मजबूत document management java वर्कफ़्लो के भीतर। बड़े डेटा सेट के साथ प्रयोग करें, कस्टम टोकनाइज़र एक्सप्लोर करें, या GroupDocs.Search को अन्य GroupDocs प्रोडक्ट्स के साथ मिलाकर एक वास्तविक एंटरप्राइज़‑ग्रेड सॉल्यूशन बनाएं।
संसाधन
- डॉक्यूमेंटेशन: GroupDocs.Search Java Docs
- API रेफ़रेंस: GroupDocs API Reference
- डाउनलोड: Latest Releases
- GitHub रिपॉजिटरी: GroupDocs Search for Java
- फ़्री सपोर्ट फ़ोरम: GroupDocs Forum
- टेम्पररी लाइसेंस एप्लिकेशन: GroupDocs Temporary License
अंतिम अपडेट: 2026-01-03
परीक्षित संस्करण: GroupDocs.Search 25.4 for Java
लेखक: GroupDocs