जावा में GroupDocs.Search का उपयोग करके मेटाडाटा इंडेक्सिंग के साथ दस्तावेज़ों को इंडेक्स में जोड़ना

आधुनिक अनुप्रयोगों में, इंडेक्स में दस्तावेज़ जोड़ना तेज़ और विश्वसनीय होना तेज़ खोज अनुभव प्रदान करने के लिए आवश्यक है। चाहे आप एक कानूनी रिपॉज़िटरी, ग्राहक‑समर्थन ज्ञान आधार, या एक आंतरिक दस्तावेज़ पोर्टल बना रहे हों, मेटाडाटा का उपयोग करके आप मेटाडाटा द्वारा दस्तावेज़ खोज सकते हैं जैसे लेखक, शीर्षक, या कस्टम टैग। यह गाइड आपको पूरी प्रक्रिया से ले जाता है—इंडेक्स सेटिंग्स को कॉन्फ़िगर करना, मेटाडाटा‑केन्द्रित इंडेक्स बनाना, अपनी फ़ाइलें जोड़ना, और शक्तिशाली खोज चलाना—सभी GroupDocs.Search for Java के साथ।

त्वरित उत्तर

  • मेटाडाटा इंडेक्सिंग का मुख्य उद्देश्य क्या है? यह पूर्ण‑पाठ सामग्री के बजाय दस्तावेज़ गुणों के आधार पर तेज़ खोज सक्षम करता है।
  • इंडेक्स में फ़ाइलें जोड़ने वाली विधि कौन सी है? index.add(YOUR_DOCUMENTS_FOLDER);
  • क्या मैं कस्टम मेटाडाटा फ़ील्ड्स द्वारा खोज सकता हूँ? हाँ, एक बार फ़ील्ड्स इंडेक्स हो जाने पर आप उन्हें सीधे क्वेरी कर सकते हैं।
  • क्या विकास के लिए लाइसेंस की आवश्यकता है? मूल्यांकन के लिए एक अस्थायी ट्रायल लाइसेंस पर्याप्त है; उत्पादन के लिए पूर्ण लाइसेंस आवश्यक है।
  • कौन सा जावा संस्करण आवश्यक है? JDK 8 या उससे ऊपर की सिफ़ारिश की जाती है।

GroupDocs.Search में मेटाडाटा इंडेक्सिंग क्या है?

मेटाडाटा इंडेक्सिंग दस्तावेज़ गुणों (जैसे लेखक, निर्माण तिथि, कस्टम टैग) को निकालता और एक खोज योग्य संरचना में संग्रहीत करता है। जब आप इंडेक्स में दस्तावेज़ जोड़ते हैं, तो इंजन इन गुणों को रिकॉर्ड करता है, जिससे आप “John Doe द्वारा लिखित सभी PDF खोजें” जैसी सटीक क्वेरी चला सकते हैं।

मेटाडाटा इंडेक्सिंग के लिए GroupDocs.Search क्यों उपयोग करें?

  • प्रदर्शन: मेटाडाटा खोज हल्की होती है और मिलीसेकंड में परिणाम देती है।
  • लचीलापन: विभिन्न फ़ाइल स्वरूपों (PDF, DOCX, PPT, आदि) को समर्थन देता है।
  • स्केलेबिलिटी: न्यूनतम मेमोरी उपयोग के साथ लाखों दस्तावेज़ों को संभालता है।

Prerequisites

  • GroupDocs.Search for Java ≥ 25.4।
  • JDK 8 या उससे नया स्थापित और कॉन्फ़िगर किया हुआ।
  • Java और Maven की बुनियादी परिचितता।

GroupDocs.Search for Java सेटअप करना

इंस्टॉलेशन निर्देश

अपने pom.xml में GroupDocs रिपॉज़िटरी और डिपेंडेंसी जोड़ें:

<repositories>
    <repository>
        <id>repository.groupdocs.com</id>
        <name>GroupDocs Repository</name>
        <url>https://releases.groupdocs.com/search/java/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-search</artifactId>
        <version>25.4</version>
    </dependency>
</dependencies>

आप नवीनतम बाइनरी सीधे GroupDocs.Search for Java releases से भी डाउनलोड कर सकते हैं।

लाइसेंस प्राप्त करना

परीक्षण के लिए अस्थायी लाइसेंस प्राप्त करने के लिए:

  1. GroupDocs वेबसाइट पर जाएँ और Purchase सेक्शन पर जाएँ।
  2. अपने मूल्यांकन आवश्यकताओं के अनुसार एक temporary license योजना चुनें।

चरण‑दर‑चरण कार्यान्वयन

फीचर 1: इंडेक्स सेटिंग्स कॉन्फ़िगरेशन

इंडेक्स को मेटाडाटा पर केंद्रित करने के लिए कॉन्फ़िगर करें:

import com.groupdocs.search.IndexSettings;
import com.groupdocs.search.IndexType;

// Initialize index settings
IndexSettings settings = new IndexSettings();
settings.setIndexType(IndexType.MetadataIndex);  // Focus on metadata indexing
  • setIndexType(IndexType.MetadataIndex) इंजन को पूर्ण‑पाठ सामग्री की तुलना में मेटाडाटा को प्राथमिकता देने के लिए बताता है।

फीचर 2: निर्दिष्ट फ़ोल्डर में इंडेक्स बनाना

एक भौतिक इंडेक्स डायरेक्टरी बनाएं जहाँ सभी मेटाडाटा संग्रहीत होंगे:

import com.groupdocs.search.Index;

String YOUR_INDEX_DIRECTORY = "YOUR_DOCUMENT_DIRECTORY\\\\output\\\\AdvancedUsage\\\\Indexing\\\\IndexingMetadataOfDocuments";

// Create index in specified directory using settings
Index index = new Index(YOUR_INDEX_DIRECTORY, settings);

अपने प्रोजेक्ट लेआउट से मेल खाने वाले पथ के साथ YOUR_DOCUMENT_DIRECTORY को बदलें।

फीचर 3: इंडेक्स में दस्तावेज़ कैसे जोड़ें

अब जब इंडेक्स मौजूद है, आप इंडेक्स में दस्तावेज़ जोड़ सकते हैं ताकि वे खोज योग्य बन जाएँ:

String YOUR_DOCUMENTS_FOLDER = "YOUR_DOCUMENT_DIRECTORY";

// Add all documents in directory to the index
index.add(YOUR_DOCUMENTS_FOLDER);

टिप्स:

  • सुनिश्चित करें कि फ़ोल्डर पथ सही है और एप्लिकेशन के पास पढ़ने की अनुमति है।
  • GroupDocs.Search प्रत्येक फ़ाइल से समर्थित मेटाडाटा को स्वचालित रूप से निकालता है।

फीचर 4: मेटाडाटा द्वारा दस्तावेज़ खोज

एक क्वेरी चलाएँ जो मेटाडाटा फ़ील्ड्स को लक्षित करती है, उदाहरण के लिए उन दस्तावेज़ों को खोजें जहाँ भाषा अंग्रेज़ी है:

import com.groupdocs.search.results.SearchResult;

String query = "English";  // Define search query
SearchResult result = index.search(query);  // Perform the search

// Process results (example)
for (int i = 0; i < result.getDocumentCount(); i++) {
    System.out.println("Found document: " + result.getFoundDocument(i).getFilePath());
}
  • search(query) इंडेक्स किए गए मेटाडाटा को देखता है और मिलते‑जुलते दस्तावेज़ लौटाता है।

व्यावहारिक अनुप्रयोग

  1. एंटरप्राइज़ दस्तावेज़ प्रबंधन: अनुबंध तिथि या हस्ताक्षरकर्ता नाम के द्वारा अनुबंध प्राप्त करें।
  2. डिजिटल लाइब्रेरी कैटलॉग: उपयोगकर्ताओं को शैली, प्रकाशन वर्ष, या लेखक के अनुसार पुस्तकें ब्राउज़ करने दें।
  3. CRM सिस्टम: कस्टम मेटाडाटा जैसे ग्राहक आईडी या क्षेत्र का उपयोग करके क्लाइंट फ़ाइलें जल्दी से खोजें।

प्रदर्शन संबंधी विचार

  • इन्क्रिमेंटल अपडेट्स: पूरे इंडेक्स को पुनः बनाना न करके नई या बदली फ़ाइलों के लिए index.addOrUpdate() का उपयोग करें।
  • मेमोरी ट्यूनिंग: इंडेक्स किए गए मेटाडाटा की मात्रा के आधार पर JVM हीप साइज (-Xmx) को समायोजित करें।
  • ऑप्टिमाइज़्ड स्टोरेज: इंडेक्स को कॉम्पैक्ट करने और क्वेरी गति सुधारने के लिए समय‑समय पर index.optimize() को कॉल करें।

सामान्य समस्याएँ और समाधान

समस्यासमाधान
कोई परिणाम नहीं मिलापुष्टि करें कि अपेक्षित मेटाडाटा फ़ील्ड्स वास्तव में स्रोत फ़ाइलों में मौजूद हैं।
अनुमति त्रुटियाँसुनिश्चित करें कि Java प्रक्रिया के पास दस्तावेज़ फ़ोल्डर और इंडेक्स डायरेक्टरी दोनों की पढ़ने की अनुमति है।
आउट‑ऑफ़‑मेमोरी त्रुटियाँJVM हीप साइज बढ़ाएँ या add ऑपरेशन को बैच में चलाएँ ताकि फ़ाइलों को छोटे समूहों में प्रोसेस किया जा सके।

अक्सर पूछे जाने वाले प्रश्न

प्र: मेटाडाटा इंडेक्सिंग क्या है?
उ: मेटाडाटा इंडेक्सिंग दस्तावेज़ गुणों (लेखक, शीर्षक, कस्टम टैग) को एक खोज योग्य संरचना में संग्रहीत करता है, जिससे पूर्ण पाठ को स्कैन किए बिना तेज़ लुक‑अप संभव होते हैं।

प्र: मैं अस्थायी लाइसेंस कैसे प्राप्त करूँ?
उ: GroupDocs खरीद पृष्ठ पर जाएँ और ट्रायल लाइसेंस प्राप्त करने के चरणों का पालन करें।

प्र: क्या मैं इस सेटअप से PDFs को इंडेक्स कर सकता हूँ?
उ: हाँ, GroupDocs.Search PDF, DOCX, PPT और कई अन्य फ़ॉर्मेट का समर्थन करता है।

प्र: दस्तावेज़ जोड़ते समय सामान्य समस्याएँ क्या हैं?
उ: सही फ़ाइल पथ की जाँच करें और सुनिश्चित करें कि एप्लिकेशन के पास डायरेक्टरीज़ के लिए पढ़ने की अनुमति है।

प्र: मैं खोज प्रदर्शन को कैसे अनुकूलित करूँ?
उ: नियमित रूप से अपना इंडेक्स अपडेट करें, इन्क्रिमेंटल ऐड्स का उपयोग करें, और JVM मेमोरी सेटिंग्स को ट्यून करें।

संसाधन


अंतिम अपडेट: 2026-01-06
परीक्षण किया गया: GroupDocs.Search Java 25.4
लेखक: GroupDocs