DOCX से इमेज निकालें – एडवांस्ड एडिटेबल डॉक्यूमेंट उपयोग
यदि आप एक .NET डेवलपर हैं और DOCX से इमेज निकालना चाहते हैं तथा अपने डॉक्यूमेंट एडिटिंग क्षमताओं को बढ़ाना चाहते हैं, तो GroupDocs.Editor for .NET एक शक्तिशाली टूल्स सूट प्रदान करता है। यह व्यापक गाइड आपको GroupDocs.Editor का उपयोग करके एडिटेबल डॉक्यूमेंट्स के एडवांस्ड उपयोग के प्रत्येक चरण में मार्गदर्शन करेगा, ताकि आप इसकी पूरी क्षमता का उपयोग कर सकें।
त्वरित उत्तर
- DOCX फ़ाइल से इमेज कैसे निकालें?
Editorके साथ डॉक्यूमेंट लोड करने के बादEditableDocument.Imagesका उपयोग करें। - क्या मैं DOCX को एम्बेडेड रिसोर्सेज़ के साथ HTML में बदल सकता हूँ? हाँ—
EditableDocument.GetEmbeddedHtml()याGetContent()को कॉल करें HTML मार्कअप के लिए। - कौन सा मेथड एडिटेड डॉक्यूमेंट को HTML के रूप में सेव करता है?
EditableDocument.Save(htmlFilePath)एक HTML फ़ाइल और एक रिसोर्स फ़ोल्डर बनाता है। - क्या Word डॉक्यूमेंट से फ़ॉन्ट निकालना संभव है? सभी फ़ॉन्ट रिसोर्सेज़ प्राप्त करने के लिए
EditableDocument.Fontsका उपयोग करें। - प्रोडक्शन उपयोग के लिए लाइसेंस की आवश्यकता है? एक वैध GroupDocs.Editor लाइसेंस आवश्यक है; एक फ्री ट्रायल उपलब्ध है।
extract images from docx क्या है?
DOCX फ़ाइल से इमेज निकालना मतलब प्रोग्रामेटिक रूप से Word डॉक्यूमेंट में एम्बेड की गई प्रत्येक तस्वीर को प्राप्त करना, ताकि आप उन्हें अलग से पुन: उपयोग, संशोधित या स्टोर कर सकें। GroupDocs.Editor EditableDocument इंस्टेंस पर Images कलेक्शन प्रदान करता है, जिससे यह कार्य सरल हो जाता है।
इस वर्कफ़्लो के लिए GroupDocs.Editor क्यों उपयोग करें?
- डॉक्यूमेंट रिसोर्सेज़ (इमेज, फ़ॉन्ट, CSS) पर पूर्ण नियंत्रण बिना मैन्युअल ZIP हैंडलिंग के।
- DOCX से HTML में सहज रूपांतरण लेआउट और स्टाइलिंग को बनाए रखते हुए।
- कस्टम इमेज हैंडलिंग, फ़ॉन्ट एम्बेडिंग या CDN डिलीवरी के लिए आसान रिसोर्स एक्सट्रैक्शन।
- मजबूत डिस्पोज़ल पैटर्न जो लंबी‑चलाने वाली सर्विसेज़ में मेमोरी लीक को रोकता है।
पूर्वापेक्षाएँ
- आपके विकास मशीन पर Visual Studio स्थापित हो।
- GroupDocs.Editor के साथ संगत .NET Framework।
- GroupDocs.Editor for .NET लाइब्रेरी। आप इसे यहाँ डाउनलोड कर सकते हैं।
- एक वैध GroupDocs.Editor लाइसेंस। आप एक फ्री ट्रायल ले सकते हैं या एक टेम्पररी लाइसेंस खरीद सकते हैं।
नेमस्पेस इम्पोर्ट करें
शुरू करने के लिए, अपने .NET प्रोजेक्ट में आवश्यक नेमस्पेस इम्पोर्ट करें:
using System;
using System.Collections.Generic;
using System.IO;
using GroupDocs.Editor.HtmlCss.Resources;
using GroupDocs.Editor.HtmlCss.Resources.Fonts;
using GroupDocs.Editor.HtmlCss.Resources.Images;
using GroupDocs.Editor.HtmlCss.Resources.Textual;
using GroupDocs.Editor.Options;
चरण 1: EditableDocument इंस्टेंस बनाना
सबसे पहले, आपको एक EditableDocument इंस्टेंस बनाना होगा, जिससे आप समर्थित फ़ॉर्मेट की इनपुट डॉक्यूमेंट को लोड और एडिट कर सकें।
string inputFilePath = "YourSampleDocument.docx";
Editor editor = new Editor(inputFilePath, delegate { return new WordProcessingLoadOptions(); });
EditableDocument beforeEdit = editor.Edit(new WordProcessingEditOptions());
इस चरण में हम इनपुट डॉक्यूमेंट को लोड करते हैं और उसे एडिटिंग के लिए तैयार करते हैं।
extract images from DOCX कैसे करें?
नीचे हम रिसोर्स एक्सट्रैक्शन क्षमताओं में गहराई से उतरते हैं, सबसे सामान्य आवश्यकता—Word फ़ाइल से सभी इमेज प्राप्त करने—से शुरू करते हैं।
चरण 2: डॉक्यूमेंट रिसोर्सेज़ निकालना
EditableDocument में विभिन्न रिसोर्सेज़ होते हैं जिन्हें निकाला और मैनीपुलेट किया जा सकता है। आइए इन्हें विस्तार से देखें:
चरण 2.1: पूरे डॉक्यूमेंट को HTML के रूप में एक्सट्रैक्ट करें
आप एक सिंगल स्ट्रिंग जेनरेट कर सकते हैं जिसमें सभी रिसोर्सेज़ एम्बेडेड HTML के रूप में हों।
string allAsHtmlInsideOneString = beforeEdit.GetEmbeddedHtml();
यह स्ट्रिंग काफी बड़ी होगी क्योंकि इसमें स्टाइलशीट्स, इमेज और फ़ॉन्ट्स base64 में एन्कोडेड शामिल होते हैं।
चरण 2.2: सभी इमेज एक्सट्रैक्ट करें (मुख्य कीवर्ड एक्शन में)
डॉक्यूमेंट से सभी इमेज निकालें—यह extract images from docx का मुख्य भाग है।
List<IImageResource> allImages = beforeEdit.Images;
चरण 2.3: सभी फ़ॉन्ट्स एक्सट्रैक्ट करें (सहायक कीवर्ड)
यदि आपको extract fonts from word भी चाहिए, तो निम्न कॉल का उपयोग करें:
List<FontResourceBase> allFonts = beforeEdit.Fonts;
चरण 2.4: सभी स्टाइलशीट्स एक्सट्रैक्ट करें
टेक्स्टुअल फॉर्मेट में सभी स्टाइलशीट्स निकालें।
List<CssText> allStylesheets = beforeEdit.Css;
चरण 2.5: सभी रिसोर्सेज़ एक साथ इकट्ठा करें
एक कॉल में सभी रिसोर्सेज़ एकत्र करें।
List<IHtmlResource> allResources = beforeEdit.AllResources;
इसमें इमेज, फ़ॉन्ट और स्टाइलशीट्स शामिल हैं।
चरण 2.6: HTML मार्कअप प्राप्त करें
डॉक्यूमेंट का HTML मार्कअप बिना एम्बेडेड रिसोर्सेज़ के प्राप्त करें।
string htmlMarkup = beforeEdit.GetContent();
convert docx to html को कस्टम हैंडलिंग के साथ कैसे करें?
कभी‑कभी आपको बाहरी लिंक को अपने स्वयं के रिसोर्स हैंडलर्स की ओर इंगित करने के लिए समायोजित करना पड़ता है।
चरण 3: बाहरी लिंक समायोजित करना
चरण 3.1: कस्टम प्रीफ़िक्स तैयार करें
मूल बाहरी लिंक के आगे प्रीफ़िक्स जोड़ने के लिए प्रीफ़िक्स तैयार करें।
string customImagesRequesthandlerUri = "http://example.com/ImagesHandler/id=";
string customCssRequesthandlerUri = "http://example.com/CssHandler/id=";
string customFontsRequesthandlerUri = "http://example.com/FontsHandler/id=";
चरण 3.2: प्रीफ़िक्स्ड HTML मार्कअप जेनरेट करें
समायोजित लिंक के साथ HTML मार्कअप जेनरेट करें।
string prefixedHtmlMarkup = beforeEdit.GetContent(customImagesRequesthandlerUri, customCssRequesthandlerUri);
चरण 3.3: केवल बॉडी वाला HTML कंटेंट प्राप्त करें
कुछ WYSIWYG एडिटर केवल हेडर के बिना शुद्ध HTML मार्कअप को हैंडल करते हैं।
string onlyBodyContent = beforeEdit.GetBodyContent();
चरण 3.4: प्रीफ़िक्स्ड बॉडी‑ओनली कंटेंट
कस्टम इमेज प्रीफ़िक्स के साथ बॉडी‑ओनली कंटेंट जेनरेट करें।
string prefixedBodyContent = beforeEdit.GetBodyContent(customImagesRequesthandlerUri);
चरण 3.5: स्टाइलशीट्स एक्सट्रैक्ट करें
डॉक्यूमेंट में उपयोग की गई स्टाइलशीट्स निकालें।
List<string> stylesheets = beforeEdit.GetCssContent();
चरण 3.6: प्रीफ़िक्स्ड स्टाइलशीट्स
कस्टम प्रीफ़िक्स के साथ स्टाइलशीट्स एक्सट्रैक्ट करें।
List<string> prefixedStylesheets = beforeEdit.GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri);
save document as html को सही तरीके से कैसे करें?
चरण 4: डॉक्यूमेंट को HTML के रूप में सेव करें
एडिटेड डॉक्यूमेंट को HTML फ़ाइल के साथ उसके रिसोर्सेज़ सहित सेव करें।
string htmlFilePath = Path.Combine("output", Path.GetFileNameWithoutExtension(inputFilePath) + ".html");
beforeEdit.Save(htmlFilePath);
यह मेथड रिसोर्सेज़ (स्टाइलशीट्स, इमेज, फ़ॉन्ट्स) के लिए एक अलग डायरेक्टरी बनाता है।
चरण 5: EditableDocument को डिस्पोज़ करना
EditableDocument IDisposable को इम्प्लीमेंट करता है और यह जांचने की सुविधा देता है कि इंस्टेंस डिस्पोज़ हुआ है या नहीं।
Console.WriteLine("EditableDocument is {0} disposed", !beforeEdit.IsDisposed ? "not" : "already");
चरण 5.1 डिस्पोज़ इवेंट हैंडल करना
आप डिस्पोज़िंग इवेंट को भी सब्सक्राइब कर सकते हैं।
EventHandler someMethod = delegate { Console.WriteLine("Disposing event was spotted!"); };
beforeEdit.Disposed += someMethod;
चरण 6: HTML से EditableDocument बनाना
HTML डॉक्यूमेंट से EditableDocument का एक इंस्टेंस बनाएं।
चरण 6.1: HTML फ़ाइल से
EditableDocument afterEditFromFile = EditableDocument.FromFile(htmlFilePath, null);
चरण 6.2: HTML मार्कअप से
EditableDocument afterEditFromMarkup = EditableDocument.FromMarkup(htmlMarkup, allResources);
ये इंस्टेंस (afterEditFromFile और afterEditFromMarkup) मूल (beforeEdit) के समान हैं।
चरण 7: मैन्युअल डिस्पोज़ल
अपने EditableDocument इंस्टेंस को मैन्युअली डिस्पोज़ करें।
beforeEdit.Dispose();
afterEditFromFile.Dispose();
afterEditFromMarkup.Dispose();
editor.Dispose();
यह रिसोर्सेज़ की उचित क्लीन‑अप सुनिश्चित करता है।
सामान्य समस्याएँ और समाधान
- इमेज एक्सट्रैक्शन के बाद दिखाई नहीं दे रही हैं: पुष्टि करें कि डॉक्यूमेंट में वास्तव में एम्बेडेड इमेज हैं और
Editकॉल करने के बादbeforeEdit.Imagesतक पहुँच रहे हैं। - HTML आउटपुट में फ़ॉन्ट गायब हैं: सुनिश्चित करें कि आप
GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri)को कॉल करके फ़ॉन्ट URL सही तरीके से एम्बेड कर रहे हैं। - बड़ी HTML स्ट्रिंग्स से मेमोरी प्रेशर: एम्बेडेड रिसोर्सेज़ के बिना मार्कअप के लिए
GetContent()का उपयोग करें और इमेज/CSS को अलग फ़ाइलों से सर्व करें।
अक्सर पूछे जाने वाले प्रश्न
प्र: GroupDocs.Editor किन फ़ॉर्मेट्स को सपोर्ट करता है?
उ: GroupDocs.Editor DOCX, XLSX, PPTX और कई अन्य लोकप्रिय ऑफिस फ़ॉर्मेट्स को सपोर्ट करता है।
प्र: क्या मैं GroupDocs.Editor को बिना लाइसेंस के उपयोग कर सकता हूँ?
उ: हाँ, आप इसे एक फ्री ट्रायल या एक टेम्पररी लाइसेंस के साथ उपयोग कर सकते हैं।
प्र: मैं डॉक्यूमेंट से विशिष्ट रिसोर्सेज़ कैसे एक्सट्रैक्ट करूँ?
उ: EditableDocument इंस्टेंस पर Images, Fonts, और Css कलेक्शन का उपयोग करें।
प्र: क्या HTML आउटपुट में लिंक को समायोजित करना संभव है?
उ: हाँ, GetContent या GetBodyContent को कस्टम URI प्रीफ़िक्स पास करके इमेज, CSS, और फ़ॉन्ट लिंक को री‑राइट किया जा सकता है।
प्र: एडिटेड डॉक्यूमेंट को HTML फ़ाइल के रूप में कैसे सेव करें?
उ: EditableDocument इंस्टेंस पर Save मेथड कॉल करें और फ़ाइल पाथ को .html पर समाप्त करें।
अंतिम अपडेट: 2026-03-14
टेस्टेड विद: GroupDocs.Editor for .NET (latest release)
लेखक: GroupDocs