didn’t translate any URLs.
Now produce final content.# DOCX képek kinyerése – Haladó szerkeszthető dokumentum használat
Ha .NET fejlesztő vagy, és DOCX képek kinyerésére vágysz, valamint szeretnéd bővíteni a dokumentumszerkesztési képességeidet, a GroupDocs.Editor for .NET egy erőteljes eszközkészletet kínál. Ez az átfogó útmutató végigvezet a szerkeszthető dokumentumok haladó használatán a GroupDocs.Editor segítségével, részletesen bemutatva minden lépést, hogy teljes mértékben ki tudd használni a lehetőségeket.
Gyors válaszok
- Hogyan tudok képeket kinyerni egy DOCX fájlból? Használd a
EditableDocument.Images-t a dokumentumEditor-rel történő betöltése után. - Átalakíthatom a DOCX-et HTML-re beágyazott erőforrásokkal? Igen – hívd a
EditableDocument.GetEmbeddedHtml()vagy aGetContent()metódust a HTML jelölőnyelvhez. - Melyik metódus menti a szerkesztett dokumentumot HTML-ként? A
EditableDocument.Save(htmlFilePath)egy HTML fájlt hoz létre egy erőforrás mappával. - Lehet betűtípusokat kinyerni egy Word dokumentumból? Használd a
EditableDocument.Fonts-t az összes betűtípus erőforrás lekéréséhez. - Szükségem van licencre a termelési használathoz? Egy érvényes GroupDocs.Editor licenc szükséges; ingyenes próba elérhető.
Mi az a extract images from docx?
A képek kinyerése egy DOCX fájlból azt jelenti, hogy programozottan lekérdezed a Word dokumentumba beágyazott minden képet, hogy külön felhasználhasd, módosíthasd vagy tárolhasd őket. A GroupDocs.Editor egy Images gyűjteményt tesz elérhetővé egy EditableDocument példányon, így ez a feladat egyszerű.
Miért használjuk a GroupDocs.Editor-t ebben a munkafolyamatban?
- Teljes irányítás a dokumentum erőforrásai (képek, betűtípusok, CSS) felett manuális ZIP-kezelés nélkül.
- Zökkenőmentes konverzió a DOCX-ről HTML-re, miközben megőrzi az elrendezést és a stílusokat.
- Egyszerű erőforrás kinyerés egyedi képkezeléshez, betűtípus beágyazáshoz vagy CDN kiszolgáláshoz.
- Robusztus felszabadítási minta biztosítja, hogy hosszú távú szolgáltatásokban ne legyen memória szivárgás.
Előfeltételek
- A Visual Studio telepítve legyen a fejlesztői gépeden.
- A GroupDocs.Editor-hez kompatibilis .NET Framework.
- GroupDocs.Editor for .NET könyvtár. Letöltheted itt.
- Érvényes GroupDocs.Editor licenc. Kérhetsz egy ingyenes próbát vagy vásárolhatsz ideiglenes licencet.
Névterek importálása
A kezdéshez győződj meg róla, hogy importálod a szükséges névtereket a .NET projektedben:
using System;
using System.Collections.Generic;
using System.IO;
using GroupDocs.Editor.HtmlCss.Resources;
using GroupDocs.Editor.HtmlCss.Resources.Fonts;
using GroupDocs.Editor.HtmlCss.Resources.Images;
using GroupDocs.Editor.HtmlCss.Resources.Textual;
using GroupDocs.Editor.Options;
1. lépés: EditableDocument példány létrehozása
Először létre kell hoznod egy EditableDocument példányt egy támogatott formátumú bemeneti dokumentum betöltésével és szerkesztésével.
string inputFilePath = "YourSampleDocument.docx";
Editor editor = new Editor(inputFilePath, delegate { return new WordProcessingLoadOptions(); });
EditableDocument beforeEdit = editor.Edit(new WordProcessingEditOptions());
Ebben a lépésben betöltjük a bemeneti dokumentumot, és előkészítjük a szerkesztéshez.
Hogyan extract images from DOCX?
Az alábbiakban bemutatjuk az erőforrás kinyerési lehetőségeket, kezdve a leggyakoribb igénnyel – az összes kép kinyerésével egy Word fájlból.
2. lépés: Dokumentum erőforrások kinyerése
A EditableDocument különféle erőforrásokat tartalmaz, amelyeket ki lehet nyerni és manipulálni. Nézzük meg ezeket részletesen:
2.1. lépés: Teljes dokumentum kinyerése HTML-ként
Létrehozhatsz egyetlen karakterláncot, amely a teljes dokumentumot tartalmazza, az összes erőforrással beágyazva HTML-ként.
string allAsHtmlInsideOneString = beforeEdit.GetEmbeddedHtml();
Ez a karakterlánc elég nagy lesz, mivel tartalmazza a stíluslapokat, képeket és betűtípusokat, base64 kódolással.
2.2. lépés: Összes kép kinyerése (primary keyword in action)
Kinyer minden képet a dokumentumból – ez a extract images from docx lényeges része.
List<IImageResource> allImages = beforeEdit.Images;
2.3. lépés: Összes betűtípus kinyerése (secondary keyword)
Ha emellett extract fonts from word-ra is szükséged van, használd a következő hívást:
List<FontResourceBase> allFonts = beforeEdit.Fonts;
2.4. lépés: Összes stíluslap kinyerése
Kinyer minden stíluslapot szöveges formátumban.
List<CssText> allStylesheets = beforeEdit.Css;
2.5. lépés: Összes erőforrás összegyűjtése
Az összes erőforrást egy hívással gyűjti össze.
List<IHtmlResource> allResources = beforeEdit.AllResources;
Ez magában foglalja a képeket, betűtípusokat és a stíluslapokat.
2.6. lépés: HTML jelölőnyelv lekérése
Szerezd meg a dokumentum HTML jelölőnyelvét beágyazott erőforrások nélkül.
string htmlMarkup = beforeEdit.GetContent();
Hogyan convert docx to html egyedi kezelés mellett?
Néha szükség van arra, hogy a külső hivatkozásokat úgy módosítsd, hogy a saját erőforráskezelőidre mutassanak.
3. lépés: Külső hivatkozások módosítása
3.1. lépés: Egyedi előtagok előkészítése
Készíts előtagokat, amelyek az eredeti külső hivatkozások elé fognak kerülni.
string customImagesRequesthandlerUri = "http://example.com/ImagesHandler/id=";
string customCssRequesthandlerUri = "http://example.com/CssHandler/id=";
string customFontsRequesthandlerUri = "http://example.com/FontsHandler/id=";
3.2. lépés: Előtaggal ellátott HTML jelölőnyelv generálása
Generálj HTML jelölőnyvet a módosított hivatkozásokkal.
string prefixedHtmlMarkup = beforeEdit.GetContent(customImagesRequesthandlerUri, customCssRequesthandlerUri);
3.3. lépés: Csak a törzs tartalmú HTML lekérése
Néhány WYSIWYG szerkesztő csak tiszta HTML jelölőnyvet kezel fejléc nélkül.
string onlyBodyContent = beforeEdit.GetBodyContent();
3.4. lépés: Előtaggal ellátott csak törzs tartalom
Generálj csak törzs tartalmat egyedi kép előtagokkal.
string prefixedBodyContent = beforeEdit.GetBodyContent(customImagesRequesthandlerUri);
3.5. lépés: Stíluslapok kinyerése
Kinyer a dokumentumban használt stíluslapokat.
List<string> stylesheets = beforeEdit.GetCssContent();
3.6. lépés: Előtaggal ellátott stíluslapok
Kinyer stíluslapokat egyedi előtagokkal.
List<string> prefixedStylesheets = beforeEdit.GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri);
Hogyan save document as html helyesen?
4. lépés: Dokumentum mentése HTML-ként
Mentse a szerkesztett dokumentumot HTML fájlként, beleértve az erőforrásait.
string htmlFilePath = Path.Combine("output", Path.GetFileNameWithoutExtension(inputFilePath) + ".html");
beforeEdit.Save(htmlFilePath);
Ez a metódus egy külön könyvtárat hoz létre az olyan erőforrásoknak, mint a stíluslapok, képek és betűtípusok.
5. lépés: EditableDocument felszabadítása
A EditableDocument implementálja az IDisposable-t, és lehetőséget biztosít annak ellenőrzésére, hogy a példány felszabadult-e.
Console.WriteLine("EditableDocument is {0} disposed", !beforeEdit.IsDisposed ? "not" : "already");
5.1. lépés: Dispose esemény kezelése
Feliratkozhatsz a disposing eseményre is.
EventHandler someMethod = delegate { Console.WriteLine("Disposing event was spotted!"); };
beforeEdit.Disposed += someMethod;
6. lépés: EditableDocument létrehozása HTML-ből
Hozz létre egy EditableDocument példányt egy HTML dokumentumból.
6.1. lépés: HTML fájlból
EditableDocument afterEditFromFile = EditableDocument.FromFile(htmlFilePath, null);
6.2. lépés: HTML jelölőnyelből
EditableDocument afterEditFromMarkup = EditableDocument.FromMarkup(htmlMarkup, allResources);
Ezek a példányok (afterEditFromFile és afterEditFromMarkup) az eredetihez (beforeEdit) hasonlóak.
7. lépés: Kézi felszabadítás
Kézzel szabadítsd fel az EditableDocument példányaidat.
beforeEdit.Dispose();
afterEditFromFile.Dispose();
afterEditFromMarkup.Dispose();
editor.Dispose();
Ez biztosítja az erőforrások megfelelő tisztítását.
Gyakori problémák és megoldások
- A képek nem jelennek meg a kinyerés után: Ellenőrizd, hogy a dokumentum valóban tartalmaz beágyazott képeket, és hogy a
Edithívás után abeforeEdit.Images-hez férsz hozzá. - A betűtípusok hiányoznak a HTML kimenetben: Győződj meg róla, hogy a
GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri)hívást használod a betűtípus URL-ek helyes beágyazásához. - Nagy HTML karakterláncok memória nyomást okoznak: Használd a
GetContent()-ot a beágyazott erőforrások nélküli jelölőnyvhez, és szolgáld ki a képeket/CSS-t külön fájlokból.
Gyakran ismételt kérdések
Q: Milyen formátumokat támogat a GroupDocs.Editor?
A: A GroupDocs.Editor támogatja a DOCX, XLSX, PPTX és sok más népszerű irodai formátumot.
Q: Használhatom a GroupDocs.Editor-t licenc nélkül?
A: Igen, használhatod egy ingyenes próbával vagy egy ideiglenes licenccel.
Q: Hogyan nyerhetek ki konkrét erőforrásokat egy dokumentumból?
A: Használd a Images, Fonts és Css gyűjteményeket a EditableDocument példányon.
Q: Lehetőség van a hivatkozások módosítására a HTML kimenetben?
A: Igen, adj meg egyedi URI előtagokat a GetContent vagy GetBodyContent metódusoknak a kép, CSS és betűtípus hivatkozások átírásához.
Q: Hogyan mentsek egy szerkesztett dokumentumot HTML fájlként?
A: Hívd meg a Save metódust a EditableDocument példányon, megadva egy .html-re végződő fájl elérési utat.
Utoljára frissítve: 2026-03-14
Tesztelve: GroupDocs.Editor for .NET (legújabb kiadás)
Szerző: GroupDocs