didn’t translate any URLs.

Now produce final content.# DOCX képek kinyerése – Haladó szerkeszthető dokumentum használat

Ha .NET fejlesztő vagy, és DOCX képek kinyerésére vágysz, valamint szeretnéd bővíteni a dokumentumszerkesztési képességeidet, a GroupDocs.Editor for .NET egy erőteljes eszközkészletet kínál. Ez az átfogó útmutató végigvezet a szerkeszthető dokumentumok haladó használatán a GroupDocs.Editor segítségével, részletesen bemutatva minden lépést, hogy teljes mértékben ki tudd használni a lehetőségeket.

Gyors válaszok

  • Hogyan tudok képeket kinyerni egy DOCX fájlból? Használd a EditableDocument.Images-t a dokumentum Editor-rel történő betöltése után.
  • Átalakíthatom a DOCX-et HTML-re beágyazott erőforrásokkal? Igen – hívd a EditableDocument.GetEmbeddedHtml() vagy a GetContent() metódust a HTML jelölőnyelvhez.
  • Melyik metódus menti a szerkesztett dokumentumot HTML-ként? A EditableDocument.Save(htmlFilePath) egy HTML fájlt hoz létre egy erőforrás mappával.
  • Lehet betűtípusokat kinyerni egy Word dokumentumból? Használd a EditableDocument.Fonts-t az összes betűtípus erőforrás lekéréséhez.
  • Szükségem van licencre a termelési használathoz? Egy érvényes GroupDocs.Editor licenc szükséges; ingyenes próba elérhető.

Mi az a extract images from docx?

A képek kinyerése egy DOCX fájlból azt jelenti, hogy programozottan lekérdezed a Word dokumentumba beágyazott minden képet, hogy külön felhasználhasd, módosíthasd vagy tárolhasd őket. A GroupDocs.Editor egy Images gyűjteményt tesz elérhetővé egy EditableDocument példányon, így ez a feladat egyszerű.

Miért használjuk a GroupDocs.Editor-t ebben a munkafolyamatban?

  • Teljes irányítás a dokumentum erőforrásai (képek, betűtípusok, CSS) felett manuális ZIP-kezelés nélkül.
  • Zökkenőmentes konverzió a DOCX-ről HTML-re, miközben megőrzi az elrendezést és a stílusokat.
  • Egyszerű erőforrás kinyerés egyedi képkezeléshez, betűtípus beágyazáshoz vagy CDN kiszolgáláshoz.
  • Robusztus felszabadítási minta biztosítja, hogy hosszú távú szolgáltatásokban ne legyen memória szivárgás.

Előfeltételek

  • A Visual Studio telepítve legyen a fejlesztői gépeden.
  • A GroupDocs.Editor-hez kompatibilis .NET Framework.
  • GroupDocs.Editor for .NET könyvtár. Letöltheted itt.
  • Érvényes GroupDocs.Editor licenc. Kérhetsz egy ingyenes próbát vagy vásárolhatsz ideiglenes licencet.

Névterek importálása

A kezdéshez győződj meg róla, hogy importálod a szükséges névtereket a .NET projektedben:

using System;
using System.Collections.Generic;
using System.IO;
using GroupDocs.Editor.HtmlCss.Resources;
using GroupDocs.Editor.HtmlCss.Resources.Fonts;
using GroupDocs.Editor.HtmlCss.Resources.Images;
using GroupDocs.Editor.HtmlCss.Resources.Textual;
using GroupDocs.Editor.Options;

1. lépés: EditableDocument példány létrehozása

Először létre kell hoznod egy EditableDocument példányt egy támogatott formátumú bemeneti dokumentum betöltésével és szerkesztésével.

string inputFilePath = "YourSampleDocument.docx";
Editor editor = new Editor(inputFilePath, delegate { return new WordProcessingLoadOptions(); });
EditableDocument beforeEdit = editor.Edit(new WordProcessingEditOptions());

Ebben a lépésben betöltjük a bemeneti dokumentumot, és előkészítjük a szerkesztéshez.

Hogyan extract images from DOCX?

Az alábbiakban bemutatjuk az erőforrás kinyerési lehetőségeket, kezdve a leggyakoribb igénnyel – az összes kép kinyerésével egy Word fájlból.

2. lépés: Dokumentum erőforrások kinyerése

A EditableDocument különféle erőforrásokat tartalmaz, amelyeket ki lehet nyerni és manipulálni. Nézzük meg ezeket részletesen:

2.1. lépés: Teljes dokumentum kinyerése HTML-ként

Létrehozhatsz egyetlen karakterláncot, amely a teljes dokumentumot tartalmazza, az összes erőforrással beágyazva HTML-ként.

string allAsHtmlInsideOneString = beforeEdit.GetEmbeddedHtml();

Ez a karakterlánc elég nagy lesz, mivel tartalmazza a stíluslapokat, képeket és betűtípusokat, base64 kódolással.

2.2. lépés: Összes kép kinyerése (primary keyword in action)

Kinyer minden képet a dokumentumból – ez a extract images from docx lényeges része.

List<IImageResource> allImages = beforeEdit.Images;

2.3. lépés: Összes betűtípus kinyerése (secondary keyword)

Ha emellett extract fonts from word-ra is szükséged van, használd a következő hívást:

List<FontResourceBase> allFonts = beforeEdit.Fonts;

2.4. lépés: Összes stíluslap kinyerése

Kinyer minden stíluslapot szöveges formátumban.

List<CssText> allStylesheets = beforeEdit.Css;

2.5. lépés: Összes erőforrás összegyűjtése

Az összes erőforrást egy hívással gyűjti össze.

List<IHtmlResource> allResources = beforeEdit.AllResources;

Ez magában foglalja a képeket, betűtípusokat és a stíluslapokat.

2.6. lépés: HTML jelölőnyelv lekérése

Szerezd meg a dokumentum HTML jelölőnyelvét beágyazott erőforrások nélkül.

string htmlMarkup = beforeEdit.GetContent();

Hogyan convert docx to html egyedi kezelés mellett?

Néha szükség van arra, hogy a külső hivatkozásokat úgy módosítsd, hogy a saját erőforráskezelőidre mutassanak.

3. lépés: Külső hivatkozások módosítása

3.1. lépés: Egyedi előtagok előkészítése

Készíts előtagokat, amelyek az eredeti külső hivatkozások elé fognak kerülni.

string customImagesRequesthandlerUri = "http://example.com/ImagesHandler/id=";
string customCssRequesthandlerUri = "http://example.com/CssHandler/id=";
string customFontsRequesthandlerUri = "http://example.com/FontsHandler/id=";

3.2. lépés: Előtaggal ellátott HTML jelölőnyelv generálása

Generálj HTML jelölőnyvet a módosított hivatkozásokkal.

string prefixedHtmlMarkup = beforeEdit.GetContent(customImagesRequesthandlerUri, customCssRequesthandlerUri);

3.3. lépés: Csak a törzs tartalmú HTML lekérése

Néhány WYSIWYG szerkesztő csak tiszta HTML jelölőnyvet kezel fejléc nélkül.

string onlyBodyContent = beforeEdit.GetBodyContent();

3.4. lépés: Előtaggal ellátott csak törzs tartalom

Generálj csak törzs tartalmat egyedi kép előtagokkal.

string prefixedBodyContent = beforeEdit.GetBodyContent(customImagesRequesthandlerUri);

3.5. lépés: Stíluslapok kinyerése

Kinyer a dokumentumban használt stíluslapokat.

List<string> stylesheets = beforeEdit.GetCssContent();

3.6. lépés: Előtaggal ellátott stíluslapok

Kinyer stíluslapokat egyedi előtagokkal.

List<string> prefixedStylesheets = beforeEdit.GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri);

Hogyan save document as html helyesen?

4. lépés: Dokumentum mentése HTML-ként

Mentse a szerkesztett dokumentumot HTML fájlként, beleértve az erőforrásait.

string htmlFilePath = Path.Combine("output", Path.GetFileNameWithoutExtension(inputFilePath) + ".html");
beforeEdit.Save(htmlFilePath);

Ez a metódus egy külön könyvtárat hoz létre az olyan erőforrásoknak, mint a stíluslapok, képek és betűtípusok.

5. lépés: EditableDocument felszabadítása

A EditableDocument implementálja az IDisposable-t, és lehetőséget biztosít annak ellenőrzésére, hogy a példány felszabadult-e.

Console.WriteLine("EditableDocument is {0} disposed", !beforeEdit.IsDisposed ? "not" : "already");

5.1. lépés: Dispose esemény kezelése

Feliratkozhatsz a disposing eseményre is.

EventHandler someMethod = delegate { Console.WriteLine("Disposing event was spotted!"); };
beforeEdit.Disposed += someMethod;

6. lépés: EditableDocument létrehozása HTML-ből

Hozz létre egy EditableDocument példányt egy HTML dokumentumból.

6.1. lépés: HTML fájlból

EditableDocument afterEditFromFile = EditableDocument.FromFile(htmlFilePath, null);

6.2. lépés: HTML jelölőnyelből

EditableDocument afterEditFromMarkup = EditableDocument.FromMarkup(htmlMarkup, allResources);

Ezek a példányok (afterEditFromFile és afterEditFromMarkup) az eredetihez (beforeEdit) hasonlóak.

7. lépés: Kézi felszabadítás

Kézzel szabadítsd fel az EditableDocument példányaidat.

beforeEdit.Dispose();
afterEditFromFile.Dispose();
afterEditFromMarkup.Dispose();
editor.Dispose();

Ez biztosítja az erőforrások megfelelő tisztítását.

Gyakori problémák és megoldások

  • A képek nem jelennek meg a kinyerés után: Ellenőrizd, hogy a dokumentum valóban tartalmaz beágyazott képeket, és hogy a Edit hívás után a beforeEdit.Images-hez férsz hozzá.
  • A betűtípusok hiányoznak a HTML kimenetben: Győződj meg róla, hogy a GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri) hívást használod a betűtípus URL-ek helyes beágyazásához.
  • Nagy HTML karakterláncok memória nyomást okoznak: Használd a GetContent()-ot a beágyazott erőforrások nélküli jelölőnyvhez, és szolgáld ki a képeket/CSS-t külön fájlokból.

Gyakran ismételt kérdések

Q: Milyen formátumokat támogat a GroupDocs.Editor?
A: A GroupDocs.Editor támogatja a DOCX, XLSX, PPTX és sok más népszerű irodai formátumot.

Q: Használhatom a GroupDocs.Editor-t licenc nélkül?
A: Igen, használhatod egy ingyenes próbával vagy egy ideiglenes licenccel.

Q: Hogyan nyerhetek ki konkrét erőforrásokat egy dokumentumból?
A: Használd a Images, Fonts és Css gyűjteményeket a EditableDocument példányon.

Q: Lehetőség van a hivatkozások módosítására a HTML kimenetben?
A: Igen, adj meg egyedi URI előtagokat a GetContent vagy GetBodyContent metódusoknak a kép, CSS és betűtípus hivatkozások átírásához.

Q: Hogyan mentsek egy szerkesztett dokumentumot HTML fájlként?
A: Hívd meg a Save metódust a EditableDocument példányon, megadva egy .html-re végződő fájl elérési utat.


Utoljára frissítve: 2026-03-14
Tesztelve: GroupDocs.Editor for .NET (legújabb kiadás)
Szerző: GroupDocs