• 동적 플레이스홀더(예: {{CustomerName}})가 포함된 템플릿을 편집해 보세요.
  • DOCX로 다시 저장하는 API(EditableDocument.saveAsDocx())를 살펴보세요.
  • 이 워크플로를 Spring Boot 서비스에 통합해 필요 시 문서를 생성하도록 구현하세요.

Next lines:

— (horizontal rule) keep as is.

Last Updated: 2026-02-21
Tested With: GroupDocs.Editor 25.3 for Java
Author: GroupDocs

Translate labels but keep dates and version.

Korean:

마지막 업데이트: 2026-02-21
테스트 환경: GroupDocs.Editor 25.3 for Java
작성자: GroupDocs

Make sure to keep bold formatting.

Now ensure we didn’t miss any shortcodes; none.

Preserve code block placeholders unchanged.

Now produce final content.# Word에서 이미지 추출 및 GroupDocs.Editor Java로 편집 가능한 문서 만들기

오늘날 빠르게 변화하는 기업 환경에서 Word 파일에서 이미지를 추출하는 능력은 게임 체인저입니다. Word를 HTML로 변환하거나 Word에서 HTML 생성, 혹은 Java 스타일로 Word 문서 편집이 필요하든, GroupDocs.Editor for Java는 이러한 작업을 자동화할 수 있는 신뢰성 높고 고성능의 방법을 제공합니다. 이 가이드에서는 환경 설정부터 고급 편집까지 필요한 모든 내용을 단계별로 안내하므로, 몇 분 안에 보고서 생성 자동화Word 문서 일괄 처리 솔루션을 구축할 수 있습니다.

빠른 답변

  • Word 파일을 로드하기 위한 기본 클래스는 무엇인가요? Editor
  • 편집용 HTML 마크업을 반환하는 메서드는? edit()EditableDocument를 반환합니다
  • Word 문서에서 이미지를 추출하려면 어떻게 하나요? EditableDocument에서 getAllResources()를 사용합니다
  • 편집된 내용을 디스크에 저장할 수 있나요? 예, EditableDocumentsave()를 호출하면 됩니다
  • 개발에 라이선스가 필요한가요? 테스트용으로는 무료 체험 또는 임시 라이선스로 충분하며, 프로덕션에서는 정식 라이선스가 필요합니다

“Word에서 이미지 추출”이란?

Word에서 이미지를 추출한다는 것은 .docx 파일을 로드하고, 이를 편집 가능한 HTML 형태로 변환한 뒤, 포함된 모든 이미지, 글꼴, 스타일시트를 추출하는 것을 의미합니다. 이렇게 하면 각 리소스를 개별적으로 관리할 수 있어 별도로 저장하거나 CDN에 재배포하거나 다른 문서에 삽입할 수 있습니다.

왜 Java용 GroupDocs.Editor를 사용하나요?

  • 전체 기능을 갖춘 Word 지원 – Microsoft Office 없이 편집, 추출 및 변환 가능.
  • 원활한 HTML 변환 – 웹 기반 편집기나 CMS 통합에 최적.
  • 강력한 리소스 처리 – 한 번의 호출로 이미지, 글꼴, CSS를 모두 가져옴.
  • 확장 가능한 성능 – 대량 처리 및 대규모 보고서 생성에 이상적.
  • 편리한 Java API – Java 8 이상 및 주요 IDE와 자연스럽게 동작.

전제 조건

  • Java Development Kit (JDK) 8 이상.
  • IntelliJ IDEA 또는 Eclipse와 같은 IDE.
  • 기본 Java 지식 및 Maven 사용 경험.

필수 라이브러리

프로젝트에 GroupDocs.Editor 라이브러리를 포함하세요. Maven을 사용해 의존성으로 추가합니다:

<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/editor/java/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-editor</artifactId>
      <version>25.3</version>
   </dependency>
</dependencies>

또는 최신 버전을 직접 GroupDocs.Editor for Java releases에서 다운로드하세요.

라이선스 획득

GroupDocs.Editor를 사용하려면 무료 체험으로 시작하거나 임시 라이선스를 요청하거나 정식 라이선스를 구매할 수 있습니다. 라이브러리는 평가용으로 바로 사용할 수 있으며, 프로덕션 라이선스로 전환하려면 라이선스 파일을 교체하기만 하면 됩니다.

GroupDocs.Editor Java를 사용해 편집 가능한 문서 만들기

설치

  1. Add Dependencypom.xml에 위의 Maven 스니펫이 포함되어 있는지 확인합니다.
  2. Download JAR – 수동 설정을 원한다면 공식 GroupDocs site에서 최신 JAR를 다운로드합니다.
  3. Configure LicenseGroupDocs.Editor.lic 파일을 resources 폴더에 배치하거나 프로그래밍 방식으로 설정합니다.

기본 초기화

환경이 준비되면 Word 파일 경로를 사용해 Editor 클래스를 인스턴스화할 수 있습니다:

import com.groupdocs.editor.Editor;

// Initialize Editor with a sample Word document
Editor editor = new Editor("YOUR_DOCUMENT_DIRECTORY/sample.docx");

이 한 줄로 문서를 로드, 편집 및 저장할 수 있는 완전한 기능의 편집기를 얻을 수 있습니다.

단계별 가이드

단계 1: 문서를 EditableDocument로 로드하기

EditableDocument로 문서를 로드하는 것이 모든 수정 작업의 첫 단계입니다.

import com.groupdocs.editor.Editor;
import com.groupdocs.editor.EditableDocument;

// Load the document into an EditableDocument
Editor editor = new Editor("YOUR_DOCUMENT_DIRECTORY/sample.docx");
EditableDocument beforeEdit = editor.edit();
  • Editor – 파일 I/O 및 형식 감지를 처리합니다.
  • EditableDocument – 문서를 편집 가능한 HTML 형태로 나타냅니다.

단계 2: Word 내용 편집 (how to edit word)

이제 HTML 문자열을 조작하고, 플레이스홀더를 교체하거나 스타일을 업데이트할 수 있습니다. 변경 후에는 save()를 호출해 저장합니다.

단계 3: 이미지 및 기타 리소스 추출

GroupDocs.Editor를 사용하면 포함된 모든 리소스를 쉽게 추출할 수 있으며, 이는 바로 Word에서 이미지 추출하는 방법과 같습니다.

import com.groupdocs.editor.htmlcss.resources.IHtmlResource;
import java.util.List;

// Extract embedded HTML, images, fonts, and CSS
String allAsHtmlInsideOneString = beforeEdit.getEmbeddedHtml();
List<IHtmlResource> allResources = beforeEdit.getAllResources();

// Accessing specific resources
List<String> stylesheets = beforeEdit.getCssContent();
  • getEmbeddedHtml() – 전체 HTML 마크업을 반환합니다.
  • getAllResources() – 원본 Word 파일에 포함된 모든 이미지, 글꼴, 스타일시트 목록을 제공합니다.
  • extract images from wordImageResource 타입의 객체를 찾기 위해 allResources를 순회하면 됩니다.

단계 4: HTML 마크업에서 외부 링크 조정

문서에 사용자 지정 핸들러(예: CDN)로 연결되어야 하는 링크가 포함되어 있다면, 이를 실시간으로 재작성할 수 있습니다.

String customImagesRequesthandlerUri = "http://example.com/ImagesHandler/id=";
String htmlMarkup = beforeEdit.getContentString(customImagesRequesthandlerUri);
  • getContentString() – 모든 이미지 참조에 제공된 URI 프리픽스를 삽입하여 이미지 제공 위치를 제어할 수 있습니다.

단계 5: 편집된 문서를 디스크에 저장

모든 편집 및 리소스 조정이 끝난 후, 결과를 HTML 파일에 다시 기록하거나 나중에 DOCX로 재변환할 수 있습니다.

// Save the edited document as an HTML file
beforeEdit.save("YOUR_OUTPUT_DIRECTORY/output.html");
  • save() – 편집된 HTML과 연결된 모든 리소스를 지정된 폴더에 저장합니다.

단계 6: 해제 상태 확인

특히 Word 문서 일괄 처리 시 적절한 리소스 관리가 중요합니다.

String res = !beforeEdit.isDisposed() ? "not" : "already";
  • isDisposed() – 문서의 네이티브 리소스가 해제되었으면 true를 반환합니다. 작업이 끝난 큰 문서는 항상 해제하세요.

단계 7: HTML에서 EditableDocument 생성

기존 HTML 파일이나 원시 마크업에서 시작할 수도 있으며, 이는 Word를 HTML로 변환하는 상황에 유용합니다.

import com.groupdocs.editor.EditableDocument;

// Create EditableDocument from file and markup
EditableDocument afterEditFromFile = EditableDocument.fromFile("YOUR_OUTPUT_DIRECTORY/output.html");
EditableDocument afterEditFromMarkup = EditableDocument.fromMarkup(htmlMarkup, allResources);
  • fromFile()save()로 이전에 저장된 HTML 파일을 로드합니다.
  • fromMarkup() – 문자열과 해당 리소스 목록으로부터 직접 EditableDocument를 생성합니다.

GroupDocs.Editor를 사용해 Word를 HTML로 변환하는 방법

edit() 메서드는 로드된 .docx를 자동으로 HTML 형태로 변환합니다. 이후 getEmbeddedHtml() 또는 getContentString()을 사용해 Word에서 HTML 생성 결과를 가져올 수 있으며, 이를 웹 페이지, 이메일에 삽입하거나 나중에 사용할 수 있도록 저장할 수 있습니다.

GroupDocs.Editor를 사용한 Word 문서 일괄 처리

수십 개에서 수백 개의 템플릿을 처리해야 할 경우, 위 단계들을 루프나 CompletableFuture 파이프라인으로 감싸면 됩니다. 메모리 사용량을 낮게 유지하려면 각 문서 처리 후 dispose()를 호출하거나 가비지 컬렉터에 맡기세요.

일반적인 문제와 해결책

  • 대용량 문서에서 OutOfMemoryError 발생 – 모든 데이터를 메모리에 로드하지 말고 스트리밍으로 리소스를 처리하고, 사용이 끝난 즉시 각 EditableDocument를 해제하세요.
  • 변환 후 이미지가 표시되지 않음getContentString()에 올바른 URI 프리픽스를 전달했는지 확인하거나 추출된 리소스를 대상 폴더에 복사하세요.
  • 라이선스 인식 안 됨GroupDocs.Editor.lic 파일이 클래스패스에 있는지 확인하거나 Editor 생성 전에 프로그래밍 방식으로 라이선스를 설정하세요.

자주 묻는 질문

Q: GroupDocs.Editor Java로 PDF를 편집할 수 있나요?
A: 예, GroupDocs.Editor는 PDF를 포함한 다양한 형식을 지원합니다. 자세한 메서드는 API reference를 확인하세요.

Q: 대용량 문서를 효율적으로 처리하려면 어떻게 해야 하나요?
A: EditableDocument 인스턴스를 즉시 해제하고 Java의 CompletableFuture를 활용해 파일을 병렬 처리하는 등 리소스 관리 기법을 사용하세요.

Q: GroupDocs.Editor가 모든 Java IDE와 호환되나요?
A: 예, IntelliJ IDEA와 Eclipse와 같은 주요 IDE에서 정상적으로 동작합니다.

Q: 다수의 파일을 처리할 때 extract images from word를 가장 효율적으로 수행하는 방법은?
A: EditableDocument.getAllResources()를 순회하면서 ImageResource 객체만 필터링하고, 이를 전용 폴더에 저장하거나 진행 중에 CDN에 업로드하세요.

Q: 편집된 HTML을 다시 DOCX 파일로 변환할 수 있나요?
A: 물론입니다. 변경 후 EditableDocument.saveAsDocx("path/to/output.docx")를 사용하면 됩니다.

결론

이제 Word에서 이미지 추출, Word 내용 편집, Word를 HTML로 변환, 그리고 GroupDocs.Editor for Java를 사용해 편집 가능한 문서 생성까지 전체 과정을 완벽히 이해하셨습니다. 이러한 기술을 활용하면 강력한 문서 중심 애플리케이션을 구축하고 보고서 생성 자동화를 자신 있게 구현할 수 있습니다.

다음 단계

  • 동적 플레이스홀더(예: {{CustomerName}})가 포함된 템플릿을 편집해 보세요.
  • DOCX로 다시 저장하는 API(EditableDocument.saveAsDocx())를 살펴보세요.
  • 이 워크플로를 Spring Boot 서비스에 통합해 필요 시 문서를 생성하도록 구현하세요.

마지막 업데이트: 2026-02-21
테스트 환경: GroupDocs.Editor 25.3 for Java
작성자: GroupDocs