분류
2021년 2월
작성일
2020.10.14
수정일
2020.10.14
작성자
고우람
조회수
50

학습 기반 알고리즘을 이용한 만화 식자 작업 자동화

제목

학습 기반 알고리즘을 이용한 만화 식자 작업 자동화

 

요약

  만화는 매우 보편적인(popular) 매체로, 다양한 언어로 번역되어 출간되고 있다. 만화의 번역 과정은 일반 도서류와 달리 각 나라말로 기록된 비정형적인 스크립트를 자국 언어로 번역하는 “텍스트 번역 작업”과 외국 만화의 텍스트를 지우고 번역된 텍스트를 자연스럽게 삽입하는 “식자 작업”으로 나누어진다. 이 과정에서 식자 작업은 번역된 만화의 품질과 번역의 비용을 결정하는 가장 중요한 과정이다. 그러나 만화 이미지의 복잡성으로 인해 식자 작업은 수작업으로 진행되고 있으며 많은 노동력과 시간이 투여되고 있다. 이 논문은 컴퓨터 시스템을 이용하여 만화 식자 작업의 비용을 줄이는 방법에 대해 설명한다.

  식자 작업은 크게 “원본 텍스트 제거 과정”과 “번역 텍스트 삽입 과정”으로 나누어진다. 텍스트 제거 과정 자동화를 달성하기 위하여 두 단계의 접근 방법을 제시하였다. 먼저 이미지 분할(image segmentation) 기술을 적용하여 만화 이미지에서 글자 영역을 분할한다. 분할된 영역의 글자를 제거한 뒤, 이미지 복원(image inpainting) 기술을 통해 지워진 영역을 자연스럽게 복원한다. 두 과정을 위해 만화에서 데이터 셋을 구성하였으며 충분한 성능을 이끌어내기 위해 심층 학습 모델을 적용하였다. 실험 결과를 통해 어떤 데이터와 모델이 만화 텍스트 제거 작업에 가장 효율적인지 보였다.

  번역 텍스트 삽입 과정은 텍스트를 지운 만화 이미지에 번역된 텍스트를 삽입하는 과정이다. 삽입되는 텍스트는 원본 만화의 텍스트와 스타일(크기, 방향, 색, 효과)이 비슷하고 일관성이 있어야 한다. 일관된 텍스트 스타일은 만화 번역의 품질을 좌우하는 중요한 특징임에도 불구하고, 일반적으로 식자 작업자의 심미안과 직관에 의존하여 결정되었다. 또한 텍스트를 다양한 스타일로 삽입하는 과정은 지루한 반복 작업을 필요로 한다. 이를 완화하기 위해 원본 이미지의 텍스트와 이미지 분할 과정에서 생성된 텍스트 마스크를 분석하여 번역 텍스트의 스타일을 추천하는 과정을 제시한다. 추천 결과의 성능 평가를 위해 만화 이미지로부터 데이터셋을 구성했으며 다양한 알고리즘을 적용하고 비교해 보았다.

  끝으로 본 논문에서 제시한 만화 텍스트 분할, 이미지 복원 연구 결과를 이용하는 새로운 응용 분야를 제시한다. 핵심적인 응용인 만화 식자 작업 자동화 뿐 아니라 정적 만화의 세미(semi) 애니메이션, 만화 텍스트 추출 시스템에 대해 추가 설명한다.

학위연월
2021년 2월
지도교수
조환규
키워드
만화 일러스트 번역, 심층 학습, 이미지 편집 시스템
소개 웹페이지
http://galab-work.cs.pusan.ac.kr/kur/
첨부파일
첨부파일이(가) 없습니다.
다음글
장입 제약을 고려한 배치형 열처리 공정 작업계획 최적화
최정훈 2020-10-14 14:57:25.133
이전글
API 서열 분석을 통한 .NET 난독화 도구 자동 식별
허태광 2020-10-14 14:55:11.137
RSS 2.0 821
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
821 Learning a Differentiable Multi-Branch Decision Tr 새글 박한얼 2025.10.21 0 8
820 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 새글 윤건우 2025.10.19 0 25
819 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 새글 조대영 2025.10.17 0 30
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 새글 조수현 2025.10.17 0 33
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 새글 김정호 2025.10.17 0 37
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 새글 곽도균 2025.10.17 0 29
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 새글 박현수 2025.10.17 0 26
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 새글 김민성 2025.10.17 0 24
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 새글 구동한 2025.10.17 0 50
812 VR에서 제자리걸음 동안 주변 시야의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연구 새글 은승우 2025.10.17 0 35
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 새글 정해원 2025.10.17 0 37
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 새글 박재현 2025.10.17 0 31
809 Autonomous Driving Agent Identification Under Host 새글 도현철 2025.10.17 0 34
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 새글 박동진 2025.10.17 0 30
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 새글 전민수 2025.10.16 0 37
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 새글 강은세 2025.10.15 0 56
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 새글 허석용 2025.10.15 0 48
804 Long-Axis Guided Diffusion Autoencoder for Through 새글 김준희 2025.10.15 0 39
803 데이터 증강을 활용한 전이 학습 기반 RT 용접 결함 분류 성능 개선 새글 강명현 2025.10.15 0 59
802 RAG와 CoT 프롬프팅을 활용한 중소형 LLM의 한국어 수학추론 성능 향상 기법: 최적 새글 조아라 2025.10.15 0 47