분류
2021년 2월
작성일
2020.10.14
수정일
2020.10.14
작성자
고우람
조회수
50

학습 기반 알고리즘을 이용한 만화 식자 작업 자동화

제목

학습 기반 알고리즘을 이용한 만화 식자 작업 자동화

 

요약

  만화는 매우 보편적인(popular) 매체로, 다양한 언어로 번역되어 출간되고 있다. 만화의 번역 과정은 일반 도서류와 달리 각 나라말로 기록된 비정형적인 스크립트를 자국 언어로 번역하는 “텍스트 번역 작업”과 외국 만화의 텍스트를 지우고 번역된 텍스트를 자연스럽게 삽입하는 “식자 작업”으로 나누어진다. 이 과정에서 식자 작업은 번역된 만화의 품질과 번역의 비용을 결정하는 가장 중요한 과정이다. 그러나 만화 이미지의 복잡성으로 인해 식자 작업은 수작업으로 진행되고 있으며 많은 노동력과 시간이 투여되고 있다. 이 논문은 컴퓨터 시스템을 이용하여 만화 식자 작업의 비용을 줄이는 방법에 대해 설명한다.

  식자 작업은 크게 “원본 텍스트 제거 과정”과 “번역 텍스트 삽입 과정”으로 나누어진다. 텍스트 제거 과정 자동화를 달성하기 위하여 두 단계의 접근 방법을 제시하였다. 먼저 이미지 분할(image segmentation) 기술을 적용하여 만화 이미지에서 글자 영역을 분할한다. 분할된 영역의 글자를 제거한 뒤, 이미지 복원(image inpainting) 기술을 통해 지워진 영역을 자연스럽게 복원한다. 두 과정을 위해 만화에서 데이터 셋을 구성하였으며 충분한 성능을 이끌어내기 위해 심층 학습 모델을 적용하였다. 실험 결과를 통해 어떤 데이터와 모델이 만화 텍스트 제거 작업에 가장 효율적인지 보였다.

  번역 텍스트 삽입 과정은 텍스트를 지운 만화 이미지에 번역된 텍스트를 삽입하는 과정이다. 삽입되는 텍스트는 원본 만화의 텍스트와 스타일(크기, 방향, 색, 효과)이 비슷하고 일관성이 있어야 한다. 일관된 텍스트 스타일은 만화 번역의 품질을 좌우하는 중요한 특징임에도 불구하고, 일반적으로 식자 작업자의 심미안과 직관에 의존하여 결정되었다. 또한 텍스트를 다양한 스타일로 삽입하는 과정은 지루한 반복 작업을 필요로 한다. 이를 완화하기 위해 원본 이미지의 텍스트와 이미지 분할 과정에서 생성된 텍스트 마스크를 분석하여 번역 텍스트의 스타일을 추천하는 과정을 제시한다. 추천 결과의 성능 평가를 위해 만화 이미지로부터 데이터셋을 구성했으며 다양한 알고리즘을 적용하고 비교해 보았다.

  끝으로 본 논문에서 제시한 만화 텍스트 분할, 이미지 복원 연구 결과를 이용하는 새로운 응용 분야를 제시한다. 핵심적인 응용인 만화 식자 작업 자동화 뿐 아니라 정적 만화의 세미(semi) 애니메이션, 만화 텍스트 추출 시스템에 대해 추가 설명한다.

학위연월
2021년 2월
지도교수
조환규
키워드
만화 일러스트 번역, 심층 학습, 이미지 편집 시스템
소개 웹페이지
http://galab-work.cs.pusan.ac.kr/kur/
첨부파일
첨부파일이(가) 없습니다.
다음글
장입 제약을 고려한 배치형 열처리 공정 작업계획 최적화
최정훈 2020-10-14 14:57:25.133
이전글
API 서열 분석을 통한 .NET 난독화 도구 자동 식별
허태광 2020-10-14 14:55:11.137
RSS 2.0 788
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
788 RAG-sLLM 기반 계약 리스크 자동 분석 프레임워크 제안 : 조선업을 중심으로 윤시록 2025.04.07 0 176
787 가상 에이전트의 지배적 행동이 사용자의 의사 결정 및 지각에 미치는 영향 연구 김태연 2025.04.07 0 115
786 스마트폰 이미지 기반 Visual Localization과 3D 모델을 사용한 수위 추정 노태윤 2025.04.07 0 121
785 Lightweight Time Series Forecasting with LLMs: Le 코난 루스 엠마누엘레 비투아 2025.04.04 0 138
784 블록체인과 CMAC 검증을 통한 전기차 배터리 관리 시스템의 데이터 신뢰성 확보 방안 설계 김재현 2025.04.04 0 88
783 Optimizing User Pairing and Power Allocation for O 아라빈 바라라만 2025.04.04 0 85
782 Deep Learning-Assisted Microservice Deployment Str 뉴그로호 아빌리아 쿠수마푸테리 2025.04.03 0 122
781 GVMambaIR: Graph Vision Mamba for Image Restoratio 리엔 홍키 2025.04.03 0 81
780 드론을 활용한 실시간 원격 흘수 정밀 계측 프레임워크 박찬일 2025.04.02 0 86
779 Mamba-Attention Surface Analysis for Brain Develop 짠시닷 2025.04.02 0 101
778 Multi-Query Retrieval Augmented Generation (RAG) f 리잘디 파흐미 2025.04.02 0 102
777 BLSM-Tree: 블록체인 데이터의 효율적인 범위 탐색을 위한 인덱스 구조 이병영 2025.04.02 0 85
776 전이학습을 통한 사전 학습된 오디오 뉴럴 넷 기반 효과음 분류 및 자동 자막 생성 시스템 정혜윤 2025.04.01 0 103
775 Federated Domain Generalization with On-Server Gra 응우옌쫑빈 2025.04.01 0 122
774 Virtual Screening in a Large Compound Library with 배종현 2025.04.01 0 92
773 텍스트 종속 화자 검증을 위한 경량 딥러닝 모델의 설계 및 구현 신채림 2025.03.31 0 133
772 실내 NLOS 환경에서 RTLS 정확도 향상을 위한 편향 및 편차 맵 기반 가중 그래프 탐 안현기 2024.10.18 0 162
771 비정형 환경 아크 센싱 개선을 위한 중간값 기반 데이터 클러스터링 활용 기법 김희준 2024.10.17 2 153
770 그래프 구조 기반 K-Means를 사용한 간선 방문 지향 MCPP 이해성 2024.10.15 0 184
769 트랜스포머 기반의 폐암 슬라이드 이미지 자동분할에 대한 연구 이리나 2024.10.14 0 137