요약
만화는 전 세계적으로 유명한 예술 형식으로, 다양한 국가의 만화가 다양한 언어로 번역되어 출간되고 있다. 만화 번역 과정은 외국 만화의 모든 텍스트를 자국 언어로 번역하는 “텍스트 번역 작업”과 외국 만화의 텍스트를 지우고 번역된 텍스트를 자연스럽게 삽입하는 “식자 작업”으로 나누어진다. 식자 작업은 번역된 만화의 품질과 번역의 비용을 결정하는 가장 중요한 과정이나, 만화 이미지의 복잡성으로 인해 수작업으로 진행되고 있으며 많은 노동력과 시간을 필요로 한다. 식자 작업은 크게 “원본 텍스트 제거 과정”과 “번역 텍스트 삽입 과정”으로 나누어진다. 본 논문에서는 원본 텍스트 제거 과정을 자동화하기 위해 두 단계의 접근 방법을 제안한다. 이미지 분할(image segmentation) 모델을 적용하여 만화에서 글자 영역을 픽셀 수준으로 분할한다. 분할된 영역의 글자를 제거한 뒤, 이미지 복원(image inpainting) 모델을 통해 지워진 영역을 자연스럽게 복원한다. 두 모델 모두 심층 학습 알고리즘을 적용하여 학습했으며, 모델 학습과 평가를 위해 데이터셋을 구성하는 방법을 제시하였다. 실험 결과를 통해 어떤 심층 학습 모델이 만화 텍스트 제거 작업에 가장 효율적인지 밝혀내었으며, 모델에 대한 정량적, 정성적 실험 결과를 제시하였다.