인공지능 기술의 발전과 함께 의학 분야에도 인공지능을 활용한 연구가 다양하게 진행되고 있다. 그 중에서 컴퓨터 비전과 딥러닝을 활용하여 의료 영상을 분석하는 연구가 활발하게 이루어지고 있으며, 의료 영상 중 병리학 이미지에 대한 연구가 많이 이루어지고 있다. 병리학 이미지는 각종 암 진단 및 예후 평가에 있어 매우 중요한 자료이다. 관련 연구로는 세포 이미지에서 암 관련 영역인 상피, 림프구, 대식세포 등을 세분화 및 분류하는 HoverNet[1], 배율이 다른 병리 이미지의 특징을 adaptive하게 사용하여 여러 암 하위 유형 영역을 분할한 AWMF-CNN[2]이 있었다. 본 연구에서는 최신 컴퓨터 비전 기술인 비전 트랜스포머(Vision Transformer) 기반의 모델을 사용하여 병리학 이미지에서의 암 영역을 판단하고 분할하는 최적의 트랜스포머 모델 구조를 찾기 위해 다양한 개선 실험을 진행하는 연구를 진행하였다.