요약
심층 신경망의 성능이 향상됨에 따라 여러 분야에서 심층 신경망을 활용한다. 그러나 이미지 분류 모델의 경우 적대적 공격 기법에 취약함이 발견되었고, 자율 주행을 비롯한 안전 필수 시스템에서 활용되는 이미지 분류 모델이 결함을 발생하는 경우 인적/금전적 손실이 발생할 수 있다. 이에 이미지 분류 모델의 테스트를 위하여 테스트 데이터 생성 방법과 방어 기법 등이 연구되었다.
기존 이미지 분류 모델 테스트에서는 적대적 공격 기법과 데이터 증강 기법 등 데이터 변형 기법들을 활용하여 테스트 데이터를 생성하였다. 그러나 무분별한 데이터 변형으로 인해 이미지 분류 모델 테스트에 적합하지 않은 데이터가 생성될 수 있다. 그러므로 변형된 테스트 데이터 중 이미지 분류 모델 테스트에 효과적인 테스트 데이터를 선정할 기준이 필요하다.
본 연구에서는 피처 맵 기반으로 이미지 분류 모델 테스트에 효과적인 데이터를 선정하는 방법을 제안하였다. 이미지 분류 모델의 추론 결과는 입력 데이터에 대한 모델의 뉴런 활성화 값에 영향을 받으며, 뉴런 활성화 값은 모델의 레이어별로 피처 맵 형태로 출력할 수 있다. 학습 데이터의 피처 맵과 테스트 데이터의 피처 맵 간의 뉴런 활성화 값 차이를 측정 방법으로 피처 맵 거리를 정의하였다. 테스트 데이터의 피처 맵 거리를 기반으로 FMD 기준치를 선정하였다. FMD 기준치보다 더 큰 피처 맵 거리를 가지는 테스트 데이터들을 FMD 테스트 데이터로 선정한다.
사례 연구로 STL10 데이터 셋과 ResNet-20 모델에 대하여 실험을 진행하였다. STL10의 10개 레이블 중 6개 레이블에서 피처 맵 거리가 클수록 정확도가 감소하여 음의 상관관계를 가짐을 확인하였다. 원본 테스트 데이터 중 오분류 테스트 데이터의 평균 피처 맵 거리를 FMD 테스트 데이터 기준 피처 맵 거리로 선정하였다. 데이터 증강 기법이 적용된 테스트 데이터 셋 20개에 대하여 FMD 테스트 데이터를 선정하였고 기존 테스트 데이터 셋과 FMD 데이터 셋의 테스트 효과성을 비교하여 FMD 테스트 데이터의 테스트 효과성이 평균적으로 더 크게 측정됨을 확인하였다.