부산대학교

분류: 2022년 2월

작성일: 2021.10.14

수정일: 2021.12.17

작성자: 최영원

조회수: 67

이미지 분류 모델 테스트를 위한 효과적인 데이터 선정 방법

요약

심층 신경망의 성능이 향상됨에 따라 여러 분야에서 심층 신경망을 활용한다. 그러나 이미지 분류 모델의 경우 적대적 공격 기법에 취약함이 발견되었고, 자율 주행을 비롯한 안전 필수 시스템에서 활용되는 이미지 분류 모델이 결함을 발생하는 경우 인적/금전적 손실이 발생할 수 있다. 이에 이미지 분류 모델의 테스트를 위하여 테스트 데이터 생성 방법과 방어 기법 등이 연구되었다.

기존 이미지 분류 모델 테스트에서는 적대적 공격 기법과 데이터 증강 기법 등 데이터 변형 기법들을 활용하여 테스트 데이터를 생성하였다. 그러나 무분별한 데이터 변형으로 인해 이미지 분류 모델 테스트에 적합하지 않은 데이터가 생성될 수 있다. 그러므로 변형된 테스트 데이터 중 이미지 분류 모델 테스트에 효과적인 테스트 데이터를 선정할 기준이 필요하다.

본 연구에서는 피처 맵 기반으로 이미지 분류 모델 테스트에 효과적인 데이터를 선정하는 방법을 제안하였다. 이미지 분류 모델의 추론 결과는 입력 데이터에 대한 모델의 뉴런 활성화 값에 영향을 받으며, 뉴런 활성화 값은 모델의 레이어별로 피처 맵 형태로 출력할 수 있다. 학습 데이터의 피처 맵과 테스트 데이터의 피처 맵 간의 뉴런 활성화 값 차이를 측정 방법으로 피처 맵 거리를 정의하였다. 테스트 데이터의 피처 맵 거리를 기반으로 FMD 기준치를 선정하였다. FMD 기준치보다 더 큰 피처 맵 거리를 가지는 테스트 데이터들을 FMD 테스트 데이터로 선정한다.

사례 연구로 STL10 데이터 셋과 ResNet-20 모델에 대하여 실험을 진행하였다. STL10의 10개 레이블 중 6개 레이블에서 피처 맵 거리가 클수록 정확도가 감소하여 음의 상관관계를 가짐을 확인하였다. 원본 테스트 데이터 중 오분류 테스트 데이터의 평균 피처 맵 거리를 FMD 테스트 데이터 기준 피처 맵 거리로 선정하였다. 데이터 증강 기법이 적용된 테스트 데이터 셋 20개에 대하여 FMD 테스트 데이터를 선정하였고 기존 테스트 데이터 셋과 FMD 데이터 셋의 테스트 효과성을 비교하여 FMD 테스트 데이터의 테스트 효과성이 평균적으로 더 크게 측정됨을 확인하였다.

학위연월: 2022년 2월

지도교수: 채흥석

키워드: DNN, Test, Neuron Activation Value, Feature Map, Image Classification

소개 웹페이지: https://sites.google.com/pusan.ac.kr/effectivedataselection/

첨부파일: 첨부파일이(가) 없습니다.

다음글: Predicting Ship Collision Detection Using Predicted Trajectories of TPR Trees
세티아완 하리 2021-10-14 15:59:17.14

이전글: Recipe Analysis Model for Evaluation of Difficulty by Using Graph Neural Network
이브라힘 아이트카진 2021-10-14 15:09:38.01

번호	제목	작성자	작성일	조회수
823	RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법	조대영	2025.12.15	140
822	Interpretable Cancer Risk Prediction with a Knowle	박한얼	2025.12.11	83
821	스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing	도건우	2025.10.23	128
820	Learning a Differentiable Multi-Branch Decision Tr	박한얼	2025.10.21	238
819	분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링	윤건우	2025.10.19	129
818	전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI	조수현	2025.10.17	102
817	멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터	김정호	2025.10.17	122
816	레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현	곽도균	2025.10.17	118
815	메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법	박현수	2025.10.17	133
814	가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구	김민성	2025.10.17	95
813	이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현	구동한	2025.10.17	135
812	VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연	은승우	2025.10.17	129
811	실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템	정해원	2025.10.17	171
810	지식 그래프 기반의 LLM 수학 추론 성능 향상 기법	박재현	2025.10.17	165
809	Autonomous Driving Agent Identification Under Host	도현철	2025.10.17	109
808	드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적	박동진	2025.10.17	109
807	시공간 정보 토큰을 활용한 3D Human Pose Estimation	전민수	2025.10.16	106
806	격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증	강은세	2025.10.15	239
805	배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구	허석용	2025.10.15	132
804	Long-Axis Guided Diffusion Autoencoder for Through	김준희	2025.10.15	110

이미지 분류 모델 테스트를 위한 효과적인 데이터 선정 방법

분류

게시글 리스트