분류
2022년 2월
작성일
2021.10.14
수정일
2021.12.17
작성자
최영원
조회수
59

이미지 분류 모델 테스트를 위한 효과적인 데이터 선정 방법

요약 

 

심층 신경망의 성능이 향상됨에 따라 여러 분야에서 심층 신경망을 활용한다. 그러나 이미지 분류 모델의 경우 적대적 공격 기법에 취약함이 발견되었고, 자율 주행을 비롯한 안전 필수 시스템에서 활용되는 이미지 분류 모델이 결함을 발생하는 경우 인적/금전적 손실이 발생할 수 있다. 이에 이미지 분류 모델의 테스트를 위하여 테스트 데이터 생성 방법과 방어 기법 등이 연구되었다.

기존 이미지 분류 모델 테스트에서는 적대적 공격 기법과 데이터 증강 기법 등 데이터 변형 기법들을 활용하여 테스트 데이터를 생성하였다. 그러나 무분별한 데이터 변형으로 인해 이미지 분류 모델 테스트에 적합하지 않은 데이터가 생성될 수 있다. 그러므로 변형된 테스트 데이터 중 이미지 분류 모델 테스트에 효과적인 테스트 데이터를 선정할 기준이 필요하다.

본 연구에서는 피처 맵 기반으로 이미지 분류 모델 테스트에 효과적인 데이터를 선정하는 방법을 제안하였다. 이미지 분류 모델의 추론 결과는 입력 데이터에 대한 모델의 뉴런 활성화 값에 영향을 받으며, 뉴런 활성화 값은 모델의 레이어별로 피처 맵 형태로 출력할 수 있다. 학습 데이터의 피처 맵과 테스트 데이터의 피처 맵 간의 뉴런 활성화 값 차이를 측정 방법으로 피처 맵 거리를 정의하였다. 테스트 데이터의 피처 맵 거리를 기반으로 FMD 기준치를 선정하였다. FMD 기준치보다 더 큰 피처 맵 거리를 가지는 테스트 데이터들을 FMD 테스트 데이터로 선정한다.

사례 연구로 STL10 데이터 셋과 ResNet-20 모델에 대하여 실험을 진행하였다. STL1010개 레이블 중 6개 레이블에서 피처 맵 거리가 클수록 정확도가 감소하여 음의 상관관계를 가짐을 확인하였다. 원본 테스트 데이터 중 오분류 테스트 데이터의 평균 피처 맵 거리를 FMD 테스트 데이터 기준 피처 맵 거리로 선정하였다. 데이터 증강 기법이 적용된 테스트 데이터 셋 20개에 대하여 FMD 테스트 데이터를 선정하였고 기존 테스트 데이터 셋과 FMD 데이터 셋의 테스트 효과성을 비교하여 FMD 테스트 데이터의 테스트 효과성이 평균적으로 더 크게 측정됨을 확인하였다

학위연월
2022년 2월
지도교수
채흥석
키워드
DNN, Test, Neuron Activation Value, Feature Map, Image Classification
소개 웹페이지
https://sites.google.com/pusan.ac.kr/effectivedataselection/
첨부파일
첨부파일이(가) 없습니다.
다음글
Predicting Ship Collision Detection Using Predicted Trajectories of TPR Trees
세티아완 하리 2021-10-14 15:59:17.14
이전글
Recipe Analysis Model for Evaluation of Difficulty by Using Graph Neural Network
이브라힘 아이트카진 2021-10-14 15:09:38.01
RSS 2.0 749
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
749 코딩 스타일 교육을 위한 자동 채점 시스템 개선 김영훈 2024.04.11 0 30
748 High-Precision Vehicle Trajectory Prediction using 김민성 2024.04.04 0 42
747 LLM 모델을 활용한 한국어 맞춤법 교정 성능 최적화 방안 연구 정주경 2024.04.04 0 47
746 블록체인 기반 항만 특화 통합 보안 관제 솔루션 오경우 2024.04.04 0 38
745 포인트 클라우드 Semantic 필터링 기반 3차원 객체 탐지 연구 정민규 2024.04.04 0 39
744 지식증류 기반의 경량 3차원 거리 추정 기법 연구 김장현 2024.04.04 0 41
743 Context-Aware Dynamic Detection for Ransomware us 프라티위 밀라티 2024.04.04 0 40
742 자기공명영상 기반 심장 영역 분할 및 질병 진단을 위한 자동화 프레임워크 개발 김민수 2024.04.04 0 29
741 경량화된 실시간 발화자 탐지 모델 정성헌 2024.04.04 0 42
740 Warehouse 물류 로봇을 위한 Visual SLAM 알고리즘 구현과 성능 실험 강민재 2024.04.04 0 31
739 Secure Implementation of End-to-End IoT Communicat 락스모노 아구스 마하르디카 아리 2024.04.04 0 39
738 전자건강기록 (EHR) 데이터와 심전도 (ECG) 데이터를 활용한 관상동맥 질환 환자의 사 강동길 2024.04.04 0 38
737 Comparative Analysis of Cross-Platform and Native 이브로키모브 사도르벡 2024.04.04 0 34
736 RAG 기반 대규모 언어 모델 할루시네이션 억제 효과 분석 및 챗봇 시스템 구현 방안 신영재 2024.04.04 0 49
735 도메인 특화 대화형 모델에서의 파인튜닝 및 RAG 기법에 따른 답변 품질 비교 연구 김보금 2024.04.04 0 41
734 PQC, LLM을 활용한 항만 보안 위협 대응 블록체인 서비스 설계 정한호 2024.04.04 0 37
733 발전소 점검 데이터 분석을 위한 LLM 기반 정보 추출 및 시계열 데이터 분석 프레임워크 심혜진 2024.04.04 0 52
732 확장성 및 익명성 보장을 고려한 온체인 및 디파이(Defi) 활동 데이터 기반 신용평가 모 오시몬 2024.04.04 0 37
731 증강현실에서 가상 물체와 실제 물체의 상호작용에 발생하는 latency 분석 및 개선 방안 엄지훈 2024.04.03 0 52
730 Node Density Clustering for Cell Allocation Enhanc 케빈 프란시스쿠스 자베리우스 2024.04.03 0 51