분류
2021년 2월
작성일
2020.10.14
수정일
2020.12.21
작성자
박태우
조회수
78

기계학습 기반 적대적 예제의 다중 레이블 분류 기법

제목

기계학습 기반 적대적 예제의 다중 레이블 분류 기법

 

요약

인공지능 분야에서 심층신경망(DNN, Deep Neural Network)은 최근 몇 년 동안 다양한 작업에서 매우 발전하였고 성능이 우수하여 널리 사용되고 있다. 하지만 심층신경망은 잡음(Noise)이나 적대적 섭동(Adversarial Perturbation)에 취약하다. 심층신경망을 속이기 위해, 데이터에 적대적 섭동을 명시적으로 생성하는 방법을 적대적 공격(Adversarial Attack)이라고 한다. 이를 통해 생성되는 적대적 공격의 산출물을 적대적 예제(Adversarial Example)라고 한다. 적대적 예제는 심층신경망을 기만하여 심층신경망이 잘못된 예측을 출력하도록 야기한다. 적대적 예제를 탐지하기 위한 이전 연구들은 주어진 데이터가 적대적 예제일 확률을 계산하여 데이터를 합법적 예제와 적대적 예제 중 하나로 이진 분류할 수 있다. 하지만 주어진 적대적 예제에 대해 적대적 공격 유형을 분류할 수 있는 방법은 현재까지 연구되지 않고 있다. 따라서 본 논문에서는 기계학습 기반으로 다중 레이블을 가지는 적대적 예제에 대해 적대적 공격 유형을 분류하는 방법을 제안한다. 제안하는 방법은 적대적 예제와 이에 대응하는 합법적 예제를 보유하고 있을 경우(화이트박스 방어 모델)뿐만 아니라 합법적 예제를 갖고 있지 않을 경우(블랙박스 방어 모델)에도 동작이 가능하도록 설계되었다. 그리고 제안하는 방법은 새로운 유형의 적대적 공격에 대한 적대적 예제를 기존의 학습 데이터세트에 포함하여 재학습한다면 새로운 유형의 적대적 공격도 분류할 수 있다. 제안하는 방법의 유효성을 평가하기 위해, 실험에서 각 MNIST, CIFAR-10 데이터세트로 학습된 각각의 심층신경망을 사용하였다. 제안하는 방법은 MNIST 데이터세트로 학습시킨 심층신경망을 대상으로 한 실험에서 높은 적대적 공격 군집 성능을 보였다. 반면 CIFAR-10 데이터세트로 학습시킨 심층신경망을 대상으로 한 실험에서 블랙박스 방어 모델을 사용할 경우 적대적 공격 군집 성능의 한계가 있었다. 하지만 적대적 공격의 유형 개수를 줄여서 CIFAR-10에 대해 블랙박스 방어 모델을 학습시킬 경우, 높은 군집 성능으로 FGSM 기반의 적대적 공격(FGSM, BIM, PGD)과 FGSM 기반이 아닌 적대적 공격(DeepFool, C&W)을 분류할 수 있었다.

학위연월
2021년 2월
지도교수
최윤호
키워드
적대적 예제, 적대적 탐지, 적대적 예제 분류, 적대적 공격 분류, 기계학습, 클러스터링, 차원 감축, 잡음 제거
소개 웹페이지
https://sites.google.com/view/bak2020master
첨부파일
첨부파일이(가) 없습니다.
다음글
이미지 Localization과 딥러닝 분류 기법을 활용한 스마트 컨트랙트 재진입 공격 취약점 위치 탐지 방법
황선진 2020-10-14 20:32:41.94
이전글
스마트시티 플랫폼을 위한 블록체인 기반 접근제어 시스템
이상현 2020-10-14 17:12:50.57
RSS 2.0 823
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
823 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 조대영 2025.12.15 0 123
822 Interpretable Cancer Risk Prediction with a Knowle 박한얼 2025.12.11 0 71
821 스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing 도건우 2025.10.23 0 123
820 Learning a Differentiable Multi-Branch Decision Tr 박한얼 2025.10.21 0 225
819 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 윤건우 2025.10.19 0 113
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 조수현 2025.10.17 0 95
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 김정호 2025.10.17 0 111
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 곽도균 2025.10.17 0 113
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 박현수 2025.10.17 0 124
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 김민성 2025.10.17 0 90
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 구동한 2025.10.17 0 126
812 VR에서 제자리걸음 동안 주변 시야의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연구 은승우 2025.10.17 0 117
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 정해원 2025.10.17 0 158
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 박재현 2025.10.17 0 148
809 Autonomous Driving Agent Identification Under Host 도현철 2025.10.17 0 101
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 박동진 2025.10.17 0 102
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 전민수 2025.10.16 0 101
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 강은세 2025.10.15 0 195
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 허석용 2025.10.15 0 127
804 Long-Axis Guided Diffusion Autoencoder for Through 김준희 2025.10.15 0 102