분류
2025년 8월
작성일
2025.03.31
수정일
2025.03.31
작성자
신채림
조회수
294

텍스트 종속 화자 검증을 위한 경량 딥러닝 모델의 설계 및 구현

화자 검증(Speaker Verification, SV)는 입력된 음성 발화와 사전에 등록된 화자의 음성 특징을 비교하여 신원을 검증하는 기술로, 텍스트 독립 방식(Text Independent SV, TI-SV)과 텍스트 종속 방식(Text Dependent SV, TD-SV)으로 구분된다.

TI-SV는 발화 내용에 제약이 없다는 장점이 있으나, 다양한 음운적 변이로 인해 정확한 식별이 어렵고, 짧은 발화 환경에서는 성능 저하가 발생하는 한계를 가진다. 

이에 반해 TD-SV는 제한된 음소 구조를 기반으로 하여 짧은 발화에서도 높은 성능을 보이며, 발화 내용과 화자 정보를 동시에 활용할 수 있어 인증의 신뢰성을 높일 수 있다.

그러나 실제 응용 환경에서는 등록(Enrollment)과 테스트(Test) 과정 간의 녹음 거리, 채널, 잡음 등 도메인 불일치 문제가 발생하기 쉽고, 이는 전체 시스템 성능 저하로 이어질 수 있다.

 

본 연구에서는 이러한 환경적 불일치에 강건하면서도 짧은 발화 기반으로 고신뢰 음성 인증이 가능한 TD-SV 시스템을 설계하고, 이를 위해 트랜스포머 기반 딥러닝 모델 및 다양한 최적화 기법을 통합하여 제안한다.

학위연월
2025년 8월
지도교수
백윤주 교수님
키워드
Text-Dependent Speaker Verification, AI, Lightweight, Speaker Recognition
소개 웹페이지
https://github.com/chwaelms/Text-Dependent-Speaker-Verification/tree/main
첨부파일
첨부파일이(가) 없습니다.
다음글
Virtual Screening in a Large Compound Library with Hash-Guided Sampling and Rank-Based Learning
배종현 2025-04-01 13:16:09.237
이전글
실내 NLOS 환경에서 RTLS 정확도 향상을 위한 편향 및 편차 맵 기반 가중 그래프 탐색 알고리즘
안현기 2024-10-18 10:49:28.83
RSS 2.0 823
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
823 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 조대영 2025.12.15 0 142
822 Interpretable Cancer Risk Prediction with a Knowle 박한얼 2025.12.11 0 86
821 스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing 도건우 2025.10.23 0 128
820 Learning a Differentiable Multi-Branch Decision Tr 박한얼 2025.10.21 0 240
819 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 윤건우 2025.10.19 0 134
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 조수현 2025.10.17 0 103
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 김정호 2025.10.17 0 123
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 곽도균 2025.10.17 0 119
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 박현수 2025.10.17 0 136
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 김민성 2025.10.17 0 98
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 구동한 2025.10.17 0 137
812 VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연 은승우 2025.10.17 0 133
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 정해원 2025.10.17 0 177
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 박재현 2025.10.17 0 167
809 Autonomous Driving Agent Identification Under Host 도현철 2025.10.17 0 111
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 박동진 2025.10.17 0 111
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 전민수 2025.10.16 0 108
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 강은세 2025.10.15 0 242
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 허석용 2025.10.15 0 133
804 Long-Axis Guided Diffusion Autoencoder for Through 김준희 2025.10.15 0 113