분류
2026년 2월
작성일
2025.10.17
수정일
2025.10.17
작성자
최성기
조회수
7

최적성 이론을 활용한 강건한 한국어 통합 G2P 프레임워크 설계 및 분석

[제목] 

최적성 이론을 활용한 강건한 한국어 통합 G2P 프레임워크 설계 및 분석


[요약]

한국어는 복잡한 음운 변동 규칙과 문맥 의존적 발음 현상으로 인해 문자-발음 변환(Grapheme-to-Phoneme, G2P)이 어려운 언어이다. 특히 실세계 텍스트는 한글, 숫자, 영어, 특수기호 등이 혼재된 code-mixing 환경이지만, 기존 연구들은 대부분 순수 한글 중심의 제한된 환경에서 수행되었으며, 규칙 기반 방법론의 유지보수 한계와 딥러닝 방법론의 해석 가능성 부족이라는 문제를 안고 있었다. 본 연구는 실세계 환경에서 강건하게 작동하는 한국어 문장 단위 통합 G2P 프레임워크를 제안한다.

제안 시스템은 비한글 전처리 모듈과 한국어 발음 생성 모듈을 단일 파이프라인으로 통합하여 code-mixed 텍스트를 일관되게 처리한다. 발음 생성 모듈은 koCharELECTRA 기반 Non-Autoregressive(NAR) Transformer 구조를 사용하며, Positional Attention 메커니즘을 통해 한국어의 위치 의존적 음운 변동을 효과적으로 모델링한다. 또한 최적성 이론(Optimality Theory)을 적용하여 딥러닝 모델의 출력을 해석하고, 한국어 표준 발음법에 기반한 명시적 음운 제약을 통해 발음 후보를 재순위화함으로써 데이터 기반 학습과 언어학적 지식을 결합한다.

실제 AI 스피커 발화 데이터를 사용한 실험에서 제안 시스템은 기존 방법들과 비교하여 경쟁력 있는 성능을 보였으며, 특히 code-mixing 환경에서 안정적인 처리 능력을 확인했다. NAR 기반 접근법을 통해 AR 모델 대비 빠른 처리 속도를 달성하여 실시간 TTS 적용 가능성을 확보했다. 본 연구는 실세계 복잡성을 반영한 한국어 G2P 평가 환경을 제시하고, 음운론 이론과 딥러닝 기술의 결합 가능성을 탐구한다.

학위연월
2026년2월
지도교수
권혁철
키워드
한국어 발음열 생성, 자연어처리, 자기회귀 모델, 심층학습, 인공지능, Grapheme-to-Phoneme, Korean G2P, Code-mixing, Optimality Theory, Non-Autoregressive Model, Text-to-Speech
소개 웹페이지
https://sites.google.com/view/ai-nlp-g2p/%ED%99%88
첨부파일
첨부파일이(가) 없습니다.
다음글
다음글이(가) 없습니다.
이전글
고속 컨베이어 환경에서의 생산 공정물 결함 검출을 위한 AI 비전 시스템
김형건 2025-10-17 13:46:29.627
RSS 2.0 138
게시물 검색
박사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
138 최적성 이론을 활용한 강건한 한국어 통합 G2P 프레임워크 설계 및 분석 새글 최성기 2025.10.17 0 7
137 고속 컨베이어 환경에서의 생산 공정물 결함 검출을 위한 AI 비전 시스템 새글 김형건 2025.10.17 0 15
136 Toward Reliable and Scalable Multi-Cell LoRaWAN Ne 새글 호앙 꾸옥 홍 낫 2025.10.16 0 12
135 Differentially Private Data-Centric Mechanism for 우타리예바 아쎔 2025.10.10 0 38
134 Adaptive Penalty Optimization and Scalable Quantum 정선근 2025.10.02 0 48
133 Comparative Complexity of Neuropeptide and Recepto 류승희 2025.10.01 0 54
132 확산 모델 기반 필기 이미지 생성에 관한 연구 홍동진 2025.04.10 0 141
131 연합학습 기반 그래프 신경망을 활용한 전기차 충전소 최적 선택 기법 류준우 2025.04.09 0 122
130 Exploring Quantum Approach Applied to Cryptanalysi 와다니 리니 위스누 2025.04.08 0 155
129 Towards computation - communication efficient and 응우옌 민 두옹 2025.04.08 0 110
128 Hybrid Quantum Residual Neural Networks for Classi 노대일 2025.04.08 0 134
127 Distributed Resource Management for Massive IoT Ne 응우옌 쑤언 둥 2025.04.08 0 97
126 A Framework for Leveraging Large Language Models i 데리 프라타마 2025.04.07 0 141
125 Discovery and Authentication of Marker Genes Using 프라타마 리안 다니스 아디 2025.04.07 0 155
124 산업 환경의 IEEE 802.15.4 TSCH 기반 네트워크에서 트래픽 처리량 향상을 위한 이희준 2025.04.07 0 130
123 Uncertainty-Based Hybrid Deep Learning Approach fo 멘가라 악셀 기드온 2024.12.10 0 163
122 Effective Deep Learning Primitives Design for Bina 황선진 2024.10.14 0 164
121 Toward Immersive Multiview Video Streaming through 탄중 디온 2024.10.14 0 128
120 A Low-cost Deep Learning Model for Real-time Low L 등 제강 2024.10.10 0 184
119 Enhancing Nested Entity Recognition Using Nested R 양홍진 2024.10.09 0 147