분류
2024년 8월
작성일
2023.10.12
수정일
2024.04.04
작성자
김혜린
조회수
160

한국어 언어 지식을 활용한 Attention Supervision 기반 사전학습 언어모형

1) 논문제목: 한국어 언어 지식을 활용한 Attention Supervision 기반 사전학습 언어모형


2) 논문요약: 사전학습 언어모형은 자연어처리 분야에서 효과적으로 사용하는 모형이다. 셀프 어텐션이라는 메커니즘을 통해 문장 내 문맥을 보다 정확하게 파악하여 의미를 이해하고 해석가능하다. 언어모형은 사전학습 과정을 통하여 학습하는 언어에 대한 기반 지식을 습득하게 되는데, 이때 그 언어에 대한 지식을 추가적으로 넣어준다면 모형의 언어 이해도가 상승하게 될 수 있다.

본 논문에서는 사전학습 언어모형에 한국어 지식을 주입하기 위해 한국어 정보를 알 수 있는 형태소 기반 규칙을 제작하여 학습에 사용한다. 이를 통해 모델이 셀프 어텐션을 업데이트할 때, 형태소 규칙을 따라 업데이트되며 한국어 문장을 보다 효과적으로 이해할 수 있게 된다. 이를 각 태스크마다 미세조정하여 평가했을 때, 기존 사전학습 언어모형보다 형태소 규칙을 적용한 언어모형에서 더 좋은 성능을 확인할 수 있다.

학위연월
2024.02
지도교수
권혁철
키워드
자연어처리, 사전학습 언어모델, 형태소
소개 웹페이지
https://github.com/HyeLynnKIM/Attention-Supervision-Based-Pre-training-Language-Model-Using-Korean-Language-Knowledge
첨부파일
첨부파일이(가) 없습니다.
다음글
테스트 효율성 개선을 위한 피처 맵 거리 기반 테스트 데이터 선정 방법
심건우 2023-10-12 14:37:35.83
이전글
웹어셈블리의 선형메모리 내 메타데이터 보호를 위한 연구
송수현 2023-10-12 13:31:07.383
RSS 2.0 749
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
749 코딩 스타일 교육을 위한 자동 채점 시스템 개선 김영훈 2024.04.11 0 34
748 High-Precision Vehicle Trajectory Prediction using 김민성 2024.04.04 0 43
747 LLM 모델을 활용한 한국어 맞춤법 교정 성능 최적화 방안 연구 정주경 2024.04.04 0 51
746 블록체인 기반 항만 특화 통합 보안 관제 솔루션 오경우 2024.04.04 0 39
745 포인트 클라우드 Semantic 필터링 기반 3차원 객체 탐지 연구 정민규 2024.04.04 0 41
744 지식증류 기반의 경량 3차원 거리 추정 기법 연구 김장현 2024.04.04 0 42
743 Context-Aware Dynamic Detection for Ransomware us 프라티위 밀라티 2024.04.04 0 40
742 자기공명영상 기반 심장 영역 분할 및 질병 진단을 위한 자동화 프레임워크 개발 김민수 2024.04.04 0 30
741 경량화된 실시간 발화자 탐지 모델 정성헌 2024.04.04 0 43
740 Warehouse 물류 로봇을 위한 Visual SLAM 알고리즘 구현과 성능 실험 강민재 2024.04.04 0 31
739 Secure Implementation of End-to-End IoT Communicat 락스모노 아구스 마하르디카 아리 2024.04.04 0 39
738 전자건강기록 (EHR) 데이터와 심전도 (ECG) 데이터를 활용한 관상동맥 질환 환자의 사 강동길 2024.04.04 0 40
737 Comparative Analysis of Cross-Platform and Native 이브로키모브 사도르벡 2024.04.04 0 35
736 RAG 기반 대규모 언어 모델 할루시네이션 억제 효과 분석 및 챗봇 시스템 구현 방안 신영재 2024.04.04 0 51
735 도메인 특화 대화형 모델에서의 파인튜닝 및 RAG 기법에 따른 답변 품질 비교 연구 김보금 2024.04.04 0 42
734 PQC, LLM을 활용한 항만 보안 위협 대응 블록체인 서비스 설계 정한호 2024.04.04 0 38
733 발전소 점검 데이터 분석을 위한 LLM 기반 정보 추출 및 시계열 데이터 분석 프레임워크 심혜진 2024.04.04 0 53
732 확장성 및 익명성 보장을 고려한 온체인 및 디파이(Defi) 활동 데이터 기반 신용평가 모 오시몬 2024.04.04 0 41
731 증강현실에서 가상 물체와 실제 물체의 상호작용에 발생하는 latency 분석 및 개선 방안 엄지훈 2024.04.03 0 54
730 Node Density Clustering for Cell Allocation Enhanc 케빈 프란시스쿠스 자베리우스 2024.04.03 0 52