분류
2021년 8월
작성일
2021.04.08
수정일
2021.06.21
작성자
김청하
조회수
86

한국어 수사를 포함한 문서를 위한 질의응답 시스템 개발

논문제목

한국어 수사를 포함한 문서를 위한 질의응답 시스템 개발

 

요약

본 문서에서는 기계 독해를 이용하여 한국어 수사를 포함한 문서를 위한 질의응답 시스템을 구축하는 방법을 제안한다. BERT 언어모형을 이용하여 한국어 수사를 포함한 한국어의 질의응답 데이터 세트를 구축하는 방법을 소개하고, 해당 시스템을 미세조정(fine-tuning)하여 성능을 높이는 방법을 제안한다. 한국어 수사를 포함한 질의응답 데이터 세트를 생성하기 위해서 안전기준 관련 법령 문서를 이용하여 질의응답 데이터 세트를 구축하는 방법을 제안하고, 해당 데이터 세트의 일반화를 위해 국제단위계, 한국어의 7가지 읽기 방식, 한국어의 단위를 이용한다. 해당 시스템은 한국어 수사를 포함한 문서를 위한 질의응답 검증 데이터 세트에 대해 EM 78.78%, F1 88.88%의 성능을 보였고, 해당 데이터 세트에 전자 신문 기사를 이용한 질의응답을 추가한 데이터 세트에 대해 EM 82.91%, F1 90.95%의 성능을 보였다. 실험 결과 기존 시스템보다 현재 시스템이 각 데이터 세트별 EM이 7.92%, 13.57%로, F1이 12.07%, 9.55%로 향상되었다.

학위연월
2021년 8월
지도교수
권혁철
키워드
기계 독해, 질의응답, 자연언어처리
소개 웹페이지
https://sites.google.com/pusan.ac.kr/cacaocat
첨부파일
첨부파일이(가) 없습니다.
다음글
블록체인기반 전력거래 중개 아키텍처 설계 및 구현
강원태 2021-04-08 12:21:47.64
이전글
Realistic Indoor Trajectory Generation Based on Delaunay Graph and Crowd Simulation
파사니티 다비드 2021-04-06 13:36:44.047
RSS 2.0 807
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
807 초거대 언어 모델 기반 궤적 예측을 활용한 산업 안전사고 예방 새글 전민수 2025.10.16 0 3
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 새글 강은세 2025.10.15 0 40
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 새글 허석용 2025.10.15 0 32
804 Long-Axis Guided Diffusion Autoencoder for Through 새글 김준희 2025.10.15 0 24
803 데이터 증강을 활용한 전이 학습 기반 RT 용접 결함 분류 성능 개선 새글 강명현 2025.10.15 0 38
802 RAG와 CoT 프롬프팅을 활용한 중소형 LLM의 한국어 수학추론 성능 향상 기법: 최적 새글 조아라 2025.10.15 0 32
801 자기 검증과 외부 지식 활용의 통합을 통한 대형 언어 모델에서의 환각 현상 완화 새글 박예린 2025.10.14 0 36
800 Adversarial Attack on CAN IDS Leveraging Multi DDQ 새글 황연정 2025.10.14 0 34
799 이종 모델 간 지식 증류를 통한 경량 시계열 예측 모델의 설계 및 구현 새글 나상진 2025.10.14 0 30
798 Transformer-ACGAN 기반 CAN-FD 침입 탐지 프레임워크 새글 윤지원 2025.10.14 0 43
797 End-to-End Framework for Condition-Specific Gene R 새글 이수빈 2025.10.13 0 27
796 RA-TI CRAFT: 문서 레이아웃 4클래스 동시 분할 새글 김덕용 2025.10.13 0 45
795 기하학적 정보를 담고 있는 슈퍼픽셀 기반의 라이다-카메라 캘리브레이션 새글 김진완 2025.10.13 0 48
794 리뷰 기반 의도 정보와 암묵적 선호도를 통합하는 그래프-시퀀스 추천 새글 이소혜 2025.10.13 0 40
793 신뢰 실행 환경 기반 블록체인 스마트 컨트랙트 오프체인 보안 기법 새글 강하영 2025.10.13 0 38
792 A Deep Learning Framework for Multi-x-objective Co 새글 김정무 2025.10.12 0 64
791 딥페이크 생성 방지를 위한 확산 모델 맞춤형 방어 기법 연구 새글 고영민 2025.10.11 0 67
790 Dual Visual-Structural Graph Construction for Open 새글 최비결 2025.10.10 0 51
789 단일광자단층촬영영상 기반 파킨슨병 진단 딥러닝 모델 해석을 위한 임상 개념 기반 해석 기법 유일해 2025.10.03 0 65
788 RAG-sLLM 기반 계약 리스크 자동 분석 프레임워크 제안 : 조선업을 중심으로 윤시록 2025.04.07 0 340