분류
2026년 2월
작성일
2025.10.17
수정일
2025.10.17
작성자
박재현
조회수
17

지식 그래프 기반의 LLM 수학 추론 성능 향상 기법

최근 대규모 언어 모델(LLM)은 자연어 처리 분야에서 높은 성능을 보여주었으나, 수학 문제 해결과 같은 논리적 추론 과제에서는 여전히 한계를 드러낸다. 이를 보완하기 위해 단계적 프롬프트 엔지니어링이나 검색 증강 생성(RAG)을 활용한 접근들이 제안되었다. 이들은 LLM의 사전학습 지식, 텍스트 유사성을 기초로 탐색된 정보에 의존해 문제를 해결한다. 그런데 복잡한 문제 해결에 필요한 수학 개념 간의 의미적 연관성과 구조적 관계를 반영하는데 한계가 있다. 본 연구는 수학 개념 간 관계를 구조화한 지식 그래프, 그리고 문제 분석-검증-풀이의 단계별 지침을 수행하는 프롬프트를 결합한 모듈형 추론 프레임워크를 제안한다. 제안 프레임워크는 먼저 문제를 분석하여 핵심 조건을 추출하고, 지식 그래프에서 관련 개념을 탐색하여 보강하며, 마지막으로 도출된 조건과 개념의 타당성을 검증하여 최종 프롬프트를 구성한다. 문항의 변수가 증가하면 LLM의 수학 추론 성능이 하락하는 연구 결과에 의해 본 연구는 이차방정식 문항을 대상으로 실험을 진행하였으며, 제안 방법은 중소형 LLMGPT-4o-mini을 활용하여 표준 프롬프팅 대비 12.8%, CoT(zero-shot) 기법 대비 5.2% 향상된 88.5%의 정확도를 달성하였다. 이를 통해 지식 그래프 기반 조건 보완과 단계별 프롬프트 설계가 LLM의 수학적 추론 능력 향상에 실질적으로 기여함을 확인하였다.

학위연월
2026년 2월
지도교수
김종덕
키워드
large language models, knowledge graph, prompt engineering, mathematical reasoning
소개 웹페이지
https://sites.google.com/mobile.re.kr/pjh/
첨부파일
첨부파일이(가) 없습니다.
다음글
실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템
정해원 2025-10-17 12:00:28.267
이전글
Autonomous Driving Agent Identification Under Hostile-Environments by Using Multi-Modal Time-Series Classification
도현철 2025-10-17 11:11:41.187
RSS 2.0 819
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
819 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 새글 조대영 2025.10.17 0 12
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 새글 조수현 2025.10.17 0 17
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 새글 김정호 2025.10.17 0 15
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 새글 곽도균 2025.10.17 0 14
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 새글 박현수 2025.10.17 0 16
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 새글 김민성 2025.10.17 0 12
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 새글 구동한 2025.10.17 0 36
812 VR에서 제자리걸음 동안 주변 시야의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연구 새글 은승우 2025.10.17 0 21
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 새글 정해원 2025.10.17 0 21
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 새글 박재현 2025.10.17 0 17
809 Autonomous Driving Agent Identification Under Host 새글 도현철 2025.10.17 0 18
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 새글 박동진 2025.10.17 0 20
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 새글 전민수 2025.10.16 0 28
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 새글 강은세 2025.10.15 0 47
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 새글 허석용 2025.10.15 0 39
804 Long-Axis Guided Diffusion Autoencoder for Through 새글 김준희 2025.10.15 0 31
803 데이터 증강을 활용한 전이 학습 기반 RT 용접 결함 분류 성능 개선 새글 강명현 2025.10.15 0 50
802 RAG와 CoT 프롬프팅을 활용한 중소형 LLM의 한국어 수학추론 성능 향상 기법: 최적 새글 조아라 2025.10.15 0 36
801 자기 검증과 외부 지식 활용의 통합을 통한 대형 언어 모델에서의 환각 현상 완화 새글 박예린 2025.10.14 0 40
800 Adversarial Attack on CAN IDS Leveraging Multi DDQ 새글 황연정 2025.10.14 0 38