분류
2021
작성일
2021.04.05
수정일
2021.04.05
작성자
이정훈
조회수
601

[권혁철 교수] 2021년 졸업과제 주제 및 상담일정

1. 졸업과제 주제 (연구실 사정에 따라 주제의 변동이 있을 수 있습니다.)

주제 1. 제품 스펙 문서 및 숫자 정보처리를 위한 표 질의응답 시스템

우리가 사용하고 있는 제품의 스펙(Specification) 문서에는 많은 중요한 데이터들이 표로 이루어져 있다. 본 주제에서는 이러한 제품의 스펙 문서에 대한 질의를 잘 처리할 수 있는 표 질의응답 시스템을 개발하고자 한다. 제품의 스펙 문서의 표는 다양한 단위와 숫자로 이루어져 있으며 이러한 데이터를 잘 처리하기 위한 임베딩 기법에 집중하여 과제를 해결할 것이다.


주제 2. 인공신경망 기반 문서 검색 기법

오픈 도메인 질의응답 시스템에서는 문서 내에서 정답을 찾는 과정뿐만 아니라, 정답을 포함하고 있을 가능성이 큰 문서들을 검색하여 선별하는 과정도 중요하다. 기존의 오픈 도메인 질의응답을 위한 시스템에서는 BM-25, TF-IDF 등의 단어 빈도를 이용한 기법이 많이 사용되고 있다. 본 주제에서는 이러한 문제를 극복하기 위해서, 지식 문서와 사용자의 질문을 잘 표현할 수 있는 임베딩 모델을 학습시키고 LSH를 이용하여 빠르게 유사한 문서를 선별할 수 있는 신경망 기반 검색 시스템을 개발하고자 한다.


주제 3. 이중 판별자 기반의 생성적 적대 신경망을 이용한 문맥의존 철자오류 교정

데이터 증강(data augmentation)은 자연어처리(NLP) 각 분야에서 널리 사용되는 전처리 방식이며, 학습 데이터가 부족한 환경에서 더욱 효과적이다. 본 실험에서는 생성적 적대 신경망을 이용해 사람이 사용하는 문장을 모사하고 이를 바탕으로 문맥의존 철자오류 교정에 적용하고자 한다.


주제 4. 한국어 어휘의미망(Korlex) 기반 그래프 임베딩을 이용한 문맥의존 철자오류 교정

한국어 어휘의미망은 세계적으로 알려진 WordNet을 기반으로 한국어에 맞게 추가 구축된 한국어 온톨로지이다. 세계적으로 딥러닝은 지식 기반(knowledge base)으로 가는 추세이고 여기에 맞춰서 문맥의존 철자오류 교정을 적용하고자 한다.

2. 과제 진행 방식
주제별로 2~3인이 팀을 구성하여 진행한다.

3. 문의 및 연락처
위치: 자연대연구실험동 316호
전화: 510-2875(인공지능 연구실)
메일: aidocu@pusan.ac.kr(연구실 메일)
첨부파일
첨부파일이(가) 없습니다.