분류
2020
작성일
2020.05.07
수정일
2020.05.07
작성자
최성기
조회수
1116

[권혁철 교수] 2020년 졸업과제 주제 및 상담일정

1. 졸업과제 주제

주제 1. 질의응답(QA: Question Answering) 시스템을 위한 테이블 데이터 임베딩 및 어텐션 시각화

질의응답 시스템은 사용자 질문에 대해서 가장 알맞은 정답을 다양한 기법을 바탕으로 제시하는 시스템이다. 예를 들어 질문 "부산에 있는 국립대학의 이름은 무엇인가?"에 대해서 '부산대학교'라는 정답을 자동으로 추출해서 제시해 주는 기능을 수행한다. 이러한 질의응답 시스템 개발을 위한 분야 중 기계독해는 인간의 문장 판별 및 독해 능력을 기계가 모방할 수 있도록 훈련하는 분야이다.
웹 문서에는 다양한 형식의 텍스트 데이터들이 존재하는데 형식 없는 일반 텍스트가 아닌 테이블 데이터에서 정답을 찾아내어 정답을 찾기 위한 시스템의 필요성이 점점 커지고 있다. 본 주제에서는 LG CNS에서 제공하고 있는 KorQuAD 2.0 데이터셋을 이용하여 테이블에서 정답을 찾는 모델을 학습하고, 학습된 모델을 시각화하고, 해당 모델의 추론 결과를 분석할 수 있는 시스템을 개발하고자 한다.


주제 2. 구문 정보를 이용한 인공신경망 기반 문서 검색 기법

오픈 도메인 질의응답 시스템에서는 입력된 문서에서 정답을 잘 찾아주는 것뿐만 아니라 다양한 지식 문서에서 정답을 포함하고 있을법한 문서를 잘 골라내어 기계독해 시스템의 입력으로 주는 것 또한 매우 중요한 작업이다.
문서 추출 작업에 신경망 기법을 적용한다면 정확도가 더 상승할 수 있지만 수많은 문서에 대해서 신경망 모델을 적용한다면 매우 오랜 시간이 걸릴 것이다.
이러한 문제를 극복하기 위해, 본 주제에서는 지식 문서인 위키피디아 문서와 사용자의 질문을 잘 표현하는 임베딩을 학습시키고 LSH를 이용하여 질문과 유사한 임베딩을 가지는 문서를 빠르게 검색할 수 있는 시스템을 개발하고자 한다.


주제 3. 생성적 적대 신경망(GAN)을 이용한 문맥의존 철자오류 교정 기술

본 과제의 목표는 광범위한 문맥을 대상으로 문맥의존 철자오류 교정(context-sensitive spelling error correction)을 하는 것이다. 문맥의존 철자오류 교정은 광범위한 단어를 대상으로 교정을 하기 때문에 비교사 학습(unsupervised learning)을 이용해 얻은 정보를 기반으로 교정을 하게 된다. 심화 학습(deep learning)에서는 대표적으로 워드임베딩(word embedding)을 통해 얻은 벡터를 사용한다. 과제에서 다루는 생성적 적대 신경망(generative adversarial network)은 기존 이미지 관련 과제(task)에서 많은 실험이 있었으며, 자연어 처리(natural language processing) 분야에서도 연구가 있어왔다. 과제에서는 미리 학습된(pretrained) 임베딩 정보와 학습 문장을 이용하여 생성적 적대 신경망을 학습하며, 생성된 임베딩 정보를 이용하여 문맥의존 철자오류 교정을 하고자 한다.


주제 4. 스마트 홈 제어를 위한 질의응답 시스템 개발

질의응답 시스템은 입력된 문서에서 정답을 찾아주는 것 외에도 다양한 센서나 IoT 기기들이 연결된 대화형 인터페이스 시스템에도 적용될 수 있다. 이러한 대표적인 환경이 스마트 홈이다. 점점 IoT 기술이 적용된 가전이 늘어나고 다양한 센서가 내장된 홈 IoT 기기들이 늘어나면서 스마트 홈 생태계가 확장되고 복잡해지고 있다.
이러한 스마트 홈을 제어하는 것을 목표로 가상의 시나리오를 작성하여, 단순한 온/습도 정보부터 입/출입 기록, 냉장고 보관 물품들의 유통기한 정보까지 다양한 스마트 홈에서 수집 가능한 정보를 대상으로 하는 질의응답 시스템을 개발하고자 한다.



2. 과제 진행 방식

주제별로 2~3인이 팀을 구성하여 진행한다.


3. 문의 및 연락처

위치: 자연대연구실험동 316호
전화: 510-2875(연구실)
메일: aidocu@pusan.ac.kr(연구실)
첨부파일
첨부파일이(가) 없습니다.