웹 문서에서는 자연어뿐만 아니라 표나 리스트와 같은 구조화된 리스트를 포함하고 있다. 구조화되지 않는 자연어에 학습된 언어 모델은 구조화된 표와 리스트 데이터에 적용했을 때 질의응답 성능이 하락하는 문제가 있다. 본 연구에서는 자연어에 학습된 언어모델과 함께 표 데이터에 사전학습한 언어모델을 활용하여 웹 문서 내의 자연어와 구조화된 리스트와 표 데이터에서 정답을 찾을 수 있는 한국어 다중지문 기계독해 모형을 제안한다. 자연어에 대한 질의응답을 위해 한국어 위키피디아에 사전학습된 BERT 모델을 사용했으며, 표에 대한 질의응답을 위해서 위키피디아 내에 존재하는 표를 이용하여 사전학습된 TAPAS 모델을 활용했다. 표를 위한 임베딩이 추가된 TAPAS 모델을 표 데이터에 적용했을 때 자연어를 위한 언어모델을 사용했을 때에 비해 성능이 향상됨을 보였다. 입력된 여러 개의 지문에서 정답이 있는 단락 선택을 위해서 정답이 있을 확률을 출력하도록한 순위화 모델을 적용했을 때 서술형 유형의 질문에서 성능이 향상됨을 보였다. 본 연구에서는 기계독해 모형의 학습과 평가를 위해서 KorQuAD 2.0 데이터셋을 이용한다.