제목 : 고유한 K-mer 분석을 이용한 규칙 기반 유전체 구조 변이 복원 및 시각화
요약 : 구조 변이는 특정 염기서열에서 일어나는 돌연변이로써, 역전, 전이, 복제, 삽입, 결실의 종류가 있다. 구조 변이는 멘델 장애뿐 아니라 암, 조현병과 같은 신경 발달 장애 등 다양한 유전 질환을 일으킨다. 또한, 암 또한 특정 유전자의 복제를 통해 항암제에 내성을 획득하는 등 복제는 구조 변이 중 특히 여러 질병과 관련되어 있다. 유전자 분석 기술의 발전으로 여러 개체에 대한 유전자 분석이 가능해졌지만, 구조 변이를 정확하게 탐지하고 이해하는 것은 여전히 고도의 연구가 필요한 분야이다. 최신 연구에서는 구조 변이에 대한 비교 및 시각화의 편의성이 아직 충분하지 않다는 문제가 나타났다. 길이가 긴 염기서열들을 다룰 때 K-mer 접근법은 데이터의 신뢰성을 향상하는 방법의 하나다. K-mer는 특정 염기서열에서 일정한 길이의 부분 문자열을 나타내는 단위이다. k를 소수로 설정함으로써 서로소성을 강화하고, 다양한 패턴을 포착할 수 있으며, 서로 다른 개체 간의 서열에서 나타나는 K-mer의 빈도와 패턴을 활용하여 구조 변이를 식별하고 비교함으로써 개체 간의 차이를 파악하는 데 유용하다. 이에 본 연구에서는 K-mer 접근법을 활용하여 인간 표준 염기서열의 특정 K-mer가 다른 개체의 염기서열에서 어떻게 발견되는지를 분석하여 구조 변이 중에서도 복제를 중점적으로 탐지하고자 한다. 이를 통해 발생한 구조 변이를 시각화하고, 이를 원복하는 과정에 대해서도 여러 알고리즘을 통해 시각화하고자 한다. 이로써 인간 게놈의 표준 염기서열에서 나타나는 특정 패턴이 다양한 개체 간의 구조 변이를 이해하는 데 어떻게 이바지할 수 있는지를 탐구하고자 한다.