분류
2024년 2월
작성일
2023.10.11
수정일
2023.10.11
작성자
김여경
조회수
157

멀티모달 지식 융합 기반 구형 3D 의미론적 분할 트랜스포머 연구

LiDAR 포인트 클라우드는 3차원 공간을 표현하는 점들의 집합으로, 일반적인 카메라로 얻는 2차원 이미지와 달리 깊이 정보를 포함하고 있다. 이러한 정보는 자율주행 분야에서 LiDAR 센서와 함께 상호 보완적인 데이터를 제공한다. 따라서, 멀티모달 데이터 융합을 통한 의미론적 분할에 대한 연구가 활발히 진행되고 있다. 그러나 융합 기반 방법은 학습 및 추론 단계에서 확실한 포인트-픽셀 매핑을 가진 LiDAR 포인트 클라우드와 카메라 이미지, 즉 페어된 데이터를 필요로 하기 때문에 실제 세계에서 응용하기 어렵다.

 

본 논문에서는 FOV(field of view) 장면 이미지의 픽셀과 매핑되도록 포인트에 대해 데이터 전처리를 수행하였다. 더불어, 보조적 모달인 2D와의 융합과 지식 증류를 활용하여 더욱 풍부한 의미론적 및 구조적 정보를 얻었으며, 이 결과를 순수 3D 네트워크로 증류하는 방식을 제안하였다.

 

구형 복셀을 사용한 3D 네트워크는 LiDAR 포인트 클라우드 데이터의 특성을 반영한다. 이전 연구들은 큐브형 복셀을 사용하여 3D 의미론적 분할을 수행하였으나, 이 방식은 포인트의 분포나 구조에 완전히 부합하지 않았다. 본 논문에서는 LiDAR 포인트 클라우드 데이터의 특성을 반영하기 위해 구형 복셀을 사용하는 네트워크를 제안하였으며, 2D 네트워크에서 증류된 지식을 활용하여 최종 의미론적 분할 결과를 도출하였다.

 

학위연월
2024년 2월
지도교수
박진선
키워드
멀티모달, 지식 증류, 구형 트랜스포머, 의미론적 분할
소개 웹페이지
https://sites.google.com/pusan.ac.kr/ 2dsphere
첨부파일
첨부파일이(가) 없습니다.
다음글
공공기관 분산시스템의 상호운용성 개선을 위한 메시지 표준화 방
황진광 2023-10-12 10:45:15.443
이전글
Non-Local Fusion 기반 멀티 모달 3차원 Bird’s Eye View 객체 탐지 네트워크 연구
남예린 2023-10-11 20:54:45.88
RSS 2.0 749
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
749 코딩 스타일 교육을 위한 자동 채점 시스템 개선 김영훈 2024.04.11 0 34
748 High-Precision Vehicle Trajectory Prediction using 김민성 2024.04.04 0 43
747 LLM 모델을 활용한 한국어 맞춤법 교정 성능 최적화 방안 연구 정주경 2024.04.04 0 51
746 블록체인 기반 항만 특화 통합 보안 관제 솔루션 오경우 2024.04.04 0 39
745 포인트 클라우드 Semantic 필터링 기반 3차원 객체 탐지 연구 정민규 2024.04.04 0 41
744 지식증류 기반의 경량 3차원 거리 추정 기법 연구 김장현 2024.04.04 0 42
743 Context-Aware Dynamic Detection for Ransomware us 프라티위 밀라티 2024.04.04 0 40
742 자기공명영상 기반 심장 영역 분할 및 질병 진단을 위한 자동화 프레임워크 개발 김민수 2024.04.04 0 30
741 경량화된 실시간 발화자 탐지 모델 정성헌 2024.04.04 0 43
740 Warehouse 물류 로봇을 위한 Visual SLAM 알고리즘 구현과 성능 실험 강민재 2024.04.04 0 31
739 Secure Implementation of End-to-End IoT Communicat 락스모노 아구스 마하르디카 아리 2024.04.04 0 39
738 전자건강기록 (EHR) 데이터와 심전도 (ECG) 데이터를 활용한 관상동맥 질환 환자의 사 강동길 2024.04.04 0 40
737 Comparative Analysis of Cross-Platform and Native 이브로키모브 사도르벡 2024.04.04 0 35
736 RAG 기반 대규모 언어 모델 할루시네이션 억제 효과 분석 및 챗봇 시스템 구현 방안 신영재 2024.04.04 0 51
735 도메인 특화 대화형 모델에서의 파인튜닝 및 RAG 기법에 따른 답변 품질 비교 연구 김보금 2024.04.04 0 42
734 PQC, LLM을 활용한 항만 보안 위협 대응 블록체인 서비스 설계 정한호 2024.04.04 0 38
733 발전소 점검 데이터 분석을 위한 LLM 기반 정보 추출 및 시계열 데이터 분석 프레임워크 심혜진 2024.04.04 0 53
732 확장성 및 익명성 보장을 고려한 온체인 및 디파이(Defi) 활동 데이터 기반 신용평가 모 오시몬 2024.04.04 0 41
731 증강현실에서 가상 물체와 실제 물체의 상호작용에 발생하는 latency 분석 및 개선 방안 엄지훈 2024.04.03 0 54
730 Node Density Clustering for Cell Allocation Enhanc 케빈 프란시스쿠스 자베리우스 2024.04.03 0 52