분류
2024년 2월
작성일
2023.10.11
수정일
2023.10.11
작성자
김여경
조회수
184

멀티모달 지식 융합 기반 구형 3D 의미론적 분할 트랜스포머 연구

LiDAR 포인트 클라우드는 3차원 공간을 표현하는 점들의 집합으로, 일반적인 카메라로 얻는 2차원 이미지와 달리 깊이 정보를 포함하고 있다. 이러한 정보는 자율주행 분야에서 LiDAR 센서와 함께 상호 보완적인 데이터를 제공한다. 따라서, 멀티모달 데이터 융합을 통한 의미론적 분할에 대한 연구가 활발히 진행되고 있다. 그러나 융합 기반 방법은 학습 및 추론 단계에서 확실한 포인트-픽셀 매핑을 가진 LiDAR 포인트 클라우드와 카메라 이미지, 즉 페어된 데이터를 필요로 하기 때문에 실제 세계에서 응용하기 어렵다.

 

본 논문에서는 FOV(field of view) 장면 이미지의 픽셀과 매핑되도록 포인트에 대해 데이터 전처리를 수행하였다. 더불어, 보조적 모달인 2D와의 융합과 지식 증류를 활용하여 더욱 풍부한 의미론적 및 구조적 정보를 얻었으며, 이 결과를 순수 3D 네트워크로 증류하는 방식을 제안하였다.

 

구형 복셀을 사용한 3D 네트워크는 LiDAR 포인트 클라우드 데이터의 특성을 반영한다. 이전 연구들은 큐브형 복셀을 사용하여 3D 의미론적 분할을 수행하였으나, 이 방식은 포인트의 분포나 구조에 완전히 부합하지 않았다. 본 논문에서는 LiDAR 포인트 클라우드 데이터의 특성을 반영하기 위해 구형 복셀을 사용하는 네트워크를 제안하였으며, 2D 네트워크에서 증류된 지식을 활용하여 최종 의미론적 분할 결과를 도출하였다.

 

학위연월
2024년 2월
지도교수
박진선
키워드
멀티모달, 지식 증류, 구형 트랜스포머, 의미론적 분할
소개 웹페이지
https://sites.google.com/pusan.ac.kr/ 2dsphere
첨부파일
첨부파일이(가) 없습니다.
다음글
공공기관 분산시스템의 상호운용성 개선을 위한 메시지 표준화 방
황진광 2023-10-12 10:45:15.443
이전글
Non-Local Fusion 기반 멀티 모달 3차원 Bird’s Eye View 객체 탐지 네트워크 연구
남예린 2023-10-11 20:54:45.88
RSS 2.0 823
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
823 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 조대영 2025.12.15 0 141
822 Interpretable Cancer Risk Prediction with a Knowle 박한얼 2025.12.11 0 86
821 스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing 도건우 2025.10.23 0 128
820 Learning a Differentiable Multi-Branch Decision Tr 박한얼 2025.10.21 0 239
819 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 윤건우 2025.10.19 0 132
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 조수현 2025.10.17 0 103
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 김정호 2025.10.17 0 123
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 곽도균 2025.10.17 0 119
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 박현수 2025.10.17 0 136
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 김민성 2025.10.17 0 98
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 구동한 2025.10.17 0 137
812 VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연 은승우 2025.10.17 0 133
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 정해원 2025.10.17 0 176
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 박재현 2025.10.17 0 167
809 Autonomous Driving Agent Identification Under Host 도현철 2025.10.17 0 111
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 박동진 2025.10.17 0 111
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 전민수 2025.10.16 0 108
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 강은세 2025.10.15 0 241
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 허석용 2025.10.15 0 133
804 Long-Axis Guided Diffusion Autoencoder for Through 김준희 2025.10.15 0 113