분류
2026년 2월
작성일
2025.10.10
수정일
2025.10.10
작성자
최비결
조회수
46

Dual Visual-Structural Graph Construction for Open-Vocabulary Semantic Segmentation

Open-vocabulary semantic segmentation aims to assign pixel­level labels using arbitrary text queries, but existing CLIP-based methods often produce diffuse similarity maps and struggle with precise boundaries or small x-objects. Two-stage approaches―first generating class-agnostic mask proposals, then aligning them to text embeddings―improve shape fidelity but suffer from over-segmentation when using dense SAM proposals and from coarse boundaries when using patch­based spectral clustering. To address these limitations, we propose a novel graph-construction pipeline in which nodes correspond to SAM’s class-agnostic masks―providing fine boundary precision―and are augmented with textual nodes representing the target class embeddings. Edge weights capture both inter-mask visual similarity and structural affinity via cosine similarity in a joint embedding space, ensuring that clusters reflect full-x-object semantics rather than only discriminative parts. Our dual visual-structural graph promotes geometrically coherent, semantically complete mask proposals without the need for costly post-processing refinements. With the proposed method, state-of-the-art performance is attained over the latest approaches on several benchmarks. 



e-mail: choivy9102@pusan.ac.kr

학위연월
2026년 2월
지도교수
전상률
키워드
Open-vocabulary semantic segmentation, vision-language model, clustering, mask proposal
소개 웹페이지
https://sites.google.com/view/bigyeolmastersdissertation
첨부파일
첨부파일이(가) 없습니다.
다음글
딥페이크 생성 방지를 위한 확산 모델 맞춤형 방어 기법 연구
고영민 2025-10-11 15:47:33.147
이전글
단일광자단층촬영영상 기반 파킨슨병 진단 딥러닝 모델 해석을 위한 임상 개념 기반 해석 기법 연구
유일해 2025-10-03 15:54:47.933
RSS 2.0 807
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
807 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 새글 강은세 2025.10.15 0 28
806 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 새글 박재현 2025.10.15 0 11
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 새글 허석용 2025.10.15 0 19
804 Long-Axis Guided Diffusion Autoencoder for Through 새글 김준희 2025.10.15 0 12
803 데이터 증강을 활용한 전이 학습 기반 RT 용접 결함 분류 성능 개선 새글 강명현 2025.10.15 0 26
802 RAG와 CoT 프롬프팅을 활용한 중소형 LLM의 한국어 수학추론 성능 향상 기법: 최적 새글 조아라 2025.10.15 0 22
801 자기 검증과 외부 지식 활용의 통합을 통한 대형 언어 모델에서의 환각 현상 완화 새글 박예린 2025.10.14 0 29
800 Adversarial Attack on CAN IDS Leveraging Multi DDQ 새글 황연정 2025.10.14 0 30
799 이종 모델 간 지식 증류를 통한 경량 시계열 예측 모델의 설계 및 구현 새글 나상진 2025.10.14 0 24
798 Transformer-ACGAN 기반 CAN-FD 침입 탐지 프레임워크 새글 윤지원 2025.10.14 0 39
797 End-to-End Framework for Condition-Specific Gene R 새글 이수빈 2025.10.13 0 24
796 RA-TI CRAFT: 문서 레이아웃 4클래스 동시 분할 새글 김덕용 2025.10.13 0 43
795 기하학적 정보를 담고 있는 슈퍼픽셀 기반의 라이다-카메라 캘리브레이션 새글 김진완 2025.10.13 0 40
794 리뷰 기반 의도 정보와 암묵적 선호도를 통합하는 그래프-시퀀스 추천 새글 이소혜 2025.10.13 0 37
793 신뢰 실행 환경 기반 블록체인 스마트 컨트랙트 오프체인 보안 기법 새글 강하영 2025.10.13 0 36
792 A Deep Learning Framework for Multi-x-objective Co 새글 김정무 2025.10.12 0 59
791 딥페이크 생성 방지를 위한 확산 모델 맞춤형 방어 기법 연구 새글 고영민 2025.10.11 0 61
790 Dual Visual-Structural Graph Construction for Open 새글 최비결 2025.10.10 0 46
789 단일광자단층촬영영상 기반 파킨슨병 진단 딥러닝 모델 해석을 위한 임상 개념 기반 해석 기법 유일해 2025.10.03 0 60
788 RAG-sLLM 기반 계약 리스크 자동 분석 프레임워크 제안 : 조선업을 중심으로 윤시록 2025.04.07 0 338