본문 바로가기

myvlm1

MyVLM: Personalizing VLMs for User-Specific Queries 논문 링크: https://arxiv.org/pdf/2403.14599.pdf프로젝트 페이지 링크: https://snap-research.github.io/MyVLM/0. Abstract최근의 대형 비전-언어 모델 (Vision Language Models, VLM)은 시각적인 컨텐츠에 대한 이해와 텍스트 묘사에 대한 생성에 좋은 성능을 보였지만 사용자별 컨셉 (user-specific concept)에 대한 이해의 성능은 부족본 논문은 VLM의 개인화에 대한 연구! → 사용자가 제공하는 컨셉 (인물, 사물 등…)에 대해 학습하고 추론하는 것이 가능예를 들어 해당 모델은 이미지 안에서 사용자를 인지하고 사용자의 행동에 대해 커뮤니케이션 할 수 있으며 사용자의 개인적인 경험과 관계에 대해 고려하는 것이 .. 2024. 9. 1.

이전 1 다음

티스토리툴바