본문 바로가기
AI#AI#CV#Multimodal조회 23

CLIP란?Contrastive Language-Image Pre-training

정의

OpenAI의 이미지-텍스트 공동 임베딩 모델. Stable Diffusion의 텍스트 이해 기반.

CLIP란?

"이 이미지가 '고양이 사진'과 가깝나?"를 판단하는 이미지-텍스트 공동 임베딩 모델이다.

영향

  • Zero-shot 이미지 분류
  • Stable Diffusion·DALL·E의 텍스트 인코더
  • 이미지 검색

🔗 함께 보면 좋은 용어

AI 전체 →