CLIP란?"이 이미지가 '고양이 사진'과 가깝나?"를 판단하는 이미지-텍스트 공동 임베딩 모델이다.영향Zero-shot 이미지 분류Stable Diffusion·DALL·E의 텍스트 인코더이미지 검색