본문 바로가기
AI2024년 6월 23일1분 읽기

OpenAI Embeddings으로 유사도 검색 구현하기

YS
김영삼
조회 1734

임베딩이란

텍스트를 고차원 벡터로 변환하는 것. 의미적으로 유사한 텍스트는 벡터 공간에서 가까이 위치합니다.

구현

import openai

response = openai.Embedding.create(
  model="text-embedding-3-small",
  input="서버 모니터링 방법"
)
vector = response.data[0].embedding  # 1536차원 벡터

코사인 유사도

import numpy as np

def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

댓글 0

아직 댓글이 없습니다.
Ctrl+Enter로 등록