카카오브레인 KARLO 3.0 공개
카카오브레인이 한국어 이미지 생성 AI 'KARLO'의 3.0 버전을 공개했다. 이전 버전 대비 한국어 프롬프트 이해도가 크게 향상되었으며, 이미지 품질도 Midjourney와 DALL-E 3에 근접한 수준으로 끌어올렸다. 한국어 텍스트 렌더링 능력도 최초로 지원하여 국내 크리에이터 시장을 본격 공략한다.
한국어 프롬프트 이해도 혁신
KARLO 3.0의 가장 큰 개선점은 한국어 프롬프트 이해다. 기존 이미지 생성 AI는 영어 프롬프트에 최적화되어 있어, 한국어 입력 시 의미 손실이 컸다. KARLO 3.0은 자체 한국어 CLIP 모델을 탑재하여 한국어 표현의 뉘앙스를 정확히 반영한다.
- 한국어 CLIP: 한국어 텍스트-이미지 정합성 45% 향상
- 한국 문화 이해: 한복, 한옥, 한국 음식 등 문화 요소 정확한 생성
- 한국어 텍스트 렌더링: 이미지 내 한국어 텍스트 생성 최초 지원
- 해상도: 최대 4K(4096x4096) 이미지 생성 지원
기술적 아키텍처
KARLO 3.0은 Diffusion Transformer(DiT) 아키텍처를 채택했다. 기존 U-Net 기반 모델에서 Transformer 기반으로 전환하여 이미지 구조의 일관성과 세밀함이 크게 향상되었다. 파라미터 수는 60억 개로 KARLO 2.0 대비 3배 증가했으며, 학습 데이터에도 한국어 이미지-텍스트 쌍 5억 건이 포함되었다.
API와 서비스 제공
KARLO 3.0은 카카오 디벨로퍼스 플랫폼을 통해 API로 제공된다. 무료 티어에서 하루 100장, 유료 플랜에서 무제한 생성이 가능하다. 카카오톡 내에서도 대화형으로 이미지를 생성할 수 있는 '카카오 드로우' 서비스가 함께 출시되어, 일반 사용자도 쉽게 접근할 수 있다.
크리에이터 생태계와 전망
카카오브레인은 KARLO 3.0 출시와 함께 크리에이터 지원 프로그램을 발표했다. AI 이미지 생성을 활용한 웹툰 제작, 광고 디자인, 상품 이미지 생성 등 상업적 활용을 적극 지원한다. 국내 이미지 생성 AI 시장은 Midjourney, DALL-E의 영어 중심 서비스와 차별화되는 한국어 특화 니즈가 크며, KARLO가 이 시장을 선점할 것으로 기대된다.
댓글 0