생성형 AI 서비스가 비약적인 발전을 거듭함에 따라 카카오브레인에서는 AI 이미지 생성 서비스 Karlo 2.0을 공개했습니다. 카카오브레인에 따르면 해당 서비스는 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 인공지능 이미지 생성 모델이라고 합니다.
생성형 인공지능 Karlo(칼로)는 3억 장 규모의 이미지와 텍스트 학습을 통해 사용자가 입력한 문장을 이해하여 이미지를 만들어내는 기능을 제공합니다. 높은 수준의 언어 이해력을 바탕으로 완성도 높은 이미지를 생성하는 성능을 갖추고 있습니다.
Karlo 칼로 서비스는 이미지를 표현하는 다양한 묘사 어휘를 활용한 복잡한 프롬프트(명령어)를 해석하고 이미지를 그려낼 수 있습니다. 해상도는 최대 2048x2048 픽셀을 지원합니다. 높은 해상도 지원은 보다 다양하고 심도깊으며 섬세한 이미지를 그려낼 수 있게 해줍니다.
생성형 AI 이미지 서비스 Midjourney 사용자가 대폭 증가함에 따라, 다양한 업체에서 비슷한 서비스를 내놓고 있습니다. 카카오의 Karlo 칼로 서비스는 사물, 배경, 조명, 구도, 스타일을 조합한 문장 표현을 이해하여, 원하는 형태의 이미지를 구현해 냅니다.
또한 카카오브레인은 칼로 2.0 오픈 API를 카카오디벨로퍼스 사이트를 통해 공개했습니다. 기존 1.4버전 대비 다양한 이미지 사이즈와 높은 프롬프트(명령어) 이해도를 가지며 부정 명령어를 통한 이미지 생성시 제외하고 싶은 부분까지 표현할 수 있습니다.
제공 기능
- 이미지 생성 : 제시어를 입력하여 인공지능 이미지 생성
- 이미지 확대 : 생성된 이미지 크기 확대
- 이미지 변환 : 주어진 이미지의 내용을 토대로 새로운 이미지 생성
- NSFW 검사 : NSFW(Not Safe For Work, 폭력적이거나 선정적인) 콘텐츠를 포함한 이미지인지 검사
해당 서비스는 최대 500장까지 가능했던 무료 생성 이미지의 수량을 월간 최대 60만장까지 확대했습니다. 일반 스타트업 기업 또는 개발자가 사용할 수 있는 무료 이미지 생성 가능 횟수를 세계 최고 수준으로 확대하여 칼로의 기술을 활용하여 다양한 가치창출이 가능하도록 하겠다는 카카오브레인의 전략을 볼 수 있습니다.
칼로 2.0 사이트에 접속하여 테스트 이미지를 생성하여 보았습니다.
생성된 결과물 이미지의 퀄리티가 이전 1.4에 비해 많이 향상된 것을 알 수 있습니다. 하지만 Midjourney 서비스와 비교하면 아직 더 많은 발전이 필요할 것 같아 보입니다.