안녕하세요👋 카카오엔터프라이즈의 AI 실험실 '테크그라운드'에서 재밌는 이야기를 열정으로 담아내고 있는 쌔미🧚♀️와 오렌지🍊입니다. 얼마 전 테크그라운드에 첫 AI 매시업으로 '앵무버스'라는 웹 애플리케이션이 오픈되었는데요. 오늘 이 앵무버스가 어떻게 탄생하게 되었는지, 그리고 앞으로 테크그라운드에서 어떤 일이 펼쳐질 것인지 스포해드리고자 블로그에 출동하게 되었답니다. 자 그럼 먼저 앵무월드 앵무버스를 확인하러 떠나 볼까요? ㅎㅎ🙌
AI 매시업이 뭐예요? 🙄
매시업(Mashup)은 웹으로 제공하고 있는 정보와 서비스를 융합하여 새로운 소프트웨어나 서비스, 데이터베이스 등을 만드는 것을 말합니다. (출처: 위키백과) 비즈니스와 일상에 AI 기술을 더하여 더 편리하고 즐거운 세상을 만들어가고자 하는 카카오엔터프라이즈의 크루로서, 회사가 보유한 다양한 AI 기술을 이리저리 조합해 새로운 쓰임새를 찾아내는 실험은 습관과도 같은 일이죠.😎 저희는 이러한 연습을 AI 매시업이라 부르며, 그 결과물 중 여러분께 소개하는 첫 번째가 바로 앵무버스랍니다.
메타버스? 우린 앵무버스! 🦜
바야흐로 2020년 어느 겨울... 한창 방영중이던 드라마 스타트업에 '눈길' 이라는 서비스 이야기가 나왔습니다. 눈길은 스마트폰 카메라를 이용해 전방의 물체를 인식할 수 있도록 돕는 서비스였는데요. 이 서비스는 카카오엔터프라이즈의 AI 기술을 조합하여 충분히 구현 가능한 것이었지 모예요(?). 하지만 그냥 따라하는 건 어쩐지 자존심이 상할(?)것 같았던 저희는 어떻게 하면 비슷한 컨셉을 재밌게 프로토타이핑해볼 수 있을까 고민하게 되었습니다. 그러다 우연히 말 잘하는 앵무새 유튜브 클립을 하나 발견하게 되는데요. a.k.a 👉(말하는 앵무새) ㅋㅋ.. 우리의 카카오미니 만큼이나 말 잘하는 앵무새가 매우 탐나버렸고(!), 재빨리 이 아이디어를 디벨롭 하게 되었답니다.
(충격고백) 사실 앵무새 컨셉을 잡은 아주 근본적이고도 핵심적인 이유는 따로 있었어요. 저희가 만든 초기 프로토타입이 가끔 헛소리(!)를 할 때가 있었기 때문에 앵무새같은 귀여운 컨셉이면 약간의 'Excuse' 를 얻을 수 있지 않을까 했답니다ㅋㅋ는 농담같지만 사실입니다. 이렇게 보면 휘뚜루마뚜루 앵무새 컨셉을 잡은 것 같지만, 실제로 저희는 오랜 기간(?) 어떤 인터랙션으로, 어떤 화면에서, 어떤 캐릭터나 어떤 시각 요소를 활용해서 유저한테 재밌는 경험을 선사할지 본격적으로 진지하고도 심각하게 논의하며 앵무새 컨셉을 구체화해나갔습니다. 맨 처음 브레인스토밍 단계에서는 사용자들이 애플리케이션으로 이곳 저곳 카메라로 찍어보게 하려면 어떻게 할까 고민하다가 어렸을 적 운동회 때 했던 손님찾기 이야기까지 나왔는데요. 하지만 저희는 기왕에 '말💬'을 할 수 있는 앵무새 컨셉을 잡았기 때문에 대화하는 느낌을 살려봐야겠다고 의견을 모았습니다.
그렇게 저희가 셋팅한 앵무버스의 기본 동작은 이렇습니다. 유저가 카메라로 어떤 물체를 찍으면, 랜덤하게 앵무새가 나타나 그 물체에 대한 설명을 그 앵무새만의 톤으로 읽어주는 것인데요. 이 때, 물체에 대한 설명을 단순히 텍스트로 보여주는 것도 가능하지만 다양한 목소리로, 비쥬얼적으로나 성격적으로나 다양한 모습의 앵무새를 통해 우리의 AI 기술을 더 다채롭게 경험할 수 있도록 했습니다. 사실 이땐 몰랐어요. 그저 재미있고자 했던 이 결정이 저희의 삶을 앵무월드로 만들어 버릴 줄은....ㅋㅋ 최대한 다양한 경험을 주고자 앵무새 베리에이션을 열심히 준비했던 저희의 온갖 검색 피드는 앵무새로 가득차게 되었고, 그야말로 앵무지옥 아니 앵무새 월드가 되어버렸답니다. 그래서 애플리케이션 이름도 (꿈과 희망의) 앵무새 세상의 느낌을 살리고자, 요즘 많이 언급되는 메타버스처럼, Universe 를 뜻하는 verse를 사용해보자 했어요. 영어로 표기했을 때 좀 더 글자 모양이 귀여웠으면 해서 영어 표기는 앙무버스(Angmooverse)가 된 건 안 비밀.🙃
크루들과 함께 뚝딱뚝딱 🔧
알록달록한 아이데이션이 어느 정도 디벨롭 된 이후 저희는 바로 프로토타입 구현을 시작했습니다. 카메라에 비친 사물이나 풍경을 읽어주는 인공지능 앵무새를 창조하기 위해 카카오엔터프라이즈가 보유한 세 가지 AI 기술을 활용하기로 했죠. 바로 앵무새의 눈이 되어줄 이미지 분석 API, 이미지 분석 API의 결과(영어)를 한국어로 번역하는 번역 API, 마지막으로 앵무새가 목소리를 낼 수 있도록 하는 음성합성 API입니다. 각 기술 담당 크루에게 API 사용 배경에 대해 공유하고, 프로토타입을 위한 엔드포인트를 제공받았습니다.
AI API를 엮어 서버를 마련하는 한편, 최소한의 기능을 담아 투박한 UI의 웹 페이지도 만들었어요. 촬영 버튼을 누르면 이미지를 캡쳐하고, 서버에서 응답한 메시지를 오디오 라이브러리(Tone.js)를 이용해 앵무새 성격 별로 맛깔나게 재생하는 것이 웹페이지의 역할입니다.
앵무버스는 프로토타입을 통해 컨셉 검증을 마치고 본격적인 프로덕션 절차 끝에 세상에 나오게 되었습니다. 이 과정에서 저희는 많은 크루분들의 도움을 받았어요.😍특히 디자이너의 금손으로 업데이트한 UI는 심미적인 면에서나 UX적인 면에서 저희가 처음 그렸던 그림과는 비교할 수 없을 정도로 세련되어져서 거의 못 알아볼뻔 했지 뭐예요ㅎㅎ. 저희는 앵무버스 속 앵무새들을, 말투와 목소리, 생김새를 나타내는 성격을 조합하여 ‘로맨틱함’, ‘까탈스러움’ 등을 포함한 27가지로 다양하게 제작했고, 수집하는 재미를 더하고자 디자인팀과 논의하여 앵무새 포토카드로 넣어놓기도 했어요.😉 앵무포카에 NFT(Non-Fungible Token) 기술까지 적용해보고자 했던 미래지향적 꿈과 야망이 있었으나... 조금이라도 빠르게 매시업을 공유하고 싶은 마음이 쪼끔 더 컸기에, 더 많은 것들을 시도해보려는 열정을 꾹~ 참아내느라 조금 힘들었다는 후문ㅋㅋ
웰컴 투 앵무버스 🙌
이런 재밌는 이야기를 담고있는 앵무버스, 너무 궁금하시죠?ㅎㅎ 지금 여러분의 모바일 기기로 앵무버스에 접속해보세요. 앵무새들을 만나려면 최신 모바일 브라우저에서 카메라 접근을 허용해야 합니다. 화면 아래 촬영 버튼을 눌러 주변의 사물이나 풍경을 촬영하면, 귀염뽀짝 앵무새가 날아와 화면에 보이는 것을 읽어줄 거예요.
알려줬으니 500원을 달라는 이 귀여운 앵무새가 마음에 드셨나요?😛 앵무새를 칭찬하면 앵무새의 프로필을 담은 포토카드를 얻을 수 있고, 길게 누르면 수집도 가능합니다. 포토카드 안의 하트로 (비공식) 프로듀스 앵무 101 인기 투표도 진행하고 있으니 하트 많이 많이 꾹!꾹! 눌러주세요!❤️
앞으로도 AI 매시업은 계속됩니다 ✨
카카오엔터프라이즈는 앞으로 카카오 i 클라우드를 통해 다양한 서비스형 AI(AIaaS, AI as a service)를 제공할 예정입니다. OCR(Optical Character Recognition), 번역을 비롯한 AI 기능을 누구나 편하고 효율적으로 활용할 수 있도록요.😉
저희가 오늘 소개한 앵무버스와 같은 AI 매시업을 만드는 이유는, 카카오엔터프라이즈가 제공하는 AI 기술을 많은 분들이 좀 더 재미있고 친근하게 체험하실 수 있도록 돕고, 이 기술들을 직접 활용해 무언가 만들어보고 싶다는 영감을 드리기 위해서입니다. 나아가 이런 AI 매시업을 공유하는 테크그라운드 또한 상호 소통 가능한 공간으로 재단장하여 AI 기술에 대한 멋진 인사이트를 나누는 뜨거운 공간으로 만들고 싶은 큰 그림도 품고 있답니다. 물론 저희의 이런 시도는 회사 내부적으로도 고객에게 제공하는 AI 기술을 크루들이 직접 쓰면서 품질과 사용성을 확인하고, 개선 사이클에 적극적으로 참여하며, 이 과정에서 사용자가 참고할 좋은 응용을 발굴해 문서와 함께 제공할 수 있는 좋은 기회가 될 것으로 생각합니다.😎
반짝반짝한 앵무버스를 시작으로, 카카오엔터프라이즈가 제공할 AI 기술들을 활용한 실험과 창작이 회사 안팎으로 활발하게 일어나면 좋겠습니다.🙏 테크그라운드, 그리고 카카오엔터프라이즈가 제공할 AIaaS에 앞으로도 많은 기대와 관심 부탁드려요! 고맙습니다.😍
댓글0