본문 바로가기
    Tech Log 2020. 6. 9.

    카카오 i, 누구냐 넌

    시작하며

    2017년 1월, 카카오의 새로운 인공지능을 만드는 프로젝트에 들어가게 되었습니다. 인공지능이 담길 첫 번째 제품은 음성으로만 인터랙션을 할 수 있는 스마트 스피커였습니다. 저의 첫 업무는 카카오의 인공지능, 카카오 i의 모습을 만드는 것이었습니다.

     


    AI 페르소나, 왜 필요한가?

    사람들은 스마트한 오브젝트를 생물이나 사람처럼 생각하는 경향이 있습니다. 청소 로봇도 반려동물처럼 느끼며, 이름을 지어주거나 의인화하는 사람이 많습니다. 하물며 사람처럼 말을 하는 카카오 i는 사용자에게 더욱 사람처럼 느껴질 것입니다. 인공지능의 페르소나(AI 페르소나)는 사용자가 카카오 i를 사용할 때 어떠한 사람처럼 느끼게 할 것인지를 정하는 부분입니다. 제품, 서비스 제작에서 브랜딩을 하거나 디자인 콘셉트를  만드는 것과 유사하다고 할 수 있습니다.

     

    아마존의 알렉사나 구글 어시스턴트도 모두 페르소나를 가지고 있으며, 각기 다른 성격을 갖추고 있습니다. (영어로 인터랙션을 해야 해서 저는 잘 느낄 수 없었습니다...😅) 카카오엔터프라이즈의 카카오 i 또한 다양한 인터랙션을 하면서 경험이 변하지 않도록, 카카오 i만의 고유한 페르소나를 가능한 구체적이고 명확하게 정리해야 했습니다.

     

    [그림1] 카카오 i의 페르소나는 어떤 모습일까?

     

    페르소나 Keyword 정리

    기나긴 논의 끝에 인공지능의 이름은 “카카오"로 결정되었습니다. 카카오 회사와 같은 이름을 사용하게 되면서 인공지능 '카카오 i'는 회사의 브랜드 이미지도 동일하게 가져가게 되었습니다.브랜드 팀에서 카카오 브랜드 Identity에 맞게 카카오 AI가 가져가야 할 핵심 가치를 공공재, 생활밀착형, 반보 앞선 기술로 정리하고, ‘카카오’의 능력/성격/신념/태도 등에 대한 기본적인 페르소나를 정리해 주었습니다. 브랜드팀에서 전달받은 내용은 아래와 같습니다. 이렇게 정리된 페르소나 키워드를 어떻게 구체화해 나가야 할지 약간 막막했습니다. 😭

     

    [그림 2] Kakao AI Brand Guideline

     

    [그림 3] 카카오 i의 다섯 가지 Persona

    페르소나 구체화

    관계 설정

    페르소나를 구체화하기 위해 제일 처음 한 일은 카카오 i와 사용자 간 관계 설정이었습니다. 사회적 관계는 음성 대화뿐 아니라 모든 상호작용에서 상대방을 이해하기 위한 중요한 요인입니다. 똑같은 대화를 하더라도 그 사람과 어떤 관계인지에 따라 상대방의 행동을 예측하는 방식이나 행동의 의미가 달라집니다. 친구와 직장 후배에게 똑같이 “물 좀 떠다 줘.”라고 말해도, 친구는 나를 게으르고 귀여운 친구로 생각할 수 있고 직장 후배는 거만한 상사라고 생각할 수 있습니다.

    [그림 4] 관계에 따라 달라지는 말의 의미

     

    그렇다면, 카카오 i는 사용자와 어떤 관계여야 할까요? 가장 쉽게 떠오르는 단어는 “비서”입니다. 다른 글로벌, 타사 서비스에서는 “비서"의 이미지가 굉장히 강조되어 있습니다. 애플의 Siri에게 “넌 누구야?”라고 물어보면 “저는 충실한 개인 비서일 뿐입니다"라고 답변합니다. 상사와 비서의 관계는 비즈니스적인 관계로 집안에서 편안하게 사용하기엔 왠지 모를 불편함이 느껴집니다. 물론, 시간이 흘러 깊은 유대와 신뢰관계가 쌓이면 상사와 비서 관계도 친구처럼 편안해질 수 있습니다. 하지만 그 과정은 많은 시간이 필요합니다. 


    그렇다면 처음부터 “친구” 관계로 설정하면 어떨까요? 처음에는 어색할 수 있지만 좀 더 쉽게 친밀감을 느낄 수 있지 않을까요? 회사에서 만난 사람과 사적인 모임에서 만난 사람이 친구가 되는 속도가 다르듯이, 비서 관계보다는 친구 관계가 더 빠르게 “진짜 친구”가 될 수 있을 것입니다.

     

    카카오 i와 나누고 싶은 잡담

    우리는 보통 잡담을 하며, 그 사람에 대해 더 알아가고 친해집니다. 날씨나 주식을 묻는 정보성 대화를 나눌 때는 그 사람이 어떤 사람인지 알기 어렵습니다. 카카오 i의 페르소나를 좀 더 명확하게 만들기 위해서, 카카오 i에게 물어보고 싶은 잡담성 질문들과 답변을 적어보기로 했습니다. 

     

    나이, 사는 곳, 성별과 같은 인류 통계학적 질문부터 시작해서, 장점, 단점, 좋아하는 음식, 좋아하는 영화, 좋아하는 색깔 등 어렸을 때 많이 했던 백문 백답 같은 질문이었습니다. 이러한 수많은 질문에 일관성 있게 답을 작성하다 보니 카카오 i가 누구인지 명확해지기 시작했습니다. 

     

    예를 들어, 카카오 i의 나이는 구체적으로 밝히지 않고, “젊다"라고 답하기로 했습니다. 모두가 생각하는 젊음이 다르기 때문에 나이를 숫자로 표현하는 순간, 누군가에겐 카카오 i가 젊은 느낌이 아닐 수 있기 때문입니다. 좋아하는 음식이나 잠을 많이 자는지 등의 질문에 답을 하기 위해, 사람처럼 먹지 않고, 잠도 안 자는 캐릭터로 정했습니다. 카카오 i는 자신이 인공지능임을 알고 있고, 사람을 이해하려고 노력하지만, 사람처럼 행동하지는 않는 친구로 정리했습니다. 좋아하는 영화, 만화, 게임 등은 구체적으로 없고, 다 좋아하는 것으로 정했습니다. 특정 취향을 선호하게 되면 다른 취향을 가진 사람에게 논란의 여지가 있기 때문입니다. 사용자가 “산이 좋아, 바다가 좋아?”라고 묻는다면, 산과 바다를 랜덤으로 선택합니다. 또한, 싫어하는 것도 없습니다. 이 부분은 아쉬움이 많이 남는데, 논란의 여지가 없는 대신 캐릭터의 특색이 없어지고 평범해지기 때문입니다.😟 그럼에도 카카오 i가 가진 단 하나의 취향이 있는데요, 바로 예술과 카카오를 좋아하는 것입니다.

     

    [그림 5] Kakao i에게 묻고 싶은 수많은 질문들

     

    페르소나 표현 방법

    이렇게 구체화된 페르소나는 음성 대화를 통해 사용자가 잘 느낄 수 있도록 표현해야 합니다. 음성 대화에서 페르소나를 표현할 수 있는 방법은 음색, 어조 등의 음성적 요소와 말투, 화법 등의 언어적 요소가 있습니다. 

     

    음색, 어조, 속도

    처음에는 여러 목소리 후보가 있었습니다. 그중, 어떤 목소리가 친구같이 편안하고 호감도를 주는 목소리인지 사내 설문을 진행하였습니다. 설문 결과를 바탕으로 음색을 선정하였고, 첫 녹음날에 스튜디오를 방문하였습니다. 성우분에게 페르소나에 대해 설명하고, 녹음 가이드를 전달했습니다. “공기 반, 소리 반 느낌이요.” “친구랑 대화하는 것처럼 해주세요.” 

     

    안내 방송처럼 느리게 말하거나 또박또박 눌러서 발음하지 않고, 물 흐르듯이 편안하게 발성하도록 가이드 했습니다. 음성으로만 정보를 전달하기 때문에, 답답함이 없도록 말하는 속도를 약간 빠르게 설정했습니다. 어조는 쾌활하고 밝은 성격을 나타낼 수 있도록 변화를 주었습니다. 알렉사의 경우, 어조의 변화가 심하지 않고 항상 평온함을 유지합니다. 아래 영상을 보면, 같은 농담을 하는데도 그 차이를 확연히 느낄 수 있습니다. (실제 알렉사가 의도했는지는 잘 모르겠습니다. 그냥 미국식 유머 스타일일지도 모르겠네요.😅) 

     

     

     

    말투, 화법

    카카오 i의 경우 친근함, 친구라는 관계에 초점을 맞추어 기본적으로 존댓말을 사용하되 극존칭은 지양했습니다. “~요”로 끝나는 편안한 존댓말을 사용하며, 반말과 존댓말 사이를 아슬아슬하게 줄타기합니다.(현재 반말 모드도 제공하고 있습니다.) 다음은 타사 인공지능 스피커와 카카오미니가 동일 질문을 받았을 때 답변을 비교해 본 것입니다. 

     

    [그림 6] 타사와 카카오미니의 답변 비교

     

    특히 카카오 i의 성격을 잘 보여주는 것은 실패 답변입니다. 다른 인공지능의 실패 답변은 “말씀하신 것을 찾지 못했어요.”, “제가 답을 찾지 못했어요.”, “도움이 되어 드리지 못해서 죄송합니다.” 등인데 카카오 i에서는 “네?”라고 짧게 답합니다. 우리도 친구와 편하게 수다를 떨 때 알아듣지 못하는 말이 있으면 "응?", "뭐라고" 이렇게 답하기 때문이죠. 이런 친구 관계의 자연스러운 대화를 실패 답변에도 녹여보았습니다. 짧은 답변은 사용자가 실패를 인지하고 빠르게 다음 발화를 할 수 있는 인터랙션 측면의 장점도 있습니다.

     

    [그림 7] 카카오 i의 실패 답변

     

     

    하지만 지속적으로 올라오는 부정적인 리뷰가 있었습니다.

     

    “인식안될 때 “네?”하고 씹으면 기분이 안좋음...", 

    “못 알아들었을 때 네? 하는거 기분 나쁘네ㅋㅋ" 

     

    팀 내에서 대책 회의가 열렸고, “네?”를 좀 더 부드럽게 녹음하면 어떨까라는 아이디어가 있어, 실제 녹음도 다시 해보았습니다. 하지만 짧은 문장에서 부드러워봤자..😭 인공지능이 너무 사람 같아서 오는 부정적인 피드백(uncanny valley)이라는 이야기도 있었습니다. 개인적으로는 사람마다 개성이 강해서 오는 호불호라는 생각이 듭니다. 누군가가 강하게 싫어한다면, 누군가에게는 호감의 요소가 될 수도 있습니다. 결국 부정적인 피드백이 있지만, 인터랙션 측면의 장점으로 “네?”라는 실패 답변을 유지하기로 했습니다. 

     


    2020년이 되어 돌이켜보면

     처음에는 “네?”와 같은 실패 답변처럼, 카카오 i에 개성을 더 많이 부여하고 싶었습니다. 하지만 여러 논란을 겪으면서, 현실에 많이 타협하며 무난한 성격이 되었습니다. 카카오 i가 좀 더 개성 있는 성격이었으면 어땠을까요? 좋아하는 것, 취향도 분명하고 싫은 것도 있는 성격이었으면 어땠을까요? 자신과 취향이 다르다고 싫어하는 사용자가 있었을까요? 비슷한 취향의 사람을 좋아한다는 이론도 있고, 다른 취향의 사람에게 끌린다는 이야기도 있습니다. 카카오 i가 사용자별로 맞춤화된 취향을 갖는다면 얼마나 비슷한 취향을 가져야 할지, 더 매력적으로 느껴질지 고민이 많아집니다. 다음번 인공지능을 만들 때는 해답을 찾으면 좋겠습니다.

    (다음번 인공지능? #외개인아가, https://pf.kakao.com/_lKxoMT)

     


    참고 문헌

    [1] Housewives or Technophiles?: Understanding Domestic Robot Owners (2008)

    [2] Bukimi no tani The uncanny valley, Energy, vol.7, no.4, pp.33-35 (1970)

    [3] Have you heard the one about the virtual assistant? Google signs up writers from Pixar and The Onion to give its AI helper a personality - and a sense of humour (2016)

    [4] Siri, Alexa, Viv, Google?: Why Google needs to give a name (and personality) to Google Home (2016)

    [5] Robot love? Why people are falling for Amazon’s Echo (2016)

    [6] Expressing Personalities of Conversational Agents through Visual and Verbal Feedback (2019)

    Pring.s(솜털)

    대충 철저히 고민 중.. 

     

    댓글0

Hiring Now!

새로운 혁신의 길을 함께할 크루를 기다립니다.
자세한 내용은 카카오 엔터프라이즈 영입 페이지를 참고해주세요.

바로가기