카카오미니8
-
내 마음대로 설정하는 나만의 호출명령어
창밖에 구름이 잔뜩 낀 날 날씨를 물어보면 친절히 우산 잊지 말라고 대답해 주는 너, ‘헤이카카오’가 아니라 내가 좋아하는 가수의 이름이었으면 해. 2020년을 지나 2021년까지 이어지고 있는 코로나 시대, 여러분들은 안녕히 잘 지내고 계신가요? 코로나로 인해 우리의 삶에는 많은 변화가 있었고, 우리는 더 많은 시간을 집에서 보내고 있습니다. 언택트 시대를 맞이하여 스마트 스피커 또한 새로운 시대를 맞이했는데요. 집 안에 머무는 시간이 늘어나면서 스마트 스피커의 진가가 드러나기 시작한 것이죠. 코로나 시대 이전에는 스마트 스피커(AI 스피커)가 단순히 노래를 재생해주고 날씨를 알려주었다면, 언택트 시대의 스마트 스피커는 언제나 말을 걸 수 있는 대상으로서, 위로되어주는 ‘친구'같은 존재가 되었습니다. ..
Tech Log 2021. 11. 8. -
사오정 API - 음악 재생 발화는 내게 맡겨주세요. [기술편]
어렸을 적 즐겨보던 만화 중 ‘날아라 슈퍼보드'라는 만화가 있었습니다. 그 만화에는 무슨 말을 해도 잘 알아듣지 못하는 ‘사오정'이라는 캐릭터가 등장하는데요. 사오정은 가는 귀를 먹어 귀의 주름을 걷고 이야기를 듣지 않으면 이야기를 엉뚱하게 알아들어 많은 해프닝을 만들어 내기도 했습니다. 이렇게 만화 속 사오정처럼 카카오 i도 가끔 명령을 완벽히 알아듣지 못하는 경우가 있죠. 저희는 카카오 i가 무슨 말을 해도 잘 알아들을 수 있도록 “사오정 프로젝트”를 진행했습니다. 만화 속 사오정은 말귀를 못 알아듣는 캐릭터로 등장하지만, 사오정 프로젝트에서의 사오정은 카카오 i 발화의 대부분을 차지하는 음악 재생 발화의 오류를 획기적으로 줄여주는 고마운 캐릭터임을 밝히며 글을 시작하도록 하겠습니다. #사오정 프로젝..
Tech Log 2021. 5. 3. -
물어보기 전에, 헤이카카오가 먼저 알려주는 "내 소식"
시작하며 안녕하세요. 여러분들은 AI 스피커에 대해 얼마나 친숙하신가요? 2019년 통계를 보면 우리나라 가구 수를 2,000만으로 봤을 때, 약 40%의 가구가 AI 스피커를 보유하고 있다고 하는데요. 이렇듯 이제 어디에서나 쉽게 AI 스피커를 접할 수 있고, AI 스피커를 통해 음악 감상, 택시 호출, 카톡 읽기, 메일 전송, 음식 배달 등을 하는 것이 전혀 어색하지 않은 시대가 되었습니다. 가끔 어린 아이들은 “헤이~카카오!”, “지니야~”, “오케이~구글"과 같이 각 AI 스피커에 해당하는 이름을 부르는 것이 익숙하다보니 주변에 있는 공기 청정기와 로봇 청소기의 이름은 무엇이냐고 묻고 자연스럽게 말을 걸어보기도 합니다. 그만큼 기기와 사람이 대화하는 것은 너무나 평범한 일상이 되었어요. 나는 AI..
Tech Log 2021. 4. 6. -
더 작고 똑똑한 스마트 스피커, 미니헥사
시작하며, 스마트 스피커(AI스피커)는 구글, 아마존, 애플 등 글로벌 테크 기업뿐만 아니라 바이두나 알리바바, 샤오미 등 중국 거대 기업들도 지속적인 투자를 하고 있는 상품입니다. 국내만 보더라도 제조업체인 삼성과 LG, 통신회사인 SKT, KT, LGU+, 인터넷 플랫폼 기업인 네이버, 카카오 모두 음성 AI 플랫폼과 함께 자사의 스마트 스피커를 출시하고 있습니다. 시장조사업체 카날리스에 따르면 전 세계 스마트 스피커 연간 출하량은 2018년 7,800만 대에서 2019년에는 전년 대비 60% 증가해 1억 2,460만 대에 이르는 것으로 조사되었습니다. 과학기술정보통신부가 집계한 국내 시장도 2019년 말 기준 누적 판매량이 800만 대에 이를 것이라고 추정하고 있습니다. 2019년 하반기부터 소비자..
Tech Log 2020. 12. 30. -
AI에게 어떻게 음성을 가르칠까?
시작하며 인간은 귀로 듣고, 입으로 말하여 타인과 의사소통합니다. 나와 대화할 수 있는 존재를 창조하고 싶다는 바람은 많은 사람들이 오래전부터 상상하고, 소설로 쓰고, 연구해 왔습니다. 오늘날 그 바람은 음성을 듣고 정보를 이해하고, 음성을 만들어 정보를 전달하는 대화형 인공지능(Artificial Intelligence, 이하 AI)의 시대가 도래하게 됨으로써 그 결실을 맺었습니다. 기계가 사람의 음성을 듣는 음성인식(Speech recognition)은 AI의 귀이고, 기계가 사람의 음성으로 말하는 음성합성(Speech synthesis)은 AI의 입이라고 할 수 있습니다. 하지만 AI가 음성을 이해하고, 활용할 수 있도록 가르치는 것은 쉽지 않은 일입니다. 사람이 몇 초면 만들 수 있는 음성 한 문..
Tech Log 2020. 8. 10. -
카카오미니의 슬롯 태깅 방법
시작하며 이전 글 카카오미니의 명령어 분류 방법에서 카카오미니가 음성을 인식하고 봇과 인텐트를 분류해 슬롯을 추출한 후 요청 동작을 수행하는 전 과정을 간단히 살펴보았습니다. 이번에는 이전 글에 소개된 명령어 분류 2, 3단계인 봇 분류, 인텐트 분류에 이은 카카오미니의 특별한 슬롯 태깅 기술이 들어간 4단계, 즉 슬롯 태깅에 대해 설명하고자 합니다. 카카오미니를 통해 발화를 인식하고 명령을 수행하기 위해서는 특정 봇, 특정 인텐트로 분류된 이후 슬롯 태깅이라는 단계가 필요합니다. 예를 들어 “아이유의 좋은 날 들려줘”라는 발화가 ‘music’ 봇의 'playSong' 인텐트로 분류되었다면, 음악을 틀어달라는 의도라는 것은 알 수 있겠죠. 하지만 구체적으로 어떤 가수의 어떤 노래를 재생해야 하는가는 봇과..
Tech Log 2020. 5. 22.