카카오미니5
-
더 작고 똑똑한 스마트 스피커, 미니헥사 #스마트_디바이스 #음성인식_스피커 #카카오AI
시작하며, 스마트 스피커(AI스피커)는 구글, 아마존, 애플 등 글로벌 테크 기업뿐만 아니라 바이두나 알리바바, 샤오미 등 중국 거대 기업들도 지속적인 투자를 하고 있는 상품입니다. 국내만 보더라도 제조업체인 삼성과 LG, 통신회사인 SKT, KT, LGU+, 인터넷 플랫폼 기업인 네이버, 카카오 모두 음성 AI 플랫폼과 함께 자사의 스마트 스피커를 출시하고 있습니다. 시장조사업체 카날리스에 따르면 전 세계 스마트 스피커 연간 출하량은 2018년 7,800만 대에서 2019년에는 전년 대비 60% 증가해 1억 2,460만 대에 이르는 것으로 조사되었습니다. 과학기술정보통신부가 집계한 국내 시장도 2019년 말 기준 누적 판매량이 800만 대에 이를 것이라고 추정하고 있습니다. 2019년 하반기부터 소비자..
Tech Log 2020. 12. 30. -
AI에게 어떻게 음성을 가르칠까?
시작하며 인간은 귀로 듣고, 입으로 말하여 타인과 의사소통합니다. 나와 대화할 수 있는 존재를 창조하고 싶다는 바람은 많은 사람들이 오래전부터 상상하고, 소설로 쓰고, 연구해 왔습니다. 오늘날 그 바람은 음성을 듣고 정보를 이해하고, 음성을 만들어 정보를 전달하는 대화형 인공지능(Artificial Intelligence, 이하 AI)의 시대가 도래하게 됨으로써 그 결실을 맺었습니다. 기계가 사람의 음성을 듣는 음성인식(Speech recognition)은 AI의 귀이고, 기계가 사람의 음성으로 말하는 음성합성(Speech synthesis)은 AI의 입이라고 할 수 있습니다. 하지만 AI가 음성을 이해하고, 활용할 수 있도록 가르치는 것은 쉽지 않은 일입니다. 사람이 몇 초면 만들 수 있는 음성 한 문..
Tech Log 2020. 8. 10. -
카카오미니의 슬롯 태깅 방법
시작하며 이전 글 카카오미니의 명령어 분류 방법에서 카카오미니가 음성을 인식하고 봇과 인텐트를 분류해 슬롯을 추출한 후 요청 동작을 수행하는 전 과정을 간단히 살펴보았습니다. 이번에는 이전 글에 소개된 명령어 분류 2, 3단계인 봇 분류, 인텐트 분류에 이은 카카오미니의 특별한 슬롯 태깅 기술이 들어간 4단계, 즉 슬롯 태깅에 대해 설명하고자 합니다. 카카오미니를 통해 발화를 인식하고 명령을 수행하기 위해서는 특정 봇, 특정 인텐트로 분류된 이후 슬롯 태깅이라는 단계가 필요합니다. 예를 들어 “아이유의 좋은 날 들려줘”라는 발화가 ‘music’ 봇의 'playSong' 인텐트로 분류되었다면, 음악을 틀어달라는 의도라는 것은 알 수 있겠죠. 하지만 구체적으로 어떤 가수의 어떤 노래를 재생해야 하는가는 봇과..
Tech Log 2020. 5. 22. -
카카오미니의 명령어 분류 방법
"헤이 카카오!" 아마 모두 한 번쯤은 들어봤을 친근한 말이죠. 카카오의 스마트 스피커, 카카오미니를 소환하는 말인데요. 카카오미니는 어떻게 사람들의 요청사항을 이해하고 기능을 수행할까요? 사용자가 카카오미니에게 명령을 내렸을 때, 다음과 같은 단계를 거치게 됩니다. (1) 음성인식, (2) 봇 분류, (3) 인텐트 분류, (4) 슬롯 추출, (5) 요청 동작 수행 아래 “SBS 라디오 틀어줘"라는 예시로 자세히 살펴보겠습니다. 변환 단계 설명 1단계. 음성 인식 텍스트 형태인 “SBS 라디오 틀어 줘”로 변환 2단계. 봇 분류 라디오와 관련된 기능 요청임을 인지 3단계. 인텐트 분류 라디오를 틀어달라는 요청인지를 파악. 라디오를 멈추거나, 가능한 라디오 채널 목록을 알려주거나, 지금 듣고 있는 라디오 ..
Tech Log 2020. 4. 24. -
"헤이, 카카오!"를 불러야 하는 이유
시작하며 카카오미니를 켜면, “이제 ‘헤이, 카카오!’라고 불러주세요”라는 말을 합니다. 여느 음성 인식 스피커와 마찬가지로, 카카오미니에게 원하는 명령을 하려면 일단은 스피커를 불러야 카카오미니가 귀를 기울이고 사용자의 명령을 들을 준비를 합니다. "헤이, 카카오!"와 같이 스마트 스피커를 부르는 단어를 호출 명령어(Wake-up Word) 또는 호출어라고 합니다. 그냥 “야, 노래 좀 틀어봐”라고 하면 편하겠지만, 그러면 스피커는 사용자가 자신을 부르는지 인식하지 못합니다. 그래서 조금 귀찮더라도 정해진 호출 명령어를 불러줘야 합니다. 각 제품마다 여러 가지 호출 명령어가 있으며, 사용자는 이들 중 하나를 선택해서 사용하게 됩니다. 본 글에서는 호출 명령어가 어떻게 정해지는지와 카카오미니가 어떻게 호..
AI Research 2020. 4. 24.