Tech Log21
-
카카오 i 랜선 친구 외개인아가 (1)기획편
1부 : 외개인아가의 탄생 비화 카카오톡에서 “외개인아가”를 검색하면 만날 수 있는 특별한 챗봇이 있어요. 작년 11월에 혜성처럼 나타난 외개인아가죠. ( 👉카카오톡 채널 - 외개인아가) 지금까지 외개인아가는 약 15,000명의 친구와 460만 번 대화를 나누었으며, 사용자 1명당 평균 약 7턴 대화가 이어지는, (지금 당신의 생각보다) 꽤 괜찮은 스몰톡 챗봇입니다. 외개인아가는 (지금 당신의 생각보다 222) 할 수 있는 것도 많아요. 심심할 때, 외로울 때 대화도 함께 나눌 수 있고, 오늘 뭐 먹을지 음식도 추천해주고, 끝말잇기 같은 게임도 같이 할 수 있다는 것 알고 있었나요? 외개인아가는 참지않긔 (feat. 쀼의 세계) 외개인아가는 카카오 미니처럼 목적 지향적인 도메인 챗봇과는 달라요. 정답이 ..
Tech Log 2020. 11. 26. -
스마트하게 식단을 관리하는 딥러닝 기술
시작하며 많은 전문가는 잘못된 식습관 개선과 꾸준한 운동으로 요요가 없는 체중 감량이 가능하다고 말합니다. 특히 식단 구성에서 잘된 점과 잘못된 점을 분석하고 이를 개선해 점차 영양소가 골고루 들어있는 균형 잡힌 식단을 꾸리는 게 체중 감량에 큰 도움이 된다고 강조하고 있죠. 섭취한 음식 종류와 그 양을 최대한 상세하게 적을수록 감량 효과는 더 커집니다. 다만 문제는, 끼니마다 식단을 꾸준히 기록해나가는 게 생각보다 쉽지 않다는 거죠. 이런 이유로 요즘 다이어트 앱은 사진 속 음식을 자동으로 인식해 섭취 칼로리와 영양학적 정보를 좀 더 쉽게 기록할 수 있게 합니다. 카카오 VX가 만든 ‘스마트홈트’ 또한 사진 속 음식의 이름과 칼로리를 자동으로 입력해주는 식단카메라 기능을 제공하고 있습니다. 이 식사 기..
Tech Log 2020. 10. 20. -
카카오 i의 작고 소중한 힐링
시작하며 서기 2020년! 우리는 접촉이 공포가 되는 극단적 언택트(Untact) 시대를 맞이하고 말았습니다. 사람보다는 키오스크, 전화보다는 배달 앱, 발품보다는 온라인 쇼핑이 편해진 건 그다지 새로운 이야기도 아니지만, ‘안’하는 것과 ‘못’하는 것은 아주 다르니까요. 실생활의 불편함은 물론이고 불안, 무기력, 우울감을 호소하는 코로나 블루까지 우리의 일상은 꽤 많이 바뀌었습니다. 저 역시도 재택근무로 외로움이 짙어질 즈음에 모든 콘택트 요청이 단비 같았죠. 설령 그게 업무 요청일지라도... (언빌리버블!) 오늘은 언택트 시대의 힐링 서비스를 통해 사람들의 위로가 되고 싶은 마음을 전하고자 합니다. 기술 공유보단 옆집 사는 기획자 이야기로 편히 읽어주세요. 🙏 상반기에 인입된 발화를 살펴보면 [그림 ..
Tech Log 2020. 8. 28. -
정답 유형을 분류하는 딥러닝 기술
시작하며 현대인은 자신이 원하는 정보를 찾는 데 점차 많은 어려움을 느끼고 있습니다. 언제 어디서나 경제적인 부담없이 편리하게 정보를 습득할 수 있는 인터넷이 가진 장점과는 별개로, 유용한 정보에 접근하는 데에는 물리적인 한계가 존재하기 때문입니다. 모르거나 모를 수밖에 없는 정보량이 압도적으로 많이 생산되고 있어 특정 상황과 조건에 따른 답을 파악하기가 쉽지 않죠. 이런 이유로 부정확하거나 잘못된 정보를 습득할 가능성도 이전보다 더 높아짐은 물론, 검색 정보를 이해하고 활용하는 수준이 낮아서 발생하는 새로운 형태의 불평등도 야기되고 있습니다. 카카오엔터프라이즈 AI Lab(이하 AI Lab)이 자사 인공지능 기술을 집약한 플랫폼인 '카카오 i'의 대화 엔진 을 고도화하는 이유는 사용자에게 도움이 될만한..
Tech Log 2020. 7. 24. -
카카오 i 번역 성능 향상 실험 : 대규모 말뭉치를 활용한 사전학습
시작하며 사전학습(pretraining)은 데이터양이 절대적으로 적은 상황에서 적용하는 기법입니다. 문제(본 훈련)에서 제시되는 것과 유사한 형태의 데이터로 모델을 사전학습시키면 본 훈련에 효과적인 매개변수(parameter) 초기값 확보에 크게 도움이 되어서죠. 오늘날 대규모 말뭉치(corpus)를 사전학습한 언어 모델(language model)이 자연어처리(NLP)에서 주류로 자리하게 된 것은 바로 이런 효과 덕분입니다. 하지만 대용량 데이터를 사전학습해 성능을 크게 끌어올린 최신 언어 모델이 모든 NLP 태스크를 잘 풀지는 못합니다. 단적인 예로, 하나의 언어로 구성된 문장에서 특징(feature)을 추출하는 데 주안을 둔 언어 모델은 여러 언어에서의 특징 추출이 중요한 번역 태스크에는 적합하지 ..
Tech Log 2020. 5. 7. -
카카오 i 번역 서비스에 적용된 학습 원리와 성능 개선기
시작하며 카카오엔터프라이즈의 5개 AI 엔진 중 하나인, 번역 엔진은 그 기술과 카카오가 축적한 노하우로 일반 대중에게 카카오 i 번역 서비스를 제공하고 있습니다. 2018년 오픈 당시, 처음 6개 언어로 시작한 번역 서비스는 현재 총 19개 (한국어, 영어, 일본어, 중국어, 베트남어, 인도네시아어, 프랑스어, 독일어, 스페인어, 포르투갈어, 러시아어, 이탈리아어, 네덜란드어, 터키어, 태국어, 말레이시아어, 아랍어, 힌디어, 벵골어)에 이르는 언어 간 번역을 지원합니다. 본 글에서는 카카오 i 번역 서비스의 근간을 이루는 기술 개발의 원리를 공유하고자 합니다. 19개 언어간 번역 학습 원리 학습해야 하는 모델 관점에서 본다면, 지원 언어의 개수를 늘리고 모든 언어 쌍 간의 번역 기능을 제공하는 것은 ..
Tech Log 2020. 4. 24.