Kakao Enterprise83
-
FRVT 1:1 검증 챌린지 참가 스토리
시작하며 얼굴 인식 기술은 지난 수십년 간 컴퓨터 비전의 주요 연구 분야 중 하나로 자리매김하고 있습니다. 카카오 또한 딥러닝을 이용한 관련 연구개발을 진행하고 있죠. 지난 2016년 말 출시된 '라이브픽'은 자사 얼굴 인식 기술을 사용한 대표적인 예입니다. 이 이미지 검색 서비스([그림 1])는 시사회, 시상식, 사인회, 공항 출입국과 같은 이벤트별로 모은 스타 사진을 시간순으로 보여줍니다. 당시 개발한 모델이 주로 학습한 데이터셋에는 서양인 얼굴이 많이 포함돼 있어 동양인 얼굴을 제대로 인식하지 못하는 문제가 있었습니다. 동양인 얼굴 이미지 수집 및 레이블링, 모델을 개선하면 좋겠다는 논의를 바탕으로 새로운 얼굴 인식 모듈 개발에 성공한 카카오는 이전보다 훨씬 더 정확한 라이브픽 서비스를 제공할 수 ..
Krew Insight 2020. 6. 16. -
[TW] Technical Writer에서 Technical Communicator로...
시작하며 안녕하세요, 카카오엔터프라이즈에서 Technical Writer(이하 테크니컬 라이터)로 일하고 있는 Sandy입니다. :) 이번 포스팅에서 제가 속한 테크니컬라이팅 팀에서 하는 일과 관련된 Technical Writing, Technical Writer, Technical Communicator 등의 개념을 소개하고자 합니다. 여러분은, 테크니컬 라이터라는 직업을 들어보신 적 있으신가요? 많은 분들이, 아니 대부분, 라고 들었을 때, 기획이나 개발 직군과 달리 생소한 느낌을 받으셨을 거라고 생각해요. 테크니컬 라이터로서, 아쉽긴 하지만, 제가 과장을 조금 보태서 말하자면 어느 회사에서나 규모는 작아도 어느 직무보다 매력적인 직업이라는 것을 말씀드리고 싶어요. 개념과 직무가 다소 생소하더라도 꼭..
Krew Insight 2020. 5. 25. -
카카오 i 번역 성능 향상 실험 : 대규모 말뭉치를 활용한 사전학습
시작하며 사전학습(pretraining)은 데이터양이 절대적으로 적은 상황에서 적용하는 기법입니다. 문제(본 훈련)에서 제시되는 것과 유사한 형태의 데이터로 모델을 사전학습시키면 본 훈련에 효과적인 매개변수(parameter) 초기값 확보에 크게 도움이 되어서죠. 오늘날 대규모 말뭉치(corpus)를 사전학습한 언어 모델(language model)이 자연어처리(NLP)에서 주류로 자리하게 된 것은 바로 이런 효과 덕분입니다. 하지만 대용량 데이터를 사전학습해 성능을 크게 끌어올린 최신 언어 모델이 모든 NLP 태스크를 잘 풀지는 못합니다. 단적인 예로, 하나의 언어로 구성된 문장에서 특징(feature)을 추출하는 데 주안을 둔 언어 모델은 여러 언어에서의 특징 추출이 중요한 번역 태스크에는 적합하지 ..
Tech Log 2020. 5. 7. -
카카오미니의 명령어 분류 방법
"헤이 카카오!" 아마 모두 한 번쯤은 들어봤을 친근한 말이죠. 카카오의 스마트 스피커, 카카오미니를 소환하는 말인데요. 카카오미니는 어떻게 사람들의 요청사항을 이해하고 기능을 수행할까요? 사용자가 카카오미니에게 명령을 내렸을 때, 다음과 같은 단계를 거치게 됩니다. (1) 음성인식, (2) 봇 분류, (3) 인텐트 분류, (4) 슬롯 추출, (5) 요청 동작 수행 아래 “SBS 라디오 틀어줘"라는 예시로 자세히 살펴보겠습니다. 변환 단계 설명 1단계. 음성 인식 텍스트 형태인 “SBS 라디오 틀어 줘”로 변환 2단계. 봇 분류 라디오와 관련된 기능 요청임을 인지 3단계. 인텐트 분류 라디오를 틀어달라는 요청인지를 파악. 라디오를 멈추거나, 가능한 라디오 채널 목록을 알려주거나, 지금 듣고 있는 라디오 ..
Tech Log 2020. 4. 24. -
신경망 번역 모델의 진화 과정
이 글은 2017년 카카오 AI 브런치에 게재된 포스팅을 가져온 것으로, 본문에서 설명하고 있는 모델 성능, 번역 결과 등은 모두 2017년 당시 자료를 바탕으로 합니다. 2017년까지의 신경망 기반 기계번역(Neural Machine Translation, NMT)의 히스토리를 정리했고, 현재는 대세가 된 NMT 모델 Transformer에 대한 전망 또한 담겨 있습니다. 이를 통해 기계번역의 발전 흐름을 이해하고 향후 발전 방향성에 대해서도 생각해볼 수 있는 시간을 가질 수 있을 것이라 생각합니다. 시작하며 End-to-End 방식의 신경망 기반 기계번역(Neural Machine Translation, 이하 NMT)이 통계 기반 기계 번역(Statistical Machine Translation, ..
Tech Log 2020. 4. 24.