Tech Log

카카오엔터프라이즈 탐방기! (비전편)

chedda.choi 2022. 6. 29. 11:50

시작하며

여러분은 요즘 어디에서 일하고 계신가요? 코로나의 등장으로 다양한 근무 형태가 나타나고, 공간도 점차 개인화되면서 집이나 카페, 도서관 등 동료들과 서로 다른 각자의 공간에서 업무를 하는 경우가 많아지고 있습니다. 그러나 이렇게 다양한 업무 공간이 있음에도 불구하고 '오피스', 즉 사무실은 사라지지 않고 있는데요. 오히려 기업의 조직문화와 일하는 방식에 맞춰 더 정교하게 설계되고, 함께 일하는 사람들과 모일 수 있게끔 만들려는 경향이 강해졌죠.

 

카카오엔터프라이즈도 이러한 경향에 맞춰 오피스에 AI Vision 기술을 접목하고, 종합 업무 플랫폼인 카카오워크와 연동해 편안하고 즐거운 오피스를 만들고 있습니다.

 

‘사원증 없이 출입하는 카카오엔터프라이즈'

‘과자, 아이스크림, 주전부리 가득한 무인상점에 마음껏 오가는 방법'

‘업무 협업툴과 사옥의 완벽한 콜라보레이션!’ 


오피스 곳곳에 어떤 기술이 사용되는지, 어떻게 적용되었는지 모두 소개해 드릴게요. 입사한 지 갓 3개월 차 따끈따끈한 워크엔진서비스 기획자 Consi(박한결)의 눈으로 바라본 카카오엔터프라이즈 오피스 공간과 디지털 세계에서 더 나은 미래를 연구하는 워크스루셀 개발자 Dizi(오태일)가 바라본 오피스에 담긴 기술을 모두 알려드리겠습니다. 호그와트에 버금가는 카엔와트! 지금 시작합니다. Drop the beat! (비트 주세요-)

 

얼굴이 곧 사원증

우리 모두 사원증을 들고 오지 않아서 곤란했던 경험이 한 번쯤 있지 않나요? 내 회사인데 들어가지 못하는 그 당혹스러움, 워크스루는 그 당혹스러움을 해결하기 위해 시작되었습니다. 덕분에 카카오엔터프라이즈에서는 사원증 없이 회사에 출입하는 모습이 일상이죠.

워크스루란

워크스루란 사원증 없이 얼굴 인식만으로 사용자를 식별해서 출입 허가를 내어주는 기술입니다. 사용자가 얼굴을 보여주면 딥러닝 모델이 얼굴을 인식하고, 해당 사용자가 서버에 등록이 되어있는 사용자인지 확인합니다. 얼굴이 등록되어있다면 출입을 허가해주고, 아니라면 불허하는 방식으로 작동하죠.

[그림 1] 워크스루를 통해 출입증 없이 얼굴로 출입 가능한 모습 (마스크, 안경, 모자를 써도 올바르게 인식)

더욱 놀라운 점은 본인의 얼굴을 사옥에 직접 방문해 등록하는 것이 아니라, 종합 업무 플랫폼인 카카오워크에서 간단하게 등록할 수 있다는 것입니다. 카카오워크 앱의 워크스루 서비스에서 얼굴 정보 등록을 누르고 앨범에서 사진을 선택하거나 촬영하면 등록이 완료됩니다! 여기에 모자나 안경을 착용한 대체 외모까지 등록하면, 얼굴 인식 정확도가 더 높아진다고 해요. 물론 언제든 얼굴 정보 재설정도 가능합니다. 카카오워크를 통해 오프라인 공간을 더 쉽고 편리하게 이용할 수 있게 되면서, 효율적인 워크라이프를 이뤄냈답니다. 😊

[그림 2] 카카오워크 앱 내에서 워크스루를 등록한 모습

 

카카오 i 시각엔진

워크스루의 작동방식을 설명하기 위해선 카카오 i 시각엔진을 설명하지 않을 수 없네요. 카카오 i 시각엔진은 다양한 자동화를 위해 개발되어, 다방면으로 딥러닝을 활용할 수 있도록 만들었습니다.

워크스루는 시각엔진의 얼굴검출 모델과 얼굴인식 모델을 사용하여 개발되었습니다. 얼굴검출을 사용하여 사진의 어떤 위치에 얼굴이 있는지를 검출하고, 얼굴의 주요 위치(눈, 코, 입 등)를 예측합니다. 이렇게 예측한 위치를 저희가 지정한 위치로 옮겨주는 작업을 하게 되면 얼굴검출 모듈의 역할이 끝납니다. 작업된 사진을 얼굴인식 모델로 보내면 학습 과정을 거친 후, 학습된 얼굴인식모델은 벡터로 신원을 식별합니다. 특정 벡터와 등록된 벡터 중 일치하는 벡터가 없는지 혹은 일치한다면 해당 사용자가 누구인지 확인합니다.

[그림 3] 얼굴 검출 인식 모델 Flow
[그림 4] 얼굴 검출 후 위치조정까지의 이미지 처리 과정

카카오 i 시각엔진의 성능에 대해 많이 궁금하실 텐데요. 딥러닝 모델의 성능을 향상하는 데에는 많은 데이터가 필요합니다. 인식 관련 모델의 성능과 데이터는 보안과 직결되기 때문에 불안하다고 느끼실 수도 있습니다. 그렇기에 저희는 더욱 강경한 모델을 위해서 사내 무인상점을 운영하여 데이터를 계속 수집하고, 활발한 연구를 통해 성능을 고도화하고 학회에 공개하고 있습니다. (연구와 관련된 자세한 논문은 AI Research를 통해 확인해보세요!) 그나저나 사내에 무인상점이라니, 놀랍죠?! 지금 바로 소개해드릴게요!

 

여러모로 굉장한 비전룸!

카카오엔터프라이즈 오피스는 크루들이 언제든지 간식을 드실 수 있도록 무인상점인 "비전룸"을 운영하고 있습니다. 비전룸에는 맛있는 아이스크림과 과자 등 다양한 간식부터 사과, 요거트, 컵라면까지 간단하게 요기할 수 있는 간식이 모든 크루들을 위해 항상 준비되어 있죠. 비전룸 역시 딥러닝 기술을 적용하여 출입을 관리하고 있답니다!

무인상점 비전룸

최근 무인상점에 대한 관심과 수요가 증가하면서, 카카오엔터프라이즈에선 무인상점과 관련된 기술들을 적극적으로 연구하고 있습니다. 무인상점에 들어온 사용자가 어떠한 상품을 들고 나갔는지 인식하는 딥러닝 모델을 개발하고 있고, 여기에 우리의 비전룸이 많은 도움을 주고 있습니다. 

[그림 5] 비전룸 출입하는 모습 (언제나 신나요 😆)

무인상점을 위한 딥러닝 모델을 만들기 위해 비전룸에서 방대한 영상 데이터를 쌓고, 해당 데이터로 성능을 평가하고 있습니다. 보통 이런 영상 데이터는 고가의 뎁스 카메라 여러 대로 수집하는 경우가 많은데, 카카오엔터프라이즈는 적은 수의 일반 RGB 카메라만으로 높은 성능의 기술을 구현했답니다. 어떻게 구현할 수 있었는지 저희와 함께 비전룸의 기술에 대해 알아볼까요?

[그림 6] 무인상점 사용자의 Pose estimation과 트래킹
[그림 7] 무인상점 내 사용자의 3D 좌표 인식

 

딥러닝

[그림 8] 무인상점 모델 Flow (출처 : if(kakao)2020 무인 편의점 개발기 : Edge Device로 Object Tracking 시스템 구축하는 방법)

무인상점에는 크게 4가지의 기술이 들어갑니다. ① 먼저 객채 검출기로 상점에 들어온 사람의 위치와 그 사람이 누구인지 인식합니다. ② 상점에 들어온 사람은 끊임없이 움직이기 때문에 동영상의 프레임 변화를 계속 관측하면서, Tracking 기술을 사용해 전/후 프레임의 차이를 기준으로 이동한 사람을 지속적으로 검출합니다. ③ 또한, 자세 인식기로 그 사람의 관절을 인식하고, 검출된 주요관절들을 Pose Estimator를 사용하여 예측합니다. ④ 이러한 예측은 상점 내 다양한 위치에 있는 카메라에서 동시 진행되며, 최종적으로 3D 좌표를 추정하여 사용자의 정확한 위치를 파악할 수 있습니다. 이렇게 4가지 기술을 토대로 파악된 위치를 가지고 어떤 사용자가 매대 근처에 있는지를 확인합니다. 파악된 위치와 함께 매대에 설치된 무게 센서가 무게를 인식하고 있어 만약 무게가 줄어들면 매대 근처에 있던 사용자가 물건을 가져갔다고 판단합니다.

 

마치며

지금까지 카카오 i 시각엔진 기술이 접목된 카카오엔터프라이즈의 공간들을 살펴보았는데요. 평범한 일상 공간으로 알고 즐겁게 다니기만 했었는데 어떤 기술이 사용되었는지, 무슨 이유로 만들어졌는지까지 알 수 있어서 정말 좋은 시간이었어요. (이제 주변 크루들에게 아는 척하고 다닐 거예요 🥳) 마지막으로 하고 싶은 말 한마디씩 할까요?

 

Dizi : 카카오톡이 일반 사용자들의 거대한 플랫폼으로 거듭난 것처럼, 카카오엔터프라이즈도 다양한 회사를 어우르는 서비스를 개발하여 거대한 플랫폼 회사로 성장했으면 좋겠습니다. 또한 딥러닝 개발자로서, 딥러닝을 사용한 업무의 자동화 기술이 빨리 개발되어 많은 회사에 적용되길 바랍니다. 

 

Consi : 저는 카카오엔터프라이즈의 AI 기술이 그저 기술만으로 멈추지 않고, 플랫폼과 연동되어 실생활에 유용하게 쓰인다는 점이 너무 좋아요. 플랫폼으로 언제 어디서나 실시간 등록이 가능하다는 점도 편하고요! 아마 곧 사내 회의실이나 카페테리아도 카카오워크와 연동되어 예약하고 쓸 수 있게 되지 않을까요? 더 나아가 다른 기업들에도 우리의 시스템을 전파하는 카카오엔터프라이즈가 되면 좋겠네요. 

 

지금까지 콘시와 디지의 카카오엔터프라이즈 비전 탐방기였습니다. 재밌게 보셨다면 좋아요, 구독, 공유까지! 부탁드려요 💛

Consi (박한결)

Why not?! 불가능이 뭐죠? Why so Serious? 재밌게 일하는 기획자입니다.

Dizi (오태일)

디지털 세계에서 더 나은 미래를 위해 얼굴영상 처리를 연구하는 디지입니다~