본문 바로가기
    Krew Talk 2020. 5. 7.

    카카오엔터프라이즈 CTO가 전하는 인공지능 이야기

    지난 2019년 12월 카카오 사내 독립기업(CIC)이었던 AI LAB이 분사해 세워진 카카오엔터프라이즈의 AI Lab(이하 AI Lab)은 인공지능 기술을 집약한 플랫폼인 ‘카카오 i’를 고도화하는 데 필요한 기술의 연구·개발을 담당하고 있습니다.

     

    그렇다면 AI Lab은 어디에 지향점을 두고 인공지능 기술을 만들어나갈까요? AI Lab의 수장이자 최고기술책임자(CTO)인 클로드를 만나 관련 이야기를 들어봤습니다.

     

    [ 그림 1 ] 카카오엔터프라이즈의 CTO 클로드

     

    ※클로드는 네이버, 삼성전자, 카카오 등의 기업에서 기술 개발과 연구를 해왔습니다. 기술에 대한 전문 지식과 오랜 경험을 바탕으로 현재는 카카오엔터프라이즈의 CTO로서 AI Lab을 이끌고 있습니다.

     

    클로드가 경험한 인공지능 기술 이야기

    “폰 노이만 기계[각주:1]가 유일한 컴퓨팅 방식이라고 생각했던 저에게 인공신경망[각주:2]은 매우 신선하고 흥미로운 방법론이었습니다. 하지만 이런 기대와는 달리, 데이터마다 오차의 변동 폭이 높아 인공신경망으로는 안정적인 학습을 기대하기가 어려웠습니다. 또한, 오차가 0으로 수렴하는 조건을 만드는 기법이 제한적이라 실제 실험에서는 오차가 되려 폭증하는 현상이 비일비재하게 발생했습니다.”

     

    "이런 이유로 제가 학교에 다니던 1990년대에는 모두가 인공지능은 잘 안 될 거라 이야기했습니다. IT서비스 개발에 인공신경망을 쓰는 사례도 거의 없었죠. 하지만 보세요. 오늘날 거의 모든 기업에서 딥러닝[각주:3]을 활용하고 있습니다. 카카오 또한 다음(Daum) 앱이나 카카오내비, 카카오맵 등 여러 앱 서비스의 기능 중 하나였던 음성인식이나 이미지인식에 부분적으로 딥러닝 기술을 적용하고 있죠."

     

    2000년대 초반에는 인공신경망이라는 단어만 나와도 논문 심사 단계에서 거절당하는 경우가 비일비재했습니다. 학계에서는 인공지능의 재부흥이 어려우리라는 자조적인 목소리도 서슴없이 튀어나왔습니다. 오늘날 인공지능 선구자로 추앙받는 토론토 대학교의 제프리 힌튼 교수, 몬트리올 대학교의 요수아 벤지오 교수, 뉴욕대학교 얀 레쿤 교수만이 그 명맥을 겨우 이어갔을 뿐입니다. 이런 이유로 2010년대 초반까지도 서포트벡터머신(Support Vector Machine)[각주:4]이나 베이지안(Bayesian neural network)[각주:5]과 같은 전통적인 기계학습 방법론으로 주로 사용됐습니다.

     

    그러다 2012년 ILSVRC(ImageNet Large Scale Visual Recognition Competition)[각주:6]에서 AlexNet[각주:7] 우승을 계기로, 기존 통계 모델보다 더 나은 성능을 내는 딥러닝 모델이 큰 인기를 구가하기 시작했습니다. 딥러닝은 객체 인식, 필기 인식, 자연어처리와 같은 복잡한 문제를 상대적으로 단순한 방식으로 처리할 수 있으면서도 뛰어난 결과를 냈습니다.

     

    다만 클로드가 카카오의 추천팀으로 합류한 2013년에도 딥러닝 기술 연구개발은 기업이 아닌 학교가 주도하는 거라는 인식이 여전했습니다. 지난 수십 년간 쓴 실패를 이미 맛본 영향이 컸습니다. 그러다 아마존(Amazon)의 음성인식 스피커 ‘에코(Eco)’의 출시를 계기로 전 세계가 딥러닝 기술의 활용처를 찾는 데 보다 적극적으로 관심을 두기 시작했습니다. 

     

    "딥러닝 기반의 음성인식 기술이 생각보다 완성도가 높다고 느꼈어요. 지난 2015년 다음과 카카오가 합병한 이후, 검색조직까지 맡았던 저는 서비스마다 제각기 존재하던 검색과 추천 엔진을 우선 하나로 합쳐야겠다 싶었습니다. 일원화된 딥러닝 프로젝트를 가동해야 한다는 점에 내부 공감대가 형성된 덕분에 작업은 일사처리로 진행됐습니다. 어떻게 보면 카카오미니는 딥러닝 연구개발 프로젝트 본격화의 시발점이라 볼 수 있겠네요."

     

    [ 그림 2 ] 카카오의 스마트 스피커 ‘카카오미니’

    AI Lab의 방향성

    현재 AI Lab에만 수백 명의 사람이 배치돼 있습니다. 이 많은 사람을 이끄는 수장은 어떤 방식으로 조직을 운영할까요? 우선, AI Lab은 인공지능 기술을 연구하는 사람과 개발하는 사람을 따로 구분 짓지 않습니다. 자신의 전문 분야에서 최고가 되는 데 목표가 있다면 본인이 자발적으로 연구와 개발을 주도하리라는 판단이 있었습니다. 클로드는 앞으로도 유연한 형태로 조직을 운영하는 데 집중한다는 계획입니다.

     

    아울러 AI Lab은 학술 연구를 목표로 하지 않고 있습니다. 기업은 자사가 보유한 서비스나 솔루션에 신기술을 적용하면 새로운 비즈니스 가치를 창출할 수 있는지를 우선해야 한다는 게 클로드의 생각입니다. 기술 검증 후 서비스 도입까지 대략 1년 정도 걸린다는 점을 고려해 최신 기술을 발 빠르게 채택하는 결단력도 갖출 필요가 있습니다. 이에 AI Lab은 기술의 실질적 활용성을 극대화하는 데 방점을 두고 독자적인 기술 로드맵을 구축하는 중입니다.

     

    클로드는 신기술에 민첩하게 대응하기 위해서는 보다 원활한 커뮤니케이션이 필요하다고 강조했습니다. AI Lab에서 각 인공지능 엔진을 담당하는 부서의 조직 내 역할과 책임이 명확하게 나누어져 있습니다. 이렇다 보니 강화학습을 비롯해 금융시장에 도입되는 딥러닝 등 최신의 딥러닝 연구 트렌드를 기민하게 대응하기 쉽지 않습니다. 클로드는 이런 상황을 타개하고자 활발한 공유와 개방적인 협력, 잦은 정보 교류가 일어날 수 있도록 시스템을 재정비하고 있습니다. 각 담당 부서에서 개발한 딥러닝 학습 모델을 내부 공유하는 'AI허브(AIHUB)'가 그 구심점 역할을 해줄 것으로 보입니다.

     

    AI Lab은 딥러닝 기술의 고도화를 위해서는 다른 공동체(카카오 계열사 및 자회사를 이르는 말)와의 협력이 필수라고 여기고 있습니다. 더욱 활발한 기술교류의 토대를 닦고자 공동체와 공동연구협약 체결을 진행한다는 계획입니다. 각사가 보유한 데이터의 공유와 서비스 품질 고도화에 필요한 기술 개발을 골자로 합니다. 현재 카카오VX, 카카오 모빌리티, 카카오페이, 카카오브레인 등과 논의 중입니다.

     

    "각자 고유의 영역인 사업과는 달리, 연구개발이 이뤄지는 본체가 한곳에 집중된다면 카카오엔터프라이즈는 물론 카카오 공동체 모두에게 도움이 될 것이라 내다보고 있습니다. 우선 AI Lab과 공동체가 함께 개발한 인공지능 기술이 각 사의  실제 서비스나 제품에 접목돼 열렬한 시장 반응을 끌어낼 수 있었으면 좋겠습니다. 카카오엔터프라이즈의 경쟁력은 시장에서 충분히 검증받은 기술력을 기업용 솔루션 및 플랫폼 개발에 녹여내는 데서 나오리라 기대합니다.”

    추론 영역에 도전하는 AI Lab

    오늘날의 인공지능은 사람의 감각기관처럼 어떤 대상을 높은 정확도로 인식하거나, 세세한 시나리오를 설정해 어떤 상황에서 특정한 입력이 들어오면 사람이 의도한 답을 내는 수준에 머물고 있습니다. 따라서 사람처럼 이미 알려진 정보를 근거로 삼아 다른 판단을 끌어내는 추론이 가능한 인공지능을 만들기까지는 두세 번의 퀀텀 점프(Quantum Jump)[각주:8]가 일어나야 한다는 게 클로드의 생각입니다. 하지만 1990년대 탄생한 웹이 2010년대에 이르러 세상을 보는 창이 되는데 걸렸던 시간보다 더 빠르게 발전하는 속도를 봤을 때, 기대보다 더 빠르게 상상이 현실로 나타날 수도 있을 거라 부연했습니다.

     

    "과거 키보드-마우스와 (스마트폰의) 터치에 이어, 음성이 새로운 인터페이스로 자리 잡았습니다. 이런 기존 검색 방식에서는 사람이 무엇인가를 입력하기 전까지는 사용자의 의도를 파악할 수가 없었습니다. 하지만 가까운 미래에는 사용자가 직접 명령어를 입력하지 않고도 시간적, 공간적, 상황적 맥락까지 함께 고려해 능동적으로 제안하는 검색 방식이 자리할 거라 봅니다. 이런 관점에서 봤을 때 딥러닝 또한 컴퓨터를 쓰는 새로운 방법이 될 거예요.

     

    최근 AI Lab이 한참 진행 중인 딥러닝 개발 프로젝트인 DFLO(Dual, Deep Learning, Dialog)[각주:9]가 클로드의 상상을 구체화할 실마리가 될 것으로 기대됩니다. 이 프로젝트에서는 레스토랑, 콜센터, 드라이빙 스루, 영화관, 병원, 호텔 등 특정 상황 또는 장소에 필요한 자동화된 고객 응대 시스템 개발을 진행하고 있습니다. 포털사이트 다음에서 수집한 300억 건의 문서와 40억 건의 이미지, 3억 건의 지식 그래프(Knowledge Graph)[각주:10] 등을 활용해 대화 엔진을 만들어 본 경험이 자산이 될 것으로 예상됩니다.

     

    [ 그림 3 ] ‘if kakao 2019’ 기조연설자로 나서 AI Lab의 DFLO 프로젝트를 발표하는 클로드

     

    "현재  이 프로젝트는 어떤 분야를 우선 자동화하면 좋을지를 구체적으로 논의하는 단계에 있습니다. 사용되는 단어나 질문의 의도가 명확한 고객 응대 매뉴얼 일부는 자동화가 가능하리라 기대합니다. 레스토랑에서 웨이터가 고객에게 주문받는 방식을 떠올려보죠. 모든 경우의 수를 따져봐도 대화 종류는 1,000개도 되지 않습니다. 시나리오가 정해진 상황에서는 사용자가 만족할만한 수준의 기술 제공은 가능하리라 판단하고 있습니다."

    AI Lab의 인재상

    AI Lab은 모델 경량화, 자연어처리, 음성처리, GPU를 사용한 딥러닝 연구 플랫폼 개발 등 전 분야에 걸쳐 인공지능 연구개발 인력을 채용하고 있습니다. 그렇다면 AI Lab에서 원하는 인재는 한마디로 어떻게 정의해볼 수 있을까요? 클로드는 3가지 키워드를 뽑았습니다.

     

    [ 그림 4 ] 카카오엔터프라이즈 웹사이트 내 채용 이미지

     

    "첫번째, 주체적인 사람이었으면 좋겠습니다. 자신이 하는 일에 본인 스스로 동기를 부여하는 사람, 자기가 좋아하는 일을 하려는 사람이 성과를 낼 수 있다고 보기 때문이죠. 물론 남이 대신 동기를 제공해 줄 수 있겠으나, 연구개발 쪽은 그렇지 않은 듯합니다. 자신이 하는 일을 좋아해야 최신의 기술 트렌드를 발 빠르게 쫓는 게 가능하다고 봅니다. 우선은 자신이 속한 조직에서 한두 개 프로젝트를 먼저 해보고 나서 자신만의 방향성을 찾았으면 좋겠습니다. 자기 주도적으로 기술을 연구하고 개발을 할 수 있는 사람이라면 분명 AI Lab에서 좋은 성과를 만들 수 있으리라 봅니다."

     

    "두번째, 집요한 사람이었으면 좋겠습니다. 전세계에서 나오는 각종 논문과 자료를 참고하면 얼추 다른 사람들과 비슷한 성능을 내는 지점까지 따라가기는 상대적으로 쉬운 축에 속합니다. 하지만 어떤 모델을 선택하느냐에 따라 초매개변수(hyperparameter)[각주:11]를 어떻게 설정하느냐에 따라, 어떤 학습 데이터셋을 선택하느냐에 따라 실험 결과는 천차만별일 수 있습니다. 수도 없이 반복되는 실험을 통해 논문 한 편을 내기까지는 최소 6개월 이상의 시간이 걸립니다. 그렇게 해서 만들어낸 0.02%P 더 나은 성능은 사람의 냉철한 분석력과 뜨거운 집념, 집요한 끈기로 완성되는 거죠. 물론 사용자에게는 이 정도의 성능 향상은 큰 관심사가 아닐 수 있습니다. 하지만 조금이라도 더 좋은 걸 만들기 위해 노력하는 자세가 조금이라도 남보다 더 나은 성과와 AI Lab만의 색깔을 만들어낸다고 생각합니다."

     

    "세번째, 다르게 생각하는 사람이었으면 좋겠습니다. 기술로 어떻게 돈을 벌 수 있을지도 생각하는 모습이 가장 이상적일 수는 있습니다. 하지만 모든 구성원이 사업성까지 고려하면서 기술을 연구개발할 수 없고, 그래서도 안 된다고 생각합니다. 다행히도 AI Lab 구성원은 자신의 전문 분야에서 시장이 실용적인 기술 또는 서비스를 만드는 데 관심이 참 많습니다. 100명의 사람이 있다면 100개의 생각과 아이디어를 장려하는 조직이 건강하다고 보는 거죠. 이게 AI Lab이 늘 새로운 분야에 도전할 수 있는 원동력이 되어 줄 것입니다. 보통의 사람과는 다른 접근 방식을 고민하는 사람들이 AI Lab에 모였으면 좋겠습니다."

    이수경(samantha) | 작성, 편집

    지난 2016년 3월 알파고와 이세돌 9단이 펼치는 세기의 대결을 취재한 것을 계기로 인공지능 세계에 큰 매력을 느꼈습니다. 카카오엔터프라이즈에서 인공지능을 제대로 알고 싶어하는 사람들을 위해 전문가와 함께 읽기 쉬운 콘텐츠를 쓰고 있습니다. 인공지능을 만드는 사람들의 이야기와 인공지능이 바꿀 미래 사회에 대한 글은 누구보다 쉽고, 재미있게 쓰는 사람이 되고자 합니다.

    새로운 길에 도전하는 최고의 Krew들과 함께 해요!

    [AI기술] 머신 러닝 응용 분야 전문가 모집

    1. 중앙처리장치(CPU)의 연산 결과를 메모리에 기억하고 하드디스크와 같은 저장장치에 기록하는 구조 [본문으로]
    2. 뇌의 뉴런 작용에서 영감을 받은 통계학적 학습 알고리즘으로, 데이터를 입력하는 뉴런들로 구성된 입력층과 결과를 출력하는 뉴런으로 구성된 출력층, 특징을 추출하는 뉴런으로 구성된 은닉층을 한 개 이상 두는 다층 퍼셉트론으로 구성된다. [본문으로]
    3. 딥러닝은 기존의 인공신경망과 비교했을 때 정말 많은 은닉층을 둔 심층신경망(deep neural network, DNN)을 활용해 데이터로부터 특징을 스스로 추출한다. [본문으로]
    4. 이진 선형 분류 모델 [본문으로]
    5. 일련의 변수 집합의 조건부 의존성을 표현한 확률적 그래프 모델 [본문으로]
    6. 대용량 영상을 분류하고 객체를 검출하는 연구를 활성화하려는 목적으로 2010년 시작된 워크샵이다. 2012년 AlexNet 이후 상위 팀은 대부분 CNN 기반 알고리즘을 제출했다. 2015년도 대회에서 우승한 마이크로소프트 리서치(Microsoft Research)의 ResNet은 1,000개의 클래스로 분류하는 문제의 top-5 오차율(학습 모델이 가장 높은 확률로 예측한 5개 범주의 틀린 빈도)을 3.54%까지 낮추었다. [본문으로]
    7. 캐나다 토론토대학교의 알렉스 크리제브스키가 만든 CNN 기반 알고리즘 ‘알렉스넷(AlexNet)’은 1,000개의 클래스로 분류하는 문제에서 top5 오차율을 2등(26.2%)보다 훨씬 낮은 16.4%를 보이며 기존 DNN 모델에 비해 정확도를 훨씬 높였다. [본문으로]
    8. 비약적인 성장이나 발전을 가리키는 말 [본문으로]
    9. AI(dual), 딥러닝(deep learning), 대화(dialog)를 상징하는 'D'와 흘러감을 뜻하는 '플로(flow)'의 합성어 [본문으로]
    10. 해당 검색어와 연결된 다양한 연관 정보를 종합적으로 파악한 후에 사용자가 원하는 결과를 우선 선별해 제공하는 일을 말한다. [본문으로]
    11. 개발자가 머신러닝 알고리즘에서 직접 조정하는 값. 필터 수나 모델의 층수, 필터 크기 등이 여기에 해당한다. [본문으로]

    댓글0

Hiring Now!

새로운 혁신의 길을 함께할 크루를 기다립니다.
자세한 내용은 카카오 엔터프라이즈 영입 페이지를 참고해주세요.

바로가기