시작하며
현시점 기술 시장에서 가장 주목받고 있는 두 기업, Google과 Microsoft의 연례 최대 개발자 행사 Google I/O 2023와 Microsoft Build (이하 MS Build)가 5월에 연이어 진행되었습니다. 금년 행사는 구글이 100여가지, 그리고 MS는 50여가지의 신규 오퍼링들을 대거 발표하였습니다. 구글의 AI 전략 발표에 이어 MS가 Build 행사를 통해 발표할 내용에 업계의 이목이 쏠렸는데요. 이번 달 진행된 각 행사들은 오늘 날 기술 시장의 방향성을 주도하는 기업인 MS와 그들의 가장 큰 경쟁사 구글이 그리고 있는 그림에 따른 향후 AI 시장 트렌드가 움직일 방향성을 엿볼 수 있었습니다.
두 기업은 모두 예상대로 생성형 AI를 전면에 앞세웠습니다. 특히 코딩, 문서 작성 업무, 일상 속 커뮤니케이션 및 검색 등 범용적인 태스크 수행이 가능한 AI 에이전트 기능들을 강조되었으며, 이러한 최신 AI 기능들을 제품과 서비스 단위가 아닌, PC나 모바일 OS 단위로 적용하며 제품 생태계 전반에 걸쳐 사용자의 디지털 경험에 패러다임을 가져오고자 하고 있습니다.
그럼, 금주에는 Google I/O와 MS Build에서 각각 발표된 주요 내용들을 추려보고, 주요 발표 내용에서 드러난 현시점 각 기업의 생성형 AI 전략에 대하여 살펴보며 두 시장 리더들이 AI 시장의 방향성을 어떻게 이끌어가고 있는지 살펴보겠습니다.
Google I/O
※ 아래 발표된 기능들은 본 링크에서 대기명단 등록을 통해 일정 기간동안 테스트해보실 수 있다고 합니다.
검색 + 생성형 AI
구글은 I/O 행사에서 무려 100개 가량의 신규 제품 및 서비스를 발표했는데요. 로이터 통신이 금년 구글 I/O를 'AI 뷔페'라고 비유할 정도로 구글은 자사의 모든 제품과 서비스 곳곳에 생성형 AI 기능을 접목하며 기반 모델 부터 각 버티컬 별 AI 솔루션들까지 최소 15개의 서로 다른 AI 제품을 선보였습니다.
Search Labs : SGE (Search Generative Experience)
지난 25년 동안 우리는 검색 엔진 구축의 과학과 기술에 전념해 왔던 구글. 금년 I/O에서 구글은 자사의 실험을 공개하는 공간인 Search Labs를 통해 기존의 구글 검색 엔진에 생성형 AI를 직접적으로 적용하여 사용자가 보고 싶어하는 정보를 보다 잘 정리해주는, 정보가 사용자에게 찾아오는 검색 엔진의 미래를 제시하였습니다. 사람들이 검색하고자 하는 것을 입력한 후, 수 많은 페이지 브라우징을 통해 검색 결과를 사용자가 찾는 것이 아닌, 보다 빠르게 원하는 것을 얻고 구글의 서비스를 나갈 수 있도록 생성형 AI로 검색 결과 화면 최상단에 가장 관련성 높거나 AI가 생성해준 결과값들의 목록, 그리고 후속 질문까지 제공하여 생성형 AI 기능을 통해 사용자가 정보를 찾아나가는 과정을 간소화해주는 것을 볼 수 있습니다.
제품과 서비스에 AI 비서 기능을 더 하는 'Duet AI', 'Sidekick'
Duet AI
구글은 자사의 생산성 제품군인 Google Workspace, Google Cloud Platform, 그리고 구글의 노코드 앱 생성 서비스 Google AppSheet에서 작동하는 'AI 콜라보레이터 (협업자)' DuetAI를 선보였는데요. 사용자는 Gmail, Slide, 그리고 Docs 등 Workspace서비스의 우측 패널을 통해 DuetAI에게 자연어로 프롬프트를 입력하면 이전에 없던 이미지를 생성하여 내용을 장표에 시각화해준다거나, 기존에 사용자가 작성하던 문서의 내용을 이해하고 이후에 올 내용을 추천하고 이어서 작성해주기까지 합니다.
Sidekick
구글 워크스페이스, 그 중에서도 구글 독스에서 사이드 패널로 접할 수 있는 글 작성 보조 기능입니다. Sidekick (사이드킥, 조수라는 뜻의 용어)은 사용자가 작성하고 있는 글의 내용을 이해하여 다음에 이어서 올 수 있는 내용을 생성하기 위한 프롬프트를 추천해준다고 합니다. 데모에서는 Sidekick이 사용자가 작성한 글을 기반으로 최대 세 개의 프롬프트를 제시하는 것을 확인할 수 있습니다. 이 기능은 Duet AI 제품군 아래 함께 포함되어 출시가 될 예정이라고 합니다.
Android OS + Generative AI
Magic Editor, Magic Compose
구글은 기존에도 Google Photos에서 사진 안의 특정 영역을 지워주는 Magic Eraser 기능과 Photo Unblur 기능을 제공하였는데요. 금년에는 여기에서 한 층 더 고도화된 Magic Editor 기능을 선보였습니다. 이제 더 이상 프로 급의 사진 수정 역량 없이도 배경을 구성하는 요소들을 움직이고 합성하는 것은 물론, 전체 그림을 자연스럽게 유지하면서 색감과 같은 요소들을 향상시킬 수 있게 된 것 입니다.
Magic Editor 기능과 함께 구글은 픽셀 폰의 RCS (Rich Communication Service; 메시징 그리고 이메일 등) 사용 시 생성형 AI가 내용을 이해하여 이후에 작성할 말을 내용과 어투 별로 추천해주는 Magic Compose 기능을 발표하였습니다. 구글은 이러한 생성형 AI 기반의 편집 및 생성 기능들을 선정된 모델의 Pixel 폰에 올 하반기 Early Access로 탑재할 것이라고 발표하였는데요. 현재는 위 기능들은 실험성 기능으로 출시되어 피드백 수집을 통해 차후 기능에 크고 작은 변화가 있을 것으로 보여집니다. 향후 위와 같은 구글의 생성형 AI 기술이 고도화되고 또 모바일 OS에 탑재될 수 있도록 안정화 및 경량화 될 수록 특정 Pixel 폰에만이 아닌 안드로이드 OS를 채택하고 있는 더 많은 모바일 디바이스를 대상으로 자사의 생성형 AI 기반 서비스들을 탑재하지 않을까 예상됩니다.
Microsoft Build
PC OS + 퍼스널 AI 에이전트 'Copilot'
Copilot은 인지적으로 복잡한 태스크를 수행해주는 multi-turn (차례를 돌아가며 대화를 하는) 대화형 에이전트 인터페이스입니다. 이 컨셉은 약 2년 전 일명 AI 페어 프로그래머, GitHub Copilot 출시를 통해 처음 소개되었는데요. 첫 출시 이후 나델라는 Copilot을 MS 제품 전반에 소개시키겠다고 예고한 바 있습니다. 그러다 올해 Build에서 MS는 Copilot이 GitHub, Microsoft 365 등 제품 및 서비스 단위가 아닌 Window 11 OS에 전반에 적용될 예정이라고 발표하였습니다.
MS는 Copilot을 그들이 보유한 가장 큰 캔버스이자 PC OS인 Windows 11에 적용하여 올 6월 초 베타프리뷰로 공개할 예정이라고 합니다. Copilot은 Windows 11 OS에 적용되어 항시 사용자가 사이드 바 또는 버튼을 통해 접근할 수 있게 설계되었는데요. PC 내 파일을 찾는 작업부터 개발환경 세팅, 작업물을 메시지로 전송하는 작업 등 MS OS에서 작동하는 다양한 제품 및 서비스 전반에 걸쳐 사용자의 작업을 대신 수행해주거나 지원할 수 있다고 합니다.
구글도 유사한 오퍼링인 Sidekick과 DuetAI를 발표했지만 제품과 서비스에 개별적으로 추가되었는데요. 반면에 Copilot은 MS의 제품과 서비스를 포괄하는 Windows 11 OS에 적용하면서 PC 사용자들이 자사의 제품 생태계 전반에 걸쳐 Copilot을 사용해볼 수 있게 하였다는 점을 눈 여겨 볼 필요가 있다고 생각됩니다. 우선 PC를 활용하는 모든 사람들에게 Copilot을 사용해볼 수 있게 함은 물론, OS에 탑재된 자사의 모든 제품 생태계에 걸쳐 AI 에이전트 기능을 제공할 수 있게 되었기 때문입니다. 올해의 Build를 종합적으로 보았을 때, AI 에이전트 Copilot은 MS의 제품 생태계 전반을 관통하며 그들의 핵심 오퍼링으로 포지셔닝 되었다고 생각됩니다.
거대 언어 모델 기반 퍼스널 AI 에이전트 개발을 위한 도구
거대 언어 모델을 직접 구축하거나 파인튜닝을 하는 MLOps 플랫폼에서 더 나아가, 최근에는 LangChain, MS의 Semantic Kernel과 같은 체인 프레임워크 기반으로 거대 언어 모델에 추가적인 기능을 붙여 보다 ChatGPT와 같은 대화형 챗봇보다 한층 더 고도화된 AI 에이전트 앱을 개발할 수 있게 되었습니다. 그리고 이러한 거대 언어 모델 기반의 퍼스널 AI 에이전트를 체인 프레임워크에 기반하여 개발할 수 있게 하는 AI 앱 개발 플랫폼이 금년 Build에서 처음으로 등장하였습니다.
Copilot Stack
우선 MS는 사용자들이 자신만의 Copilot, 즉 퍼스널 AI 에이전트를 만들 수 있는 AI 개발 프레임워크를 소개하였습니다. 이 스택을 보시면 플러그인을 지원하여 실시간 정보를 가져오고, 기업 또는 사업의 데이터를 적용하고, 새로운 방식의 연산을 하고, 사용자 대신에 안전하게 액션을 취해주는 등 기존 MS가 제공하는 AI 시스템의 기능과 AI가 존재할 수 있는 생태계를 확장할 수 있는 것이 특징입니다. CEO, CTO, 그리고 Greg Brockman 등 MS와 OpenAI의 대표자들은 특히 이 프레임워크 중에서도 Copilot 플러그인을 강조했습니다. 플러그인의 확장 가능성은 거대 언어 모델이 기존의 것을 분석하고 새로운 것을 생성하는 '기능'으로서의 AI에서 더 나아가 스스로 외부 도구를 활용하여 태스크를 수행하는 퍼스널 AI 에이전트로 발전하기 위한 가장 중요한 요소 중 하나이기 때문입니다.
Azure AI Studio, Azure ML Prompt Flow
거대 언어 모델에 플러그인 기능을 붙일 수 있게 하는 것이 바로 Azure AI Studio와 Azure ML Studio의 Prompt Flow 기능입니다. Azure AI Studio 사용자는 모델 카탈로그를 통해 Azure가 큐레이팅한 오픈소스 모델, 허깅페이스에서 호스팅되는 모델 및 Open AI의 AI 모델들을 브라우징 및 선택할 수 있습니다. 사용자는 선택한 모델에 자신이 보유하고 있는 정형 또는 비정형 데이터를 대입하여 보다 커스텀한 대화형 AI 모델 클릭만으로 생성 및 배포할 수 있습니다. 이후 이 모델을 가지고 Azure ML Studio의 Prompt Flow에서 거대 언어 모델에 외부 툴 기능을 붙이는 것을 이전 보다 용이하게 하는LangChain, MS의 Semantic Kernel과 같은 체인 프레임워크를 선택하여 AI 에이전트 앱을 보다 수월하게 개발할 수 있습니다. 이러한 체인 프레임워크를 활용하게 되면, 시중에 출시된 오픈소스 및 OpenAI의 자체 거대 언어 모델에 추가적으로 다른 분석형 및 생성형 AI 모델, 외부 툴 등을 연결해주어 검색이나 생성 뿐만 아니라 식당을 예약해주거나 자연어로 물건을 검색하고 주문까지 하는 등 더 복잡하고 범용적인 태스크 수행이 가능한, 그리고 사용자나 기업의 데이터에 기반한 퍼스널 AI 에이전트 개발이 가능합니다.
이번 주의 인사이트
두 기업 모두 공통적으로 생성형 AI를 '모두', 그리고 '누구나' 사용하여 더 많은 것을 해낼 수 있도록 힘쓰고 있습니다. 특히 구글과 MS 모두 각각 Duet AI와 Copilot을 통해 자사의 제품 생태계에서 사용자를 지원하는 AI 에이전트를 제시하였습니다. 또한 양사는 여기에서 더 나아가 생성형 AI 기능과 AI 에이전트 기능을 모바일과 PC OS에 탑재하려는 새로운 시도를 보이고 있습니다. 특히 금년 두 행사를 종합해보면 구글은 생성형 AI '기능'을 안드로이드 OS에 접목하는 것에 그친데 비해 MS는 OS에 이러한 생성형 AI 기능들을 태스크를 수행하기 위한 도구로 활용하는, 생각하는 '뇌'로서의 AI 에이전트 Copilot을 도입하며 PC 사용자 경험을 완전히 뒤바꾸고자 하고 있습니다.
Google I/O를 통해 본 Google의 방향성
안드로이드 OS + 생성형 AI
구글은 기존 검색 엔진에 생성형 AI 기능을 적용하여 인류가 정보를 대하는 방식이 점차 사용자가 찾아가는 것에서 정보가 사용자에게 찾아오는 방식으로 이동하는 트렌드에 따라가기 위한 시도를 하고 있습니다. 그리고 이러한 사용자의 정보를 대하는 태도에 대한 변화는 MS와 OpenAI의 ChatGPT가 견인한 만큼 그들을 더욱 견제하며 생성형 AI를 자사의 제품과 서비스 곳곳에 적용하고 있다는 것을 확인할 수 있었습니다. 특히 구글의 많은 발표 내용 중에서 DuetAI라는 AI 콜라보레이터 기능은 MS의 Copilot을 의식하고 출시한 것으로 보여집니다. 마지막으로, 구글은 자사의 스마트폰 브랜드인 Pixel 디바이스에 생성형 AI 기능 Magic Editor와 Magic Compose를 적용할 계획을 밝혔는데요. 구글은 향후 Pixel 폰 뿐만 아니라 향후 모든 안드로이드 OS 사용자들이 자사의 생성형 AI 기술을 사용해볼 수 있게 할 계획인 것으로 보여집니다.
MS Build를 통해 본 MS의 방향성
PC OS + 퍼스널 AI 에이전트
MS는 금년 Build에서 Copilot이라는 멀티모달 AI 에이전트가 제품 랜드스케이프 전반을 관통하고 있는 그림을 그렸습니다. 대화형 AI 서비스에서 더 나아가, 최근에는 대화 이상으로 외부 도구를 활용을 하고 사용자 대신 콘텐츠를 생성해주는 등 액션을 취해주는 AI 에이전트가 MS나 구글의 기존 제품 생태계에 새로운 기능을 더해주고 있는데요. MS는 코파일럿을 깃헙에서부터 시작하여 마이크로소프트 생산성 제품군 Microsoft 365와 BingChat에도 도입하여 기존의 검색 엔진 그리고 생산성 툴에 AI 비서 기능을 더했습니다. 그리고 구글도 이를 견제하고 유사한 서비스 DuetAI를 출시했습니다. 그러던 중 MS는 자사의 퍼스널 AI 에이전트 Copilot 를 제품이나 서비스에 개별적으로 제공하는 것에서 더 나아가 Windows 11 OS에 탑재할 계획을 발표하였습니다. Windows 11의 사용자 모두에게 자신만의 AI 비서인 Copilot을 제공함으로서 PC에서 할 수 있는 모든 사용자 경험을 혁신함과 동시에, Windows 11에 탑재된 MS의 제품 생태계 전반에 걸쳐 퍼스널 AI 에이전트를 사용해볼 수 있게 한 것 입니다. 향후 그들이 퍼스널 AI 에이전트를 통해 어떻게 사용자의 디지털 경험을 바꿀 것인지 기대가 되는 대목입니다.
Google I/O와 Microsoft Build에서 관측된 최신 AI 트렌드
"You’ll never go to a search site again, you’ll never go to Amazon...
Whoever wins the personal agent, that’s a big thing
(더 이상 검색이나 쇼핑 사이트를 방문할 필요가 없어질 것이다...
퍼스널 에이전트의 승기를 잡는 것이 중요해질 것이다)"
- Bill Gates
퍼스널 AI 에이전트
빌 게이츠는 향후 검색 엔진이 아닌, AI 비서를 잘 만드는 기업이 시장에서 승기를 잡을 것이라고 주장하고 있습니다. 최근 빅테크 (구글과 MS의 Duet AI와 Copilot AI 에이전트 발표 소식) 와 오픈소스 진영의 트렌드로 미루어 보았을 때 이제는 ChatGPT나 Bard와 같은 대화형 AI 서비스에서 더 나아가, 최근에는 AI가 외부 툴을 활용하여 사용자 대신에 복잡한 태스크를 수행해주는 AI 에이전트가 떠오르고 있습니다. 그리고 거대 언어 모델이 외부 도구들을 추가 기능으로 활용하여 범용적인 태스크 수행이 가능한 AI 에이전트를 구성하기 위해 LangChain, 그리고 MS의 Semantic Kernel과 같은 체인 프레임워크가 앞으로 더욱 중요해질 것으로 예상됩니다. 더 나아가, Azure AI Studio, 그리고 Azure ML Studio와 같이 체인 프레임워크를 기반으로 AI 에이전트 개발이 가능한 AI 앱 개발 플랫폼이 향후 B2B 시장에서 하나의 큰 경쟁력으로 자리 잡을 것으로 전망되고 있습니다.
OS + AI
구글은 오늘 날 고도화된 생성형 AI 기능을 경량화하여 Pixel 폰에 탑재하여 안드로이드 OS로 가져올 예정이고, MS는 GitHub에서 사용자의 코딩을 보조해주는 역할을 하던 AI 어시스턴트 Copilot을 제품이나 서비스 단위를 넘어 자사의 PC OS인 Windows 11에 탑재하여 이를 올 6월에 베타프리뷰로 공개할 계획을 가지고 있습니다. 로컬 디바이스인 PC와 스마트폰 OS에 AI 에이전트가 적용되면서 진정한 AI의 개인화 시대가 다가오고 있습니다. 기업들이 AI 에이전트 기능을 제품이나 서비스에 개별적으로 붙이는 것에서 더 나아가 향후에는 PC나 모바일에 OS 단위로 적용을 하면서 근미래에 사용자 디지털 경험에 새로운 패러다임을 가져올 것으로 기대되고 있습니다.
written by Sarah
댓글