시작하며
ChatGPT를 필두로 생성형 AI에 대한 전세계적 관심이 연일 식을 줄을 모르고 있으며, 관련하여 금주에 수 많은 신규 발표 소식들이 있었습니다. Google이 OpenAI와 MS에 대항하기 위해 자사의 거대 언어 모델 PaLM API를 공개하고 Google Workspace에 거대 언어 모델 기반 생성형 AI 기능을 본격 접목하기 시작했습니다. 그리고 바로 다음 날, 다음 주 정도 공개가 될 것이라고 루머가 돌았던 OpenAI의 차세대 거대 언어 모델 GPT-4의 출시가 보다 예상보다 빠르게 발표되었습니다. 일각에서는 거대 언어 모델을 보다 가볍고 저렴하게 만드려는 노력들이 이루어지고 있습니다.
그럼 GPT-4를 포함한 2023년 3월 셋째 주의 주요 기술 시장 발표 소식들을 살펴보겠습니다.
Google, 모든 제품에 생성형 AI를 접목
Google (이하 구글)은 ChatGPT에 대항하기 위해 현재 자사의 모든 서비스에 생성형 AI를 접목하는 전략을 택하였습니다. 구글은 GPT-4 공개 바로 전 날에 Google Workspace 곳곳(Spreadsheet, Docs 등)에 생성형 AI 기능을 추가하여 텍스트를 자동 완성하는 기능들을 추가하였다고 발표하였습니다 (구글은 의도적으로 최대한 빨리 GPT-4 출시 이전에 발표를 진행하였다고 합니다). 또한 Google Workspace 사용자들 뿐만 아니라, AI/ML 분야의 개발자들을 위해 자사의 거대 언어 모델 PaLM의 API를 공개하고, 향후 자사의 MLOps 플랫폼 Vertex AI를 통해 더 많은 기반 모델 1 에 대한 API들에 대한 접근 권한을 열 예정이라고 합니다. OpenAI와 MS의 기세에 밀리지 않기 위해 구글이 생성형 AI를 자사의 모든 제품에 적용하는 전략은 많은 언론과 매체에서 2011년 구글이 페이스북에 맞서기 위해 자사의 모든 제품에 소셜 기능을 추가했다가 실패했던 Google+ 사례와 비교되고 있습니다.
Google Workspace에 생성형 AI 기능 추가: Gmail 텍스트 자동 생성, Google Docs 자동 요약과 같은 기존 AI 기능에서 더 나아가, 거대 언어 모델 기반의 생성형 AI 기능을 추가했습니다. 이제는 사용자가 원하는 주제를 입력하면 초안을 받아볼 수 있고, 클릭만으로 내용을 정교하게 다듬을 수 있으며, 축약과 어조 수정도 가능하다고 합니다.
PaLM API, MakerSuite 공개: 쉽고 안전하게 구글의 모든 거대 언어 모델에 접근하여 각종 multi-turn (대화를 주고 받는) 유즈케이스에 적용해볼 수 있는 개발자용 API를 공개했습니다. API와 함께 개발자들이 프로토타이핑을 보다 쉽고 빠르게 시작할 수록 돕는 툴인 MakerSuite도 프라이빗 프리뷰로 공개했고, 곧 대기명단을 열 예정이라고 합니다.
Vertex AI에 생성형 AI 기능 추가: MLOps 플랫폼 Vertex AI를 사용자 (많은 사용자 중, 데이터 과학자를 특정하였습니다)들에게 구글을 포함한 다양한 기업의 기반 모델이라고 들에 대한 접근 권한을 열어줄 예정이라고 합니다.
Generative AI App Builder: 개발자들에게 사전에 만들어진 템플릿이 포함된 API를 제공하여 빠르게 봇, 챗 인터페이스, 커스텀 검색 엔진, 디지털 어시스턴트와 같은 앱들을 빠르게 만들 수 있게 지원한다고 합니다.
OpenAI, 차세대 거대 언어 모델 GPT-4 출시
월요일 독일의 한 언론 매체를 시작으로 GPT-4가 차주 즈음 공개될 것이라는 루머가 돌았었는데요. GPT-4는 불과 이틀만인 2023년 3월 14일에 모두의 예상보다 빠르게 공개되었습니다. GPT-4는 ChatGPT의 기반이 되는 GPT 3.5의 차세대 업그레이드 버전으로 이미지와 더 많은 수와 종류의 언어를 이해할 수 있는 능력을 갖췄습니다.
GPT-4가 GPT 3.5에 비해 달라진 점은?
👍 이미지를 이해하는 멀티모달 모델: GPT-3.5가 텍스트 입력만 받을 수 있었다면, GPT-4는 이미지 입력까지 받을 수 있고 이를 이해하여 설명해줄 수 있습니다 (+ 그래프 같은 이미지가 있는 시험 문제도 풀 수 있다고 합니다).
※ 현재 멀티모달 기능은 대중에게 완전히 공개되지 않았고, 유튜브 라이브 스트리밍을 통해 데모를 시연하였습니다.
👍 더 많은 단어와 언어 처리 (+ 한국말도 잘 하는 GPT-4) : GPT-4는 GPT-3.5에 비해 단어 처리할 수 있는 단어의 수가 8배가량 많아지고, 지원 언어도 26개국어로 늘어 보다 더 다양한 언어로 이전 모델 대비 더 길고 완성도 높은, 그리고 심지어는 더 창의적인 문장 생성이 가능해졌다고 합니다.
❗️ 할루시네이션 (Hallucination)은 줄었지만, 완전히 해소되지 않음: ChatGPT에서 오답을 마치 정답처럼 말하는 일명 할루시네이션 (환각) 증상은 줄었으나, 여전히 문제는 완전히 해결되지 않았습니다.
❗️ ChatGPT Plus 구독 ($20), 또는 Bing 통해 사용 가능: 누구나 무료로 사용해볼 수 있도록 한 ChatGPT와는 달리 GPT-4는 ChatGPT Plus를 구독하거나, Bing을 통해 기능을 일부 사용해볼 수 있다 (사실 이미 출시 이전에도 Bing에서 GPT-4를 계속 기반으로 하고 있었다고 하며, 검색에 특화된 버전으로 제공되고 있었다)고 합니다.
※ MS가 오늘 아침에 Bing ChatGPT (GPT-4 기반) 대기명단를 없앨 것이라는 소식을 전했습니다. 로그인만 하면 모두가 기술을 체험할 수 있게 한 것입니다.
MS의 GPT-4 기반 업무 자동화 비서, Copilot for Work
구글의 워크스페이스 생성형 AI 기술 추가 소식이 나온 후 불과 몇 일만에 MS는 그에 대적할 만한 신규 기술 오퍼링을 발표합니다. ‘인공지능과 함께하는 직업의 미래(The Future of Work with AI)’를 주제로 오피스 365 소프트웨어에 거대 언어 모델 기반 프로그래밍 기술 Copilot을 탑재한다고 발표한 것인데요. Copilot for Work는 문서 작성 뿐만 아니라, 엑셀 데이터를 분석하여 차트 형태로 시각화 해주고, 파워포인트에서 기존 문서를 기반으로 발표 슬라이드까지 만들어주는 기능입니다. Google Workspace뿐만 아니라 AI 모델을 사용하고자 하는 개발자들을 위한 신규 오퍼링들을 함께 공개한 구글과는 다르게 MS는 이미 전세계 수 많은 사람들이 익숙한 자사의 생산성 소프트웨어 사용자 대상에 집중한 기술을 발표했습니다.
The Copilot System: Enterprise-ready AI: GPT-4를 기반으로 개발된 Microsoft 365 코파일럿은 많은 사람들이 익숙한 파워포인트, 엑셀과 같은 MS의 생산성 소프트웨어 안에서 비서처럼 프롬프트 입력만으로 주문만 하면 각종 업무를 자동화해준다고 합니다. 텍스트 생성에서 더 나아가, Copilot은 엑셀 데이터 분석을 통한 시각화 차트 생성부터 기존 텍스트를 기반으로 PPT자료까지 대신 만들어준다고 합니다.
Stable Diffusion처럼 오픈소스화, 경량화 되는 거대 언어 모델
Stable Diffusion은 Midjourney와 같은 이미지 생성형 모델이지만, 이를 대중에게 오픈소스로 공개하고, 일반 컴퓨터에서도 로컬로 실행될 수 있게하여 한 때 기술 시장에서 가장 핫한 AI 모델로 주목받기도 하였습니다. 최근 가장 대표적으로 메타의 LLaMA 7B 모델 공개를 시작으로, ChatGPT의 기반이 되는 것과 같은 GPT-3, GPT-3.5급의 거대 언어 모델들이 Stable Diffusion처럼 경량화되어 개인 컴퓨터에서도 실행할 수 있도록 출시되고 있습니다.
무겁고 비싼 거대 언어 모델
놀랍게도 프롬프트로 이미지를 생성하는 모델보다 거대 언어 모델 소프트웨어를 실행하는 것이 훨씬 무겁고 비싸다고 합니다. GPT-3와 같은 기반 모델은 OpenAI라는 사기업의 API와 웹사이트를 통해서만 접근이 가능하며, 개인 소유의 장비에서 실행할 수 있도록 공개하지 않았는데요. 만일 GPT-3 모델에 접근이 가능하다 해도 모델들을 실행하기 위해서는 A100급의 GPU 여러개가 요구되며, 일반적인 하드웨어에서는 실행이 불가하다고 합니다. 거대 언어 모델을 실행할 수 있는 조건을 갖추었다고 해도 유지하는 것은 또 다른 이야기입니다. CNBC에 의하면, 한 때 유명했던 텍스트 기반 롤플레잉 게임 AI Dungeon의 개발사 Latitude는 사용자 수가 피크였을 때 GPT 사용료로 매달 약 $200,000를 OpenAI에 지불해야 했다고 합니다.
거대 언어 모델을 좀 더 가볍고 저렴하게 제공하기 위한 최신 사례들
2023년 2월 24일: Meta AI가 LLaMA를 발표 (용도에 따른 리소스 절감을 위한 네 가지 버전 공개, 7B가 가장 작음) 2023년 3월 2일: 누군가 BitTorrent를 통해 LLaMA 모델을 유출 (아래 사례들이 생겨날 수 있었던 발단) 2023년 3월 10일: 개인 개발자 Georgi Gerganov가 M1 Mac에서 실행할 수 있는 llama.cpp 공개 2023년 3월 11일: 또 다른 개인 개발자 Artem Andreenko가 Raspberry Pi 4에서 LLaMA 7B를 실행 (느림) 2023년 3월 12일: node.js 실행 도구인 NPX에서 실행되는 LLaMA 7B 공개 2023년 3월 13일: 또 다른 개인이 Pixel 6 휴대전화에서 llama.cpp를 실행 (느림) 2023년 3월 13일: 스탠포드 대학이 $600 미만으로 GPT-3.5와 유사하게 작동하지만 개인 로컬 하드웨어에서도 실행될 수 있는 LLaMA 7B의 파인튜닝 (Hugging Face 프레임워크 사용) 버젼 Alpaca 7B를 출시. 현재는 학술 목적에만 한정되어있음 |
이번 주의 인사이트
기존 AI 시장의 두 가지 주요 세력 : 폐쇄형 vs. 개방형
최신 소식들을 종합해보았을 때, 현재 AI 시장은 굉장히 흥미로운 방향으로 발전해나아가고 있는 것 같습니다. 구글이 AI 연구 개발 분야를 독점할 때, 그들의 자회사 DeepMind와 긴밀히 협력했던 OpenAI가 등장했습니다. 이후 OpenAI가 MS와 손을 잡으며 구글과 본격 AI 연구 개발 경쟁을 시작하게 됩니다. 이에 Stability AI, Eleuther AI와 같이 구글, OpenAI 와 같은 거대 폐쇄형 세력들에 맞서는 신생 스타트업들이 등장하였고, 오픈소스로 일반 개발자 또는 비개발자들도 모델을 로컬 기기에서 사용해볼 수 있게 하여 한 때 기술 시장의 주목을 사고 대형 투자까지 이어졌습니다. 이와 같이 기존 AI 시장은 크게 폐쇄형, 그리고 개방형, 두 가지 방향성으로 시장 랜드스케이프가 나뉘었던 것으로 생각됩니다.
OpenAI에 맞서 개방형 세력에 참여하여 모델을 더 저렴하고, 가볍게 개발하는 추세
구글이 아직 윤리 등의 문제로 거대 언어 모델을 논문으로 공개할 때, 오픈AI는 클라우드 인프라를 제공하는 MS와 함께 과감하게 GPT-4와 같은 기반 모델 연구 개발 결과를 ChatGPT라는 제품을 통해 누구나 사용해볼 수 있게 개방하여 전세계를 놀라게 하였습니다. 금주 발표된 GPT-4 API를 적용하는 사례들도 벌써 나오고 있는 반면에 주요 AI 시장참여자들은 API를 그대로 사용하는 것을 지양하고 시장에서 차별화되는, 자신만의 ChatGPT를 만들고자 하고 있습니다. 이렇게 현시점 가장 거대한 AI 세력인 OpenAI에 대적하기 위해 허깅페이스, 스탠포드 대학, 그리고 기존에 모델을 API로 공개하지 않았던 구글, 메타와 같은 빅테크 기업들까지 합세하여 거대 언어 모델을 일반 사용자 뿐만 아니라 개발자들에게도 보다 저렴하고 가볍게 제공할 수 있는 방법을 연구하고, 또 이를 발 빠르게 공유하고 있습니다.
ChatGPT 등장, AI의 "I-Phone Moment"가 될 수 있을까?
현재 ChatGPT의 등장이 아이폰급의 혁신과 비교되고 있습니다. AI는 이미 새로운 기술이 아니지만 아직 스마트폰급의 대중 시장이 형성되지는 않았다고 생각됩니다. 작년 10월, Stable Diffusion을 직접 사용해보았을 때 로컬 컴퓨터에서 가볍게 실행할 수 있어 놀라웠고, 이 모든 것을 실행하는 것이 무료였다는 점에서 두 번 감탄한 적이 있는데요. Stable Diffusion 역시 당시 주목을 받았지만, 사람들이 일상적으로 사용하는 기능이 아니다 보니 파급력이 지속되지는 않았습니다. 이에 반면 ChatGPT는 AI, 그 중에서도 거대 언어 모델을 일반 대중이 자신의 로컬 기기에서 웹페이지 접속만으로도 사용할 수 있게 기반 모델을 제품화 하여 전세계 사람 대부분이 매일 필수적으로 하는 검색 과정을 혁신하였습니다. 뿐만 아니라 금번 GPT-4와 이에 기반한 Bing, Copilot 업무 자동화 비서 발표를 통해 미루어보았을 때 AI는 곧 창작, 개발, 업무 등 더 넓은 일상 범위에서 크고 유의미한 영향을 미칠 것이라고 예상해볼 수 있습니다. 향후 아직 해소되지 않은 높은 비용과 윤리와 같은 문제까지 해결이 된다면 오늘 날 아이폰 같이 ChatGPT가 향후 AI의 보급화를 통한 대중시장 형성을 앞당긴 주역으로 회자되지 않을까 생각됩니다.
written by Sarah.7
- 기반 모델 (Foundation model): 텍스트와 이미지 데이터로 사전 훈련되어 수십억 개의 파라미터 (매개변수)를 포함한 테라바이트 규모의 대규모 기계 학습 모델. 거대 언어 모델의 경우 ChatGPT가 제품, GPT-3.5가 기반 모델이 된다. [본문으로]
댓글