시작하며
4월에도 기술 시장 소식은 AI를 중심으로 끊임없이 이어지고 있습니다. 금주의 수 많은 소식들을 살펴보며 특히 눈에 띄었던 것은, 바로 AGI (Artificial General Intelligence)에 대하여 다루는 내용의 자료들이 부쩍 많이 보이기 시작했다는 것 입니다. AGI는 여러가지, 또는 모든 태스크를 사람과 같이 수행 할 수 있는 유형의 AI, 일명 범용AI를 일컫는 용어입니다. 이와 같은 유형의 AI가 정확히 무엇이고, 또 어떻게 실현될 수 있는지에 대한 의견은 분분한 상태이지만, 많은 가능성을 열어두며 이와 같은 수준의 AI 발전 방향성이 여러 갈래로 나뉠 것으로 예상되고 있는데요. 그럼, 아래 금주의 소식들을 살펴보며, 왜 AGI가 거론되고 있는지 살펴보고 AI의 빠른 발전에 대한 기대감과 함께 커진 우려에 대하여 다루어보겠습니다.
AGI (Artificial General Intelligence)란?
우선 제목의 주인공, AGI가 무엇인지 간단하게 살펴보겠습니다. AGI는 소개드릴 AI의 세 가지 레벨 (또는 단계, stage, tier 등으로 표현) 중 하나입니다. 이와 같은 레벨은 AI의 '능력 (Capabilities)'에 따라 나뉘는데요. 보통 크게 두 가지 또는 많게는 세 가지까지 분류되고 있는 것으로 보입니다.
AI의 세 가지 레벨 : Capabilities 중심
Level 1. ANI (Artificial Narrow Intelligence): 단일 태스크를 사람과 같이 수행하는 AI, Weak AI라고도 함 Level 2. AGI (Artificial General Intelligence): 다양한 분야에서 대체적으로 사람보다 더 똑똑하게 여러 태스크를 범용적으로 수행할 수 있는 AI, Strong AI 라고도 함 Level 3. ASI (Aritificial Super Intelligence): 모든 분야에서 사람의 지능과 능력을 초월하여 태스크를 수행하는 AI, 이 또한 Strong AI라고 일컫는다고 함 |
※ 위키피디아 및 OpenAI 블로그 내용을 참조하여 개념의 High-Level 수준에서만 정리해본 것 입니다. 실제로 AGI, ASI의 널리 합의된 정의는 없다고 합니다.
현재 AI는 AGI라고 할 수 있을까?
그래서 현재 AI는 어디까지 온 것이라고 할 수 있을까요? 결론부터 말씀드리면 AGI가 도래할 시점, 기준, 그리고 발전 방향성 등에 대한 다양한 의견이 존재하는 것으로 보여집니다. 이는 최근 ChatGPT Plugin, 또는 이후에 소개드릴 HuggingGPT를 통해 ChatGPT가 다른 모델의 능력을 활용하여 더 다양한 태스크를 수행할 수 있는 것을 AGI의 초기 모습, 또는 AGI로 향해 가는 과정으로 보고 있는 시각이 생겨나고 있기 때문입니다.
용어또한 정의되고 해석되는 방식이 매우 다양합니다. '사람과 같다'는 의미를 개개인마다 해석하는 데 차이가 존재하기 때문인데요. 몇몇 업계 관련 전문가들이 AGI를 어떻게 바라보는지 살펴보겠습니다:
"AGI is a feeling. Like love. Stop trying to define it
(AGI는 감정이다. 마치 사랑 같이 말이다. 이를 정의 하려고 하지 마라)."
- Andrej Karpathy
“that which would make the world a weird place
(세상을 이상한 곳으로 만들 그 무언가)”
- AnthropicAI 연구진들
“an intellect that is much smarter than the best human brains in practically every field
(모든 분야에서 최고인 사람 두뇌보다 훨씬 똑똑한 지능적인 존재)”.
- Nick Bostrom
GPT-5 출시 루머
ChatGPT Plugin, HuggingGPT외에도 AGI에 대한 논의를 수면 위로 끝어올린데 기여한 사건이 저번 주에 있었습니다. 그리고 현재 내용 관련하여 기사가 쏟아져 나오고 있는데요. 아래 내용 살펴보겠습니다:
최근 Runway Financial의 CEO이자 창립자, Siqi Chen이 Twitter를 통해 공유한 글로 인해 본격적으로 GPT-5 루머가 돌기 시작하였는데요. Chen의 트윗에서 말하는 연말은 GPT-5가 학습이 완료될 것으로 예상되는 시점이지, 모델이 출시되는 시점은 아니라고 합니다, GPT-5가 출시되었을 경우, 해당 모델이 AGI를 달성했는지 여부가 뜨거운 논쟁거리가 될 것을 예고를 하며 많은 이들의 관심을 샀습니다. OpenAI는 이에 공식적인 답변을 내놓지는 않은 상황입니다.
OpenAI의 휴머노이드 스타트업 투자, 그 목적은?
최근 OpenAI가 2014년에 설립된 노르웨이 소재의 휴머노이드 로보틱스 기업, 1X Technologies (전 Halodi Robotics)의 2천 350만 달러 규모의 시리즈 A2 투자 라운드를 CodiumAI와 함께 리드하였습니다 (투자를 리딩한 OpenAI와 CodiumAI 뿐만 아니라 Tiger Global Ventures, Alliance Venturem Goldman Sachs 등 유명 벤쳐 캐피털 및 투자 은행에서는 휴머노이드의 보급화가 현대 사회의 인구 변화로 인한 노동력 감소의 해결책이 될 것이라고 전망하고 있다고 합니다).1X Technologies는 현재 투자금을 활용하여 안전을 최우선으로 휴머노이드 (안드로이드라고도 칭함)를 개발 중에 있습니다.
OpenAI, 왜 다시 로보틱스에 투자하는가?
투자 소식을 읽던 중, OpenAI의 투자 전략의 배후에 숨은 의미가 궁금해졌습니다. MS가 거대한 규모의 투자를 하기 전, OpenAI는 기존에 거대 언어 모델보다 로보틱스, 그 중에서도 로봇 팔의 강화학습에 비중을 더 많이 두고 있는 기업이었습니다. 하지만 이후 MS와 손을 잡은 이후에 해당 부서를 해체한 것으로 많은 관심을 받았었는데요. 이랬던 그들이 최근에 다시 로보틱스에 관심을 보이는 이유는 무엇일까요? 아래와 같이 추측해보았습니다:
AGI에 도달하기 위한 요소, Embodiment
AGI로 향하는 길은 수 많은 갈래로 나뉘어지겠지만 그 중에서도 embodiment (이하 체화, 형상화)는 AGI에 있어 필수적인 요소가 될 것이라는 시각이 존재하고 있는데요. AI가 형체를 갖추어야 비로소 AGI에 도달할 수 있다는 의견은 사람과 화면 그 이상에서 얻을 수 있는 인터랙션이 오가야 할 것이라고 생각하는 것에서 발전하였다고 합니다. 샘 알트먼은 최근 한 유명 팟캐스트에 출연하여 AGI를 기술적, 또는 정서적 측면에서 실현하기 위해 몸이 필요할 것 같냐는 질문에 "필요없다고 생각하지만 확정 지을 수 는 없다"고 답하였습니다. OpenAI 또한 AGI를 실현시키기 위한 주요 요소로서 AI의 물리적 형상화, 체화를 고려하여 휴머노이드를 AI를 담기 위한 많은 물리적 개체 중 하나의 가능성으로 보고 있는 것은 아닌가 예상이 됩니다.
생성형 AI 개발 중단을 촉구하는 사람들
현재 무려 15,000명 이상의 사람들이 GPT-4 이상의 성능을 가지게될 거대 AI 연구 개발을 중단하는 것을 촉구하는 온라인 서명 운동을 벌이고 있습니다. 해당 운동은 ‘삶에 도움이 되고 극단적인 대규모 위험을 지양하는 방향으로 기술을 이끌고 가는 것’을 사명으로 하는 조직, Future of Life Institute에 올라왔습니다.
서명자 중에는 Apple 공동 창립자 Steve Wozniak, Twitter CEO Elon Musk, 정치인 Andrew Yang, AI 분야의 선구자 Joshua Bengio까지, 수 많은 저명한 학자 및 기술 리더들이 포함되어 있습니다. ChatGPT는 수 많은 주요 빅테크 및 오픈소스 기업들의 AI 경쟁을 점화하며 AI 개발을 급격하게 가속화시키는데 일조하며 AI 업계를 그 어느 때 보다 더 뜨겁게 달구고 있는데요. AI를 통해 새로운 기회가 곳곳에서 발생하고 있는 반면에 많은 사람들, 그리고 특히 AI 및 테크 전문가들은 안전장치, 가이드라인 등이 형성되지 않은 상태에서 AI가 AGI라고 여겨질 수 있는 수준의 성능을 달성했을 때 발생할 수 있는 각종 사회적, 경제적 위험 요소들에 대한 우려의 깊이를 서명 숫자 그 자체로 보여주고 있습니다.
금주 빅테크 소식: 메타까지 합세한 AI 경쟁
메타버스에서 AI로 가는 '메타'
메타의 연구 조직이 바로 어제인 2023년 4월 6일에 자사의 이미지 분리 모델, SAM (Separate Anything Model) 데모를 실행해볼 수 있는 사이트를 블로그 포스트를 통해 공개하였습니다. 그들이 공개한 모델은 사전에 한 번도 본 적이 없는 이미지 또는 비디오라도 식별하고, 이미지에서 분리할 수 있는 기능을 선보이는 Zero-Shot generalization이 가능하다고 합니다. 뿐만 아니라, 메타는 초현실적인 영상을 생성하는 Make-a-Video라는 모델을 공개를 하기도 했습니다.
메타는 OpenAI와 같이 오픈소스 기반 모델 LLaMA에 이어 ChatGPT와 같이 개발 경험이 없는 일반 대중이 사용해볼 수 있는 서비스 데모 공개를 이어가고 있습니다. 이는 메타가 확고하게 AI 시장의 경쟁자로서 참여하는 것으로 해석할 수 있습니다. 뿐만 아니라 CEO Mark Zuckerberg가 이러한 “creative aids (창의적 보조 수단)”들을 자사의 플랫폼에 탑재시키는 것이 올해의 최우선 순위라고 언급한 것을 미루어 보았을 때, 그들이 최근까지도 내세우던 메타버스 사업은 이제 AI에게 우선 순위를 확실하게 내어준 것으로 보입니다.
Google의 추격
구글은 이번 주에도 MS, OpenAI를 기반 모델이 아닌, 하드웨어 (인프라)와 서비스 레벨에서도 추격을 하고 있는데요. 검색 서비스에 LLM 탑재 계획과 AI 학습을 위한 TPU를 발표했습니다.
AI 학습을 위한 최신 슈퍼컴퓨터 공개
앞서 MS가 ChatGPT를 실행하기 위한 IaaS 수익을 통해 클라우드 리더 자리를 노리고 있다고 언급하였는데요. 구글은 금주 수요일에 자사의 AI 슈퍼컴퓨터, TPU (Tensor Processing Unit) v4에 대한 상세 정보를 공개한 바 있는데요. 그들의 주장에 따르면 TPU v4는 Nvidia의 시스템 보다 1.2배에서 1.7배 빠르고 전략 소비를 1.3배에서 1.9배정도 감소시켜 더 효율적이라고 합니다. 하지만 더 발전된 공정 기술로 만들어졌기 때문에 구글의 TPU v4와 Nvidia의 AI 칩, H100 칩과 MLPerf 테스트를 진행하지는 않았다고 합니다.
Google Search에 GPT 스타일 AI 기능 탑재 발표
사실 구글은 이미 Bard를 공개하며 전통적인 검색 방식을 깨고, Google Search에 거대 언어 모델을 검색에 접목하겠다는 계획을 밝힌 바는 있었습니다. 하지만 금번 CEO와의 인터뷰를 통해 이와 같은 계획을 더욱 확고하게 한 것에 주목할 필요가 있습니다. Wall Street Journal은 한국 시간으로 어제 밤, 구글 CEO Sundar Pichai와 단독 인터뷰 내용을 공개하였는데요. Pichai는 거대 언어 모델을 통해 구글 검색이 가능할 것이냐는 질문에 '당연하다'고 답을 하였다고 합니다. 그리고 현재 후속 질문까지 가능한 새 검색 기능을 최종 테스트 중에 있다고 밝혔는데요, 이와 같은 후속 질문 기능의 검색 엔진 탑재 계획은 구체적으로 언급하지 않았다고 합니다.
금주 GitHub 소식: AGI에 더 가까이, 'HuggingGPT'
금주에는 모델 경량화 외에도 한 가지 더 특히 주목해야 할 발표 내용이 있었습니다. 바로 앞서 AGI를 설명하며 언급드린 'HuggingGPT'입니다.
Vicuna-13B 출시
LLaMA, Alpaca에 이어 GPT-4의 오픈소스 대체 모델, Vicuna-13B까지 등장하였습니다. UC Berkeley, CMU, Stanford, 그리고 UC San Diego의 팀이 개발했다고 하는데요. 허깅페이스가 메타의 LLaMA 모델을 사용하여 파인튜닝한 모델로, ChatGPT의 성능을 약 90%까지 쫓아갈 수 있다고 합니다. 뿐만 아니라, Stanford의 Alpaca가 600달러에 출시되었던 것에 반해 Vicuna는 그의 절반 가격인 300달러에 출시가 되었다고 합니다. 데모는 다음 링크에서 사용해보실 수 있습니다: https://chat.lmsys.org/
Hugging Face - HuggingGPT 출시
ChatGPT로 하여금 현존하는 모든 언어 모델에 대한 접근을 가능하게 해주는 프레임워크로, 모든 GPT 기반의 언어 모델들을 보다 유연하고 효율적으로 학습시킬 수 있다고 합니다. 이는 즉 ChatGPT가 태스크를 수행할 때 다른, 외부 모델의 힘을 빌려 경우에 맞게 태스크를 수행하도록 하는 것, 즉 하나의 모델로 타 모든 모델들을 지배하는 것으로 볼 수 있는데요.. 논문에서 HuggingGPT는 범용 AI, 즉 AGI에 한 발짝 더 가까워지는 것을 목적으로 자사의 허브를 통해 400개 이상의 태스크 특화 모델들을 ChatGPT와 통합을 지원한다고 합니다.
이번 주 인사이트
시장 파괴자, AGI를 향한 기대와 우려
OpenAI는 2015년 설립할 때 부터 AGI를 개발하는 것을 목표로 가지고 있던 기업입니다. 이에 그 당시 일부 업계 관계자들이 그들을 부정적인 시선으로 바라보았다고 하는데요. 이제는 불과 2-3년 전까지만 해도 상상에만 맡겼던 일들이 하나 둘 씩 현실화, 대중화 되고 있습니다. ChatGPT Plugin, Hugging GPT등을 통해 ChatGPT를 중심으로 단일 AI 모델이 각종 태스크 수행이 가능하게 되었기 때문입니다. 반면 현재 기술 시장의 중심에 선 OpenAI의 CEO 알트먼 조차도 인터뷰에서 기하급수적으로 발전하는 AI에 대한 행복감도 있지만 두려움 또한 가지고 있다고 여러 인터뷰에서 언급한 바 있습니다. AI의 급속도 발전에 따른 우려에 올해 2월, 샘 알트만은 직접 자사 블로그를 통해 AGI를 인류에게 유익하게 만들 수 있도록 하겠다는 포부를 밝히며 또 각종 리스크에 대한 지속적인 배움과 대응을 멈추지 않겠다고 선언하였는데요. 뿐만 아니라, 샘 알트먼은 5월과 6월에 서울을 포함한 각국의 주요 도시들을 방문하여 AI에 관심이 있는 모든 사람들, 그리고 각국 정부 관계자들을 대상으로 OpenAI 투어 2023을 진행, 걷잡을 수 없는 속도로 발전하고 있는 “AI의 발전 방향성에 대한 논의”를 진행할 계획을 발표하였습니다.
빌게이츠, 스탠포드 AIRE 디렉터 등 전문가들은 AI의 시대가 이제 비로소 그 서막이 열렸다고 보고 있습니다. 빌 게이츠는 자신의 블로그, GatesNotes에 "AI의 시대는 시작되었다"라는 제목으로 글을 올리며 AI가 향후 사람들의 생활 방식을 전반적으로 바꾸어 놓을 것으로 보고 있습니다. 게이츠는 AI가 발전함으로서 다양한 분야에서의 개개인, 단체 차원에서의 생산성 뿐만 아니라, 전세계적으로 사람들이 겪는 불평등함을 해소해 줄 수 있을 것이라고 기대하고 있으며, 한 때 컴퓨팅 산업의 꿈으로 여겨졌던 AGI가 오늘 날 현실에 매우 빠르게 가까워지고 있다고 언급하였습니다. 올해 상반기가 채 지나지 않았는데도 비단 기술 시장뿐만이 아닌, 전세계 인류에게 있어 역사적이라고 할 수 있는 순간들이 지속적으로 등장하였습니다. ChatGPT에 여러 다른 AI 모델을 연결해주는 HuggingGPT와 곧 학습이 완료될 수 있다는 GPT-5 루머까지. 오늘 날 AI의 비약적인 발전으로 인해 발생한 각종 기대와 우려 중 어느 것이 더 현실로 다가올지는 지켜보아야 하겠지만, 우리가 생각하는 것 보다 AI 시장은 AGI를 달성하는 것에서 그리 멀지 않은 것은 아닌가 생각이 됩니다.
written by Sarah.7
댓글