본문 바로가기
IT & TECH/미국AI동향

OpenAI, GPT-4o를 넘어 GPT-5에서 기대되는 3가지 주요 업그레이드

by 노사전과학 2024. 5. 30.
반응형

OpenAI는 최근 출시된 모델 GPT-4o의 뛰어난 성능에도 불구하고 차세대 주력 모델 GPT-5 개발에 착수했습니다. 아직 GPT-5가 고객에게 제공되기까지는 수개월 이상 걸릴 수 있지만, OpenAI의 차세대 모델에 대한 기대감은 높아지고 있습니다. 이번 글에서는 GPT-5에서 기대되는 3가지 주요 업그레이드를 살펴보고, 인공 일반 지능(AGI, Artificial General Intelligence)으로의 발전 가능성에 대해 논의해보겠습니다.

 

1. GPT-5에서 기대되는 것 : 향상된 정확도

GPT-5는 이전 모델들과 마찬가지로 더 많은 데이터를 학습하여 응답의 정확도를 높일 것으로 예상됩니다. 생성형 AI 모델은 학습 데이터를 기반으로 답변을 생성하기 때문에, 더 많은 데이터 학습은 모델의 성능 향상으로 이어집니다. GPT-3.5는 1,750억 개의 매개변수로 학습되었고 GPT-4는 1조 개로 학습되었다는 보고가 있습니다. 따라서 GPT-5는 더욱 많은 매개변수로 학습되어 정확도가 크게 향상될 것으로 기대됩니다.

 

2. 다중 모달 기능 확장

GPT-3.5는 텍스트 입력 및 출력만 가능했습니다. GPT-4 Turbo는 텍스트 및 이미지 입력으로 텍스트 출력을 생성할 수 있었고, GPT-4o는 텍스트, 오디오, 이미지, 비디오를 조합하여 입력하고 텍스트, 오디오, 이미지를 조합하여 출력할 수 있습니다. 이러한 추세를 고려하면, GPT-5는 비디오 출력 기능을 추가할 가능성이 있습니다. OpenAI는 2월에 텍스트-비디오 모델 Sora를 공개했으며, 이 모델이 GPT-5에 통합되어 비디오 출력 기능을 제공할 수 있을 것으로 예상됩니다.

 

3. 자율 행동 능력 (AGI의 미리보기와 마찬가지)

챗봇은 코드 생성, 엑셀 수식, 에세이, 이력서, 앱, 차트, 표 등 다양한 작업을 돕는 강력한 AI 도구입니다. 그러나 최소한의 지시만으로 사용자가 원하는 작업을 수행하는 AI, 즉 인공 일반 지능(AGI)에 대한 요구가 증가하고 있습니다. GPT-5가 완전한 AGI를 달성하기는 어렵겠지만, 추론, 계획, 실행을 통해 목표를 달성하는 자율 에이전트를 활용할 수 있을 것으로 기대됩니다.

예를 들어, 이상적인 시나리오에서는 GPT-5에게 "맥도날드에서 햄버거를 주문해줘"라고 요청하면, AI 모델은 맥도날드 웹사이트를 열고 주문, 주소, 결제 정보를 입력하는 등의 작업을 수행하는 에이전트를 사용하여 주문을 완료할 수 있을 것입니다. 사용자는 햄버거를 먹는 것만 신경 쓰면 됩니다.

Rabbit은 실제 환경에서 Uber 예약, 음식 주문 등의 작업을 원활하게 처리하는 에이전트를 사용하는 가젯을 개발하여 비슷한 목표를 추구하고 있습니다. Rabbit의 R1은 위에서 언급한 고급 작업을 수행할 수는 없지만, 여러 차례 매진되는 등 인기를 끌었습니다.

AI의 다음 단계인 AGI는 AI가 제공하는 지원 방식을 완전히 바꾸고, 우리가 비서를 생각하는 방식을 변화시킬 수 있습니다. AI 비서가 날씨 정보를 알려주는 대신, 처음부터 끝까지 작업을 완료하는 데 도움을 줄 수 있게 될 것입니다. GPT-5가 아직 완전한 AGI는 아니지만, 이러한 가능성을 엿볼 수 있게 해줄 것이며, 이는 기대할 만한 발전입니다.

 


  여기서 잠깐 ! 
     

인공 일반 지능 (AGI): 인간 수준의 지능을 갖춘 AI의 현재와 미래
인공 일반 지능(Artificial General Intelligence, AGI)은 인간과 같이 다양한 지적 과제를 수행하고 학습하며 문제를 해결할 수 있는 능력을 가진 인공지능을 의미합니다. 즉, 특정 분야에 국한되지 않고 범용적인 문제 해결 능력을 갖춘 AI를 말합니다. 현재 널리 사용되는 AI는 특정 작업에 특화된 '약한 AI'이며, AGI는 이와 구별되는 '강한 AI'로 볼 수 있습니다.

AGI 개발의 현재 단계

AGI는 아직 연구 개발 단계에 있으며, 완전한 AGI는 구현되지 않았습니다. 현재 AI 기술은 특정 영역에서 뛰어난 성능을 보여주지만, 범용적인 지능을 갖춘 AGI 수준에는 미치지 못합니다. OpenAI의 GPT 모델과 같은 대규모 언어 모델은 텍스트 생성, 번역, 질의응답 등 다양한 작업에서 인간과 유사한 성능을 보여주지만, 여전히 인간의 직관, 창의성, 상식 추론 등에는 한계를 보입니다.

AGI 개발의 주요 과제는 다음과 같습니다.

범용적인 학습 능력: 특정 분야에 국한되지 않고 다양한 분야의 지식을 습득하고 활용하는 능력
상식 추론: 인간이 당연하게 여기는 상식적인 지식을 이해하고 추론하는 능력
창의성: 새로운 아이디어를 생성하고 문제를 해결하는 창의적인 능력
자기 인식: 자신의 존재와 능력을 인식하고 스스로 발전하는 능력

AGI의 전망과 영향

AGI는 인류 역사상 가장 중요한 기술 발전 중 하나가 될 수 있습니다. AGI는 과학, 의료, 교육, 예술 등 다양한 분야에서 혁신을 가져올 수 있으며, 인간의 삶을 더욱 풍요롭고 편리하게 만들 수 있습니다. 예를 들어, AGI는 질병 진단 및 치료, 신약 개발, 기후 변화 예측, 교육 개인화 등에 활용될 수 있습니다.

그러나 AGI는 동시에 잠재적인 위험을 내포하고 있습니다. AGI가 인간의 통제를 벗어나 예상치 못한 행동을 할 경우, 심각한 사회적 혼란을 야기할 수 있습니다. 따라서 AGI 개발과 함께 윤리적, 사회적 문제에 대한 논의와 대비책 마련이 필수적입니다.

결론적으로, GPT-5는 향상된 정확도, 다중 모달 기능 확장, 자율 행동 능력 등 다양한 측면에서 발전하여 AGI로 향하는 중요한 발걸음이 될 것으로 기대됩니다.

반응형