AI All

“현존하는 인공지능 중 가장 뛰어나” 구글, AI 언어모델 ‘제미나이’ 공개

2023-12-07 3 min read

author:

“현존하는 인공지능 중 가장 뛰어나” 구글, AI 언어모델 ‘제미나이’ 공개

Reading Time: 3 minutes

구글은 6일(현지시간) 인공지능 모델 제미나이(Gemini, 이하 ‘제미나이’)를 발표했다. 제미나이는 구글 딥마인드(Google DeepMind)와 구글 리서치(Google Research) 등 구글 조직 전반에 걸친 대규모 협업의 결과로 구글 역사상 가장 큰 과학적 및 기술적 노력 중 하나라는 설명이다. 구글은 “지금까지 개발한 인공지능 모델 중 가장 유능하고 범용적“이라고 제미나이에 대한 자신감을 보였다. 

구글 AI 모델의 첫 번째 버전인 제미나이 1.0은 규모에 맞게 세 종류로 최적화했다. ‘제미나이 울트라(Gemini Ultra)’는 방대하고 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델(Most capable and largest model for highly complex tasks)이며 ‘제미나이 프로(Gemini Pro)’는 다양한 작업에서 확장하기에 가장 적합한 모델(Best model for scaling across a wide range of tasks)이다. 그리고 ‘제미나이 나노(Gemini Nano)’는 온디바이스(on-device) 작업에 가장 효율적인 모델(most efficient model for on-device tasks)이다.


제미나이는 멀티모달 기반 AI 모델로, 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있다. 또한, 데이터센터부터 모바일 기기까지 모든 환경에서 범용적으로 유연하게 활용될 수 있습니다. 앞으로 개발자들과 기업은 AI를 활용해 제품을 구축하고 확장하는 방식을 개선한다. 

구글은 “지금까지의 멀티모달 인공지능 모델을 만드는 표준 접근 방식은 서로 다른 모달리티에 대해 별도의 구성 요소를 학습시킨 다음, 이를 서로 연결하여 일부 기능을 비슷하게 모방했다. 이와 같은 모델은 이미지 설명과 같은 일부 작업은 잘 수행할 수 있지만 보다 개념적이거나 복잡한 추론에는 어려움을 겪을 수 있다”라며 “제미나이를 개발 단계 초기부터 다양한 모달리티로 사전 학습시켜 ‘태생적으로 멀티모달(natively multimodal)’이 되도록 설계, 개발했다. 이후 추가적인 멀티모달 데이터로 미세 조정하여 그 효과를 더욱 개선해 제미나이는 처음부터 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있고 기존 멀티모달 모델보다 훨씬 뛰어나며 거의 모든 영역에서 가장 앞선 성능을 보였다”고 밝혔다. 

구글은 다양한 작업에서 제미나이 모델을 철저하게 테스트하고 성능을 평가했다. 그 결과 자연스러운 이미지와 음성, 영상의 이해부터 수학적 추론까지 제미나이 울트라의 성능은 업계에서 대형 언어 모델(LLM) 연구개발 평가에서 주로 사용되는 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 보였다는 설명이다. 

수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding; 대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록한 제미나이 울트라는 전문가 인력보다 높은 결과를 기록한 최초의 모델이다. 

또한, 제미나이 울트라는 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 최상위 점수를 획득했다. 제미나이 1.0은 구글의 다양한 제품과 플랫폼을 통해 순차적으로 출시될 예정이며 일반 이용자들은 7일부터 파인튜닝된 제미나이 프로가 적용된 바드를 한국을 포함한 170개 이상의 국가 및 지역에서 영어로 이용할 수 있다.

구글 픽셀(Pixel)에도 제미나이가 탑재될 예정이다. 픽셀 8 프로 모델은 제미나이 나노가 실행되도록 설계된 스마트폰으로, 제미나이 나노는 녹음 앱의 요약하기와 같은 새로운 기능을 지원하며, 왓츠앱(WhatsApp)을 시작으로 내년에 더 많은 메시징 앱에 적용될 예정이다. 향후 몇 달 안에 구글 검색, 광고(Ads), 크롬(Chrome), 듀엣(Duet) AI 등 더 많은 구글 제품 및 서비스에서 제미나이를 활용할 수 있도록 한다는 계획이다. 

개발자와 기업은 Google AI Studio 또는 Vertex AI의 제미나이 API를 통해 제미나이 프로를 이용할 수 있다. 현재 제미나이 울트라는 출시를 앞두고 신뢰할 수 있는 외부 기관 소속 레드팀의 리뷰 등 광범위한 신뢰성 및 안전 점검을 완료한 후, 미세 조정과 사람의 피드백을 통한 강화 학습(Reinforcement Learning from Human Feedback: RLHF)을 통해 모델을 더욱 개선하는 작업을 진행 중이다.

가장 뛰어난 성능의 최대 규모 모델인 제미나이 울트라를 적용해 최첨단 AI 경험을 제공하게 될 바드 어드밴스드(Bard Advanced)는 내년 초 선보일 예정이다. 

[생성(Generative) AI 소식 전체보기]



스타트업 소식을 전하는 외우테일 편집장
Leave a comment

댓글 남기기