구글 제미니, AI 시스템, 대규모 언어 모델, 멀티모달, 챗봇

구글 제미니(제미나이): 지금까지 알려진 사실 8가지

구글 제미니, AI 시스템, 대규모 언어 모델, 멀티모달, 챗봇

출처: pexels

최신 인터뷰와 보고서를 바탕으로 OpenAI와 경쟁할 Google의 곧 출시될 AI 시스템인 Gemini(제미나이)에 대해 지금까지 알려진 내용을 정리했습니다.

하이라이트

  • 구글 딥마인드는 OpenAI와 경쟁하기 위해 제미니(Gemini/제미나이)라는 새로운 LLM을 만들고 있습니다.
  • 구글은 일부 기업에 제미니(제미나이)에 대한 조기 액세스 권한을 부여하여 곧 출시될 예정임을 알렸습니다.
  • 딥마인드와 구글 리소스의 융합으로 제미니의 영향력은 잠재적으로 엄청날 것으로 예상됩니다.

2023년 5월 Google I/O 개발자 컨퍼런스에서 CEO 순다르 피차이(Sundar Pichai)는 곧 출시될 인공 지능(AI) 시스템인 제미니(제미나이)를 발표했습니다.

대규모 언어 모델(LLM, Large Language Model)은 구글 딥마인드 사업부(브레인 팀 + 딥마인드)에서 개발 중입니다. 이 시스템은 OpenAI의 ChatGPT와 같은 AI 시스템과 경쟁할 수 있으며, 그 성능을 능가할 수도 있습니다.

자세한 내용은 아직 알려지지 않았지만, 구글 제미니(제미나이)에 대한 최신 인터뷰와 보고서에서 확인할 수 있는 내용은 다음과 같습니다.

구글 제미니(제미나이)는 멀티모달이 될 것

피차이는 제미니(제미나이)가 복잡한 바둑 게임을 마스터한 것으로 알려진 딥마인드의 알파고 시스템의 강점과 광범위한 언어 모델링 기능을 결합했다고 말했습니다.

그는 이 모델이 처음부터 텍스트, 이미지 및 기타 데이터 유형을 통합하는 멀티모달로 설계되었다고 말했습니다. 이를 통해 보다 자연스러운 대화가 가능해질 수 있습니다.

또한 피차이는 추론이 필요한 작업을 가능하게 하는 메모리 및 계획과 같은 미래 기능에 대해서도 암시했습니다.

도구와 API를 사용할 수 있는 제미니(제미나이)

구글 수석 과학자 제프리 딘(Jeffrey Dean)은 여름에 자신의 전문 약력을 업데이트하면서 제미니가 자신이 공동 주도하고 있는 “차세대 멀티모달 모델” 중 하나라고 말했습니다.

그는 다양한 데이터 세트에 대한 학습을 확장하기 위해 구글의 새로운 AI 인프라인 Pathways를 활용할 것이라고 말했습니다.

이는 제미니(제미나이)가 1750억 개 이상의 매개변수를 가진 GPT-3의 규모를 뛰어넘는, 지금까지 만들어진 언어 모델 중 가장 큰 규모가 될 가능성이 있음을 암시합니다.

다양한 크기와 기능으로 제공될 예정

자세한 내용은 딥마인드 CEO 데미스 하사비스(Demis Hassabis)가 밝혔습니다.

6월에 그는 강화 학습 및 트리 검색과 같은 알파고의 기술이 제미니(제미나이)에 추론 및 문제 해결과 같은 새로운 능력을 부여할 수 있다고 Wired와의 인터뷰에서 말했습니다.

하사비스는 제미니(제미나이)가 다양한 크기와 기능으로 제공될 “모델 시리즈”라고 말했습니다.

그는 또한 제미니(제미나이)가 메모리를 활용하거나, Google 검색과 같은 출처에 대한 사실 확인 및 향상된 강화 학습을 활용하여 정확성을 높이고 위험한 환각 콘텐츠를 줄일 수 있다고 언급했습니다.

제미니(제미나이)의 유망한 초기 결과

9월 Time 인터뷰에서 하사비스는 제미니(제미나이)가 규모와 혁신을 결합하는 것을 목표로 한다고 다시 한 번 강조했습니다.

그는 계획과 메모리를 통합하는 것은 초기 탐색 단계에 있다고 말했습니다.

또한 하사비스는 제미니(제미나이)가 사실의 일관성을 높이기 위해 단어 단위로 생성하는 것이 아니라 전체 정보 블록을 출력하는 검색 방법을 사용할 수도 있다고 말했습니다.

그는 제미니(제미나이)가 이미지 캡션 시스템 플라밍고(Flamingo)와 같은 딥마인드의 멀티모달 작업을 기반으로 하고 있다고 밝혔습니다.

하사비스는 전반적으로 제미니(제미나이)가 “매우 유망한 초기 결과를 보여주고 있다”고 말했습니다.

범용 개인 비서로서의 고급 챗봇

며칠 후 게재된 Wired와의 인터뷰에서 피차이는 제미니(제미나이)가 구글의 제품 로드맵에 어떻게 들어맞는지 가장 명확하게 설명했습니다.

그는 바드(Bard)와 같은 대화형 AI 시스템이 “최종 상태”가 아니라 더 발전된 챗봇으로 가는 길목이라고 말했습니다.

피차이는 제미니(제미나이)와 향후 버전이 궁극적으로 여행, 업무, 엔터테인먼트 등 사람들의 일상 생활 전반에 걸쳐 통합되는 “놀라운 범용 개인 비서”가 될 것이라고 말했습니다.

그는 제미니(제미나이)가 텍스트와 이미지의 강점을 결합할 것이라며 오늘날의 챗봇은 몇 년 안에 “사소해 보일 것”이라고 거듭 강조했습니다.

제미니(제미나이)의 성능에 관심을 보이는 경쟁사들

OpenAI CEO는 구글 제미니(제미나이)가 GPT-4를 능가할 수 있다는 유료 기사 보도에 대한 답변으로 보이는 트윗을 올렸습니다.

SemiAnalysis에서 제공한 수치가 정확한지에 대한 일론 머스크(Elon Musk)의 후속 질문에 대한 공식적인 답변은 없었습니다.

일부 기업에게 제미니(제미나이) 조기 액세스 권한 부여

이번 주에 제미니(제미나이)의 진행 상황에 대한 더 많은 단서가 나왔습니다: The Information은 구글이 구글 외부의 소수의 개발자에게 제미니(제미나이)에 대한 조기 액세스 권한을 부여했다고 보도했습니다.

이는 제미니(제미나이)가 곧 베타 버전으로 출시되어 구글 클라우드 버텍스 AI(Google Cloud Vertex AI)와 같은 서비스에 통합될 준비가 되었음을 시사합니다.

OpenAI와 경쟁하기 위해 LLM에서 작업 중인 메타

지금까지 제미니(제미나이)에 대한 소식은 희망적이지만, OpenAI와 경쟁하기 위해 새로운 LLM을 출시할 준비가 된 회사는 구글만이 아닙니다.

월스트리트 저널에 따르면 메타(Meta)도 ChatGPT를 구동하는 GPT 모델과 경쟁할 수 있는 AI 모델을 개발 중이라고 합니다.

메타는 최근 마이크로소프트(Microsof)와 협력하여 오픈소스 AI 모델인 라마 2(Llama 2)를 출시했다고 발표했습니다. 메타는 보다 접근하기 쉬운 AI를 책임감 있게 개발하는 데 전념하고 있는 것으로 보입니다.

구글 제미니(제미나이) 카운트다운

지금까지 알려진 바에 따르면 제미니(제미나이)는 자연어 처리 분야에서 상당한 발전을 이룰 수 있을 것으로 보입니다.

딥마인드의 최신 AI 연구와 Google의 방대한 컴퓨팅 리소스가 융합되어 그 잠재적 영향력은 과장하기 어려울 정도입니다.

제미니(제미나이)가 기대에 부응한다면 “수십억 명의 사람들에게 책임감 있는 방식으로 AI를 제공하겠다”는 Google의 야심에 따라 대화형 AI의 변화를 주도할 수 있을 것입니다.

Meta와 Google의 최신 소식은 기술 기업 CEO들이 미국 상원의 일부 의원들과 비공개로 만나 AI의 미래에 대해 논의한 첫 번째 AI 인사이트 포럼이 열린 지 며칠 후에 나왔습니다.

원글 보러가기
🙌 디지털 마케팅 전문가의 도움이 필요하신가요? NNT와 무료 상담을 받아보세요!

위로 스크롤