상세 컨텐츠

본문 제목

[구글] 생성형 AI '제미나이(Gemini)'로 브랜드 통합과 유료화 발표, OpenAI 社의 챗GPT와 비교

IT시사

by EdgarKim 2024. 2. 10. 09:29

본문

반응형

인공지능(AI)은 현재 우리의 삶과 사회에 많은 영향을 미치고 있습니다. 특히, 생성형 AI는 텍스트, 이미지, 오디오, 동영상 등 다양한 유형의 정보를 이해하고, 조합하고, 창출할 수 있는 AI로서, 새로운 기회와 혁신을 가져올 것으로 기대됩니다.
'구글'과
비영리 연구기관 '오픈AI'는 현재 세계적으로 생성형 AI(GenAI) 분야에서 선도적인 역할을 하고 있는 두 조직입니다.(사실 마이크로소프트의 Bing Chat도 있으나 오픈AI社의 대주주로서 독점사용 권한이 있으니..)
'오픈AI'는 2022년 11월에 ChatGPT라는 생성형 AI 챗봇을 출시하였으며, 이는 생성형 AI의 열풍을 일으킨 주요 계기가 되었습니다.
'구글' 또한 이에 대응하여 챗봇 'Bard(바드)'를 공개하면서 미래의 GenAI 시장에서의 캐시카우 확보를 위한 빅테크 기업간 주도권 전쟁이 치열해지고 있는 상황에서 구글이 최신 인공지능(AI) 모델 ‘제미나이(Gemini)'를 중심으로 생성형 AI 브랜드 통합과 함께 유료화 정책을 발표했습니다.

제미나이 컨셉 이미지

구글이 최신 인공지능(AI) 모델 ‘제미나이’(Gemini)를 중심으로 생성형 AI 생태계를 재구성한다. 이에 따라 챗봇 ‘바드(Bard)' 이름도 제미나이로 변경하기로 했고 새로운 유료 챗봇도 공개했다. 앞서 구독형 서비스를 내놓은 오픈AI와 마이크로소프트(MS)에 이어 구글까지 AI 서비스 유료화에 나서고 있다.
8일(현지시간) 구글은 자사 블로그를 통해 제미나이 생태계의 다음 단계를 소개한다며 이와 같이 발표했다.
구글은 지난해 12월 제미나이를 처음 공개했다. 제미나이는 멀티모달 모델로 텍스트뿐만 아니라 이미지, 음성, 영상까지 인식하고 추론할 수 있다. 학습 규모에 따라 울트라, 프로, 나노로 나뉘며 40개국의 언어를 지원한다. 
구글은 이날 “제미나이가 단순히 모델 그 이상으로 진화하고 있다”며 “수십억명의 사람들이 매일 사용하는 제품에서부터 개발자들과 기업이 혁신하는 것을 돕는 API(애플리케이션 프로그래밍 인터페이스)와 플랫폼에 이르기까지 생태계 전체를 지원한다”고 밝혔다. 
구글은 자사 모든 AI 제품을 ‘제미나이’로 통합한다. 이에 따라 그동안 바드로 불린 AI 챗봇의 이름도 제미나이로 바뀐다. 또 구글 워크스페이스와 구글 클라우드 내에 생산성 향상과 단순 작업 수행을 지원하는 AI 도구인 ‘듀엣 AI’의 명칭은 ‘워크스페이스용 제미나이’와 ‘구글 클라우드용 제미나이’로 바뀐다
출처 : 블로터(https://www.bloter.net)

 

《 구글 제미나이(Gemini) 소개 》

Alphabet의 Brain Team과 DeepMind가 만든 최신 LLM(대규모 언어 모델)으로, 지난해 12월에 공개된 구글의 최첨단 AI 모델로, 다양한 벤치마크에서 탁월한 성능을 보여주었습니다. 또한, 올해 2월에는 웹과 모바일 앱을 통해 일반 사용자들에게도 서비스를 시작하였습니다. 제미나이는 텍스트뿐만 아니라 이미지, 오디오, 동영상 등 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있는 멀티모달 AI입니다. 즉, 제미나이는 단순히 정보를 검색하거나 분류하는 것이 아니라, 직접 정보를 생성하고, 추론하고, 명령하고, 코딩하고, 창의적으로 협업할 수 있는 AI입니다.

제미나이 3가지 버전

1. 제미나이 1.0의 3가지 버전 (출처, https://tinyurl.com/2a6zry8a)

  • 제미나이 울트라(Gemini Ultra): -> 챗GPT 4.0보다 뛰어나다는 평가
    Gemini Ultra는 Google의 새로운 LLM(대형 언어 모델)인 Gemini의 가장 강력한 버전입니다. 매우 복잡한 작업에 최적화되어 있으며 텍스트, 이미지, 비디오, 오디오 및 코드 전반에 걸쳐 원활하게 추론할 수 있습니다. 다양한 작업을 처리할 수 있는 다목적 모델입니다. Gemini Ultra는 여러 주요 벤치마크에서 최첨단 성능을 제공하며 검색, 광고, Bard를 포함한 다양한 Google 제품 전반에 걸쳐 사용되도록 설계되었습니다.
    MMLU(Massive Multitask Language Understanding), Big-Bench Hard 및 HumanEval을 포함한 많은 주요 벤치마크에서 최첨단 성능을 제공합니다. 실제로 Gemini Ultra는 MMLU와 같은 LLM 벤치마크와 MMMU, VQAv2, MathVista와 같은 다중 모드 벤치마크에서 GPT-4보다 성능이 뛰어났습니다. 90.0%의 점수를 얻은 Gemini Ultra는 MMLU에서 인간 전문가보다 성능이 뛰어난 최초의 모델입니다.
  • 제미나이 프로(Gemini Pro)
    Gemini Pro는 이제 개발자와 기업이 액세스할 수 있는 강력하고 다재다능한 AI 모델입니다. 다중 모드(텍스트, 이미지, 오디오, 비디오 및 코드를 이해하고 작업) 기능, 강력한 성능, Google 제품과의 통합을 통해 다양한 애플리케이션에 유용한 도구가 됩니다. Google은 Gemini Pro의 기능과 가용성을 지속적으로 확장함에 따라 AI 개발 및 혁신을 발전시키는 데 중요한 역할을 할 준비가 되어 있습니다.
  • 제미나이 나노(Gemini Nano):
    Gemini Nano는 다중 모드 모델입니다. 즉, 텍스트, 이미지, 오디오, 비디오 및 코드를 이해하고 사용할 수 있습니다. 온디바이스의 기기 내 작업에 최적화 되어 있으며 Android 기기에서 오프라인으로 실행되도록 설계된 가장 효율적인 모델입니다. Gemini Nano에는 1.8B 매개변수(Nano-1)와 3.25B 매개변수(Nano-2)를 갖춘 두 가지 모델이 포함되어 있어 메모리 용량이 높거나 낮은 장치에 쉽게 배포할 수 있습니다.(삼성의 갤럭시 S24에 빌트인된 모델로 추정됨)
  • 결론:
    결론적으로 이러한 다양한 버전은 다양한 사용 사례에 최적화되어 있습니다.
    - Nano는 온디바이스 작업에 가볍고 효율적이고,
    - Pro는 광범위한 작업에 걸쳐 확장되며,
    - Ultra는 매우 복잡한 다중 모달 추론에 적합합니다. 이 모델은 현재 영어로 제공되며 전 세계 Google 제품 및 서비스에 통합할 계획입니다.

AI 인공지능에서 매개변수(Parameter) 값 이해하기
매개변수(Parameter)는 AI가 처리하는 변수의 단위입니다. 매개변수 개수가 많을수록 더 많은 변수를 처리할 수 있다는 뜻인데요. 비유하자면 호텔 방을 예약할 때 '오션뷰인 스위트룸 7월 1일부터 3일간 부탁합니다'라는 문장에서의 매개변수는 '오션뷰', '스위트룸', '7월 1일', '3일간' 총 4개입니다. 오션뷰 대신 시티뷰를, 스위트룸 대신 더블베드 룸을, 7월 1일이 아닌 7월 4일부터, 3일 동안이 아닌 일주일을 머무를 수도 있는 것이니 말이죠.
출처 : 머니네버슬립(https://moneyneversleeps.co.kr)


2. 제품 포지셔닝

구글은 제미나이(Gemini)를 통해 개인과 기업이 매일 사용하는 구글 제품에도 AI의 뛰어난 기능을 제공합니다.
예를 들어, 워크스페이스(Workspace)에서는 제미나이 포 워크스페이스(Gemini for Workspace)를 통해 지메일, 구글 닥스, 스프레드시트, 슬라이드, 미트 등에서 글쓰기 도움, 문서 요약, 프레젠테이션 제작, 화상 회의 통역 등의 서비스를 지원하며,
구글 클라우드에서는 제미나이 포 클라우드(Gemini for Cloud)를 통해 기업 고객들에게 코딩 도움, 데이터 분석, 사이버 보안 등의 서비스를 제공합니다.

3. 유료화 방침

구글은 브랜드 명칭 변경과 함께 월 19.99달러(약 2만6647원)의 유료 구독 서비스 '제미나이 어드밴스드'를 공개했습니다. 세계 150개국에서 영어판으로 나오는 해당 서비스에는 대규모 언어모델(LLM) 중 가장 강력한 성능을 가진 '제미나이 울트라 1.0' AI 모델이 적용되는 것으로 제미나이 어드밴스드(Gemini Advanced) 유료 구독자들은 기존 월 9.99달러의 2TB(테라바이트)의 클라우드 저장공간도 활용할 수 있습니다. 또 지메일, 구글 닥스 등에서 기존의 듀엣 AI인 제미나이도 조만간 사용할 수 있게 됩니다.

 

《 오픈AI의 Chat GPT vs. 구글의 제미나이(Gemini) 비교 》

항목 오픈AI의 ChatGPT 구글의 제미나이(Gemini)
파라미터
(매개변수) 수
100조개 추정
(GPT4)
175조개 추정
(제미나이 울트라)
정보 유형 텍스트 텍스트, 이미지, 오디오, 동영상
정보 활용
(생성/이해/추론/명령/협업)
자연어 기반 자연어/이미지/오디오/동영상/코드 기반
벤치마크 점수 MMLU: 86.4% MMLU: 90.04%

출처, Gemini: Google's Multimodal Mastermind and Its Impact on AI(https://tinyurl.com/26lj7nw4)


1. 비즈니스 철학

오픈AI는 구글과 함께 생성형 AI 분야에서 선도적인 역할을 하고 있는 비영리 연구 기관입니다. ChatGPT는 17.5조 개의 파라미터를 가진 LLM(Large Language Model)으로, 텍스트를 기반으로 한 자연스러운 대화를 할 수 있습니다.
그러나 오픈AI는 ChatGPT 4부터 핵심 기술을 MS에만 독점 제공하기로 하였으며, 이는 오픈AI의 이름과 정책에 어긋나는 것으로 비판을 받았습니다. 오픈AI의 공동 창립자이자 수석 과학자인 일리야 수츠케버는 “AI 모델은 현재도 매우 위험하고, 미래에는 더욱 위험할 것이다. 우리는 AI의 안전성과 책임성을 보장하기 위해 MS와 협력하기로 결정했다”고 설명했습니다.
반면에 구글은 제미나이를 통해 AI의 접근성과 활용성을 높이고, AI의 잠재력을 최대한 발휘하고자 합니다. 또한, 구글은 제미나이의 안전성과 책임성을 확보하기 위해 AI 원칙에 따라 엄격한 검증과 평가를 거치고 있으며, 각 정부 및 전문가와 협력하여 AI 거버넌스를 수립하고 있습니다.
이렇게 보면, 오픈AI와 구글은 생성형 AI의 목표와 방향에 있어서 상당한 차이가 있음을 알 수 있습니다. 오픈AI는 AI의 위험성을 최소화하고, AI의 공공성을 유지하고자 하는 반면, 구글은 AI의 가능성을 최대화하고, AI의 상용성을 확대하고자 합니다. 이러한 차이는 각각의 기관의 철학과 가치관에 기인하는 것으로 보입니다.

2. 기술 특성

오픈AI의 ChatGPT는 텍스트를 기반으로 한 생성형 AI로, 자연어와 관련된 작업에 특화되어 있습니다. 구글의 제미나이는 텍스트뿐만 아니라 이미지, 오디오, 동영상 등 다양한 유형의 정보를 기반으로 한 생성형 AI로, 자연어와 관련된 작업뿐만 아니라 이미지와 관련된 작업, 오디오와 관련된 작업, 동영상과 관련된 작업, 코드와 관련된 작업 등에도 능숙하게 수행할 수 있습니다.
또한, 오픈AI의 ChatGPT는 단일 정보 유형(자연어 기반)을 조합하여 활용할 수 있습니다. 예를 들어, 텍스트로 된 질문에 텍스트로 답변을 할 수 있습니다. 구글의 제미나이는 다중 정보 유형(멀티 모달)을 조합하여 활용할 수 있습니다. 예를 들어, 텍스트로 된 질문에 이미지로 답변을 하거나, 이미지로 된 질문에 텍스트로 답변을 할 수 있습니다.
마지막으로, 오픈AI의 ChatGPT는 MMLU (massive multitask language understanding) 테스트에서 82.37%의 점수를 기록하였습니다. MMLU 테스트는 수학, 물리학, 역사, 법학, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 테스트입니다. 구글의 제미나이는 MMLU 테스트에서 90.04%의 점수를 기록하였습니다. 이는 전문가 인력보다 높은 결과로, 최초로 인공지능이 인간을 능가한 사례입니다.

 
## 참고 정보 ##

 

구글, AI 챗봇 '제미나이'로 바꾸고 유료 서비스 출시…AI 유료화 나서는 빅테크

구글이 최신 인공지능(AI) 모델 ‘제미나이’(Gemini)를 중심으로 생성형 AI 생태계를 재구성한다. 이에 따라 챗봇 ‘바드’(Bard) 이름도 제미나이로 변경하기로 했고 새로운 유료 챗봇도 공개했다.

www.bloter.net

https://www.reuters.com/technology/google-rebrands-bard-chatbot-gemini-rolls-out-paid-subscription-2024-02-08/

 

Gemini Ultra vs Gemini Pro vs Gemini Nano: Google's Gemini versions explained

Google Gemini is the newest LLM and it comes in three modes. Here's our guide comparing Gemini Ultra vs Gemini Pro vs Gemini Nano.

www.androidauthority.com

https://www.linkedin.com/pulse/gemini-googles-multimodal-mastermind-its-impact-ai-manish-tyagi-du2tf

 

Gemini: Google's Multimodal Mastermind and Its Impact on AI

Gemini is the result of large-scale collaborative efforts by teams across Google, including their colleagues at Google Research. It was built from the ground up to be multimodal, which means it can generalize and seamlessly understand, operate across and c

www.linkedin.com

 

반응형

관련글 더보기