[아이뉴스24 윤소진 기자] 오픈AI GPT-5.1과 구글 제미나이 3가 일주일 간격으로 등장하면서 두 회사의 최신 모델에 대한 관심이 뜨겁다. 성능은 직전 모델보다 모두 개선됐다는 공통된 평가지만, 모델별 강점과 사용자 체감은 뚜렷하게 갈린다.
![구글 제미나이3와 오픈AI GPT-5.1의 대결이라는 프롬프트로 제미나이가 제작한 이미지. [사진=제미나이 제작]](https://image.inews24.com/v1/ba4fd29fd2978b.jpg)
먼저 제미나이3 시리즈는 영상·이미지·문서·PDF 등 복합 멀티모달 처리에서 높은 평가를 받는다. 구글은 공식 블로그에서 ‘인류의 마지막 시험' 벤치마크 결과 시리즈 최상위 모델인 ‘제미나이3 프로’가 37.5% 정답률을 기록해 GPT-5.1(26.5%)을 앞섰다는 분석을 내놨다. 100만 토큰 이상의 대규모 문맥 유지력과 워크스페이스·유튜브·안드로이드 등 구글 생태계와 강력한 연동도 강점으로 꼽힌다.
‘바이브 코딩’은 텍스트만으로 3D 시뮬레이션·게임 구조·데이터 시각화를 자동 생성하는 기능이다. 이미지·코드 생성 도구 ‘나노바나나 프로’는 1K~4K 고해상도 이미지, 95%대 텍스트 렌더링, 스튜디오급 스타일 편집 기능을 제공해 크리에이터용 고급 옵션으로 평가된다.
심층추론 모드인 ‘딥싱크(DeepThink)’는 대규모 문맥을 깊게 분석하도록 설계된 고급 기능으로, 현재 일부 개발자에게만 제한적으로 제공된다. 다만 초기 버전에서는 간헐적 추론 오류가 보고됐고, 제미나이 시리즈 전반의 높은 API 단가도 부담 요인으로 지적된다.
반면 GPT-5.1은 적응형 추론과 빠른 처리 속도에 초점을 맞췄다. 인스턴트(Instant)·씽킹(Thinking) 두 가지 추론 모드를 제공해 작업 난이도에 맞춰 처리 시간을 자동 조정한다. 레딧, 해커뉴스 등 개발자 커뮤니티에서도 “실시간 대화나 API 기반 서비스에선 GPT-5.1이 더 안정적”이라는 평가가 우세하다.
코딩 벤치마크 SWE-bench Verified에서 GPT-5.1은 76.3%를 기록해 제미나이3 프로(76.2%)를 소폭 앞섰다. 전작(GPT-5) 대비 2~3배 빠른 속도와 절반 수준으로 줄어든 토큰 비용도 기업 환경에서 매력 포인트다. 다만 복잡한 멀티모달 처리나 초장기 문맥 유지력은 제미나이3보다 보수적이라는 평가가 많다.
멀티모달 vs 속도·효율…업무 유형 따라 격차 뚜렷
![구글 제미나이3와 오픈AI GPT-5.1의 대결이라는 프롬프트로 제미나이가 제작한 이미지. [사진=제미나이 제작]](https://image.inews24.com/v1/bb8b27aa83a636.jpg)
미국 테크 매체 톰스가이드가 11개 항목으로 두 모델을 직접 비교한 결과 제미나이3가 창의적 글쓰기·이미지 분석·전략적 추론 등 7개 테스트에서 승리했다고 밝혔다. GPT-5.1은 수학 문제 해결과 명확한 지시 수행 등 구조화된 작업에서 우위를 보였다는 분석이다.
정리하면 둘다 최상위 모델이지만, 잘하는 게 다르다는 결론이다. 제미나이3는 이미지·영상·PDF 등 복합 입력을 자주 다루는 사용자, 3D·시각화·콘텐츠 제작처럼 창의적 작업 중심의 업무에 적합하다. 긴 문맥을 유지해야 하는 기술문서·UI/UX 생성 같은 작업에서도 강점을 보인다.
GPT-5.1은 빠른 응답 속도와 비용 효율을 우선하는 개발자, 실시간 챗봇·API 서비스·에이전트 구축 기업, 코딩 자동화가 중요한 엔지니어링 환경에 더 최적화돼 있다.
테크크런치 등 해외 테크 전문 매체들은 공통적으로 “두 모델의 선택은 우열이 아니라 목적에 달렸다”고 강조한다. 제미나이3는 멀티모달·장기 문맥·복잡한 추론에서 우세하고, GPT-5.1은 빠른 응답과 코딩 효율·안정성에서 강점을 보인다는 평가다.
톰스가이드는 “창의적·복합적 사고가 필요하면 제미나이 3, 정밀성과 계산 중심 업무라면 GPT-5.1이 더 적합하다”고 평가했다. 테크크런치는 “더 뛰어난 모델을 찾는 시대는 끝났다. 이제는 어떤 일을 누구에게 맡길지가 핵심”이라고 진단했다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기