구글 클라우드, AI 추론 맞춤 7세대 TPU '아이언우드' 정식 출시

[아이뉴스24 윤소진 기자] 구글 클라우드는 6일(현지시간) AI 추론 시대를 이끌 핵심 컴퓨팅 솔루션인 7세대 텐서처리장치(TPU) ‘아이언우드’를 정식 출시(GA)하고 Arm 기반 악시온 가상 머신(VM) 인스턴스의 프리뷰 버전을 발표했다고 밝혔다.

아이언우드는 지난 4월 ‘넥스트 2025’에서 공개된 차세대 TPU로, 대규모 모델 학습과 복잡한 강화학습, 초저지연 추론을 위한 전용 칩이다.

전 세대인 TPU v5p 대비 최대 10배, TPU v6e 대비 칩당 4배 향상된 성능을 제공한다. 구글의 통합 AI 슈퍼컴퓨팅 인프라인 ‘AI 하이퍼컴퓨터’의 핵심 구성요소로, 컴퓨팅·네트워크·스토리지·소프트웨어를 통합 설계해 효율과 성능을 극대화했다.

아이언우드는 최대 9,216개 칩을 묶은 슈퍼포드(Superpod) 구성이 가능하며, 초고속 인터칩 인터커넥트(ICI) 네트워크로 9.6Tb/s 속도와 1.77PB의 공유 메모리 접근을 지원한다.

광회로 스위칭(OCS) 기술로 장애 발생 시 실시간 경로 재구성이 가능해 중단 없는 서비스 운영이 특징이다. 필요 시 수십만 개 TPU로 확장할 수 있어 초대형 추론 환경에도 대응한다.

이미 여러 글로벌 AI 기업이 아이언우드를 활용 중이다. 앤트로픽은 클로드(Claude) 모델 학습과 서비스 운영에 아이언우드를 적용했으며, 향후 최대 100만 개 TPU 사용을 계획 중이다.

구글은 동시에 범용 컴퓨팅용 Arm 기반 중앙처리장치(CPU) ‘액시온’ 라인업도 강화했다. 액시온은 데이터 수집, 전처리, 앱 호스팅 등 백엔드 워크로드에 최적화된 맞춤형 프로세서로, 전력 효율성과 비용 대비 성능을 높였다.

이번에 공개된 N4A VM은 현 세대 x86 기반 VM 대비 최대 2배 높은 가격 효율을 제공하며, 마이크로서비스·데이터베이스·웹 서비스 등 일반 업무용으로 적합하다.

또 첫 Arm 베어메탈 인스턴스 ‘C4A 메탈’도 곧 프리뷰로 공개될 예정이다. 안드로이드 개발, 차량 내 시스템, 시뮬레이션 등 특수 워크로드를 위한 전용 물리 서버다.

구글은 이번 발표로 N4A, C4A, C4A 메탈 등 세 가지 옵션을 추가해 고객이 워크로드 요구에 맞는 CPU를 선택할 수 있도록 했다.

TPU 고객은 구글 쿠버네티스 엔진(GKE)에서 ‘클러스터 디렉터’ 기능을 활용해 대규모 학습 환경을 자동 관리할 수 있으며, 오픈소스 LLM 프레임워크 ‘맥스텍스트(MaxText)’와 ‘vLLM’도 최신 TPU 기능을 지원한다.

추론 게이트웨이 최적화로 최초 토큰 생성 시간(TTFT)을 최대 96% 단축하고 서비스 비용은 최대 30% 절감했다.

마크 로메이어 구글 클라우드 AI 및 컴퓨팅 인프라 부문 부사장 겸 총괄 매니저는 “하드웨어부터 소프트웨어, 관리형 서비스까지 긴밀히 통합된 풀 스택 AI 하이퍼컴퓨터를 바탕으로, 구글 클라우드 고객은 아이언우드와 액시온을 비롯한 다양한 컴퓨팅 옵션을 조합해 가장 까다로운 워크로드에도 최적의 유연성과 성능을 확보할 수 있을 것”이라고 말했다.

/윤소진 기자(sojin@inews24.com)

구글 클라우드, AI 추론 맞춤 7세대 TPU '아이언우드' 정식 출시

Arm 기반 CPU ‘액시온’ 포트폴리오도 확대

주요뉴스

댓글 쓰기 ^제목 구글 클라우드, AI 추론 맞춤 7세대 TPU '아이언우드' 정식 출시

댓글-

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순

Arm 기반 CPU ‘액시온’ 포트폴리오도 확대

주요뉴스새로고침

댓글 쓰기 제목 구글 클라우드, AI 추론 맞춤 7세대 TPU '아이언우드' 정식 출시

뉴스톡톡 인기 댓글을 확인해보세요. 정렬 인기순 최신순

주요뉴스

댓글 쓰기 ^제목 구글 클라우드, AI 추론 맞춤 7세대 TPU '아이언우드' 정식 출시

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순