IBM은 Intel의 Gaudi 3 가속기를 특정 IBM 클라우드 지역인 프랑크푸르트와 워싱턴 D.C.에서 사용할 수 있게 되었다고 발표했으며, 2025년 2분기까지 댈러스로 확장할 계획이다. 이번 협력은 인프라 비용 상승과 AI 솔루션에 대한 수요 증가 속에서 기업들이 생성적 AI 작업을 확장할 수 있는 비용 효율적인 플랫폼을 제공하는 것을 목표로 한다. IBM의 'AI in Action 2024' 보고서에 따르면, 67%의 경영진이 AI를 통해 25% 이상의 수익 증가를 보고했으며, 이는 강력한 인프라의 필요성을 강조한다.
Gaudi 3는 다양한 배포 옵션을 갖춘 모듈형 구조를 제공한다: IBM 클라우드 VPC에서 독립형 서버로, Red Hat OpenShift AI 클러스터를 위한 컨테이너화된 작업 노드로, 기존 IBM watsonx.ai 고객을 위한 Bring-Your-Own-watsonx 라이선스 모델을 통해 제공된다. 또한 IBM은 다양한 시나리오를 위한 배포 가능한 아키텍처(Deployable Architectures, DAs)를 제공하며, 이는 2025년 하반기에 제공될 예정이다.
이 프로젝트는 Red Hat 및 Wipro와의 파트너십도 포함되어 있으며, 오픈 소스 접근 방식과 기존 클라우드 파트너십의 통합을 강조하고 있다. 보안 문제는 Intel TDX(Trust Domain Extensions)의 통합을 통해 해결되며, 이는 하드웨어 기반의 기밀 컴퓨팅 기능을 제공한다.
IBM 클라우드에서 Gaudi 3의 도입은 전략적인 움직임이지만, 특히 NVIDIA와의 경쟁에서 차별화는 제한적이다. 배포 옵션의 유연성은 주목할 만하지만, 이 이니셔티브의 성공은 성능, 소프트웨어 통합 및 실험적 사용 사례를 넘어서는 시장 채택에 달려 있다.
* 이 글은
igorslab.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.