Pliops는 XDP LightningAI 장치와 FusIOnX 소프트웨어를 도입하여 복잡한 언어 모델의 확장된 컨텍스트 윈도우를 처리하는 데 있어 GPU에 연결된 고대역폭 메모리(HBM)의 한계를 극복하고자 합니다. 이 솔루션은 미리 계산된 컨텍스트를 빠른 SSD에 …
2025-05-16 09:46 | 댓글: 0개퀄컴이 서버 CPU 시장에 복귀하며 사우디 아라비아의 AI 프로젝트를 위한 프로세서를 공급할 계획입니다. 이전에 센트리크 2400을 포함한 데이터센터 부문에서의 실패에도 불구하고, 퀄컴은 최근 고급 인재를 영입하고 2021년에 누비아를 인수하면서 서버 …
2025-05-15 06:31 | 댓글: 0개구글은 'Google Cloud Next '25' 행사에서 최신 AI 가속기 아이언우드(Ironwood)를 공개했습니다. 이번 세대의 TPU 칩은 추론 작업에 최적화되어 있으며, 이전의 훈련 유닛 중심에서 전환된 것을 의미합니다. 아이언우드는 192GB의 고대역폭 메모리(High …
2025-04-11 04:00 | 댓글: 0개인텔이 AI 추론 능력을 향상시키기 위해 차세대 AI GPU인 재규어 쇼어스(Jaguar Shores)를 소개했습니다. 이 새로운 칩은 인텔의 자체 18A 공정 노드를 활용할 것으로 예상되며, 특히 NVIDIA와 AMD와 같은 기존 강자들과 …
2024-11-20 18:20 | 댓글: 0개최근 보고서에 따르면 OpenAI, Anthropic, Google의 주요 AI 모델들이 상당한 발전을 이루는 데 어려움을 겪고 있습니다. OpenAI의 GPT-4 후계자로 기대를 모았던 오리온(Orion) 모델은 기대에 미치지 못하고 있으며, GPT-3와 GPT-4 간의 …
2024-11-16 16:24 | 댓글: 0개AMD는 AI 시장에서 경쟁하기 위한 전략의 일환으로 첫 번째 소형 언어 모델인 AMD-135M을 소개했습니다. 이 모델은 Llama 계열의 일원으로, 개인 비즈니스 배포를 위해 설계되었으며, 추론을 위해 AMD 하드웨어를 활용합니다. AMD-135M …
2024-09-30 10:54 | 댓글: 0개MLPerf Inference v4.1의 출시로 데이터 센터 추론에 주목이 집중되었으며, 엣지 결과는 단 40개만 제출되었습니다. NVIDIA의 B200은 AMD의 MI300X보다 여러 벤치마크에서 우수한 성능을 보였으며, AMD는 1개에서 8개 MI300X GPU까지의 경쟁력 있는 …
2024-08-28 19:58 | 댓글: 0개인텔의 가우디 3는 AI 훈련 및 추론을 위해 설계된 최신 AI 칩으로, 2024년 동안 샘플링에서 생산으로 전환될 예정입니다. 2019년경부터 개발된 이 가우디의 3세대는 이전 모델들에 비해 향상된 컴퓨팅 능력, 증가된 …
2024-08-27 00:08 | 댓글: 0개