태그: AI inference

중국 GPU 제조업체인 Moore Threads가 MTT S80 및 S70 GPU를 위한 새로운 v290.100 드라이버를 출시했습니다. 이 드라이버는 특정 게임 타이틀에서 상당한 성능 향상을 약속합니다. 업데이트는 Unigine Valley와 Rhinoceros 3D를 포함한 …

2025-02-20 16:28 | 댓글: 0개

샌디스크는 고대역폭 플래시(고대역폭 플래시, HBF)라는 새로운 메모리 기술을 소개했습니다. 이 기술은 3D NAND의 높은 용량과 고대역폭 메모리(고대역폭 메모리, HBM)의 대역폭을 결합합니다. 첫 번째 세대 HBF는 GPU에서 최대 4TB의 VRAM을 지원할 …

2025-02-13 12:16 | 댓글: 0개

2019년에 소개된 Ascend 910 프로세서의 변형인 화웨이의 HiSilicon Ascend 910C가 DeepSeek의 연구에 따르면 Nvidia의 H100 추론 성능의 60%를 제공하는 것으로 보고되었습니다. Ascend 910C는 시장에서 최고의 성능을 자랑하지는 않지만, 중국의 Nvidia …

2025-02-04 13:30 | 댓글: 0개

인텔의 루나 레이크(Lunar Lake) CPU 플랫폼은 새롭게 출시된 메타 LLaMA 3.2 모델과 함께 인상적인 AI 추론 성능을 보여주었습니다. 플래그십 인텔 코어 울트라 9 288V CPU는 32개의 입력 토큰에 대해 28.5ms의 …

2024-09-27 07:00 | 댓글: 0개

세레브라스(Cerebras)는 AI 추론 작업에서 NVIDIA의 H100 GPU를 크게 능가하는 혁신적인 웨이퍼 크기 AI 칩을 소개했습니다. 2024년 Hot Chips 행사에서 이 회사는 44GB의 SRAM을 갖춘 자사의 칩이 전체 모델을 직접 칩 …

2024-08-27 22:18 | 댓글: 0개

AMD는 2024년 핫 칩스(Hot Chips) 행사에서 2021년에 출시된 이전 세대를 기반으로 한 Versal AI Edge Series Gen 2를 소개했습니다. 이 새로운 시리즈는 전처리, 추론, 후처리를 단일 칩에 통합하여 워크플로우를 간소화하고 …

2024-08-27 16:02 | 댓글: 0개

FuriosaAI는 지속 가능한 AI 컴퓨팅을 목표로 하는 RNGD 프로세서를 소개했습니다. 이는 AI 플랫폼에서 전력을 극대화하는 추세와 대조되는 솔루션입니다. RNGD 프로세서는 낮은 전력 소비를 위해 설계되었으며, 열 설계 전력(TDP)이 단 150W에 …

2024-08-27 01:13 | 댓글: 0개

구글이 NVIDIA의 L4 GPU를 Cloud Run 서비스에 통합하여 사용자가 클라우드에서 생성형 AI 모델을 포함한 AI 추론 애플리케이션을 실행할 수 있도록 했습니다. 이 개선 사항은 개발자들이 구글의 Gemma와 메타의 Llama와 같은 …

2024-08-22 15:50 | 댓글: 0개

암페어는 최근 AmpereOne 라인업, 특히 AmpereOne 192코어 CPU의 성능에 대한 자세한 정보를 발표했습니다. 해당 기업은 자사 서버가 AMD와 Intel 경쟁사 대비 더 비용 효율적이고 전력 소모가 적으며 우수한 성능을 제공한다고 …

2024-08-03 17:56 | 댓글: 0개