태그: AI inference

독일의 트럼프프 그룹에서 분사한 Q.ANT는 광학 칩을 활용한 컴퓨팅을 선도하며, Nvidia, AMD, 인텔과 같은 주요 기업의 전통적인 실리콘 기반 시스템에 도전하고 있습니다. 이들의 광학 보조 프로세서는 리튬 나이오베이트를 사용하여 전기가 …

2025-06-25 04:00 | 댓글: 0개

AMD가 토론토에 본사를 둔 AI 칩 회사 Untether AI의 엔지니어링 팀을 인수하여 AI 추론 능력을 강화하는 전략적 조치를 취했습니다. 일반적인 인수와 달리 AMD는 Untether AI의 자산을 구매하지 않아 speedAI AI …

2025-06-06 11:34 | 댓글: 0개

AMD는 미국의 수출 규정을 준수하는 중국 시장 맞춤형 AI 칩인 Radeon AI PRO R9700을 출시할 예정입니다. 이 칩은 현지 AI 추론 및 작업을 위해 설계되었으며, 다중 GPU 구성의 확장성을 지원합니다. …

2025-05-29 11:52 | 댓글: 0개

스파클(Sparkle)은 인텔 아크 B60 그래픽 카드의 듀얼 GPU 버전을 개발 중이라고 발표하며, 2025년 컴퓨텍스에서 세 가지 독특한 냉각 솔루션을 선보였습니다. 아크 프로 B60 카드에는 2560개의 스트림 프로세서, 20개의 Xe 코어, …

2025-05-28 10:02 | 댓글: 0개

☆

AMD는 2025년 컴퓨텍스 기조연설에서 AI 시장을 겨냥한 새로운 워크스테이션급 비디오 카드인 라데온 AI 프로 R9700을 발표했습니다. RDNA 4 아키텍처를 기반으로 제작된 R9700은 전문 시각화, CAD/CAM, AI 모델 추론을 위해 설계되었으며, …

2025-05-22 14:30 | 댓글: 0개

퀄컴의 CEO 크리스티아노 아몬은 AI 중심의 컴퓨텍스 기조연설을 마무리하며 데이터 센터 시장을 겨냥한 서버급 CPU와 AI 추론 가속기에 대한 예고를 발표했습니다. 퀄컴은 과거에 클라우드 AI 100 추론 가속기와 같은 제품으로 …

2025-05-19 13:00 | 댓글: 0개

인텔은 컴퓨텍스 2025에서 전문 그래픽 카드의 새로운 아크 프로 B 시리즈를 공개했습니다. 이 시리즈는 아크 프로 B50과 아크 프로 B60 두 가지 모델로 구성되어 있습니다. B50은 그래픽 집약적인 워크스테이션 애플리케이션에 …

2025-05-19 10:30 | 댓글: 0개

중국 GPU 제조업체인 Moore Threads가 MTT S80 및 S70 GPU를 위한 새로운 v290.100 드라이버를 출시했습니다. 이 드라이버는 특정 게임 타이틀에서 상당한 성능 향상을 약속합니다. 업데이트는 Unigine Valley와 Rhinoceros 3D를 포함한 …

2025-02-20 16:28 | 댓글: 0개

샌디스크는 고대역폭 플래시(고대역폭 플래시, HBF)라는 새로운 메모리 기술을 소개했습니다. 이 기술은 3D NAND의 높은 용량과 고대역폭 메모리(고대역폭 메모리, HBM)의 대역폭을 결합합니다. 첫 번째 세대 HBF는 GPU에서 최대 4TB의 VRAM을 지원할 …

2025-02-13 12:16 | 댓글: 0개

2019년에 소개된 Ascend 910 프로세서의 변형인 화웨이의 HiSilicon Ascend 910C가 DeepSeek의 연구에 따르면 Nvidia의 H100 추론 성능의 60%를 제공하는 것으로 보고되었습니다. Ascend 910C는 시장에서 최고의 성능을 자랑하지는 않지만, 중국의 Nvidia …

2025-02-04 13:30 | 댓글: 0개

인텔의 루나 레이크(Lunar Lake) CPU 플랫폼은 새롭게 출시된 메타 LLaMA 3.2 모델과 함께 인상적인 AI 추론 성능을 보여주었습니다. 플래그십 인텔 코어 울트라 9 288V CPU는 32개의 입력 토큰에 대해 28.5ms의 …

2024-09-27 07:00 | 댓글: 0개

세레브라스(Cerebras)는 AI 추론 작업에서 NVIDIA의 H100 GPU를 크게 능가하는 혁신적인 웨이퍼 크기 AI 칩을 소개했습니다. 2024년 Hot Chips 행사에서 이 회사는 44GB의 SRAM을 갖춘 자사의 칩이 전체 모델을 직접 칩 …

2024-08-27 22:18 | 댓글: 0개

AMD는 2024년 핫 칩스(Hot Chips) 행사에서 2021년에 출시된 이전 세대를 기반으로 한 Versal AI Edge Series Gen 2를 소개했습니다. 이 새로운 시리즈는 전처리, 추론, 후처리를 단일 칩에 통합하여 워크플로우를 간소화하고 …

2024-08-27 16:02 | 댓글: 0개

FuriosaAI는 지속 가능한 AI 컴퓨팅을 목표로 하는 RNGD 프로세서를 소개했습니다. 이는 AI 플랫폼에서 전력을 극대화하는 추세와 대조되는 솔루션입니다. RNGD 프로세서는 낮은 전력 소비를 위해 설계되었으며, 열 설계 전력(TDP)이 단 150W에 …

2024-08-27 01:13 | 댓글: 0개

구글이 NVIDIA의 L4 GPU를 Cloud Run 서비스에 통합하여 사용자가 클라우드에서 생성형 AI 모델을 포함한 AI 추론 애플리케이션을 실행할 수 있도록 했습니다. 이 개선 사항은 개발자들이 구글의 Gemma와 메타의 Llama와 같은 …

2024-08-22 15:50 | 댓글: 0개

암페어는 최근 AmpereOne 라인업, 특히 AmpereOne 192코어 CPU의 성능에 대한 자세한 정보를 발표했습니다. 해당 기업은 자사 서버가 AMD와 Intel 경쟁사 대비 더 비용 효율적이고 전력 소모가 적으며 우수한 성능을 제공한다고 …

2024-08-03 17:56 | 댓글: 0개

태그: AI inference

AMD, 라데온 AI 프로 R9700으로 워크스테이션 AI 시장 겨냥 ☆ (servethehome.com)

비트가 빛이 될 때: Q.ANT가 유럽의 광학 AI 플래그십 프로젝트를 시작하며 TSMC의 기어에 단순히 편승하지 않다 (igorslab.de)

AMD, 캐나다 AI 추론 기업 Untether AI의 전체 칩 팀 인수 — 제품 지원 중단 (tomshardware.com)

AMD, 중국 시장을 위한 수출 규정 준수 AI 칩 개발, Radeon AI PRO R9700은 2025년 3분기 출시 예정 (tomshardware.com)

스파클, 인텔 아크 B60의 듀얼 GPU 버전 개발 중 - 패시브, 액체 냉각 및 블로워 옵션 공개 (tomshardware.com)

AMD, 라데온 AI 프로 R9700으로 워크스테이션 AI 시장 겨냥 ☆ (servethehome.com)

퀄컴, 데이터 센터용 새로운 CPU 및 AI 추론 가속기 개발 예고 (servethehome.com)

컴퓨텍스 2025: 인텔 아크 프로 B 시리즈: 워크스테이션 및 AI 추론을 위한 새로운 GPU 개요 (igorslab.de)

중국산 게이밍 GPU, 최대 120% FPS 향상 — MTT S80 및 S70 카드의 새로운 드라이버와 안정성 수정 (tomshardware.com)

샌디스크의 새로운 고대역폭 플래시 메모리, GPU에서 4TB의 VRAM 지원 및 HBM 대역폭과의 일치 (tomshardware.com)

DeepSeek 연구에 따르면 화웨이의 HiSilicon Ascend 910C는 Nvidia H100 추론 성능의 60%를 제공 (tomshardware.com)

인텔, 메타 LLaMA 3.2와 함께 강력한 루나 레이크(Lunar Lake) AI 성능 자랑 (wccftech.com)

세레브라스, AI 추론에서 NVIDIA H100 GPU를 압도하는 혁신적인 웨이퍼 크기 AI 칩 발표 (servethehome.com)

AMD Versal AI Edge Series Gen 2: 비전 및 자동차를 위한 솔루션 (servethehome.com)

지속 가능한 AI 컴퓨팅을 위한 FuriosaAI RNGD 프로세서 (servethehome.com)

구글, NVIDIA L4 GPU를 활용해 Cloud Run에서 AI 추론 애플리케이션 실행 가능 (wccftech.com)

암페어 AmpereOne 192 코어 성능 개요 (servethehome.com)

☆

☆