핫 칩스 2024에서 테슬라는 저지연 애플리케이션을 위해 TCP를 대체하도록 설계된 새로운 전송 프로토콜 TTPoE(Tesla Transport Protocol over Ethernet)를 공개했습니다. 특히 자동차 기계 학습에 중점을 둔 도조(Dojo) 슈퍼컴퓨터에서 사용됩니다. 도조 슈퍼컴퓨터는 …
2024-08-27 23:58 | 댓글: 0개2024년 Hot Chips에서 OpenAI는 확장 가능한 AI 인프라 구축의 도전과 전략에 초점을 맞춘 기조연설을 진행하며, 조직의 증가하는 컴퓨팅 수요를 강조했습니다. 발표에서는 GPT-1에서 GPT-4까지 OpenAI 모델의 진화를 다루었으며, 각 버전이 점점 …
2024-08-26 21:53 | 댓글: 0개마이크로칩은 자사의 두 번째 PCIe Gen 5 엔터프라이즈 SSD 제어기 '플래시텍 5016'을 선보였습니다. 이 제품은 선대 모델인 '4016'에 비해 크게 향상된 기능을 제공합니다. 플래시텍 5016은 x4 또는 독립 x2/x2 모드를 …
2024-08-08 21:30 | 댓글: 0개Siggraph에서 NVIDIA는 '신경망 외관 모델(Neural Appearance Models)'이라는 혁신적인 접근법을 소개했습니다. 이 방식은 인공 지능을 활용하여 실시간 소재 렌더링을 향상시킵니다. 이 기술은 기존 렌더링 기술에 비해 최대 24배 성능 향상을 보입니다. …
2024-07-30 04:00 | 댓글: 0개미국 에너지부(DOE)가 현재 가장 빠른 슈퍼컴퓨터인 Frontier를 대체할 새로운 슈퍼컴퓨터 'Discovery'의 개발을 위한 제안요청서(RFP)를 발표했습니다. Discovery는 2027년 또는 2028년 초 등장할 것으로 예상되며, 컴퓨팅 처리량이 8.5 엑사플롭스에 달해 Frontier보다 3배에서 …
2024-07-24 09:50 | 댓글: 0개메타는 자사 내부 벤치마크 결과 OpenAI의 GPT-4o 미니와 유사한 성능을 보이는 새로운 AI 모델 Llama 3.1을 출시했습니다. Llama 3.1 405b 모델은 이전 Llama 3 모델(70억, 80억 매개변수)보다 훨씬 많은 4,050억 …
2024-07-23 16:53 | 댓글: 0개NVIDIA는 Vulkan과 SPIR-V 지원을 활용하여 머신러닝 분야에서 중요한 진전을 이루며, 전통적인 CUDA 플랫폼에 대한 경쟁력 있는 대안으로 자리매김하고 있습니다. 이 변화는 주로 그래픽 렌더링으로 알려진 Vulkan이 이제 AI 소프트웨어에 활용되고 …
2025-03-02 15:00 | 댓글: 0개TurnkeyML이 OpenAI 호환 서버를 포함한 6.0 버전의 출시를 발표했습니다. 이번 업데이트는 TurnkeyML을 강력한 AI 인사이트 도구 체인으로 자리매김하게 하여 개발자와 데이터 과학자들의 역량을 강화합니다. OpenAI 호환성의 통합은 사용자가 고급 AI …
2025-03-02 11:32 | 댓글: 0개DeepSeek AI는 오픈 소스 주간 행사에서 Fire-Flyer 파일 시스템(3FS)을 완전한 오픈 소스 솔루션으로 출시했습니다. 이 병렬 파일 시스템은 AI-HPC 작업을 위해 설계되었으며, 2019년부터 사용된 서버 데이터 클러스터에서 인상적인 집합적 읽기 …
2025-03-01 16:32 | 댓글: 0개이 기사는 라데온 RX 9070 시리즈의 출시를 다루며, 출시일에 공식 ROCm 지원이 제공되지 않을 것임을 강조합니다. ROCm(Radeon Open Compute)은 AMD의 GPU를 컴퓨팅 작업에 의존하는 개발자와 사용자에게 매우 중요한 요소로, 특히 …
2025-02-28 13:00 | 댓글: 0개AMD는 Vulkan과 SPIR-V를 MLIR(다중 수준 중간 표현) 기반의 통합 소프트웨어 스택에 통합하여 AI 소프트웨어 기능을 발전시키고 있습니다. 이 이니셔티브는 AMD의 하드웨어뿐만 아니라 다양한 하드웨어 플랫폼에서 AI 애플리케이션의 성능과 효율성을 향상시키는 …
2025-02-28 12:02 | 댓글: 0개앤트로픽이 시장을 선도하기 위해 두 가지 새로운 AI 모델, 클로드 3.7 소네트와 클로드 코드(Claude Code)를 소개했습니다. 특히 클로드 3.7 소네트는 전통적인 언어 모델 기능과 고급 추론 프로세스를 결합한 첫 번째 …
2025-02-25 19:12 | 댓글: 0개구글 클라우드가 엔비디아의 GB200 기반 NVL72 머신을 탑재한 A4X 가상 머신을 공개했습니다. 이 시스템은 72개의 B200 GPU와 36개의 Grace CPU를 특징으로 하며, 대규모 AI 작업 부하, 대형 언어 모델 및 …
2025-02-20 17:03 | 댓글: 0개이 기사는 Binh Pham이 Raspberry Pi Zero를 활용하여 USB 스틱에서 로컬 대형 언어 모델(LLM)을 실행하는 프로젝트에 대해 다룹니다. 이 프로젝트는 클라우드 기반 솔루션에서 벗어나 로컬 LLM 사용의 증가 추세를 반영합니다. …
2025-02-17 20:10 | 댓글: 0개인텔의 파이토치 확장 최신 버전인 2.6은 Granite Rapids 및 Sierra Forest 아키텍처를 포함한 Xeon 6 프로세서에 대한 중요한 최적화를 도입합니다. 이러한 개선 사항은 머신 러닝 작업의 성능과 효율성을 향상시키는 것을 …
2025-02-17 13:47 | 댓글: 0개AMD는 32 GB VRAM을 탑재한 라데온 RX 9070 XT에 대한 루머를 공식적으로 부인했지만, 동일한 메모리 구성을 갖춘 라데온 RX 9070 XTX 변종에 대한 추측은 여전히 존재합니다. 이 새로운 명칭은 AMD가 …
2025-02-17 05:00 | 댓글: 0개Zed Editor는 개발자들의 편집 경험을 향상시키기 위해 "Zeta"라는 이름의 오픈 소스 편집 예측 모델을 출시했습니다. 이 모델은 지난해 가을에 소개된 Zed AI의 일환으로, 소프트웨어 개발에서 특히 AI 분야에 대한 회사의 …
2025-02-13 20:58 | 댓글: 0개OpenAI는 다가오는 모델에 대한 로드맵을 공개했으며, CEO 샘 알트먼은 GPT-4.5와 GPT-5의 임박한 출시를 확인했습니다. 코드명 오리온(Orion)인 GPT-4.5는 논리적 추론 능력을 향상시키는 Chain-of-Thought 접근 방식을 사용하지 않는 마지막 모델이 될 것입니다. …
2025-02-13 06:17 | 댓글: 0개하드웨어 유출가 Jaykihn의 최근 유출 정보에 따르면, 인텔의 차기 팬서 레이크(Panther Lake)와 와일드캣 레이크(Wildcat Lake) CPU 사양이 공개되었습니다. 팬서 레이크는 애로우 레이크-H(Arrow Lake-H)를 대체할 예정이며, 올해 하반기에 출시될 것으로 예상되며, …
2025-02-07 18:21 | 댓글: 0개애플의 연구팀은 비인간형 로봇의 표현적 움직임에 초점을 맞춘 ELEGNT라는 개념을 소개했습니다. 이 개념은 다양한 움직임을 통해 소통할 수 있는 모터화된 테이블 램프를 통해 시연되었습니다. 연구팀은 로봇의 움직임에 의도와 감정과 같은 …
2025-02-07 08:11 | 댓글: 0개인텔이 OpenVINO 2025.0을 출시했습니다. 이번 업데이트는 Deepseek 모델에 대한 지원을 도입하여 AI 성능을 향상시킵니다. 이 업데이트는 개발자들이 고급 딥러닝 모델을 보다 효과적으로 활용할 수 있게 해주어, AI 애플리케이션의 효율성과 정확성을 …
2025-02-06 13:34 | 댓글: 0개무어 스레드(Moore Threads)는 DeepSeek의 오픈 소스 AI 모델, 특히 DeepSeek V3 및 R1 모델을 실행할 때 GPU에서 상당한 성능을 달성했다고 보고했습니다. 이 모델들은 라즈베리 파이(Raspberry Pi)와 같은 상대적으로 저렴한 하드웨어에서 …
2025-02-05 15:03 | 댓글: 0개인텔이 Core Ultra Linux 시스템을 위해 특별히 설계된 NPU(신경망 처리 장치) 드라이버의 1.13 버전을 출시했습니다. 이번 업데이트는 인텔의 NPU 기술의 성능과 호환성을 향상시켜 AI 및 기계학습 애플리케이션에서 점점 더 중요해지고 …
2025-02-03 11:36 | 댓글: 0개엔비디아는 RTX 50 시리즈와 새로운 그래픽 드라이버와 함께 브로드캐스트 2.0을 출시하며 스튜디오 음성 녹음이라는 베타 기능을 도입했습니다. 이 기능은 AI 모델을 사용하여 마이크 오디오 품질을 스튜디오 수준으로 향상시키는 것을 목표로 …
2025-02-03 11:00 | 댓글: 0개중국 스타트업 DeepSeek는 AI 모델 R1로 주목받고 있으며, 이 모델은 낮은 컴퓨팅 자원 요구 사항을 가지고 있다고 주장하고 있습니다. 그러나 SemiAnalysis의 보고서에 따르면, DeepSeek는 하드웨어에 약 16억 달러를 투자했으며, 50,000개의 …
2025-02-02 18:02 | 댓글: 0개Rust-CUDA 프로젝트가 NVIDIA CUDA 커널을 Rust 프로그래밍에 통합하기 위해 재개되었습니다. 이 이니셔티브는 Rust의 메모리 안전 기능을 활용하면서 CUDA의 강력한 병렬 컴퓨팅 능력을 이용하여 GPU 프로그래밍의 성능과 안전성을 향상시키는 것을 목표로 …
2025-02-02 13:41 | 댓글: 0개