카테고리: AI

2025년 컴퓨텍스에서 엔비디아 CEO 젠슨 황은 무어의 법칙이 끝났다고 선언하며, AI 산업을 이끄는 새로운 기술로의 전환을 강조했습니다. 그는 컴퓨팅 성능을 향상시키면서 에너지 효율성을 관리하기 위한 세 가지 주요 혁신인 3D …

2025-05-22 22:12 | 댓글: 0개

OpenAI는 Stargate UAE의 출범을 발표하며, 자사의 AI 인프라 플랫폼인 Stargate의 첫 국제 배치를 알렸습니다. 이 프로젝트는 아부다비에 1GW 클러스터를 건설하는 것으로, 2026년까지 200MW가 가동될 것으로 예상됩니다. 이번 확장은 OpenAI의 안전하고 …

2025-05-22 15:46 | 댓글: 0개

구글의 I/O 2025 개발자 회의에서 AI, 특히 업그레이드된 제미니 어시스턴트가 주목받았습니다. 주요 기능으로는 모든 Android 및 iOS 사용자에게 카메라 및 화면 공유 기능을 도입하는 제미니 라이브(Gemini Live)가 있어, 어시스턴트가 사용자가 …

2025-05-20 17:45 | 댓글: 0개

레드햇이 생성 AI 애플리케이션의 배포를 향상시키기 위해 설계된 Kubernetes 네이티브 고성능 분산 LLM 추론 프레임워크인 llm-d 프로젝트를 공개했습니다. 이 프레임워크는 사용자가 AI 모델을 대규모로 제공할 수 있는 간소화된 경로를 제공하며, …

2025-05-20 14:30 | 댓글: 0개

Microsoft는 OpenAI의 Sora 비디오 생성 API가 Azure AI Foundry에 통합되어 개발자들이 이전에는 이용할 수 없었던 비디오 제작 기능에 접근할 수 있게 될 것이라고 발표했습니다. 이 통합은 이미 유사한 서비스를 제공하고 …

2025-05-20 06:45 | 댓글: 0개

마이크로소프트 빌드 2025에서 CEO 사티아 나델라는 맞춤형 AI 에이전트를 주요 초점으로 강조했습니다. GitHub Copilot은 보조 도구에서 에이전트로 발전하고 있으며, 기업들이 프로그래밍 기술 없이도 Copilot Tuning을 통해 자체 데이터를 통합할 수 …

2025-05-20 06:15 | 댓글: 0개

NVIDIA는 Microsoft의 Build 개발자 행사에서 TensorRT 소프트웨어 도구에 대한 중요한 업데이트를 발표하며 'RTX를 위한 TensorRT'를 소개했습니다. 이 새로운 버전은 개발자가 각 개별 GPU 모델에 맞춰 AI 소프트웨어를 수동으로 최적화할 필요를 …

2025-05-19 16:00 | 댓글: 0개

엔비디아가 세계 최초의 유용한 양자 컴퓨터 개발에 집중하는 스타트업 PsiQuantum에 투자하기 위한 심도 있는 논의를 진행 중인 것으로 전해졌습니다. 이 잠재적 투자는 엔비디아가 상업적으로 실행 가능한 양자 기술의 발전에 중요한 …

2025-05-19 14:13 | 댓글: 0개

엔비디아는 폭스콘과 파트너십을 체결하여 대만에 AI 슈퍼컴퓨터를 구축한다고 발표했습니다. 이는 컴퓨텍스 2025에서 CEO 젠슨 황이 발표한 내용입니다. 이 프로젝트는 10,000개의 엔비디아 Blackwell GPU를 배치하는 것을 포함하며, 폭스콘의 자회사인 빅 이노베이션 …

2025-05-19 11:28 | 댓글: 0개

엔비디아는 클라우드에서 AI 컴퓨팅 파워에 대한 접근을 간소화하기 위해 DGX 클라우드 레프턴을 출시했습니다. 이는 개발자와 GPU를 연결하는 '차량 공유 앱'에 비유됩니다. 이 플랫폼은 Nvidia Partner Network (NPN) 내의 Nvidia Cloud …

2025-05-19 08:32 | 댓글: 0개

엔비디아는 2025년 컴퓨텍스에서 NVLink Fusion 프로그램을 공개하며 데이터 센터 및 기업 AI 이니셔티브를 강화할 계획을 밝혔습니다. 이 프로그램은 고객과 파트너가 엔비디아 CPU 및 가속기를 엔비디아의 제품과 랙 규모 아키텍처에 통합할 …

2025-05-19 03:51 | 댓글: 0개

엔비디아 CEO 젠슨 황이 대만 타이페이에서 열리는 컴퓨텍스에서 기조연설을 진행하며, AI와 엔비디아의 선도적인 하드웨어에 대해 집중적으로 다룰 예정입니다. 이 행사는 대만 시간으로 오전 11시에 시작되며, 이는 동부 표준시(ET)로는 오후 11시, …

2025-05-19 00:28 | 댓글: 0개

OpenAI는 다양한 코딩 작업을 처리하기 위해 설계된 O3 기반의 소프트웨어 개발 에이전트 '코덱스'를 공개했습니다. 각 작업은 격리된 클라우드 샌드박스에서 운영되어 보안을 강화합니다. 현재 선택된 사용자들은 연구 미리보기로 이 에이전트를 테스트할 …

2025-05-17 06:33 | 댓글: 0개

록칩의 NPU 드라이버인 RKNN이 오픈소스 프로젝트로서 개발이 진행되고 있습니다. 이 이니셔티브는 록칩의 신경망 처리 장치(Neural Processing Units, NPU)의 기능성과 접근성을 개발자와 연구자들에게 향상시키는 것을 목표로 하고 있습니다. 드라이버는 작동 가능한 …

2025-05-17 05:00 | 댓글: 0개

Pliops는 XDP LightningAI 장치와 FusIOnX 소프트웨어를 도입하여 복잡한 언어 모델의 확장된 컨텍스트 윈도우를 처리하는 데 있어 GPU에 연결된 고대역폭 메모리(HBM)의 한계를 극복하고자 합니다. 이 솔루션은 미리 계산된 컨텍스트를 빠른 SSD에 …

2025-05-16 09:46 | 댓글: 0개

구글의 AI 부서는 대규모 언어 모델을 기반으로 한 새로운 코딩 에이전트 알파이볼브(AlphaEvolve)를 소개했습니다. 이 에이전트는 복잡한 알고리즘을 독립적으로 생성할 수 있는 능력을 가지고 있으며, 회사 내 여러 프로세스를 최적화한 것으로 …

2025-05-15 10:34 | 댓글: 0개

미국 정부는 화웨이 아센드(Ascend) 칩의 전 세계 사용이 미국의 수출 통제를 위반한다고 선언하는 새로운 지침을 발표했습니다. 이 결정은 AI 확산 규칙의 철회에 따른 것이며, 화웨이의 아센드(Ascend) 가속기 사용을 명시적으로 금지합니다. …

2025-05-15 10:00 | 댓글: 0개

OpenAI는 GPT-4.1 모델을 ChatGPT에 통합하였으며, 이는 이전에 API를 통해서만 접근할 수 있었습니다. 사용자는 이 모델을 활용하기 위해 Plus, Pro 또는 Teams 중 하나의 유료 요금제에 가입해야 합니다. GPT-4.1은 효율성을 위해 …

2025-05-15 09:58 | 댓글: 0개

Llamafile의 최신 버전인 0.9.3은 Qwen3 및 Phi4 모델에 대한 지원을 추가하여 로컬 AI LLM 벤치마킹 기능을 향상시킵니다. 이 업데이트는 AI 모델을 로컬 환경에서 평가하기 위한 도구를 제공하는 것을 목표로 하는 …

2025-05-15 04:00 | 댓글: 0개

사우디아라비아의 새로운 인공지능 프로젝트인 HUMAIN은 NVIDIA, AMD, Qualcomm 등 주요 기술 기업들의 막대한 투자를 받고 있습니다. 이 프로젝트는 무함마드 빈 살만 왕세자가 이끄는 공공투자기금(PIF)을 통해 사우디 국가와 직접적으로 연관되어 있습니다. …

2025-05-14 06:51 | 댓글: 0개