엔비디아의 젠슨 황, AI 칩 설계 결함이 '100% 엔비디아의 잘못'이라고 인정 — TSMC는 비난받지 않아, 이제 수정된 Blackwell 칩이 생산 중

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Anton Shilov | 작성일: 2024-10-23 21:34
사이트 내 게시일: 2024-10-23 22:18
엔비디아는 Blackwell GPU에서 발생한 중요한 설계 결함을 인정했으며, 이 문제는 이제 수정되었습니다. CEO 젠슨 황은 이 문제가 전적으로 엔비디아의 책임이라고 밝혔으며, 이는 TSMC를 비난한 이전 보고서와는 상반된 내용입니다. 이 결함으로 인해 생산 수율이 낮아졌고, 엔비디아는 제조 결과를 개선하기 위해 GPU의 상부 금속층을 수정했습니다.

Blackwell B100 및 B200 GPU는 TSMC의 CoWoS-L 패키징 기술을 사용하며, 이는 지역 실리콘 상호 연결 브리지와 함께 RDL 인터포저를 특징으로 하여 약 10 TB/s의 인상적인 데이터 전송 속도를 가능하게 합니다. 그러나 GPU 칩렛과 기타 구성 요소 간의 열 팽창 특성 불일치로 인해 휘어짐과 고장이 발생했습니다. 이러한 문제는 반도체 산업에서 드물지 않으며, 인텔의 사파이어 래피드(Sapphire Rapids)에서도 여러 버그가 발생하고 여러 차례 설계 수정이 필요했던 사례가 있습니다.

수정된 Blackwell GPU는 10월 말 대량 생산에 들어갈 예정이며, 2024년 초에 배송이 시작될 것으로 예상되며, 이는 엔비디아의 2025 회계연도와 일치합니다. 개선에도 불구하고 엔비디아는 초기 저수율 Blackwell 프로세서의 일부가 2024년 구글, 마이크로소프트, AWS와 같은 주요 클라우드 서비스 제공업체에 여전히 배송될 것이라고 밝혔지만, 정확한 수량은 불확실하다고 전했습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: Nvidia (1324) technology (1070) AI (806) semiconductors (428) GPU (286) TSMC (270) Blackwell (162) cloud computing (158) data centers (113)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.