Nvidia Blackwell 아키텍처 심층 분석: RTX 50 시리즈 GPU의 업그레이드에 대한 자세한 살펴보기

전문: https://www.tomshardware.com/pc-components/gpus/nvidia-blackwell-ar...

원저자: Jarred Walton | 작성일: 2025-01-15 14:00
사이트 내 게시일: 2025-01-15 16:39
Nvidia의 새로운 Blackwell GPU 아키텍처는 다가오는 RTX 50 시리즈 GPU의 핵심 기술로, 주로 AI 및 neural rendering 기술에 중점을 둔 중요한 향상을 제공합니다. 이 아키텍처는 새로운 신경 작업 부하를 최적화하고, 메모리 사용량을 줄이며, 에너지 효율성을 개선하는 것을 목표로 하고 있습니다.

주요 업그레이드로는 4세대 RT 코어의 도입이 있으며, 이는 이전의 Ada 아키텍처에 비해 두 배의 레이 삼각형 교차 속도를 자랑합니다. Blackwell 아키텍처는 Mega Geometry를 위해 설계되어, 향후 언리얼 엔진 5(Unreal Engine 5) 게임의 성능을 향상시킵니다. 또한, GPU는 향상된 neural shaders, DisplayPort 2.1 UHBR20(80 Gbps) 지원, PCIe 5.0을 특징으로 하여 소비자 GPU의 중요한 전환점을 나타냅니다.

성능 지표에 따르면, RTX 5090은 1,676 TFLOPS의 FP8 성능을 달성하며, 이는 RTX 4090의 1,321 TFLOPS에 비해 27% 증가한 수치입니다. FP32 성능에서는 RTX 5090이 최대 104.8 TFLOPS를 제공하며, RTX 4090의 82.6 TFLOPS에 비해 역시 27% 증가했습니다. RTX 5090의 다이는 22% 더 크고, 이전 모델보다 21% 더 많은 트랜지스터를 포함하고 있습니다.

아키텍처의 발전 사항으로는 모든 셰이더 코어에서 FP32/INT32 호환성을 완전하게 지원하며, '신경 셰이더'를 통해 셰이더와 텐서 코어 작업의 혼합이 개선되었습니다. Shader Execution Reordering (SER)은 아다 아키텍처에 비해 두 배 빠릅니다.

메모리 업그레이드는 상당하며, GDDR6 및 GDDR6X에서 GDDR7 메모리로의 전환이 이루어집니다. 대부분의 RTX 50 시리즈 GPU는 GDDR7을 28 Gbps로 운영하며, 이는 원래 GDDR6의 두 배 속도입니다. RTX 5080은 30 Gbps GDDR7을 특징으로 하며, 이는 2080 Super의 15.5 Gbps에 비해 거의 두 배 빠릅니다. RTX 5090은 32GB의 GDDR7 메모리를 갖춘 512비트 인터페이스를 가집니다.

추가 기능으로는 AI 작업 부하의 개선된 스케줄링을 위한 AI 관리 프로세서와 전력 게이팅 및 에너지 관리의 향상이 포함되어, 아키텍처의 전반적인 효율성에 기여합니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: gaming (1209) Nvidia (1126) Performance (852) AI (747) Blackwell (141) PCIe 5.0 (117) GDDR7 (100) RTX 50-series (14) DisplayPort 2.1 (14) Neural Rendering (13)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.