AArch64 아키텍처에 대한 GNU C 라이브러리의 최근 조정이 memset 함수의 성능을 크게 향상시켜 약 24%의 속도 증가를 달성했습니다. 이 개선은 특히 Neoverse N1 플랫폼에서 두드러집니다. 작은 메모리 설정을 최적화하여 분기를 피하고 중첩 저장을 활용함으로써 성능이 향상되었습니다. 또한, 128바이트를 초과하는 메모리 복사에 대한 DC ZVA(데이터 캐시 제로 벨류 어드레스)의 구현이 이 성능 향상에 기여했습니다. 이 패치는 64바이트 및 128바이트 이외의 ZVA 크기에 대한 불필요한 요소를 제거하여 코드를 간소화하고 효율성을 더욱 높였습니다.
이 개발은 메모리 작업에 크게 의존하는 애플리케이션에 매우 중요하며, 실행 시간을 단축하고 전체 시스템 성능을 개선할 수 있습니다. 메모리 기능 최적화에 대한 집중은 하드웨어 성능을 극대화하려는 소프트웨어 개발의 광범위한 추세를 반영하며, 특히 고성능 컴퓨팅 환경에서 두드러집니다. 이러한 향상은 Ampere Altra 아키텍처에서 구동되는 서버와 같은 다양한 애플리케이션에 혜택을 줄 것으로 예상됩니다. 이 아키텍처는 클라우드 및 데이터 센터 작업을 위해 설계되었습니다.
* 이 글은
phoronix.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.