테슬라는 수백만 개의 코어로 구성된 Dojo 슈퍼컴퓨터에서 고장난 코어를 감지하기 위해 Stress 도구를 개발했습니다. 이 도구는 단 하나의 무음 데이터 오류가 수주간 걸리는 대규모 AI 훈련을 위태롭게 할 수 있기 …