Stress-ng 종합 벤치마크

AWS EC2 인스턴스 51종 CPU/메모리/컨텍스트 스위칭 성능 비교 (5세대 ~ 8세대)

2026년 01월 | 서울 리전 (ap-northeast-2) | 4 vCPU xlarge

종합 점수 최고

472,629
r8g.xlarge

Matrix 최고

21,897
c8g.xlarge ops/s

CPU Int 최고

526,352
m8g.xlarge ops/s

최고 가성비

c8g.xlarge
3,037 점/$

Graviton 평균

348,161
종합 점수 (16개)

Intel 평균

247,144
종합 점수 (30개)

목차

1. 테스트 방법론

테스트 환경

벤치마크 도구stress-ng 0.17.05
OSUbuntu 22.04 (Docker image)
플랫폼Amazon EKS (Kubernetes 1.34)
노드 프로비저닝Karpenter 1.5.0
노드 격리podAntiAffinity로 벤치마크당 단일 노드 보장
인스턴스 크기xlarge (4 vCPU) - 51개 인스턴스 타입
반복 횟수인스턴스당 5회 실행 후 평균
리전ap-northeast-2 (서울)

stress-ng 벤치마크

CPU, 메모리, 시스템 자원의 종합적인 스트레스 테스트

  • CPU Integer: 정수 연산 (int64, int128)
  • CPU Float: 부동소수점 연산 (float, double)
  • Matrix: 행렬 연산 (SIMD 최적화)
  • Memcpy: 메모리 복사 대역폭
  • Context Switch: 컨텍스트 전환 성능
  • 측정 단위: ops/sec (높을수록 좋음)

왜 stress-ng인가?

  • 종합 벤치마크: 300+ 스트레서로 다양한 워크로드 시뮬레이션
  • 마이크로 아키텍처 분석: CPU 파이프라인, 캐시, 분기 예측 특성 파악
  • 실제 스트레스: 최대 부하 상황에서의 안정성 확인
  • 오픈소스: Ubuntu 공식 도구, 재현 가능한 결과
# Matrix 스트레서 (4 workers, 60초)
stress-ng --matrix 4 --timeout 60s --metrics

핵심 인사이트

  • 종합 성능: r8g.xlarge가 종합 점수 472,629으로 1위 (Graviton 8세대)
  • 가성비: c8g.xlarge가 $0.154/hr로 가격 대비 성능 최고 (3,037 점/$)
  • 아키텍처 비교: Graviton 평균 348,161 vs Intel 247,144 (41% 우위)
  • 세대별 향상: 8세대가 5세대 대비 평균 2.5배 성능 향상

2. CPU 성능 분석

Integer, Float, Matrix 연산 성능을 선택하여 비교

Integer 연산 인사이트

  • Graviton4 압도적: m8g/r8g/c8g가 526K ops/s로 Top 3 독점
  • Intel 8세대: 376K ops/s로 Graviton4 대비 71% 수준
  • 세대 간 격차: 8세대 Intel이 6세대 대비 39% 향상

Float 연산 인사이트

  • Graviton4 최고: c8g/m8g/r8g가 54K ops/s로 동일 성능
  • Intel 8세대: 48K ops/s로 Graviton4 대비 89% 수준
  • AMD 5세대: c5a가 33K로 Intel 5세대보다 우수

Matrix 연산 인사이트

  • 행렬 연산 최적화: Graviton이 NEON SIMD로 압도적 우위
  • 8세대 Graviton: 21.9K ops/s (7세대 18.5K 대비 18% 향상)
  • Intel 최고: c8i가 12.1K로 Graviton의 55% 수준

3. 메모리 성능 분석

Memcpy (메모리 복사) 및 Cache 성능

Memcpy 인사이트

  • 메모리 대역폭: r8g.xlarge가 1,808 ops/s로 최고
  • Graviton 우위: 8세대 Graviton이 1,780-1,808 범위로 최상위권
  • Intel 8세대: 1,165 ops/s로 Graviton 대비 65% 수준

Cache 인사이트

  • 캐시 효율성: m5zn.xlarge가 36 ops/s로 의외의 강세
  • 세대별 차이 미미: 캐시 성능은 아키텍처보다 캐시 크기에 의존
  • 5세대 강세: c5.xlarge 33 ops/s로 상위권

4. 시스템 성능 분석

Context Switch 및 Branch Prediction 성능

Context Switch 인사이트

  • 8세대 압도적: Graviton4가 1.9M ops/s로 최고 (프로세스 스케줄링 최적화)
  • Intel 8세대: 1.59M ops/s로 Graviton4 대비 84%
  • 7세대 격차: Graviton3 1.32M vs Intel7 1.2M (10% 차이)

Branch Prediction 인사이트

  • 분기 예측 효율: Graviton4가 618K ops/s로 최고
  • 세대별 향상: Graviton 6→7→8세대 약 13% 향상
  • Intel 8세대: 384K ops/s로 Graviton의 62% 수준

5. 가격 대비 성능 (Cost Efficiency)

시간당 비용 대비 종합 점수 - 버블 크기는 종합 점수

가성비 인사이트

  • 최고 가성비: c8g.xlarge (3,037 점/$) - 저렴한 가격 + 높은 성능
  • Graviton 전체 우위: 상위 10개 중 8개가 Graviton
  • Intel 가성비: c8i-flex.xlarge가 Intel 중 최고 (1,708 점/$)
  • 피해야 할 인스턴스: 5세대 AMD는 가격 대비 성능이 가장 낮음

6. 아키텍처별 세대별 성능 비교

Intel (5-8세대), AMD (5세대), Graviton (6-8세대)

세대별 성능 향상률

  • Matrix Intel: 5세대 6.7K → 8세대 12.0K (+79% 향상)
  • Matrix Graviton: 6세대 14.7K → 8세대 21.8K (+48% 향상)
  • 8세대 비교: Matrix - Graviton 21.8K vs Intel 12.0K (Graviton +82%)

메트릭별 세부 비교

세대별 성능 추이 (아키텍처별)

Graviton vs Intel vs AMD 세대별 종합 점수 변화

7. 가성비 Top 20 (효율성 점수)

효율성 = 종합점수 / ($/hr × 1000) | 높을수록 좋음

가성비 핵심 인사이트

  • Graviton4 압도적: c8g.xlarge가 $0.154/hr로 가성비 1위 (3,037 점/$)
  • 상위 독점: Top 10 중 8개가 Graviton - ARM 아키텍처의 효율성 입증
  • Intel 최선: c8i-flex.xlarge가 Intel 중 가성비 최고 (1,708 점/$)
  • 세대 효과: 같은 가격대에서 신세대가 구세대 대비 20-40% 효율적

8. 전체 결과 테이블

# 인스턴스 Arch Gen $/hr Matrix Float Int Memcpy Switch 종합 가성비