Sysbench 종합 벤치마크 리포트

CPU + Memory 성능 분석 | 51개 EC2 인스턴스 타입 비교

생성일: 2026-01-20 11:08 | 리전: ap-northeast-2 (서울) | 인스턴스 크기: xlarge (4 vCPU)

최고 CPU 성능 (Multi-thread)

c8g.xlarge
4,947 events/sec
GRAVITON

최고 CPU 성능 (Single-thread)

c8i.xlarge
1,293 events/sec
INTEL

최고 메모리 대역폭

c8g.xlarge
102,390 MiB/sec
GRAVITON

최고 가성비 (CPU)

c7g.xlarge
27,577 events/$/hr
GRAVITON

목차

테스트 방법론

테스트 환경

도구sysbench 1.0.20 (LuaJIT 2.1.0-beta3)
OSUbuntu 22.04 (Docker image)
플랫폼Amazon EKS (Kubernetes 1.34)
노드 프로비저닝Karpenter 1.5.0 (노드 자동 스케일링)
노드 격리podAntiAffinity로 벤치마크당 단일 노드 보장
인스턴스 크기xlarge (4 vCPU) - 51개 인스턴스 타입
리전ap-northeast-2 (서울)

CPU 벤치마크

소수 계산을 통한 정수 연산 성능 측정

  • Multi-thread: 4 threads, 60초, 3회 반복 후 평균
  • Single-thread: 1 thread, 30초
  • Prime limit: 20,000
  • 측정 단위: events/sec (높을수록 좋음)
# Multi-thread (3회 반복)
sysbench cpu --threads=4 --time=60 --cpu-max-prime=20000 run

# Single-thread
sysbench cpu --threads=1 --time=30 --cpu-max-prime=20000 run

메모리 벤치마크

다양한 메모리 접근 패턴 성능 측정 (5회 반복)

  • Sequential Write/Read (1K): 순차 접근, 캐시 효율성
  • Random Write/Read (1K): 무작위 접근, 실제 워크로드
  • Large Block (1M): 실제 메모리 대역폭
  • 측정 단위: MiB/sec (높을수록 좋음)
# Sequential Write (1K block)
sysbench memory --threads=4 --time=60 \
  --memory-block-size=1K --memory-total-size=100G \
  --memory-oper=write --memory-access-mode=seq run

# Large Block (1M block)
sysbench memory --threads=4 --time=60 \
  --memory-block-size=1M --memory-total-size=100G \
  --memory-oper=write --memory-access-mode=seq run

왜 Large Block (1M)이 중요한가?

  • 1K 블록 테스트는 CPU 캐시와 메모리 컨트롤러 효율성을 측정
  • Large Block (1M)은 실제 메모리 대역폭을 측정 - 대용량 데이터 처리 성능 지표
  • 데이터 분석, ML 워크로드에서는 Large Block 성능이 더 중요

CPU 성능 개요

CPU Multi-thread 성능 Top 25
CPU Single-thread 성능 Top 25
Graviton
Intel
AMD

메모리 성능 개요 (5가지 메트릭)

Large Block (1M) 메모리 대역폭 Top 25 - 실제 메모리 대역폭
Sequential Write (1K) Top 25
Sequential Read (1K) Top 25
Random Write (1K) Top 25
Random Read (1K) Top 25
Graviton
Intel
AMD

메모리 메트릭 해석

  • Large Block (1M): 실제 메모리 대역폭 측정 - 대용량 데이터 처리에 가장 중요
  • Sequential (1K): CPU 캐시 및 메모리 컨트롤러 효율성 측정
  • Random (1K): 무작위 접근 패턴 - 실제 애플리케이션 워크로드에 가까움
  • AMD 인스턴스는 1K 테스트에서 높은 점수를 보이나, Large Block에서는 Graviton/Intel 대비 낮음

아키텍처별 세대별 성능 비교

Intel (5-8세대), AMD (5세대), Graviton (6-8세대)

세대별 CPU Multi-thread 평균 (아키텍처 구분)
세대별 메모리 Large Block 평균 (아키텍처 구분)
CPU 성능 추이: 패밀리별 Graviton vs Intel (AMD 제외)
Intel (실선)
Graviton (점선)

세대별 성능 추이 인사이트

  • Graviton: 6세대부터 시작, 매 세대 10-15% 성능 향상
  • Intel: 5세대 → 6세대에서 큰 폭 향상 (Ice Lake), 이후 점진적 개선
  • 8세대: Graviton4가 Intel 대비 약 80% 높은 CPU 성능
  • C/M/R 패밀리 간 동일 아키텍처에서는 성능 차이 거의 없음

가격 대비 성능 (Cost Efficiency)

시간당 비용 대비 CPU/Memory 성능 - 버블 크기는 메모리 대역폭

Graviton
Intel
AMD

가성비 인사이트

  • 최고 가성비: c8g.xlarge - 저렴한 가격 + 최고 CPU 성능
  • Graviton 우위: 상위 10개 중 대부분이 Graviton
  • 8세대 권장: c8g, m8g 모두 가성비 상위
  • 메모리 가성비: Graviton이 Intel 대비 2-3배 높은 가성비

전체 결과

인스턴스 아키텍처 세대 CPU MT CPU ST Seq Write Seq Read Rnd Write Rnd Read Large Block $/hr CPU 효율

결론 및 권장사항

CPU 집약적 워크로드

  • 최고 성능: c8g.xlarge (Graviton4) - 8세대 최신
  • 최고 가성비: c7g.xlarge (Graviton3) - 가격 대비 우수
  • Intel 8세대 (c8i)도 좋은 성능, AMD는 추천하지 않음

메모리 집약적 워크로드

  • 최고 대역폭: Graviton4 계열 (r8g, m8g, c8g)
  • 가성비: c8g.xlarge - 낮은 가격에 높은 메모리 대역폭
  • 데이터 분석/ML: Graviton4 강력 추천

핵심 권장사항

  • 범용 워크로드: m8g.xlarge 또는 m7g.xlarge 추천
  • 비용 최적화: c7g.xlarge (Graviton3) - 우수한 가성비
  • 최고 성능: c8g.xlarge 또는 r8g.xlarge (Graviton4)
  • 레거시 x86 필요 시: c8i.xlarge 또는 m8i.xlarge