Sysbench 종합 벤치마크 리포트

CPU + Memory 성능 분석 | 51개 EC2 인스턴스 타입 비교

생성일: 2026-01-20 11:08 | 리전: ap-northeast-2 (서울) | 인스턴스 크기: xlarge (4 vCPU)

최고 CPU 성능 (Multi-thread)

c8g.xlarge

4,947 events/sec

GRAVITON

최고 CPU 성능 (Single-thread)

c8i.xlarge

1,293 events/sec

INTEL

최고 메모리 대역폭

c8g.xlarge

102,390 MiB/sec

GRAVITON

최고 가성비 (CPU)

c7g.xlarge

27,577 events/$/hr

GRAVITON

테스트 방법론

테스트 환경

도구	sysbench 1.0.20 (LuaJIT 2.1.0-beta3)
OS	Ubuntu 22.04 (Docker image)
플랫폼	Amazon EKS (Kubernetes 1.34)
노드 프로비저닝	Karpenter 1.5.0 (노드 자동 스케일링)
노드 격리	podAntiAffinity로 벤치마크당 단일 노드 보장
인스턴스 크기	xlarge (4 vCPU) - 51개 인스턴스 타입
리전	ap-northeast-2 (서울)

CPU 벤치마크

소수 계산을 통한 정수 연산 성능 측정

Multi-thread: 4 threads, 60초, 3회 반복 후 평균
Single-thread: 1 thread, 30초
Prime limit: 20,000
측정 단위: events/sec (높을수록 좋음)

# Multi-thread (3회 반복)

                        sysbench cpu --threads=4 --time=60 --cpu-max-prime=20000 run

# Single-thread

                        sysbench cpu --threads=1 --time=30 --cpu-max-prime=20000 run

메모리 벤치마크

다양한 메모리 접근 패턴 성능 측정 (5회 반복)

Sequential Write/Read (1K): 순차 접근, 캐시 효율성
Random Write/Read (1K): 무작위 접근, 실제 워크로드
Large Block (1M): 실제 메모리 대역폭
측정 단위: MiB/sec (높을수록 좋음)

# Sequential Write (1K block)

                        sysbench memory --threads=4 --time=60 \

                          --memory-block-size=1K --memory-total-size=100G \

                          --memory-oper=write --memory-access-mode=seq run

# Large Block (1M block)

                        sysbench memory --threads=4 --time=60 \

                          --memory-block-size=1M --memory-total-size=100G \

                          --memory-oper=write --memory-access-mode=seq run

왜 Large Block (1M)이 중요한가?

1K 블록 테스트는 CPU 캐시와 메모리 컨트롤러 효율성을 측정
Large Block (1M)은 실제 메모리 대역폭을 측정 - 대용량 데이터 처리 성능 지표
데이터 분석, ML 워크로드에서는 Large Block 성능이 더 중요

CPU 성능 개요

CPU Multi-thread 성능 Top 25

CPU Single-thread 성능 Top 25

Graviton

Intel

AMD

메모리 성능 개요 (5가지 메트릭)

Large Block (1M) 메모리 대역폭 Top 25 - 실제 메모리 대역폭

Sequential Write (1K) Top 25

Sequential Read (1K) Top 25

Random Write (1K) Top 25

Random Read (1K) Top 25

Graviton

Intel

AMD

메모리 메트릭 해석

Large Block (1M): 실제 메모리 대역폭 측정 - 대용량 데이터 처리에 가장 중요
Sequential (1K): CPU 캐시 및 메모리 컨트롤러 효율성 측정
Random (1K): 무작위 접근 패턴 - 실제 애플리케이션 워크로드에 가까움
AMD 인스턴스는 1K 테스트에서 높은 점수를 보이나, Large Block에서는 Graviton/Intel 대비 낮음

아키텍처별 세대별 성능 비교

Intel (5-8세대), AMD (5세대), Graviton (6-8세대)

세대별 CPU Multi-thread 평균 (아키텍처 구분)

세대별 메모리 Large Block 평균 (아키텍처 구분)

CPU 성능 추이: 패밀리별 Graviton vs Intel (AMD 제외)

Intel (실선)

Graviton (점선)

세대별 성능 추이 인사이트

Graviton: 6세대부터 시작, 매 세대 10-15% 성능 향상
Intel: 5세대 → 6세대에서 큰 폭 향상 (Ice Lake), 이후 점진적 개선
8세대: Graviton4가 Intel 대비 약 80% 높은 CPU 성능
C/M/R 패밀리 간 동일 아키텍처에서는 성능 차이 거의 없음

가격 대비 성능 (Cost Efficiency)

시간당 비용 대비 CPU/Memory 성능 - 버블 크기는 메모리 대역폭

Graviton

Intel

AMD

가성비 인사이트

최고 가성비: c8g.xlarge - 저렴한 가격 + 최고 CPU 성능
Graviton 우위: 상위 10개 중 대부분이 Graviton
8세대 권장: c8g, m8g 모두 가성비 상위
메모리 가성비: Graviton이 Intel 대비 2-3배 높은 가성비

전체 결과

인스턴스	아키텍처	세대	CPU MT	CPU ST	Seq Write	Seq Read	Rnd Write	Rnd Read	Large Block	$/hr	CPU 효율

결론 및 권장사항

CPU 집약적 워크로드

최고 성능: c8g.xlarge (Graviton4) - 8세대 최신
최고 가성비: c7g.xlarge (Graviton3) - 가격 대비 우수
Intel 8세대 (c8i)도 좋은 성능, AMD는 추천하지 않음

메모리 집약적 워크로드

최고 대역폭: Graviton4 계열 (r8g, m8g, c8g)
가성비: c8g.xlarge - 낮은 가격에 높은 메모리 대역폭
데이터 분석/ML: Graviton4 강력 추천

핵심 권장사항

범용 워크로드: m8g.xlarge 또는 m7g.xlarge 추천
비용 최적화: c7g.xlarge (Graviton3) - 우수한 가성비
최고 성능: c8g.xlarge 또는 r8g.xlarge (Graviton4)
레거시 x86 필요 시: c8i.xlarge 또는 m8i.xlarge

최고 CPU 성능 (Multi-thread)

최고 CPU 성능 (Single-thread)

최고 메모리 대역폭

최고 가성비 (CPU)

목차

테스트 방법론

테스트 환경

CPU 벤치마크

메모리 벤치마크

왜 Large Block (1M)이 중요한가?

CPU 성능 개요

메모리 성능 개요 (5가지 메트릭)

메모리 메트릭 해석

아키텍처별 세대별 성능 비교

세대별 성능 추이 인사이트

가격 대비 성능 (Cost Efficiency)

가성비 인사이트

전체 결과

결론 및 권장사항

CPU 집약적 워크로드

메모리 집약적 워크로드

핵심 권장사항