Code&Data Insights
AWS 기반 재해 복구(DR: Disaster Recovery) 아키텍처 - active/passive & active/active | RTO & RPO | Poilot Light & Warm Standby 본문
Cyber Security/Cloud
AWS 기반 재해 복구(DR: Disaster Recovery) 아키텍처 - active/passive & active/active | RTO & RPO | Poilot Light & Warm Standby
paka_corn 2024. 12. 28. 22:25RTO & RPO
RTO (Recovery Time Objective)
: 서비스 중단과 서비스 복원 사이의 최대로 허용 되는 지연시간
RPO (Recovery Point Objective)
: 마지막 데이터 복구 가능한 시점 이후에 장애시 데이터 손실을 허용 할수 있는 최대 시간
재해 복구 전략
: 낮은 RTO(Recovery Time Objective) 및 RPO(Recovery Point Objective)의 이점과 구축 및 운영 비용 중 어디에 중점을 둘지 고려해야 함
1) 백업 및 복구
- 다른 전략대비 RTO가 가장 높아, 복구에 많은 시간이 소요됨
- Amazon EventBridge와 같은 AWS 리소스를 사용하여 재해 상황의 감지 및 복구 시나리오를 개선하여, 복구 시간을 줄이고 자동화할수 있음
2) 파일럿 라이트
장애 발생으로 모든 인프라를 생성 및 동작 시키기 전까지 어떤 요청도 처리할수 없음
3) 웜 스탠바이
주기적인 백업 외에도 최신의 데이터를 유지 + 요청을 처리할 수 있는 최소의 인프라를 유지(프로덕션 수준 트래픽 처리는 불가)
- 파일럿 라이트 배포보다 자동화되고 더 확장 가능한 설정을 제공
- active/passive & active/active
active/passive 전략
: 워크로드는 단일 사이트에서 작동하며 모든 요청은 이 액티브 리전에서 처리, 재해 상황이 발생하고 액티브 지역이 워크로드를 처리 할수없는 경우, 패시브 사이트로 시스템이 복구됨
active/active 전략
: 한 리전이 재해 상황이 발생하였을 경우, 해당 리전의 트래픽이 나머지 액티브 리전(Region)으로 전달 되는 구조, 리전 간에 데이터는 복제되고 있지만, 재해 복구 전략의 일부로 데이터를 백업함
- 복구 시간이 가장 빠르고(가장 낮은 RTO), 데이터 손실이 가장 적은(가장 낮은 RPO) 재해복구가 필요한 경우 Multi-site Active/Active 사용
reference
'Cyber Security > Cloud' 카테고리의 다른 글
Comments