얼마전에 장애가 발생했다.
서비스가 죽은건 아니지만 CUD시 장애가 발생하기 시작했다.
월요일 오전이라 배포한것도 없고 도대체 무슨 문제지?
로그를 확인해보니 새벽시간에 RDS가 업그레이드 되버렸다.
PostgreSQL RDS에 Aurora PostgreSQL 읽기전용 복제본을 생성하여 사용중인데 PostgreSQL RDS만 업그레이드가 진행되
데이타복제가 안되는 현상이였다.
이전에 업그레이드 메일을 받기는 하였으나 다른업무들로 인해 우선순위가 계속 밀렸고 자동 업그레이드가 된다는 내용으로
업그레이드시 문제되는 부분을 일부 체크는 해두었기에 큰 문제는 없을거라 오판을 했다.
자동업그레이드가 RDS만 되고 Aurora는 안될거라고는 생각도 못했다.
RDS와 Aurora PostgreSQL 는 독립적인 서비스이며 그렇기 때문에 자동 업그레이드 별도로 진행되게 된다.
AWS에서 RDS PostgreSQL 10 버전의 인스턴스들은 maintenance window 시간에 관계없이 강제로 업그레이드되며
내부적으로 담당자들이 수동으로 수행하는 작업이 아니라 back-end 로 무작위 scan 후 특정 공지 없이 업그레이드를 수행되기때문에
RDS와 Aurora PostgreSQL 동시에 진행 될 수 없다.
클라우드 인프라는 처음이라 쓴 경험을 쌓고 있다.
'AWS > RDS' 카테고리의 다른 글
[AWS] RDS 클러스터(Cluster)와 인스턴스(Instance) (0) | 2023.07.18 |
---|---|
[AWS] Aurora PostgreSQL 삭제중 상태 (0) | 2023.07.18 |