장애는 언제든 발생합니다. 어떻게 회고하는지가 중요합니다. PO/PM이다보니 어느 회사를 다니든 장애 프로세스도 주 업무였습니다. 11년 정도 되는 근속 기간동안 백억 정도 비용이 날라가는 장애을 비롯해서 기억에 남는 장애는 3번 정도인 것 같습니다. 심지어 이번주에도 장애를 겪었네요. 해서 장애에 대해 글을 작성해보고자 합니다. 장애가 발생한다면 어떻게 해야할까요? 점검 공지 판단 장애가 발생하면 무엇부터 해야할까요? 가장 먼저 해야할 일은 점검 공지 판단입니다. 장애가 발생했다는 것은 우리 메인 서비스에 문제가 발생했다는 것을 의미합니다. 장기간 노출되어도 서비스 사용에는 큰 문제가 아닌 버그와 순식간에 원인도 모르게 발생하여 서비스를 이용할 수 없는 상태가 되는 장애는 정말 다릅니다. 그렇기 때문에..