아마존 웹서비스 내부 DNS 서버 장애

오늘 2018년 11월 22일 오전에 아마존 내부 DNS 서버 장애가 발생했다. 아마존웹서비스의 경우 대부분의 상품이 floating ip 를 사용하고 있으며, 개발 가이드 문서에도 서비스를 “IP 주소 대신 도메인으로 연결해서 작업하여라” 라고 쓰여 있다. 따라서 아마존웹서비스를 사용하는 곳들은, 비록 자신이 사용하는 서비스의 IP 를 알고 있더라도 Domain 주소를 입력하는게 일반적이다.   이렇게 도메인 주소를 사용해서 서비스를 구성하는게 일반적인데, 갑자기 amazon 내부의 domain name resolving 서버가 먹통이 된 것이다! 서버들은 통신 대상을 찾지 못하여 통신 장애를 일으켰다. 여러 장애 시나리오에 대해 대응 정책을 세우지만, (아마존에서 자체 관리하는) 내부 DNS 서버가 다운될 것이라고 가정한 곳은 없었던 것 같다. 따라서 이러한 예측하지 못한 장애에 대해서 대비가 되어있지 않았고, 서비스가 다운된 것이다.   나도 감히 이런 장애가 발생할 것이라고는 생각하지 못했다.   내가 자체적으로 파악한 바로는, 오늘(2018-11-22)의 Amazon WebService … 아마존 웹서비스 내부 DNS 서버 장애 계속 읽기