질문과 답변
서버 / IT 윈도우서버 장애 관련 모니터링 시 빠른 인지를 위한 대책 요청드립니다
2017.01.09 13:32
안녕하세요?
현재 호스팅회사에서 매니지드 서비스를 제공하고 있습니다.
저희 자체 모니터링을 통해 고객님 서버를 실시간 모니터링 하고 있습니다.
저희쪽 특정 에이전트 포트로 서버 장애 (다운현상) 여부를 파악하고 있습니다.
하지만, 서버에 문제가 생겼을 때, 에이전트 포트가 모두 장애가 발생하는 것이 아니기 때문에
특별한 상황에서는 장애를 감지하기 어렵습니다.
추가로, ICMP 모니터링도 생각해봤지만, ICMP 경우에는 어플리케이션이 모두 죽고난 후에도 ICMP는 살아있기 때문에
장애 여부 판단이 어렵습니다.
혹시, 빠른 장애여부 판단을 확인하기 위해 어떠한 것을 모니터링 하면 좋을까요?
(예를 들어, 최근에 일어난 장애는 IIS와 에이전트 포트가 Down되고, 서버 터미널 접근이 되지 않았지만,
장애 확인된 IIS와 에이전트 포트 모니터링은 3분 후 체크되었습니다)
좋은 정보 요청 드립니다.
감사합니다.
댓글 [1]
-
DarknessAngel 2017.01.09 17:08
많이 고민하는 부분인데, 특별한 대책 없습니다 (예를 들어 서버의 메인 어플만 다운되어도 다른건 다 살아있는경우 해당 서버에 접속 시도해보기전엔 알 수 없으니까요)
다만 IIS등의 웹서버는 웹서버에 시험용 택스트 파일 (0바이트면 체크가 안 되므로 반드시 특정 문구 넣어놔야함)라도 올려둔후 정기적으로 이걸 다운로드해서 제대로 내용물이 읽히는지 시험하는등의 방법으로 작동 여하 체크 가능합니다 (예를 들어 test라 적은 문서파일 하나 올려둔후 1분에 한번씩 wget으로 이걸 받아서 내용물이 제대로 있는지 시험)
저거떄문에 ICMP해보거나, 일부러 서버의 어플의 블렉리스트에 걸리는 페킷 던져서 응답 확인하거나 별의 별 방법 다 써봤습니다만, 실재 작동여하를 체크하게 만드는것 이외에는 정확하게 체크하는 방법 없었습니다