IT이야기2009. 5. 21. 19:12
오후에 아시는 분이 잡코리아가 안뜬다고 해서 확인해봤다. 메인웹도 안뜨고, 다른 서브 도메인도 뜨질 않았다. 브라우저 대신 직접 쉘에서 커넥션을 시도했는데, 동일한 현상이었다. 같은 회사의 서비스인 알바몬 사이트도 마찬가지였다. 둘다 아주 간헐적으로 접속되거나 아에 안뜨거나.


그러다가 시간이 조금 지나니 잡코리아는 정상적으로 접속이 되었다. 그런데, 알바몬은 점검페이지를 공지하고 있었다. 이때 알바몬(www.albamon.com) 도메인을 lookup해봤다.

;; ANSWER SECTION:
www.albamon.com.        49      IN      A       203.xxx.xxx.138

;; ANSWER SECTION:
albamon.com.            300     IN      SOA     albamon.com. master.albamon.com. 200708853 3600 300 604800 300

IP는 203.xxx.xxx.138, SOA레코드의 시리얼번호는 200708853.
몇십분의 시간이 흐른 분 알바몬 사이트도 정상 서비스가 되었다. 이때 lookup한 결과이다.

;; ANSWER SECTION:
www.albamon.com.        60      IN      A       61.xxx.xx.45

;; AUTHORITY SECTION:
albamon.com.            300     IN      SOA     albamon.com. master.albamon.com. 200708854 3600 300 604800 300

차이가 보이는가? IP는 61.xxx.xx.45, SOA레코드의 시리얼번호는 1이 더해진 200708854로 변경되었다.

lookup결과로, 장애 처리 과정을 생각해보자.
  1. 알바몬에 장애가 발생했다.
  2. 그런데 이것 때문에 잡코리아까지 서비스에 문제가 생겼다.
  3. 그래서 잡코리아만이라도 정상화 하기 위해 알바몬 서비스를 임시로 다른 곳으로 돌린다. 이런 결과로 잡코리아는 정상화, 알바몬은 점검 공지 페이지가 뜬다.
  4. 그 후 알바몬의 장애가 정상화되어 원래 서비스 IP로 돌린다.

외부에서 판단하기에는 이렇다. 참고로 15일(금) 공지를 보니 23일(토)에 IDC를 옮긴다고 한다.

Posted by 좋은진호
IT이야기2007. 7. 11. 18:10
'순돌이아빠'님이 다음 사이트가 이상하다는 얘기를 들은 때가 16:15분이었다. aqua, avicom, kaien 님 등도 사이트가 이상하다는 얘기를 하셨고, 실제로 css는 어디로 도망을 간건지 css없이 그대로 HTML이 뿌려졌다. 정상화된 건 16:30분쯤. 신문기사에는 7분간이라는데, 이보다는 더 길었다.
 
사용자 삽입 이미지

장애시의 HTML과 정상복구됐을 때의 HTML을 비교해보면 아래의 딱 한줄이 빠져있었다. ?v=0711_1 로 css캐싱되지 않도록 설정을 했는데, 날짜별로 버전명을 써두는 것을 보면 그 시간에 디자인 변경중 실수한건 확실한 것 같다.
 
<link rel="stylesheet" type="text/css" href="http://top-sc.daum.net/static/css/main.css?v=0711_1" />
 
짧은 시간에 시원함(?)을 준 다음의 메인사이트. 그 시간에 이용했을 네티즌들은 어디를 클릭해야할지 몰라 허둥지 둥했을지도 모른다. 아차 하는 실수로 인한 네티즌의 불편함은 없어야할 것이다.
 
다음 사이트와는 별개의 얘기인데,
FF의 addon 툴인 Web Developer는 CSS를 disable하는 기능 등 웹개발에 유용한 패블릿(Favelet) 등 다양한 기능이 모여있으니, 아직 안써본 분은 꼭 설치해보길...
https://addons.mozilla.org/en-US/firefox/addon/60

Posted by 좋은진호
IT이야기2007. 6. 17. 17:28
어제까지 안되었고, 오늘 언제부터인지는 모르지만, 16:00 현재 접속이 된다.

웹서버 정보를 보니 점검 때 Apache 1.3.31에서 점검 전인 Apache 1.3.33 으로 돌아왔다. 캐싱서버의 문제였는지 real서버의 문제였는지 알 수는 없으나 서버에 문제가 있었는 것 같다. 'X-Cache: MISS from www01.zdnet.co.kr' 정보를 보고 lookup을 해보니 서버는 www00.zdnet.co.kr ~ www03.zdnet.co.kr까지 최소 4대 이상으로 보인다.

$ HEAD www.zdnet.co.kr/
200 OK
Connection: close
Date: Sun, 17 Jun 2007 07:09:37 GMT
Server: Apache/1.3.33 (Unix)
Content-Type: text/html
Client-Date: Sun, 17 Jun 2007 07:08:37 GMT
Client-Response-Num: 1
Set-Cookie: UID=deleted; expires=Sat, 17 Jun 2006 07:09:36 GMT; path=/; domain=zdnet.co.kr
Set-Cookie: SESSION_ID=deleted; expires=Sat, 17 Jun 2006 07:09:36 GMT; path=/; domain=zdnet.co.kr
X-Cache: MISS from www01.zdnet.co.kr

장애에 대한 공지사항은 없다. 장애시 점검 페이지 딸랑 하나 뜬 것도 ZDNet 사이트의 인지도에 비해서는 너무 초라하지 않는가. 무사 귀환한 것을 다행으로 생각하지만 네티즌들에 대한 세심한 배려가 필요하다.
Posted by 좋은진호
시스템이야기2007. 2. 14. 22:38
사용자 삽입 이미지

KISA의 내부 메일을 통해서 내 블로그를 들어온게 있네?
어느 페이지를 본 것인지 확인이 안되지만 최근에 국내 DDoS공격 사례와 공격당한 root DNS, 엠파스의 장애 관련 포스팅을 한 것 때문인 것 같다. 걸어둔 '다음 웹인사이드'로 분석이 안되어서, KISA홈페이지에서 링크(메일과 무관하게) 된 거라도 있는지 무심코 살펴보았다.

 KISA 동향정보
사용자 삽입 이미지

어? KISA홈페이지의 동향정보에 '엠파스, 인터넷서비스 한때 차질'이라는 제목의 신문기사 링크가 있네? 동향정보에 올라오는 글은 보안, 해킹 관련 사항일 거라는 가정하에 다른 포털의 장애건 검색을 위해 '네이버', '장애', '차질' 검색어로 KISA 통합검색을 해봤지만 나오는게 없다. 보안 이외의 장애건에 대해서는 동향정보에 올리지 안는다라는 결론인데. 그럼 엠파스 장애는 공격때문?
국내는 큰사이트일수록 장애 원인을 발표하지 않는터라 궁금증만 커진다.


그러저나 '다음 웹인사이드'의 유입검색어 분석을 보니 9개가 DDoS공격 관련 검색어라니..
몇주전에는 UCC, 동영상, 사진, DieHard가 주검색어였는데, DDoS에 대한 관심이 대단하다.
사용자 삽입 이미지

※ 잡다한 생각이라 제목을 뭘로 써야할지 애매하더라...
Posted by 좋은진호
IT이야기2007. 1. 24. 12:35
네이버 뉴스( http://news.naver.com/ )가 나왔다 안나왔다 합니다. (12:15현재)
telnet으로 직접 접속해봐도 그러네요. 참고로 사무실과 커피닉스 서버 모두 EPN 회선입니다.

$ telnet news.naver.com 80
Trying 220.73.156.125...
telnet: connect to address 220.73.156.125: Connection refused
telnet: Unable to connect to remote host: Connection refused
                                                                                             
메인페이지에서도 일부 안나오는 부분도 있구요. 또 뭔일인지...
                                                                                              
사용자 삽입 이미지

---------------------------------------------------------------------------------------
[ 21:51분 내용 추가 ]

그만님의 블로그( http://www.ringblog.net/tt/765 ) 와 뉴스를 검색해보니 오후 1시쯤에 정상화되었다.

* 네이버에서 '네이버 장애'로 검색한 결과
* 네이버, 오전 2시간 동안 접속 장애 (매일경제, 2007.01.24 14:00:01 입력)
* 네이버, 오전 내내 뉴스 등 일부 서비스 장애 (디지털데일리, 2007년 01월 24일 15:05:37)

매일경제 뉴스의 일부분이다. 다른 뉴스들을 봐도 일부지역만 안되었다고 하지만, 한정된 지역이지는 않은 것 같다. 12시대에 부산과 광주에서도 접속이 안되는다는 걸 확인했다.

오늘 오전 11시부터 국내 포털 1위인 네이버(www.naver.com) 서비스 일부에 접속되지 않는 장애가 빚어졌다.

매경인터넷에서 11시부터 네이버의 일부 서비스의 접속 장애에 대한 상황을 인지한 직후, 약 두 시간 가량 서울 일부 지역에서 네이버 메인 페이지 및 일부 하위 서비스 페이지들이 열리지 않거나 오류 메시지가 뜨는 등 이상 현상이 계속됐다.
... 생략 ...

이들 서울 지역을 제외한 경기도 수원, 대구 등 지방 사용자들은 장애를 느끼지 못했다고 알려왔다.

작년 3월, 그리고 7월, 올해 1월 등 반기마다 이런 사건들이 일어나고 있는데,  올 상반기에는 더이상의 장애가 없기를 바란다.

* 네이버 장애, 이제 검색은 되네요. (2006.7.9)
* 네이버 서버에 문제가 있는건가 (2006.3.9)

Posted by 좋은진호