IT이야기2011. 8. 13. 23:28
'쥐박이' 도메인을 청와대에서 등록했다는 기사를 봤다.(한겨레신문) 그래서 재미삼아 도메인 whois 검색을 해봤다. 쥐박이, 명박이 도메인은 같은날에 등록을 했다. 언론에 노출된 뒤로 등록자 정보가 모두 감춰졌다.

$ whois_list.sh 쥐박이
쥐박이.kr            등록 => 등록일: 2010. 01. 27.
쥐박이.com           등록 =>  Creation Date: 27-jan-2010
쥐박이.org           등록 => Created On:27-Jan-2010 06:06:52 UTC
쥐박이.net           등록 =>  Creation Date: 27-jan-2010

$ whois_list.sh 명박이
명박이.kr            등록 => 등록일: 2010. 01. 27.
명박이.com           등록 =>  Creation Date: 27-jan-2010
명박이.org           등록 => Created On:27-Jan-2010 06:06:47 UTC
명박이.net           등록 =>  Creation Date: 27-jan-2010

$ whois_list.sh 이명박
이명박.kr            등록 => 등록일: 2010. 12. 02.
이명박.com           등록 =>  Creation Date: 15-nov-2000
이명박.org           없음
이명박.net           등록 =>  Creation Date: 11-nov-2005


* 명박이.kr whois 정보

도메인이름                  : 명박이.kr
등록인                      : 후이즈 도메인 관리자   <-- blind 처리
등록인 주소                 : 서울 구로구 구로3동 182-4 대륭포스트타워 3차 1101호
등록인 우편번호             : 152847
책임자                      : 후이즈 도메인 관리자
책임자 전자우편             : admin@whoisblind.com
책임자 전화번호             : 82-2-1588-4259
등록일                      : 2010. 01. 27.
최근 정보 변경일            : 2011. 08. 12.          <-- 언론 노출 후 정보 변경
사용 종료일                 : 2012. 01. 27.
정보공개여부                : Y


쥐박이, 명박이 도메인은 청와대에서 등록을 했다. 그런데, '이명박' 도메인은 이명박.kr, .com, .net이 모두 다른 소유자가 갖고 있었다.
왜 이명박.kr 은 청와대(국민 세금이 들어가는 것이니 개인적으로 원치는 않지만)에서 등록하지 않았을까? 이명박.com과 .net은 오래전에 등록되어 있으니 그런가보구나 넘어갈 수 있는데, 이명박.kr은 누군가에 의해 작년 12월에 등록되어 있다. 쥐박이, 명박이는 작년 1월에 등록했다. 그러면 작년 1월에 이명박.kr과 이명박.org도 같이 등록했을 수도 있지 않았을까.

한글 도메인은 이쯤하고, 다른 것을 검색해보고 싶었다. 그순간, 방통위로 부터 접속차단당한 트위터 2MB18nomA가 떠올랐다. whois 검색을 해볼까?

$ whois_list.sh 2mb18noma
2mb18noma.co.kr      없음
2mb18noma.or.kr      없음
2mb18noma.re.kr      없음
2mb18noma.pe.kr      없음
2mb18noma.go.kr      없음
2mb18noma.kr         없음
2mb18noma.com        등록 =>  Creation Date: 15-jul-2011
2mb18noma.org        등록 => Created On:15-Jul-2011 07:53:15 UTC
2mb18noma.net        등록 =>  Creation Date: 15-jul-2011


어? 등록되어 있다. 3개가 7월에. 현재 2mb18noma.com, 2mb18noma.net은 도메인 파킹되어 있다. 
2mb18noma.org은 진보넷에서 사용중인 것으로 보인다. 사이트를 가보니 '2MB18nomA 접속차단에 반대한다. 방송통신심의위원회 통신심의 문제 감시 블로그'라고 쓰여있다. 와~ 좋은 목적의 블로그다. ^^ 3개 도메인 모두 소유자는 'Domains by Proxy'으로 표시되어 있는데, 같은 날짜에 등록한 것을 보면 '진보넷'에서 등록했을 듯 싶다. 

* 2mb18noma whois 정보 

Registrant:
   Domains by Proxy, Inc.
   DomainsByProxy.com
   15111 N. Hayden Rd., Ste 160, PMB 353
   Scottsdale, Arizona 85260
   United States


※ whois 검색은 '커피닉스에 올려둔 스크립트'를 사용했다.
 
Posted by 좋은진호
IT이야기2011. 3. 24. 21:20

그 때는 검색봇 이름이 'pirs'과 'pirst'였다. 그런데, 3일전에 'first'로 비슷하게 이름이 바뀌어서 접속을 했다. 기존에 User-Agent명으로 차단을 시켜두었다. 하지만, 이를 비켜간 'first'는 마구 긁어가기 시작했다. 몇 시간뒤에 차단 조치를 취하고(개인정보를 취급하지 않는 사이트임), 얼마동안 페이지를 긁어가는지 확인했다. 48시간 가까이 긁어갔다. 포털, 구글의 봇보다 무섭다.

  • 사이트 운영자들은 봇이름으로 차단하는 경우가 많다. 그런데, 이름을 바꾸면 문제가 있지 않겠는가? 예를 들어 구글이나 네이버, 다음의 봇 이름이 바뀐다고 생각해봐라.
  • 여전히 robots.txt는 읽지 않았다. KISA의 공지와는 다르게 검색 규칙을 따르지 않는 것이다.
  • 과거에 긁어간 적이 있는 사이트는 페이지 목록이 DB화되어 있는 건가? 차단을 해도 여전히 여러 페이지를 읽어갔다.
  • referer는 http://www.pirst.kr:6600/RS/PIRST_FAQ.jsp 로 남았다.
  • IP대역은 61.111.15.110~61.111.15.119까지 총 10개이다. 이전의 IP 대역과 비슷하고, 검색 서버의 대수는 동일했다. KISA 모니터링 시스템에 대해서는 'KISA의 '개인정보 모니터링 시스템'에서 확인할 수 있다.

[ referer에 남겨진 http://www.pirst.kr:6600/RS/PIRST_FAQ.jsp 페이지의 공지 내용 ]


사이트 운영자에게 대상 사이트임을 먼저 알리는게 우선이지, 먼저 긁어가고 불편하면 메일로 문의를 하라는 것은 순서가 바뀌것 아닌가? 요즘 개인정보노출에 대한 문제가 많다. 그래서 KISA의 취지를 이해하고, 취지도 좋다고 본다. 하지만, 좋지 않은 인상을 남기는 안타까운 순간이다.
Posted by 좋은진호
IT이야기2009. 12. 14. 23:51
며칠전부터 'pirs'라는 User-Agent명으로 페이지를 너무 많이 긁어가는 경우가 많았다. 어제 하루만 18000여건의 페이지 요청이 발생했다. 웹로그를 살펴봤더니 Referer중에 www.pirst.kr:6600/ 가 남아있다. html 소스를 봤더니 다음과 같은 내용이 나온다. 바로 11월말에 구축했다는 'KISA 개인정보 노출 대응체계' 사이트였다.

* Project Name :  KISA 개인정보 노출 대응체계 구축
* Source Name : header.jsp
* Description : (대응시스템)HEADER
* DATE : 2009.06.27
* Author  : OOO
* History : 2009.06.27

'다음'에서 'KISA 개인정보 노출 대응체계'를 검색하면 다수의 기사가 나온다. 그 중 '세계일보' 기사 하나만 살펴보자.
  • 방통위와 한국인터넷진흥원(KISA)은 웹사이트에서 노출되는 개인정보를 검색·대응하는 '개인정보 노출 대응시스템'을 23일 구축완료
  • 24일부터 365일·24시간 운영
  • 하루 약 6500개 웹사이트에서 개인정보 노출을 검색
  • 그동안 포털 검색을 활용, 웹사이트에서 주민등록번호만 노출됐는지 검색했으나 이번 상황실 운영을 계기로 신용카드번호·계좌번호 등 9개 개인정보 노출을 검색

'개인정보 노출 대응시스템' 무엇이 문제인가.

  1. 대상이 6500여개 웹사이트이다. 개인정보 자체를 취급하지 않는 사이트는 대상에서 제외해야 하는데, 취급 유무 판단은 하지 않는 것으로 보인다. 개인정보가 없는 사이트도 저 'pirs', 'pirst' 봇이 방문을 했기 때문이다.
  2. 하루에 18000여 페이지를 긁어갔다. 문이 열렸다고, 신발자국 내면서 집안 구석구석 먼지하나까지 확인한 것이 아닌가. 그 것도 주인도 모르게 말이다. 목적이 분명하다면 대상 사이트에는 미리 알려줘야하는 것이 옳다.
  3. robots.txt는 전혀 읽지 않는다. 봇(bot)의 기본 룰을 따르지 않는 것이다. 모든 페이지의 개인정보를 확인해야한다는 이유로 robots.txt을 따르지 않는 것으로 보인다. 그러나 비공개가 필요한 페이지를 제외하게 pirs 봇에 맞게 robots.txt을 설정할 수도 있는데, 이 걸 완전히 무시한 것이다.
  4. 모니터링한 대상 사이트의 웹페이지를 개인정보 노출에만 이용할지는 의문스럽다. 페이지 전체를 긁어가는 형태이기 때문이다. 저인망식으로 웹페이지를 마구잡이 긁어가서 감시한다면  웹생태계를 파괴하는 일이 될 수도 있다. 현 정부에서 규제와 감시가 강화됐기 때문에 의심하게 된다.

만약 개인정보를 취급하지 않는 곳이라면, KISA에 제외요청할 수 있겠지만 2가지 방법 중에 한가지 방법으로 차단조치를 취할 수도 있다.

1.  웹서버 설정에 User-Agent명으로 차단 (403 페이지로 처리)

SetEnvIfNoCase User-Agent   "pirs"   notaccept
SetEnvIfNoCase User-Agent   "pirst"  notaccept

<Location "/">
    Order allow,deny
    Allow from all
    Deny  from env=notaccept
</Location>


2. 방화벽에서 봇 IP를 차단

pirs 봇은 210.97.192.140~210.97.192.149 에서 접속했다. 방화벽에서 210.97.192.0/24 대역 전체를 또는 해당 IP만 차단한다.
pirst 봇은 61.111.15.10 과 61.111.15.20, 61.111.15.30 에서 접속했다. pirst봇은 한 두 페이지 정도만 요청이 이뤄졌다. 이 3개 IP는 차단전에 좀 더 지켜보고 요청이 많다면 차단 처리하는게 좋을 듯.

* 관련글 :

2010/04/15 - [IT이야기] - KISA의 웹사이트 개인정보 모니터링 시스템
2011/03/24 - [IT이야기] - KISA, 개인정보 노출 검사위해 웹페이지 여전히 긁어간다

Posted by 좋은진호
IT이야기2009. 3. 31. 20:06
올 1월말에 정부는 '본인확인조치 의무대상' 사이트(본인확인제)로 153개를 선정했다.

youtube 유튜브

대상 사이트의 서비스 적용일이 바로 '4월 1일'이다. 그 사이트 중에 '유튜브'가 포함되어 있다. 구글코리아의 유튜브도 해당 국가의 법에 따라야 하니, 실명 확인절차를 거칠 수 밖에 없다. 날짜도 묘하게 4월 1일인데, 만우절에나 있을 법한 일이 거짓말이 아닌 참말로 진행되고 있다. 정치적, 사회적 이슈의 동영상이 삭제 및 조사의 위협(?)을 받지 않으려면 앞으론 해외의 다른 곳에 올려야할 것 같다. (아니면 구글의 '19금' 검색제한을 우회하는 것과 같은 방식이 있다면 그렇게 하거나)

외국 네티즌의 시각으로 보면, '한국은 인터넷 활용도가 높은줄만 알았는데, 규제도 심한 나라구나'라고 여길 것 같다. 규제를 푼다는 정부는 최소한 IT에서 만큼은 정반대로 가고 있다.
  1. 일일 이용자 10만명 이상은 '본인확인제'. 올해 대폭 확대되었다.
  2. 포털 5만명 이상, 그 외 사이트는 1만명 이상은 '주민등록번호 대체 수단' 의무 제공. 이제 시행한다.
  3. SSL 의무적용. 작년에 유난히 웹사이트 운영 업체에 메일을 많이 보냈다. 영리목적 사이트를 대상으로 하므로 공공기관은 예외다. 개인정보 유출의 한 몫을 차지하는 공공기관은 뺀 것은 앞뒤가 맞지 않다.
  4. 연매출 100억 이상 사이트, 호스팅업체, 결제업체, IDC 등은 '정보보호 안전진단'(예전부터 시행)
  5. 게임 심의(예전부터 시행)
IT(정확히는 '인터넷') 초기 단계에서는 정부가 긍정적인 방향으로 붐을 일으키려고 노력했다. 하지만 지금은 뭔가? 규제와 감시로 역행하려고 애쓰고 있다. 정부여~~~ 규제와 감시보다는 네티즌과 서비스 업체의 노력에 맡겨둬라. 이들의 눈높이가 정부보다 한 수 높거든...

참고로 '본인확인제' 대상 사이트 전체 목록은 '방통위 공지사항'에서 확인 가능하다.


Posted by 좋은진호
IT이야기2009. 2. 2. 23:13
방통위에서 며칠전 2009년도 '본인확인조치 의무대상' 사업자(본인확인제) 선정결과를 공시하였다. 2008년에는 포털 16개, 인터넷 언론 15개, UCC 6개(판도라TV, 디씨인사이드, 엠엔캐스트, 티스토리, 이글루스, 엠군)등 37개 업체였다. 그러나 올해는 무려 153개 사이트로 급증했다.


- P2P 사이트 상당수(짱파일, kdisk, wedisk, mfile, zfile, 프루나, 파일노리, ...)
- 쇼핑몰사이트 상당수
- JobKorea, 알바몬, 인크루트, 사람인, 커리어 등 취업 사이트 다수
- 유투브, 뽐뿌, SLR클럽, 풀빵닷컴, 다나와, cafe24 등

선정기준은 일평균이용자수가 10만명 이상이며 게시판 및 댓글 서비스를 운영하는 사이트를 대상으로 했다고 한다. 결국 유저들이 가는 대부분의 곳에 규제 및 감시할 수 있는 장치를 마련한 것이 아닌가. '정보통신망 이용촉진 및 정보보호 등에 관한 법률'에 따른 것이라는데, 늘 생각 되는게 '이용촉진'이라는 말을 왜 저기에 쓰는 것인지 알 수가 없다.

작년 말 교과서 수정하라는 말도 안되는 일이 벌여졌다. 하지만 교과서에만 해당된 것이 아니었다. '현 대한민국에서 출판의 자유는 없다!! - 때 아닌 출판 검열!!'이라는 글을 읽어보면, 끓어오르는 감정과 나도 모르게 불끈쥔 주먹을 보게될 것이다.

이쯤하면 '빅브라더'도 울고갈 세상이다. '조지 오웰'이 쓴 소설 '1984'(빅브라더가 등장하는 바로 그 소설)는 디스토피아 세상인 1984년을 배경으로 했다. 1984년은 시간적으로 이미 지났지만 '1984'는 결코 멈추지 않고 최근 1년간 무섭게 진행되고 있음을 우리는 안다. 이런식의 규제와 겸열은 그만두고, 정치인이나 고위직의 언행을 검열하는게 나을 듯 싶다. 먼저 뱉어낸 다음 '그게 아니다', '오해다'라고 얘기하고, 지키지 못할 약속으로 국민을 붙통터트리고 있지 않는가.

Posted by 좋은진호