Diary - Comment書き込み - 2009年03月11日

書き込み対象の日記

RE: RE: 美人時計の画像filesが欲しい

http://d.hatena.ne.jp/Yamashiro0217/20090310/1236674979

のはてぶのタグに何故か Python タグがあったので,

http://d.hatena.ne.jp/jYoshiori/20090311/1236768388yoshioriさんがpythonで書いてらっしゃったので

みしょはperlで書いてみることにしm……な ぜ 画 像 だ け で 満 足 す る の か !!!!!

男なら画像に加えてprofile情報も欲しいだろjk……。。。。


美人時計という素晴らしいserviceがあります。

1分ごとに美人が表示される素晴らしいweb siteですが,悲しい技術者の性。Url 分かるんだったら画像取得できるし,ちょっとAjaxの中身見ればprofileも取得できちゃうじゃん!とか思っちゃうわけです。

というわけで,美人時計の画像を根こそぎGETしちゃって,その上なおかつ美人なみなさまのprofileまでGETしちゃうcodeを書きました。

3月16日追記:なんか使えなくなってたので修正しました!なんか英語になっちゃったけど,これで大丈夫☆ もうすぐ使えなくなるのでお早めに!! 旧版は倉庫に置いておきます。

#!/usr/bin/perl

$OUTPUT  = 'bijin.html';
$TMPFILE = 'tmp';
$MAX_RETRY = 10;
  
open(OUT, ">$OUTPUT");
print OUT <<_EOF_;
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8"> 
<title>美人時計</title>
</head>
<body>
<h1>美人時計</h1>
<table border="1">
<tr>
  <th>TIME</th><th>NAME</th><th>BIRTHDAY</th><th>HOME</th>
  <th>BLD</th><th>HEIGHT</th><th>3-SIZE</th><th>OCC.</th><th>FAVORITE WEBSITE</th>
</tr>
_EOF_
  
$retry = 0;
  
for $h(0..23){
  $h="0$h" if $h<10;
  for $m(0..59){
    $m = '0'.($m+0) if $m<10;
    my $file = "";
    if($retry++>$MAX_RETRY){exit 1;}
    sleep(5);
    my @prof = ();
    print `wget http://www.bijint.com/en/clocks/view/$h$m -O $TMPFILE`;
    open(IN,$TMPFILE) or redo;
    foreach (<IN>){
      chomp;
      if($_ =~ /(\/jp\/img\/clk\/.*?\.jpg)/){
        $file = $1;
      }
      $_ =~ s/<[^a].*?>//g;
      push(@prof,$_) if $_;
      last if $_ =~ /</;
    }
    close(IN);
    unlink($TMPFILE);
    redo if @prof < 5;
    $elem = join("</td><td>",@prof);
    print OUT "<tr><th>$h$m</th><td>$elem</a></td></tr>";
    exit 1 if $file eq '';
    while(not(-f "$h$m.jpg")){
      if($retry++>$MAX_RETRY){exit 1;}
      sleep(5);
      print `wget http://www.bijint.com$file -O $h$m.jpg`;
    }
    $retry = 0;
  }
}
print OUT "</table></body></html>";
close(OUT);
exit 0;

ひたすらshellでwgetを叩きまくるだけのprogramなので,wgetを使える環境で実行してください!!

あと,自分用に作ったので大してdebugとかしてないので動作は保証しません!!動かなかったらあの有名なweb siteで質問してみてください!!「use strictしろよー」とか「DOCTYPE宣言は?」とかゆうひとは使うな!!!!

もちろんみしょは環境にやさしい人なので,Yamashiro0217さんとは違ってちゃんとsleepを入れています!!!

あと,みしょはこの情報の入手に全身全霊をつぎ込んだので,きちんとERROR処理もしています!!!!

みなさまもこれで快適美人時計らいふをお送り下さい!!!

Comments

Commented by ( 美人時計 担当/東條  at  2009/03/12(Thu) 17:35:19

【削除】

いつも美人時計を拝見して頂き、ありがとうございます。

拝見させて頂きました。

現在、当社はプライバシーポリシーに違反する誘導、使用の取りやめのご協力をお願いしております。

3日以内に公開、使用の取りやめ行わない場合、権利に基づいた対応をとらせて頂く場合がございます。

ご理解のほど、ご協力宜しくお願いします。

東條

info@bijint.com

Commented by みしょ  at  2009/03/12(Thu) 18:09:44

【削除】

あなただれ?本物の中の人なの?

あと,とりあえず日本語でおk。

Commented by みしょ  at  2009/03/12(Thu) 19:01:25

【削除】

http://d.hatena.ne.jp/nishiohirokazu/20090311/1236800725

あの西尾さんもこう言ってるし,まぁいいか!!

対応するに吝かではないのですが,とりあえず「Privacy policyに違反するのは誰か」「権利とは何の権利か」が意味不明なので……現状のままではいたずらにしか見えないわー。

Commented by 名無しさん  at  2009/03/21(Sat) 13:22:22

【削除】

現状のままでは訴えられるようにしか見えないわー

Commented by みしょ  at  2009/03/21(Sat) 23:02:25

【削除】

はいはい

< Commentを書き込む >

[Trackback URL : http://www.misho-web.com/diary/Trackback/20090311]

書き込みform

名前
(必須)
削除password
(必須)
内容
(Tagは使えません)

名前と削除passを保存する