2008年10月21日火曜日

前のサイトの雑記2

とりあえず前のサイトから雑記を細かく抽出するソースを書いて9割方上手く抽出できているっぽいけど・・・むーん。
  • 1タイトルの抽出条件が強引なので条件に引っかからない部分が漏れる。
  • 映画の監督名や制作年の抽出条件も強引なのでちゃんと抜き出せない箇所がある。
  • 内部リンク貼っている箇所は相対パスからフルパスに変換するだけなので前のサイトにリンクされる。

5割かた漏れるとかなら諦めるけど、少しだけ漏れるっていうのがまた微妙。
かといって前のサイトの全HTMLファイルの中身をチェックするのも嫌だし。
ざっとHTMLをgrepして確認するだけでUPしちゃおうかなぁ。

0 件のコメント:

コメントを投稿