人気ブログランキング | 話題のタグを見る

エキブロURLの拒否設定の書き方


先日、久しぶりにトラックバックスパムが来ました。
どうやら、あちこちで発生しているみたいですね。

今まで、ウチにはスパムなんて来なかったので、
特定のURLからのTBスパムの拒否設定はしていませんでした。
しかし、折角エキサイトブログにはそういう機能があるのだから、
この機会に、してみようかと思ったわけです。

相手も、ほんの少しずつURLを変えて、
複数のTBを打ってくるのですが、
しかし、いちいち、全部登録しているのは手間です。
なるべく簡単に、沢山のアヤシイURLを蹴りたいわけです。
正規表現が使えて、部分一致だと簡単なのになぁと。

実際、エキサイトでは、拒否設定したURLと、打ってきたURLの文字列を
どんな風にマッチングさせているのでしょう?
正規表現は使えるのか。
完全一致か部分一致か、部分一致なら前方か後方か。
色々わからないことが出てきました。

そこで、どうせエキサイトには、その辺りのヘルプがないでしょうから(怒)、
ググってみました。
utamaru's blog「トラックバックSPAMウゼーーーo(`ω´*)o」
なるほど!
知りたいことがズバリ書いていました。
拒否URLは、TB発射URLと、部分一致でマッチングさせているのですね。

これでURLを全種類、一つずつ登録しなくても、簡単に拒否できるわけです。
しかも、上記記事では
「スパムは online と on-line を登録しておけば、殆ど除けられる」
というような内容の、ステキな考察もされています。
早速、これを真似させていただいて、登録しましたm(_ _)m
でもなぁ、正規表現が使えると、もっと良いんだけどなぁ。
せめてアスタリスクくらいで良いんで。

拒否IDの方はどうなっているのでしょう。
「_」とか書いておくと、「_」を含むIDの人は、
全員拒否されるのでしょうか。
知っている方、どうぞ教えてください。
ま、IDを部分一致させたいっつーのも、よくわからん設定ですねぇ(笑)
追記:sofiaさんが検証されたところによると、
IDの部分一致設定はできないようです。そりゃそうか(^^;;

   ■■■

いつも思うのですが、
MS-Word や MS-Excel などの MS 製品は、
正規表現処理がイマイチ強力でないですね。
どうせ用意しても使いこなせないだろう、ということでしょうか。
または、ワープロソフトにそんなもの求めるな?
でも、Excel ではそういうの必要ですよねぇ。
「あ~おのどれかで始まって5文字以上10文字以内」とか、したいですよね?
え?必要ない(^^;;?

確かに、正規表現を使いこなすのは、非常に難しいです。
オライリーから1冊で本が出ているほどですし。
ブラケットやバックスラッシュ、¥など、
普段あまり使わない文字を多用するので、
ユーザが設定した正規表現をプログラム内で扱うには
さらにこれらをクオートしなくてはいけなくて、
プログラム的にも面倒くさいのも、想像がつきます。
そのあたりを頑張って windows に実装しても、
それほど使われなくてコストに見合わないから、
実装してもらえないのかなぁ、と思っています。

そんなわけで、そのあたりは、どうしても emacs に頼ってしまいます
( winodows では xyzzy を使っていますが)。
なくてはいられない体ですね。
パソコンを使う日は、
re-search-forward などの正規表現周りの関数は、
1日1回以上は絶対使っていますから。

正規表現が使えない世界に行ったら、きっと死んじゃうかも(言い過ぎ
by xiaoxia | 2005-05-20 21:27 | ネット
<< 東浩紀「動物化するポストモダン」 雨の歌といえばブラームス >>