●ここのところ書いているスパムメール対策について、とても有益な情報をいただいたので挙げておくのだ。ポール・グレアム氏の「スパムへの対策 ---A Plan for Spam」日本語訳。ちょっと読み辛いかもしれないが、じっくり読めば非常におもしろい。ヘッダも本文も含めて、メール中に含まれる単語について統計的手法を使えば、スパムだけを選別することはできるっていう話。これはいける。スパムと非スパムについてある程度まとまったサンプルが必要になるが、この手法を正しく用いればスパム問題はほとんど解決しちゃうんじゃないだろか。
●なので、だれかこのやり方でフリーウェアかシェアウェアを作ってくれないかなあ。きっと大ヒットすると思うんだけど。日本語を単語分割するときは、漢字だけ拾うってことで実用上問題ないところまでできない? まあ、仮にできなくても英語対応だけでも十分。(01/24)
January 18, 2003