1年ほど前に話題になったもののようですが、
私が SEO を勉強し始めたのは先月のことなので、
今まで知りませんでした。あまり耳にしないような気がするのは
あまり使われていなさそうなのか、私が勉強不足なだけなのか。。。
この TrustRank とは簡単に言ってしまうと次のような方法で
スパムページとそうでないページを分類するための方法です。
- まず、確実に Spam でないことがわかっているページでかつ沢山リンクを持っているもの(例:Dmoz)を「Seed」として選ぶ。
- Seedから辿ることができるページは Spam でないと判断。Seedからどうやっても辿れないページは Spamである可能性が高い。
このように、最初に少しだけ人の手を入れることで
Spam ページを効率的に排除することができる、というものです。
さて、これと似た話をどこかで聞いたことがないでしょうか。
私はこの話を聞いたときに、 mixi が採用しているモデルを連想しました。
これは大雑把に言うと「良い人の友達は、良い人である」という考えを背景に持つものです。
確かにTrustRank と似ています。
ここでさらに連想するのは、mixi のこのモデルが最近はうまく働いていないということです。
参加人数が大きくなるに従って、悪意を隠さない人の割合が無視できなくなり、
いくつかの事件が起こったことは、皆さんの記憶にも新しいと思います。
これをTrustRankに当てはめると、最初は白いページから始めても、
いくつかリンクを辿るうちにだんだん黒くなってきて、最後には真っ黒なページにたどり着く、
ということでしょうか。
まぁ、確かにスパムページはそうでないページにお金を払ってリンクを張って貰うなどすれば
有る程度白に近づくことはできますよね。
このように単純な TrustRank は悪意を持ったページに対して脆弱です。
ひとつの(すぐに思いつく)対策は、
Spam ページにリンクを張ったページにはペナルティを課すなどの
逆方向の TrustRank (SpamRankと呼びましょう)を導入することでしょう。
これは mixi の場合、Ban されたユーザの友達もまとめて Ban されることに相当します。
ただ、これは検索エンジンの場合、あまりうまくいきません。
TrustRank のときは少数の Seed を選ぶだけで、後は芋づる式に
大量のページがシロであると判定できますが、
SpamRank の場合、ひとつの SpamSeed を決めても
そこにリンクしているページがそれほど大量にあるとは思えません。
ひとつのSpamあたり、ほんの少しのページしか Spam であると判定することができないのではないでしょうか。
ですので、このやり方で Spam を排除するには大量の SpamSeed が必要となると思います。
なお、mixi ではBan対象のユーザがいないか常に監視して、一人一人(その友達も含めて)削除しているそうです。
何かいいアイデアが思いつけばお金になるなぁ、と思って
しばらく考えているのですが、そうそう思いつくものではないですね。
もうちょっと考えたいと思います。
0 件のコメント:
コメントを投稿