2007/01/14

dmoz 復活

dmoz が復活していました。

ハードウェア障害によりしばらくURLの申請ができなかったのですが、やっと復旧したようです。噂ではここ半年間に行われた申請データが消えたとか。。。真偽のほどはわかりません。

さて、最近は dmoz に登録しても SEO 効果は無い、といわれています。これは、Google の同一コンテンツ判定アルゴリズムによるものだと思います。以前は dmoz に登録されると、dmoz クローンのカテゴリサイトに軒並み登録されることになり、結果沢山のリンクを受けることができるようになっていたのですが、Google は現在 dmoz クローンからのリンクはカウントしないようになっているため、以前ほどの効果は無い、ということになっています。

また、昔ほど dmoz 経由のアクセスも無いこと、エディタの数が足りていないため新規サイトの登録が滞っていることなどが指摘されています。

2007/01/13

PageRank は重要?(1)

Web担当者Forumにおいて、[質問]PageRank(ページランク)は今でもSEOには重要な指標?という記事が投稿されています。

巷では、PageRank は Google における順位付けに対して影響が無い、ただの目安程度にしか参照しない、などと言われてします。本当に PageRank は意味の無い数字で、チェックするには値しないし、外部リンクを増やす努力は不要なのでしょうか?この件について、私なりの考えを述べてみたいと思います。

一言で言うなら、「そんなわきゃない」ということになります。

まずこの問題を考える前に、以下の3つの事柄を区別する必要があります。
1) Google Toolbar で表示される PageRank (緑のバー)を増やすこと
2) Google が内部的に保持している、「真のPageRank」を増やすこと
3) バックリンクを増やすこと

まず 1) と 2) はどう違うのでしょうか。Toolbar に表示される緑の PageRank は3ヶ月に一度程度しか更新されません。先日の投稿で書いた PageRank の更新、というのはこの目に見える値としての、Toolbar の値が更新された、ということを意味しています。この Toolbar のPageRank は3ヶ月に一度しか更新されませんが、Google が内部で用いている PageRank は実は毎日のように更新されています。ですので、もし毎日外部リンク数が増えていけば Google 内部の PageRank は徐々に上がっていきます。一方で Toolbar の値はずっと変わらず3ヶ月後になってやっと動く、ということになります。

次に 3) と 1),2) はどう違うのでしょうか。これらは、どんなリンクでも PageRank の増加につながるわけではない、という点で、異なります。Google は、Spam対策として、明らかにリンクファームと思われるサイトからのリンクの価値を下げたり、相互リンクばかり持つサイトの場合は外部リンクの価値を下げている、ということを明言しています。(そもそもこのような対策を講じること自体彼らがリンクを依然重要視していることの現われです。)従ってそのような「自然でない」リンクを増やしてもPageRankの増加には聞いてこない、ということになります。実際に、リンクファームから数十万件のリンクが張られているのにもかかわらず、PageRank が非常に小さいサイトも存在します。従って、単純にリンクを沢山張れば PageRank が上がる、というわけではありません。

ということで、「PageRankはもはや意味を持たない」などと言ったときには、
1,2,3 のいずれの意味で言っているのかを見極める必要があります。通常は、1 の意味で言われていることが多いように感じています。だとするとそれは当たり前で、でもそれがすぐに外部リンクを増やす必要がない、という結論につながるかというと、「そんなわきゃない」ということになります。

続きはまた後ほどポストします。

2007/01/11

pagerank 更新

SEO ブログでも報じられているように、pagerank の更新が開始されたようです。

現在 Google Toolbar などで表示される pagerank は3ヶ月に一度程度しか更新されません。1月10ごろに次の更新がある、とうわさされていたのですが、まさに10に更新が開始されました。

この数ヶ月の間に新しく作成されたサイトにはここで初めて pagerank が付与されることになります。

2007/01/04

Googleの新特許

Google が2つの新しい特許を申請したことが報じられています。

一つは‘Methods and apparatus for estimating similarity‘で、同一コンテンツを検出する方法に関する特許のようです。アルゴリズムの詳細も書かれているはずなので、これによってどのようなコンテンツが同一コンテンツとみなされるテいるのかが明らかになるでしょう。

二つ目は‘Detecting spam documents in a phrase based information retrieval system‘です。Abstractが短く、意味がはっきりとはつかめないのですが、spam を自動検出するためのもののようです。情報レスですみません。

しばらくは時間が取れずこれを読む暇が無いので(特許の文章って読みにくいですし)、誰かがまとめてくれることを期待して待つことにします(笑)。