2006/12/04

バッドノウハウ

先日の sitemap.xml に関するエントリで、
> これまでの、ロボットが理解しやすいHTMLを作成するという
> バッドノウハウ的SEO対策から脱却するための良い一歩だと思っています。
と書いたのですが、これについて少し触れておきたいと思います。

まず、sitemap.xml ですが、
これは明らかに「セマンティックウェブ」の理念に基づいて考えられたものです。

セマンティックウェブがどういうものかについて詳しくはWikipediaなどで調べていただくとして、
ざっくり簡単に述べておくと、
「HTMLは人間が目で見たときにわかりやすいように作られたデータフォーマットで、
 ロボットが読むには難しすぎる。
 ロボットにはロボットが読みやすいファイル(メタデータ)を別途用意すべきだ。
 そして、世の中全てのHTMLにメタデータが付加されれば私たちのネットライフはうんと良くなる」
という考えです。非常にもっともな考えですね。

HTML の meta タグにある Keyword や description などもひとつのメタデータです。
HTML をロボットが読んでキーワードを抽出したり、概要をまとめることは、
全く不可能ではないでしょうが、時間がかかりますし、HTML作成者の意図通りに解釈してもらえる保障はありません。
一方で、私たちが書いたmetaタグの keyword を読むだけなら簡単です。
これはセマンティックウェブの考えに非常に忠実です。

ですが、検索エンジンのロボットは、metaタグだけを見るわけではありません。
実際には、先ほど難しいと述べた HTML の解析を頑張って行っているのです。
HTML 文書の構造を解析して、重要な部分とそうでない部分を切り分けます。
そうしてページの中で重要なキーワードを抽出して、重み付けを行っているのです。

しかしですね、上で書いたように、HTML の解析はやっぱり難しいんです。
その理由は、HTMLは「人間が見やすいように」文書が配置されているということや、
多くのブラウザは、HTMLの文法が若干崩れていてもうまく表示してしまうため、
文法の崩れた HTML が数多く存在すること、などです。
そこで自然とロボットが読みやすい HTML とロボットが読みにくい HTML がでてくるわけで、
ロボットが読みにくいページでは、HTML製作者の意図がうまくロボットに伝わらず、その結果あまり検索結果が芳しくないことになります。
そうなってくると、私たちサイト管理者のとり得る対策としては、
「ロボットが読みやすいHTMLを作る」ということになります。
また、ロボットがどのタグを重視しているかを推測して
「重みが最大になるようなタグ付けを行う」というテクニックも横行することになります。

でも、これって変じゃないですか?
少なくとも、セマンティックウェブの考えとは少しずれています。

なぜなら、ひとつの HTML ファイルを人間とロボット両方が読みやすいものにしようとしてしまっているからです。
これははっきり言って不自然な努力だと思います。
こんなことをせずに、最初からロボット用のファイルを別途用意すればいいのではないでしょうか?
ページのどの部分が重要でどの部分がそうでないか、
どのリンクが重要でどの画像が重要なのか、
そのような、人間が知る必要の無い情報はロボット用のファイルに記入すればよいのです。
そうすれば、現在のように、ロボットにも人間にも読みやすいHTMLを頑張って作成して、
それをロボットが正しく解釈してくれることをじっと祈る必要もなくなります。

このような意味で、私は現在のSEOにおける一部のテクニックを
バッドノウハウである、と考えています。
「タイトルタグはロボットが最も重視するから重要なキーワードを配置する」
のようなテクニックは、ユーザを無視した(というとやや言いすぎですが)、
不自然なテクニックだと思います。

実際に、現在 Google などで検索を行うと、
上位のページのほとんどに、そのキーワードが含まれている、という状況をよく目にします。
こうなってしまうとページを区別するのにタイトルはほとんど役に立たなくなってしまいます。

人間用、ロボット用のファイルをそれぞれ別々に作るようになれば、
このような状況も改善されるのではないか、と思います。

もちろん、ロボット用のファイルに嘘のデータを記載するなどの方法で
悪用されてしまう、という可能性もあります。
ですが、現時点でページからキーワードや概要を抽出する技術はあるのですから、
逆にキーワードや概要が与えられたときに、それが HTML の内容と
合致するかどうかを Verify するのはもっと簡単にできる、と信じています。

まぁ、課題はおそらく他にも沢山あるでしょうが、
今後、より高度なセマンティックウェブの仕組みが普及してくれることを祈っています。

========================

さて、このセマンティックウェブのことを私が初めて耳にしたのは大学生のころでした。
そのときの、私を含めた皆の反応は
「誰がメタデータを作るのか?」
というものでした。
当時すでに膨大な数のウェブページが存在していましたし、
世の中の HTML 製作者がセマンティックウェブという概念を理解し、賛同し、従うとは思えませんでした。
だから、全てのページにメタ情報を付加するなんてできっこないと考えていました。

ですが、いまとなっては認識を改めています。
今現在のウェブサイト管理者、特に私たちのようなビジネスを目的として
ウェブサイトに関わっている方々は、
SEO 対策というものに非常に敏感です。
アクセスアップのためなら多少の手間を厭いません。
それこそ、自分が管理しているページ全てのメタデータなんて、
それでアクセス数がアップするなら喜んで作るでしょう。
実際のところ、メタデータは一度作ってしまえばそれほど頻繁には変動しないので、
実は長期的に見るとたいした手間ではありません。

ということで、セマンティックウェブは現時点(少なくともビジネスサイト)においては
非常に現実的なアイデアになってきたといえます。
時代は変わるものですね。

さて、そう考えると、やはり今後は上で述べたようなより高度なセマンティックウェブが
実現していくのではないかと考えています。
検索エンジンがタグの意味からページの重要度を推測するのではなく、
こちらから情報を提供できる仕組みが出来上がっていくことになると想像しています。
2年後、5年後、ウェブの世界がどう変わっているか、非常に楽しみです。

0 件のコメント: