いつの日からかGoogleの被リンク検索は使い物にならなくなってしまったが、このツールを使えば自分のサイト内の文書に限り被リンクを発見することができる。
サイトマップを用意し、それをサイトマップとしてGoogleに教えてやればGoogleに対して更新通知を行なうこともできるようだ。Google独自のXML応用としてサイトマップを記述することもでき、スキーマも存在し、それを生成するツールもあって、かつそれはPythonスクリプトで用意されている。サイト運営においてXML形式のサイトマップはサイトの再構築、特にパンくずナビの生成に必要だったし、Googleのこのオープンソースに乗っかってみることにしよう。一石二鳥どころか三鳥くらい仕留めた気分。SAXでサイトマップのツリーを辿りながらRSSも吐いてしまえば四鳥くらいか。
以前サイトマップはRDF/XMLで書いていたけれど、(RDFはともかく)アレは自分の中では既に終わってる。
スキーマを読んでみたのだけれど、何か勘違いしていたらしい。urlset要素以外は内容モデルが全部SimpleTypeで、唯一ComplexTypeのurlset要素も、複数のurl要素を子に持てるのみ。並列に。わらい。こりゃ駄目だ使い物にならん。Atomで何が不満だったんだろうGoogleは。Atom形式もサイトマップとして認識してくれるらしいけど。