Jintrick.netagenda2002年12月アーカイブ → 2002年12月31日

Semantic markup

今日はリアル大掃除とサイト内の大掃除で目が回りました。さて、ちょっとした事件があったので臨時に27日のボツ記事を公開いたします。因みに、2002年の全てのボツ記事は年始に公開します。例の下品な企画ですね。

ここからボツ記事です。

Mark Pilgrimさんが、記事の中のcite要素を利用して、アーカイブを作られた模様。

Let's see, why can't you do this? Wait, wait, don't tell me... it's coming to me... oh right, you don't use semantic markup. Sucks to be you.

Pushing the envelope (dive into mark) より

痛快ですなあ。私大好きですこの人の文章。何故オライリーの記事にはスパイスが効かなかったのか……ってそりゃあそうですね。

ただこの話をHTMLに結び付けるのは勘違いの原因になります。何故なら、個々人が勝手にclassで定義した<span class="cite"></span>でも一向構わないわけですから。このような制作者サイドの利用に限っては。

このような方法に基づいた記事収集を検索エンジンが行ってくれるなら、その時は私も攻勢(謎)に出ますけれども。

ここまでがボツ記事です。

氏の、この「痛快」な文章ですが、「腐れぶろがー」達を煽る結果になったらしく、中々面白いことになっています(The tag soup of a new generation (英語)参照)。「似非セマンティッカー」とか色々登場。しかしHTMLでさえ意味付けを徹底しようとしない連中が何を言っても説得力はない訳で、Pilgrimさんのいう「新世代不思議マークアップ」が登場するだけだと思います。

リンクの性質をUser Agentに伝える

一連の話題のうち、面白そうなアイデアをピックアップします。

dive into mark (英語)では、他サイトとの自動的な双方向リンクを実現しており、リンク元の記事のタイトルやPermalink、所謂「永続的URI」を取得させているそうです。制作者のエゴだ等々という批判を受けながらどんどん進化していった経緯があり、便利なので私は良く利用します。逆にいえば、dive into mark以外の「双方向リンク」は全然使ったことありません。リンク先に何があるか良く分からないからです。メンテナンスも疎かなので、宣伝目的のリンクとかが紛れているのも嫌です。それはさておき。

その「永続的URI」をUser Agentに知らせる為には、a要素にrel="bookmark"という属性を付加すると良いそうです。むしろそれ以外には無い気もします(推測になってしまう為)。他のa要素についても、XSLTスタイルシートを変更してなるべくrel属性を示そうと思いました。

余談

サイトの大掃除(全ての文書をXSLTスタイルシートで変換)が終ってからこの辺りを考えたので、またやり直しです。急いでPURLを取ってきて、大急ぎでRDF形式のprofileをでっちあげ、それをXHTMLに変換するスタイルシートを書き、変換の高速化を図るためにスクリプトを修正し、ようやく今さっき終ったところです。バッチリうまく行ったのはスクリプトだけですね。200以上のファイルを20秒で全部変換します。今までは変換結果のXMLファイルのDOMツリーにアクセスしていたのですが、変換結果(XHTML)をパースする際にDTDを毎回読みに行っていたのが遅くなっていた原因の全てでした。メモリも恐ろしく消費しまして、ごみ収集だけで2、3分かかっていました。ところが変換結果をStringとして取得してDOMツリーのアクセスを諦めれば、何もかも高速になります。折角大掃除用に考えてみたXSLT&DOM用クラスの数々のメソッドが殆ど無駄になってしまいました。まあ今後使いまくる予定なのですが。


webmaster@jintrick.net
公開: 2002年12月31日
カテゴリ: HTML