Jintrick.netagenda2003年02月アーカイブ → 2003年02月11日

構造とプレゼンテーションの分離は不可能?

久しぶりに批判を行ってみます。最近RDFやOWL関連の文書を読みふけっていたせいか語彙がそっち系に偏ってしまっていますが悪しからず。

従来、xmlは意味的な内容と表現を分離して、内容だけを取り出すと言われていたが、実際に取り扱ってみるとよくわかることだが、表現を完全に分離してしまうと、内容だけからは表現を再現することができない場合が多い。更新日記のような簡単な構造のものでさえそうである。

更新日記@2/9/2003 (Sun.) より

例えば新聞のチラシから表現に関する情報を全て削除し、意味とその構造のみをXMLとしてマークアップしたなら、そこから表現を再現することは難しいかもしれません。例えば、チラシにおける各種の見出しは、見出しというクラスに属しているものの、極めて多種多様な「サブクラス」にも同時に属しており、デザイナはそのサブクラスに基づいて(殆ど無意識に)スタイルを決めます。従って、「見出し」という意味を与えただけでは全く足りないのです。難しいと書いたのは、そのサブクラスを認識し、語彙として定義してやる過程のことであります。

さて、「更新日記」ではどうでしょうか。チラシ並に押し付けがましくアピールすべき要素が、「更新日記」に存在するでしょうか。否。「更新日記」の読者はチラシのような「プレゼンテーション」を望んでいません。やりたいならやっても良いでしょうが、所謂フォント弄り系になるのがオチでしょう。

何れにしろ、内容だけからは表現を再現することができないというのは良く分からない話です。「内容」を「各要素の意味と文書構造」に置き換えて考えてみたとしても、詳細なクラスを定義してやれば表現を再現することは恐らく可能です。出来なかったとすれば、その表現に問題があると言えましょう。一切の理由が存在しないまま気まぐれで設定された表現というのは読書の邪魔ですから。もしくは、その表現を定義する言語が非力なだけかもしれません。例えば一文字ずつフォントタグでマークアップして「レインボーカラー」を実現していたとして、そのマークアップを排除した場合、それを再現することは難しいと言えます。まあ難しいだけで十分可能ですけれども、確かに標準規格だけでは無理かもしれません。

手短に纏めますと、内容だけからは表現を再現することができないというのは:

この何れかが原因です。

Documentation for NITFを調べてみた。バージョンは3.1になっている。xmlhtmlのサンプルを比較してみるとよくわかる。表現に関わる部分はHTMLに近い。リストやパラグラフはそのままだが、テーブルにはメタデータを記述するためのタグがある。イメージはmediaというタグで属性を細かく指定することができる。結論、XMLにも表示用タグは必要。メタデータ用タグ(メタデータ) + 表示用タグ(コンテンツ) = XML である。表示用タグはメタタグで包まれる関係になる。意味・内容はXMLで、表示はXSLでという図式は思い込みの幻想だった。コンテンツと表現の分離はどう考えても原理的に無理があるということ。XML + XSL = HTML + meta data のほうが実際的な表現かもしれない。

更新日記@2/10/2003 (Mon.) より

イメージ(画像)におけるwidthやheightといった属性は、本質的に論理属性です。高さや幅が存在しなかったら画像にはなりません。要素の性質を叙述したものが論理属性です。画像という概念(クラス)には、幅と高さという性質(プロパティ)が必ず付属しますが、見出しという概念には幅や高さといった性質がありません。そこを勘違いされてコンテンツと表現の分離はどう考えても原理的に無理があるという結論にもってゆくのは早過ぎであると思います。私はむしろ、原理的には可能だが、現状、完全な実現は難しい、と考えています。

因みにそのxmlは、かなりのレベルで分離が実現されているようにしか見えません。

全然関係ありませんが、RDF関連の仕様書を読み終えて、このサイトのサイト構造はかなり腐っていることを認識しました。そのうち大幅に修正します(各文書のURLは変わりません)。


webmaster@jintrick.net
公開: 2003年02月11日
カテゴリ: 意見交換, 批判等