XTを使ってXMLファイルをHTMLに変換したところ、全ての日本語が数値文字参照に置き換わってしまった。
<xsl:output method="html" encoding="Shift_JIS"/>
こうしてShift_JISで生成すると、今度は以下のような余計なゴミが強制的に挿入される。
<META http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
要素名大文字、終了タグ無しですか 。XTのバージョンが古い(XT Version 19991105 (英語))のが原因 のような気が。
やらなきゃならないことは多い:
まず、XTのバージョンアップ、それから、手持ちのエディタはUTF-8で保存するとゴミ(BOM)がくっついてきてXTが文字コードを認識してくれないから他のテキストエディタを探すか何かしなきゃならないし、XTのGUI操作を補助してくれるツールも探したいし(GUI世代故) 。
XSLTは趣味の範囲ギリギリだ。XPathに馴染みがあったので、まだ若干楽しめる程度。ただ、HTMLのcodingを変更するのは、もう、うんざりだし、XHTMLのテンプレート部(だんだん肥大してきた)が隠蔽されていないのも気味が悪いというか。
というか、見出し構造とツリー構造の「明示」についての「明示方法の悪例」って、モロにウチの構造でないの。古林さんは、ウチを「参考」にしたのかな(苦笑)。 ツリーの深さにある制約を課していただけなんだけど、視点を変えると何だか酷いマークアップに見えるものだ。
若干異論はあるものの、div イコール sectionと見なせば確かにその通りだし、その意味で統一した方がベターだとも思うので、これからは構造と見栄え、それから内容の3つを分離してフレキシブルにすることにした。初期投資がでかいけど、どうせなら徹底的に。
こういう記事をみると妙にやる気がでるのは一体なんなのだろう。