ワープロ文化とHTML

十年ほど前は、OA化によってオフィスから紙がなくなるなどということが、まじめに語られていました。もちろん、紙はなくなったりせず、むしろテストプリントなどのせいで、オフィスから出る紙のゴミは圧倒的に増加しています。そしてまた今度、イントラネットや電子メールによるペーパーレスに期待がかかっていますが、これもそう簡単に進みそうにはありません。となると、このワープロ文化の中で、印刷物と共存する形でHTMLなどの電子文書を作っていくしかなさそうです。

オフィス文書と印刷

メンバーはすべて携帯端末を所有していて、どこにいても好きなときにサーバーから資料を引き出すことができる。書類は電子決済され、捺印という習慣はずいぶん前になくなってしまった。印刷なんてことは基本的に不必要・・・というような世界は、未来には訪れるのかも知れません。しかし現実は、ほとんどの書類は印刷を前提としています。どんなに電子メールやグループウェアを活用していても、最後は紙に出力するとなると、オフィスではワープロは欠かせません。

情報を電子的に共有するという理念に向けてイントラネットの構築を始めたとき、最初に躓くのが、どうやってワープロ文書をHTMLに変換するかという問題です。すべての書類を最初からHTMLで書くようにすればもちろんスムーズですが、書類の内容がが印刷物の形で評価される以上、今のHTMLでは力不足なのは明らか。いきおい、文書はまずワープロで見栄えよく作成され、イントラでの共有はまた今度となってしまうのが実情でしょう。

ワープロ文書をそのままHTMLに

そこでまず考えられるのが、ワープロの文書をプログラムで自動的にHTMLに変換するという方法です。気に入ったワープロで文書を作成しておけば、あとで変換プログラムが一括して適切なHTMLを生成してくれる。これは一つの理想型ですが、このためにはワープロのファイルを解析し、そこから必要な情報を選んでタグを加えていくプログラムを自力で開発しなければなりません。多くのワープロは独自形式のファイルにデータを保存しており、こうした変換プログラムは簡単に作成できないという問題があります。強力なマクロがあれば可能かも知れませんが、これもかなり敷居の高い解決策です。

スタイルシートを使う

あるレベル以上のワープロは「スタイルシート」という機能を備えています。これは、文字列を個別に「ゴシック体・20ポイント」などと指定していくのではなく、大見出しを「ゴシック体・20ポイント」、中見出しを「明朝体・16ポイント」という具合に書式定義しておき、必要な部分に「大見出し」「中見出し」などのスタイルを指定していこうというものです(図1)。これならば、中見出しはやはり18ポイントに変更しようと考えたとき、見出しの書式を一つずつ変えていくのではなく、スタイルシートの「中見出し」の定義を一個所書き替えるだけで、これがすべての見出しに反映されるというわけです。

これは、「見出し」という文書の論理的な構造と、「ゴシック体・20ポイント」という物理的な指定を切り離し、別々に管理するという進んだ考え方です。そしてこれは、HTMLの「文書の論理構造を記述する」という考え方とも一致します。もしスタイルシートの「大見出し」の定義に、「HTML書出しの場合は<h1>タグでくくる」という指定さえ加われば、印刷用の書式に影響されることなく、正しいHTMLが自動生成されるはずです。

スタイルシートの応用によるHTML変換のできる頼もしいワープロがそろそろ市場にも出現し始めていますが(図2)、残念なことにこれらの生成するHTMLは今のところ「文書の構造」を記述するものになっていません。スタイルシートで大見出しを指定すると、HTMLではなんと<font size=6>などといった、フォントの物理サイズの指定に置き換えられてしまうのです(図3)。

<hn>タグと<font>タグ

これまでも述べてきたように、HTMLは文書の組み立て(論理構造)がどのようになっているかということを、タグによって記述していくものです。見出しをどのように(どんなフォントで)表示するかというのはブラウザの仕事であって、HTMLは本来関知しません。スタイルシートでワープロ文書中の「見出し」という構造と「ゴシック体・20ポイント」という物理表現を分離したのと同様に、HTMLでは画面上のレイアウトはブラウザに任せています。

ところが、WWWが急速に広まる中で、HTMLを使って画面デザインをもっとコントロールしたいという要望が強まってきました。論理構造を伝えるなどという回りくどいことをいわず、見栄えの良い表現を直接記述したいというわけです。こうした流れによってHTMLの仕様に後から追加されたのが<font>などの画面デザインを特定するタグなのです(図4)。

HTMLで構造を記述するメリットは、その応用範囲の広さにあります。すべてのファイルがきちんと<hn>タグを使って記述されていれば、たとえば自動的に見出し部分を抽出して、全文書の目次を自動生成することは簡単です(図5)。キーワードが辞書型定義(<dl>、<dt>などのタグ)で示されていれば、索引や用語集の作成もわけありません。ところが、これが<font size>指定になっていたらどうでしょう。そこが見出しなのか、単なるデザイン上の都合で文字を大きくしているのかは機械的に判定することは困難です。これでは、ワープロ文書をHTMLに変換して、電子的に共有するメリットが半減してしまうのです。

物理属性から見出しを推測する離れ業

ワープロが正しく見出しタグを書き出してくれるのが理想的な形ですが、現実はまだそうなっていません。ワープロが単なるレイアウトソフトから脱却して、情報の共有を視野に入れたオフィスシステムに成長していくまでには、まだ時間がかかりそうです。

困ったもんだとため息をついていたら、発想を逆転させた面白いソフトがありました。一般に見出しには本文よりも大きい、異なる書体のフォントが使われるということを逆手にとって、文中の書体指定から見出しを推定してHTMLを書き出そうというのです。これはプリンタドライバに成りすまし、ワープロが印刷メニューから送るデータを取り込んで処理するという方法をとっています。ということは、ワープロソフトはこれまで使い慣れたものをそのまま利用できるわけで、わざわざHTML書き出し機能を持った製品に買い換える必要もありません。このソフトはMyrmidon(ミアミドン)という風変わりな名前をつけられています。忠実に命令を実行するしもべという意味だそうです。

Myrmidonを使う

使い方は至ってシンプル。インストーラを使うと、Myrmidonの本体が機能拡張フォルダにコピーされます。あとはセレクタからプリンタドライバとしてMyrmidonを指定するだけ(図6)。ワープロから印刷命令を実行すると、プリンタに出力する代わりに、図7のようにHTMLのファイルとして内容が書き出されます。

どの書体を見出しとして認識させるかは、ワープロの「ファイル」メニューにある「用紙設定」を通して“Myrmidon設定”ダイアログボックスを呼び出して行います(図8)。この設定は、ワープロの「スタイルシート」の書体設定と連動させるとよいでしょう。ワープロで「見出し1」というスタイルを20ポイントのボールド体と定めたら、Myrmidonでも<h1>の定義を同じようにしておくのです(図9-11)。こうしておけば、ワープロで「見出し1」のスタイルを選んだ部分は、Myrmidonをつかえば自動的に<h1>として書き出されます。両者が間接的に連動し、あたかもスタイルシートによってHTMLまで定義できるような合理的な環境が実現するわけです。

Myrmidonの設定は「メタプリンタ」として何通りも保存しておけるので、文書のタイプによって使い分けが可能です(図12)。「メタプリンタ」をあらかじめ用意し、紙に印刷したあとはMyrmidonによるHTML書き出しも合わせて行うというルールにしておけば、無理なくイントラネットの素材が揃いますね。

HTMLによる情報の共有は、普段の仕事の流れの中で自然に実現することが重要です。Myrmidonや(未来の)スタイルシートを活用し、スムーズなイントラネット展開を進めましょう。

(MacFan 1997-07-01号)

*HTMLの書き方については ごく簡単なHTMLの説明 を参照してください。