文章を適当なサイズのファイルに分割

印刷物とは異なり、ウェブでは1つのファイルがそのまま1ページになってしまいます。画面で見るとき、あまりに長いページは読みにくいので、作品のボリュームによってはページを分割した方がよい場合があります。

ファイルの大きさ

多くの場合、作品は全体で1つのファイルだったり、1つの章が1ファイルだったりして、かなりサイズが大きくなっていることでしょう。印刷用の原稿としてはこれでよいのですが、インターネットで提供する電子テキストの場合、読者はコンピュータの画面上でその作品を読むことを考えなければなりません。長いファイルだと、ダウンロードする(ネットワーク経由でデータを自分のコンピュータに持ってくる)のに時間がかかる上、読むのも大変なのです。

どの程度の長さが最適かというのはきちんとしたルールがあるわけではありませんが、1ページあたり2000字(原稿用紙4〜5枚程度)までにとどめておくのが無難でしょう。この点に関してはハイパーテキスト・スタイルガイド個々のドキュメントの大きさも参照して下さい。

ただし、作品全体のボリュームが大きい場合、あまり小さい単位でファイルを分割してしまうと、今度は逆にいちいちページをダウンロードするのが煩わしくなってしまいます(原稿用紙500枚の力作が100個のファイルになっていては、やはり困ってしまいますね)。この場合は、むしろ印刷して読んでもらうことを前提に大きめのファイルにまとめるか、エキスパンドブックのようなツールを利用する方が良いでしょう。要は、読者が読みやすいサイズにまとめようということなのです。

ファイル名の付け方について

インターネットで提供するファイルの名前の付け方には、いくつかの約束があります。

  1. HTMLのファイルには、「.html」という拡張子をつける。
  2. ファイル名は大文字と小文字が区別される。MyBook.htmlとmybook.htmlは別のものになるので注意が必要。また、ファイル名に使う文字は英数字(及びいくつかの記号)に限る。ファイル名の途中にスペースは入れないのが原則。
  3. 入り口のページ(全体の目次、インデックス、イントロなど)には普通「index.html」という名前を付けておく。

最初の約束は、これを目印にしてコンピュータが「このファイルはHTMLで書かれているから、見出しを大きくしたりして表現しよう」と判断するためのものです。「.html」ではなくテキストファイルとして保存したときのまま「.txt」などとしておくと、思ったように表示されません。

2番目は、インターネットで一般に使われるUNIXというシステムの約束です。WindowsやMacintoshでは大文字、小文字を区別しないため、自分のコンピュータ上ではきちんと表示されていたのに、インターネットでは「File Not Found」といわれてしまって驚くことがあります。また、ファイル名に区切りとしてスペースが欲しい場合は、その代わりにアンダースコア(_)を使うのが一般的です。すなわち、my book.htmlではなく、my_book.htmlとします。

最後は必須ではありませんが、このようにしておくとあとでいろいろ都合が良くなります。「表紙ページはcover.htmlでなくては嫌だ」という方は、別にそれでも大きな支障はありません。

一連のファイルには規則的な名前を

文書を分割してたくさんのファイルができるときは、規則的な名前を付けて、管理しやすいようにしておきましょう。「バナナの曲がり具合について」という論文を分割したなら、banana010.html, banana020.html, banana030.html..... というように、説明的な名前の後に連番を付加する方法がよく用いられます。

数字を01ではなく010としているのは、あとで気が変わって、1番目と2番目のファイルの間に新しいテキストを挿入したくなったときに対応しやすくするためです(完成した作品を分割するときは不要かも知れません)。また、最初に0を付けるのは、ファイルを名前順に並べたとき、banana2.htmlがbanana10.htmlより後ろに行ってしまわないようにするためです。細かいことですけれども、のちのちの作業がずいぶん楽になります。