テキストの簡易タグ付け

電子テキストを作るには、最終的に出版するフォーマット(HTML、 エキスパンドブック、など)に従ったタグを付けて完成させる前の段階として、簡単な記号による「簡易タグ付け」をしておくと作業が効率的になります。これは個人的な電子出版のみならず、出版社による本格的な電子テキストの作成でも応用される方法です。

出版社に元原稿が純粋なテキストファイルとして届くと、電子テキスト化を行う作業班は、まず原稿の可読性を損なわない方法で、見出し、図、リンク、検索キーワードなどに簡易タグを付けていきます。例えば、

  1. ■で始まる行は章見出し
  2. □で始まる行は節見出し
  3. *で囲まれた語句はあとで索引作成用に拾い出すキーワード
    ...

といった具合です。ルールは好みで決めて構いません。一貫した規則さえ守られれば、どのような記号でも「簡易タグ」として機能します。

この方法の利点は、<h1>などのHTMLタグよりも違和感が少なく、タグ付けしてもテキストが読みにくくならないという点です。筆者との調整を行う際も、このレベルのテキストを使えば、スムーズに進むでしょう。それでも、ルールをきちんと決めておけば、この簡易タグをHTMLなどのタグに置き換えるのは簡単です。

最終的に電子テキストによる出版を目指すかどうかは別として、最初からこうしたルールを自分で作って、作品に簡易タグを用いるようにしていると、いろいろな応用が利くのではないでしょうか。

(参考)このようなルール付けができている原稿を自動的にHTMLに変換するプログラムを試作しました。お試しください。