多機能な住所URL

近頃は企業の新聞広告にも、ホームページを示すhttp://www....という表示が目立つようになりました。「ホームページアドレス」とか「URL」とか呼ばれていて、前回とりあげたドメイン名と似ていますが、http://なんていうおまじないが付いています。実はこのおかげで、インターネットの使い方がずいぶん楽になっているのです。

インターネットのさまざまな情報

インターネット上の情報は多種多様。そして、その内容によって提供方法もさまざまです。代表的な仕組みとしては、テキストを中心とした電子メールやネットニュース、ファイルを直接やり取りするFTP、情報を体系化して使いやすくするゴーファー(Gopher)、そしてハイパーリンクによって各地に分散する情報を結び付けるWWWなどがあります。

もともとは、これらの手段ごとに専用のソフトが開発され、利用者は目的に応じてソフトを使い分けてきました。しかし、最近のWWWブラウザはどんどん機能が充実し、インターネットのほとんどの形態の情報を扱うことができるようになっています。ネットスケープひとつあれば、メールのやり取りもネットニュースもFTPも、そしてもちろんWWWの情報も手に入れることができるのです。

さて、こうした多様な情報を扱うには、情報資源の所在ととともに、それがどのようなタイプのものかをも合わせて示す統一された方法が必要です。情報の形態も、それをやり取りするためのルールも異なるので、タイプがわからないとサーバーに対して依頼の出しようがないからです。統一的に情報資源の所在地と形態を記述する。これが、しばしばお目にかかるURL(ユニフォーム・リソース・ロケーター)の役割です。URLを解釈することで、ブラウザは情報の場所とともに種類や取得方法を理解し、適切な手段でデータを要求したり受け取ったりすることができるのです。

URLの構成

WWWブラウザで「ロケーション(場所)」や「アドレス」という指示に従って入力するのがURL。このURLは、大きく分けて3つの部分からなっています。

(例) http://www.kanzaki.com/docs/sample.html

というような書式のうち、最初のコロン( : )までの部分は、情報のタイプ(scheme)を示します。この例のHTTPは、ハイパーテキスト・トランスファ・プロトコルの意味で、WWWの情報であることを示しています(最もよく見かける形です)。情報の種類によって、ここはftp:とかgopher:などと記述されるわけです。

コロンの後の二重スラッシュ(//)から次のスラッシュ(/)までは、インターネット上のホストを示します。ここには前回取り上げたドメイン名やIPアドレス(123.20.20.15のような形)が入ります。

ここから後ろの部分は、ホスト上でのリソース(ファイルなど)の所在地です。スラッシュはUNIXシステムでディレクトリの区切りを示す文字。ウィンドウズやMS-DOSでは\、マッキントッシュなら:に置き換えるとよくわかるでしょう。

URLの働き

例えば、ある文献を入手するには本屋、図書館、オンラインなどいろいろな手段が考えられます。ここで 《文学部資料室にある17世紀フランス文学の『パンセ』》 が必要ならば、資料室に行き、図書館一般で定められた手続きをとり、係の人にその本を取り出してもらうことができます。これをURL風に記述すれば

(例) 図書館://資料室.文学部/仏文/17世紀/パンセ

という具合になるでしょうか。情報入手の手続きと場所を合わせて記述しているので、ルールが明確ならこれだけでロボットでもお使いが可能です。

では、書名はわからないけれど、とりあえず資料室に行くとしたら? その場合、まず図書カードやインデックスを繰ると想定できますね。つまり

(例) 図書館://資料室.文学部/

ならば、資料室でインデックスを見るという意味だと解釈できます。URLも同様に

(例) http://www.kanzaki.com/

となっている時は、このホストのインデックス(index.html)をさがすという約束になっています。URLは私たちが情報を調べる方法を、インターネットの世界に置き換えて簡潔に記述していると考えても良いでしょう。

URLによって、WWWブラウザはさまざまな情報を一括して扱えるようになりました。インターネット上には多様な資源が溢れていますが、このような工夫によって、私たちは何種類もの手続きを学ぶ必要を免れ、自在にこれらの情報を利用できるのです。

(NetFan, January 1997)

関連するRFC