まなちゃん日記

2003年8月25日の日記

2003年8月25日(月) [出勤]

ネット [2003/8/26 23:58 記]

今日は給料日なので、定時帰り。 All-In-Wonder 9800Proを買って財布の中身がほとんど無くなったので、近くのATMでお金をおろしてきた。 生活費だけは確保しておかないと、生きていけない。

早めに家に帰ったものの、何もやる気が起きない。 構想しているアイデアも、実現するためのアクションを何ら起こせなかった。 このままじゃいかんなぁ。 結局のところ、ネットサーフィンばかりしていた。

アクセスログを見ていて気になることがあったので、RFC2396について調べてみる。 RFC2396とはURIの書き方についての文書だ。 へたれなので原文を読むのはあきらめ、RFC2396の日本語訳を読む。 思ったとおり、クエリー(query)成分には「/」を含めてもかまわないことになっているようだ。 パス(path)成分中では「/」をセグメントの区切りとして扱うことになっているが、クエリー(query)成分中ではただの情報文字列として解釈しなければならない。 要するに、クエリー(query)成分中の「/」はセグメントの区切りではないということだ。

なんでこんな話になるのかというと、はてなアンテナのアクセスで「http://www2u.biglobe.ne.jp/~manachan/diary.cgi?2003/6/robots.txt」というものをたまに見かけるから。 はてなアンテナのヘルプ17.ページの編集 - ロボット拒否ページについてに「robots.txtの置かれている場所については独自に下位のディレクトリも参照しています。」とある。 しかし、URI文字列中の最初の「?」以降はクエリー(query)成分であって、そこに「/」が記述されていても、その「/」はセグメントの区切りではない。 よってURIが「http://www2u.biglobe.ne.jp/~manachan/diary.cgi?2003/6/28」となっている場合、その最下位ディレクトリは「http://www2u.biglobe.ne.jp/~manachan/」と解釈してもらいたいのだが…。 問い合わせるかどうかは、迷うところだなぁ。 とりあえず保留。

ちなみに私はrobots.txtなんか置いてないよ。 robots.txtを正しく解釈する、礼儀正しいロボットならむしろ大歓迎。 robots.txtを無視するような行儀の悪いロボットの方が嫌いだ。