掲示板 - 2001年2月の Messages

 
Message-Id: <20010228010908.22502@www2u.biglobe.ne.jp>
Date: Wed, 28 Feb 2001 01:09:08 +0900 (JST)
From: hsaka
Subject: コーディング

最近、全然コーディングしていない。
2001/1/19(My 30th birthday) の w3m-m17n-0.10 以来ほとんどやってない。 引越の準備を始めたのが、ちょうどその日だから仕方無いといえば仕方無いが、 文字コードにどっぷり浸かってしまったのも原因かも。
# 三十路になったからというのは勘弁。
Message-Id: <20010226221644.22594@www2u.biglobe.ne.jp>
Date: Mon, 26 Feb 2001 22:16:44 +0900 (JST)
From: hsaka
Subject: 電話が繋がった

電話が繋がったので一安心。
Message-Id: <20010226153633.01036@www2u.biglobe.ne.jp>
Date: Mon, 26 Feb 2001 15:36:33 +0900 (JST)
From: hsaka
Subject: Unicode だけではダメな理由

Unicode だけではダメな理由、それは… Unicode は JIS ではないから!
# ここでの JIS は JIS X 0201,0208,0212,0213 の意味です。
# 国際規格の翻訳である JIS X 0202(ISO/IEC 2022),0221(ISO/IEC 10646≒Unicode) は省きます。

多少の問題は抱えつつも JIS は日本語の表記や通信のために 最適な様に設計されています。 記号の種類や漢字の並びはもとより、 JIS X 0208 の文字の数がわずか 7000 字足らずであることも その一つです(9000 字近い領域があるにも関わらずです。) 文字の数は多ければいいというわけではありません。

従って、Unicode で JIS を置き換えるには、Unicode が JIS より 最適に(正確に低コストで)日本語を扱えなければなりません。 そのためには Unicode は JIS の全ての機能の superset である必要があります。 そして、そうであれば JIS 以外の機能を持っている Unicode が JIS より低コストであることは不可能です。

日本語以外の環境でも全く同じです。 母国語の扱いを犠牲にしてまで他の言語を扱うなんて本末転倒もいいところです。 (そういう意味では GB18030 や ISO/IEC 2022 は健全といえよう。 w3m-m17n も同じポリシー。)

実は最近では、ユーザの立場としては Unicode だけの世界になる なんていう心配はほとんどしなくなりました。 上記の理由で、日本国内では Unicode だけ使えるアプリでは JIS だけ使えるアプリには勝てませんから、Unicode ベースであろうとも JIS も使えるか JIS の機能の superset である様になるはずだからです。
可哀想なのは Unicode (特に 2.0 レベル)だけ実装すれば 世界中どこででも喜んで使ってもらえると信じた(特に欧米の)開発者達ですね。 苦労して Unicode 3.x を実装して、 さらに苦労して各言語に正しく対応してください。 アジアの開発者の苦労が少しは分かると思いますよ(^^;


Message-Id: <20010226101717.04315@www2u.biglobe.ne.jp>
Date: Mon, 26 Feb 2001 10:17:17 +0900 (JST)
From: haska
Subject: 引越済んだ

引越終わった。
でもまだ電話は繋がっていない。今日帰ったら繋がっているはず。

6年振りの"一人暮らし"ということで、 完全に感覚を忘れていて、次から次へとこまごまとしたものが 無いことに気づいて買いに行っていた週末でした。
# 金銭感覚が麻痺するぅ。


Message-Id: <20010224032614.09637@www2u.biglobe.ne.jp>
Date: Sat, 24 Feb 2001 03:26:14 +0900 (JST)
From: hsaka
Subject: 引越

さて、朝起きたら引越だ。
電話が使える様になるのが月曜の予定なので、少しの間はインターネット にも繋がらない環境になってしまう。まあ、それもいいか。
Message-Id: <20010223182848.26441@www2u.biglobe.ne.jp>
Date: Fri, 23 Feb 2001 18:28:48 +0900 (JST)
From: hsaka
Subject: Unicode Unicode Unicode

Unicode ネタばかりですが Unicode を否定しているわけではなく、 私が英語を嫌いというのと同レベルで嫌いなだけですので気にしないでください。

私は、Unicode というのは国際英語(≠米語)のようなものだと思っています。 これが存在することで、

  1. 比較的簡単に国際社会での意志交流(Internet での情報伝達)ができ、
  2. 国際英語(Unicode)との間での翻訳(文字コード変換)を介することで、 各国語(各国文字コード)間でも翻訳(文字コード変換)が可能になる、
わけです。

しかし、例えば日本語(JISコード)には日本特有かつ必須の機能が自然な形で 盛り込まれているわけであり、それを完全に国際英語(Unicode)で表現するのは 現実的ではありません。 なぜなら完全さを求めると国際英語(Unicode)の存在理由の一つの 比較的簡単という部分が失われます。 従って、国際英語(Unicode)と日本語(JISコード)は共存すべきなのです。


Message-Id: <20010222143554.27424@www2u.biglobe.ne.jp>
Date: Thu, 22 Feb 2001 14:35:54 +0900 (JST)
From: hsaka
Subject: mapping of \

# 昨日の続き

iconv で、

   echo '\\' | iconv -f euc-jp -t utf-8
とやると、
   \\
となってしまう。 なお『\』は 0x5C (UTF-8 だと REVERSE SOLIDUS (バックスラッシュ))。
# でも iconv ベースのブラウザだと何を書いているのかすら分からないのかな?

これがバグなのは明らかだが、正しい答えは euc-jp の GL が US-ASCII か JIS X 0201 かという定義により変わってしまう。 そして、その原因は少々複雑。
まず、Unicode と他の文字コードとの間の変換で FULL/HALF width variant を 使う場合は文字集合(CCS)ベースではなく文字コード(CES,charset)ベースであり、 文字集合の規格である Unicode にエンコーディングを含む文字コードを 持ち込んだのが諸悪の根源。 これは、round trip を確保するために必要だったらしいが、 皮肉なことに、上記例の様に round trip を失敗させている原因になっている(^^;。
しかも、http://www.unicode.org/ にあるマッピングテーブルは文字集合ベースだったりするので、 良く理解せずに作ると上記例の様になってしまう。

で、一番の問題は、こういう事は 10年近く前から知られているはずだが、 いまだに根本的な対処(JIS X 0221 を改訂するとか unicode.org のテーブルを 文字コードベースにするとか)がされていないのはなぜ、ってことだな。

PS.
なお、良く理解していない頃にコーディングしたため(^^; w3m-m17n も同じですが、修正(?)します。

PS.PS.
TR#11 の問題はメールしてみたけど返事がくるかな?


Message-Id: <20010221231223.03987@www2u.biglobe.ne.jp>
Date: Wed, 21 Feb 2001 23:12:23 +0900 (JST)
From: hsaka
Subject: TODO

もう TODO を書かないと、やらない(やれない)気がしてきたので書く。

こんなもんだろう。ま、引っ越してからだな(^^)


Message-Id: <20010221212223.06639@www2u.biglobe.ne.jp>
Date: Wed, 21 Feb 2001 21:22:23 +0900 (JST)
From: hsaka
Subject: VISCII -> CP1258

libiconv-1.5.1 も FreeBSD の iconv-2.0_1 も結合文字を全く見ないみたい。はぁ。
それだと、例えばベトナム語の VISCII から CP1258 への変換などで困るのだが。 将来的には対応するのかな。

で、w3m-m17n で VISCII から CP1258 に変換しようとして、 バグってるのが分かった(;_;)。-o pre_conv=0 なら問題ないのだが。


Message-Id: <20010220203656.08088@www2u.biglobe.ne.jp>
Date: Tue, 20 Feb 2001 20:36:56 +0900 (JST)
From: hsaka
Subject: たった2日

たった2日メールを読めなかっただけなのに、 返事すべきメールが一杯来てた。ふつう土日は静かなのになぁ。

最近、やっと ISO/IEC 2022 と Unicode (ISO/IEC 10646) の違いがまとまってきた。
ISO/IEC 2022 は、一つの言語に特化した幾つかのスクリプト からなるかもしれない幾つかの文字集合を切替える規格で、 Unicode は、主要な言語で使用可能な幾つかのスクリプトからなる一つの文字集合 の規格だ。 ちなみに JIS X 0208,0212,0213 は日本語に特化した幾つかのスクリプトからなる 文字集合の規格だ。
だから、基本的に ISO/IEC 2022 の目指すのは多言語化であり、 Unicode の目指すのは、ある言語での多スクリプト化だ。 そのため、現時点での Unicode の実装で多言語化は不可能で 多スクリプト化に過ぎないし、 Unicode で多言語化しようとすると Language Tags が必要というわけだ。 でも、Language Tags なんか入れたら ISO/IEC 2022 より面倒な気がする。 というか、最近の Unicode Technical Reports を、まともに実装するのってアプリケーションには辛すぎないかい?


Message-Id: <20010217015736.25151@www2u.biglobe.ne.jp>
Date: Sat, 17 Feb 2001 01:57:36 +0900 (JST)
From: hsaka
Subject: w3m-m17n & xterm

w3m-m17n の libwc なんだけど、iconv や XPG の wchar の形式に 合わせたい気もする。 ちょっと遅くなりそうなのも気になるけど、 最大の問題は Str を使いたいことなんだよなぁ。
# いや最大の問題は完成できなくなることか(^^;;

久保田さんの XTerm の国際化のための patch がなかなか使える。 iconv が認識するほぼ全ての文字コードが使えるというのはすごいかも。 w3m-m17n のテストに活躍してくれそう。 でも、w3m-m17n も xterm のテストに使えると思うから、良い関係なのかな。
# FreeBSD + iconv-2.0_1 だと少々修正が必要だったけど。


Message-Id: <20010216203034.13854@www2u.biglobe.ne.jp>
Date: Fri, 16 Feb 2001 20:30:34 +0900 (JST)
From: 池上
Subject: いつのまにやら

いつのまにやら掲示板が!早速挨拶。
ぼくも@niftyのcgi(perl)で遊んでますが、
まだ一から(零から?)組んだものはない・・・

引越しですか。寮だっけ?やっぱり年齢制限?
はあ、わたしも1/26で大台にのりました。

でわまた。
                    http://homepage1.nifty.com/georgeMI/

Message-Id: <20010216184342.02053@www2u.biglobe.ne.jp>
Date: Fri, 16 Feb 2001 18:43:42 +0900 (JST)
From: hsaka
Subject: 脱帽

この前、脱帽 したんだけど、 これ を見ると、べつに帽子を脱がなくてもよかったのかな(笑)
Message-Id: <20010215014908.12340@www2u.biglobe.ne.jp>
Date: Thu, 15 Feb 2001 01:49:08 +0900 (JST)
From: hsaka
Subject: iconv & w3m-m17n-0.11

w3m-m17n-0.11 を、とりあえず公開しました。 0.10 が致命的なバグを持っていたので、その fix のみです。

しかし、iconv って変態的な仕様だなぁ。 何で、iconv_open(3) と iconv(3) とで引数の順が逆なの?

  cd = iconv_open("shift_jis", "euc-jp");	/* euc-jp -> shift_jis */
  iconv(cd, &euc_buf, &euc_nbuf, &sjis_buf, &sjis_nbuf);

Message-Id: <20010214015451.22210@www2u.biglobe.ne.jp>
Date: Wed, 14 Feb 2001 01:54:51 +0900 (JST)
From: hsaka
Subject: 「文字の海、ビットの舟」と XMLと文字メーリングリスト

「文字の海、ビットの舟」の小形さんからメールの御返事をもらった。 GB18030 には注目しているとのこと。期待しよう。

また、そのメールで、 XMLと文字メーリングリスト という ML を教えてもらった。 これが無茶苦茶面白い。しばらくログを読ませてもらおう。


Message-Id: <20010212232158.13712@www2u.biglobe.ne.jp>
Date: Mon, 12 Feb 2001 23:21:58 +0900 (JST)
From: hsaka
Subject: "信"と"仁"

引越したら、ISDN にするので Aterm を買った。
で、付属の CD-ROM のマニュアルを見ようと FreeBSD から mount してみたが、
一部のファイル名が変。もちろん、SJIS だから、
  env LANG=ja_JP.SJIS w3m-m17n /cdrom
として見たのだけど、「通信」となるべきが「通仁」になっている。
あとは問題なさそうなんでしばらく悩んだが、
  echo 信仁 | nkf -s | od -c
の結果
  220   M 220   m
を見て納得。case-insensitive で mount されるから SJIS の2バイト目も
問答無用で lowercase にされたんですね。

改めて SJIS で case-insensitive なファイルシステムを構築している
Windows に脱帽。

Message-Id: <20010211031048.06440@www2u.biglobe.ne.jp>
Date: Sun, 11 Feb 2001 03:10:48 +0900 (JST)
From: hsaka
Subject: 引越しの準備

引越しの準備を本格的に始めた。
今度の部屋は広いし窓も大きくていいんだけど、 カーテンの丈が 230cm になってしまい規格外なので高い;_;。 結局、4万円近くかかってしまった…。

ところで、 部屋にある本(中国史系小説、SF、コンピュータ系解説本、マンガ etc.) の数が半端じゃない…。 分かっていたことだけども整理するとなかなか凄いものがある。 特に中国史系のはハードカバーだけで優に 100冊はある。 ホントは HomePage にも中国史の話とかも書きたいんだけど、 他人の役に立つことなんて書けないから…。 コンピュータの話だったら多少は役に立つとは思うから、 どうしてもコンピュータ中心になってしまうんですよね。 ま、ここに適当に書こう。 (そういうネタを書きたいから作ったともいえる^^;)

ちなみに光武帝劉秀陰麗華のカップルが好きなのだ。 悲しいのは彼らの時代に関連した書物がほとんど無いこと。 プロの作家が書いてくれないから、 Web 上で自分で小説を書く人が現れているくらい。


今日、いきなり PC が変な音を立て始めてあせったあせった。 とりあえず backup はとったけれど、そろそろ寿命なのかな。 買ったのは 3年以上前だから、実際よく使ってるよこれ。
Message-Id: <20010210094442.25704@www2u.biglobe.ne.jp>
Date: Sat, 10 Feb 2001 09:44:42 +0900 (JST)
From: sakane
Subject: Re: Where are you?

お家のWindows98なパソコンからです。(^^;
#さて、これから子供の面接に行かねば…

Message-Id: <20010210012143.04355@www2u.biglobe.ne.jp>
Date: Sat, 10 Feb 2001 01:21:43 +0900 (JST)
From: hsaka
Subject: Where are you?

ところで、坂根さん。
どこから書き込んでいるのですか?

Message-Id: <20010210011336.29647@www2u.biglobe.ne.jp>
Date: Sat, 10 Feb 2001 01:13:36 +0900 (JST)
From: hsaka
Subject: Re: IP MessangerのURL

指摘ありがとうございます。
『がんばれ和製オープンソースソフト』では @URL(ソフト名)@ と 書くと、そのソフトのホームページの URL に展開される機構を使っている のですが、@URL(ipmsg)@ と書くべきを @URL(ipsmg)@ と 書いてしまってました。その結果 href="" になってしまい…。
Message-Id: <20010210003621.07923@www2u.biglobe.ne.jp>
Date: Sat, 10 Feb 2001 00:36:21 +0900 (JST)
From: sakane
Subject: IP MessangerのURL

坂根です。

『がんばれ和製オープンソースソフト』の新着情報に書かれている、IP Messanger ver1.42のリンクが、坂本さんのトップページになってました。
http://www.asahi-net.or.jp/~VZ4H-SRUZ/ipmsg.html ですね。

Message-Id: <20010209124817.07711@www2u.biglobe.ne.jp>
Date: Fri, 09 Feb 2001 12:48:17 +0900 (JST)
From: hsaka
Subject: GB18030

文字と言語の実験室 で、 漢字文献情報処理研究会: GB 18030関連情報  なるページを教えてもらった。 GB18030 に関する情報はしばらくここから辿ろう。
# 会員になるのが嫌な訳ではないが、BBS は公開して欲しい。
# 検索エンジンにかからないじゃないか。

GB18030 と JISX0213 を比べて感じるのは、 やはり中国という国は権謀術数にたけた国だということ。 文字数や encoding 法などどうにでもなる。


Message-Id: <20010208215832.18919@www2u.biglobe.ne.jp>
Date: Thu, 08 Feb 2001 21:58:32 +0900 (JST)
From: hsaka
Subject: w3m 連絡帳

w3m 連絡帳 なる web BBS が出来た(^o^)。
Message-Id: <20010208034459.07962@www2u.biglobe.ne.jp>
Date: Thu, 08 Feb 2001 03:44:59 +0900 (JST)
From: hsaka
Subject: 倚天屠龍記(第二巻)

倚天屠龍記(第二巻) をやっと見つけて買って読んだ。 常遇春や朱元璋といった歴史上の人物も登場。でも主人公は弱いまま…。
この金庸の武侠小説を知らない人は徳間書店のホームページ 金庸・武侠小説の世界 を見るべし。 隣の国のこんな面白いものが数年前まで紹介されてないなんてどういうこと? しかし、全小説の全訳を出してくれる徳間書店はえらい。 だんだんと装丁が良くなっているのは売れているからだろうか?
Message-Id: <20010207142943.06001@www2u.biglobe.ne.jp>
Date: Wed, 07 Feb 2001 14:29:43 +0900 (JST)
From: hsaka
Subject: Re: 富豪的プログラミング

なんか無茶苦茶嬉しい(^^)

この掲示板は、富豪的プログラミング でございます。
CGI で動的 HTML 生成なので、きっとサーバに負担を掛けまくってます。

でも大学で使っていたバンド計算プログラムや会社で開発していたプログラムは
配列演算が主でメモリや CPU を大量に消費するので貧乏症が染みついてます。
# 大学だとスパコンが 1〜7円/1sec だったので余計に…

Message-Id: <20010207102553.27638@www2u.biglobe.ne.jp>
Date: Wed, 07 Feb 2001 10:25:53 +0900 (JST)
From: aito
Subject: Re: 富豪的プログラミング

おお,こんなところに.

富豪的プログラミングですが,研究用プログラムでは富豪的に やっています.数回しか走らないプログラムが多いし, メモリは1GBぐらいあるし.プログラムをスクリプト言語で書く のがそもそも富豪的ですよね.

でも普段メールの読み書きに使っているのは HP model712/60 (PA-RISC 60MHz)/メモリ32Mという赤貧マシンなので, ちょっと富豪的にやるのは勘弁...

(しかしw3mはちょっと貧乏症が過ぎるかと最近ちょっと反省して はいるのです.もうちょっと庶民的でもよいかも.)


Message-Id: <20010207021024.19587@www2u.biglobe.ne.jp>
Date: Wed, 07 Feb 2001 02:10:24 +0900 (JST)
From: hsaka
Subject: 最近の w3m の話題

最近の w3m の話題から
w3m-m17n
最近、開発は止まってます。使ってくれている方々すみません。 とりあえず、CP932(MS-Kanji) と JISX0123 なんとかせにゃ (リンク されたりしてるし)。 ただ、厳密に JISX0208/JISX0213/CP932 の区別をやると遅くなるかもしれないのが心配。
kokb24 → 次期正式版
みなさん、お忙しいみたいですね。セキュリティ上の問題とかも出てきたし。 kokb24 が出たら機能 fix してコンパイルのチェックしてバグとって、 リリース!だぁ。あ、これ(↓)もあるなぁ。
ドキュメント(w3m-doc)
そろそろ始まると思うけど、みんな協力してくださいね。
cgimap (w3m-dev-en より)
ああもう、理解してよ。poor な英語だけどさ... これ以上、セキュリティを脆弱にするのは嫌なのよ。 代案だって出してるんだし。
Ruby-regex, jrsearch, incremental search
面白いんだけど...もうちょっと汎用的になったらいいな。 とりあえず正規表現の ( | ) ? + は入れたいな。
backend, w3m.el
-halfdump を使いたい気持ちは理解できるが、 そのために -halfdump の形式を決めるという窮屈な思いはしたくない。
実際、w3m-m17n だと内部コードは外部コマンドが簡単に扱えるものでは なくなっているし、罫線の扱いは内部コード化していたりする (現行版でも罫線の扱いを内部コード化になるかもしれない)。 HTMLページャの実装次第では、 高速化のために、タグベースではなくコンパイルされた様な バイナリコード化されるかもしれないし。 ま、その時は勝手に対応してもらおう。
なんか色々と要望があるんですね。 確かに本体はかなり強固になってきたからなぁ。 でも、まだ細かい(がそれなりに重要な)不具合はあるんですよねぇ。
Message-Id: <20010207011417.23449@www2u.biglobe.ne.jp>
Date: Wed, 07 Feb 2001 01:14:17 +0900 (JST)
From: hsaka
Subject: 日記のはずが...

日記のはずが昨日(2/6)は書いてない...どうでもいいことではあるが。
ま、生まれてこのかた日記帳なんて持ったことのない人だからな。

Message-Id: <20010205215458.09903@www2u.biglobe.ne.jp>
Date: Mon, 05 Feb 2001 21:54:58 +0900 (JST)
From: hsaka
Subject: Re: JVim 3.0-j2.1a

あ、2000/02/03 って書いてしまった。 でも実際にそう書いてあるんだもの(^^;
Message-Id: <20010205214620.12147@www2u.biglobe.ne.jp>
Date: Mon, 05 Feb 2001 21:46:20 +0900 (JST)
From: hsaka
Subject: JVim 3.0-j2.1a

JVim 3.0-j2.1a (2000/02/03) が出てる。 でも、UNIX 用のソース差分はまだみたい。
Message-Id: <20010204231949.23610@www2u.biglobe.ne.jp>
Date: Sun, 04 Feb 2001 23:19:49 +0900 (JST)
From: hsaka
Subject: Character Model for the World Wide Web 1.0

Character Model for the World Wide Web 1.0 について。
内容はともかく、こういう文書で entity 表現ならまだしも、 charset=iso-8859-1 はいかんと思う。 私は w3m-m17n で JIS X 0213 を使って表示させているからなんとか読めるが、 普通の w3m の人とか読めない。
Unicode といいながら ISO-8859-1 だけを特別扱いする、 その感覚で国際化を論じようってんだから。
Message-Id: <20010204222755.17348@www2u.biglobe.ne.jp>
Date: Sun, 04 Feb 2001 22:27:55 +0900 (JST)
From: hsaka
Subject: Re: あれ? Date: が出ない

このサーバって perl4 なのね(;_;)
コンテキスト依存の localtime が使えない。
自前で書きました。

Message-Id: <20010204221113.21066@www2u.biglobe.ne.jp>
From: hsaka
Subject: もっかい



Message-Id: <20010204220946.07357@www2u.biglobe.ne.jp>
From: hsaka
Subject: もっかい



Message-Id: <20010204220755.19323@www2u.biglobe.ne.jp>
From: hsaka
Subject: あれ? Date: が出ない



Message-Id: <20010204202023.13087@www2u.biglobe.ne.jp>
From: hsaka
Subject: 富豪的プログラミング

jrsearch のページからリンクされている 富豪的プログラミング というのを読んだ。
言いたいことは良くわかる(特に UI の貧弱さ)が、 コンピュータの発達とともにユーザの要求も増大しているので、 結局、メモリや実行効率を気にしてつくらないといけないと思う。

というのは建前で、本音としては、 w3m にケンカ売ってる としか思えん。


Message-Id: <20010204051525.15563@www2u.biglobe.ne.jp>
From: hsaka
Subject: 掲示版を作ってみました

掲示版を作ってみました。 aito 連絡帳 をお手本に perl で scratch (車輪の再発明)。
掲示版というより Web日記と化すでしょう(^^)。

# 引越しの用意もせずに何やってんだか。


ホームページへ 新着情報 コンピュータ コラム ダウンロード
用語集(索引) 用語集 プロフィール リンク w3m おぼえがき

このページへのお問い合わせは hsaka@mth.biglobe.ne.jp まで御願いします。