Message-Id: <20010228010908.22502@www2u.biglobe.ne.jp> Date: Wed, 28 Feb 2001 01:09:08 +0900 (JST) From: hsaka Subject: コーディング
Message-Id: <20010226221644.22594@www2u.biglobe.ne.jp> Date: Mon, 26 Feb 2001 22:16:44 +0900 (JST) From: hsaka Subject: 電話が繋がった
Message-Id: <20010226153633.01036@www2u.biglobe.ne.jp> Date: Mon, 26 Feb 2001 15:36:33 +0900 (JST) From: hsaka Subject: Unicode だけではダメな理由
多少の問題は抱えつつも JIS は日本語の表記や通信のために 最適な様に設計されています。 記号の種類や漢字の並びはもとより、 JIS X 0208 の文字の数がわずか 7000 字足らずであることも その一つです(9000 字近い領域があるにも関わらずです。) 文字の数は多ければいいというわけではありません。
従って、Unicode で JIS を置き換えるには、Unicode が JIS より 最適に(正確に低コストで)日本語を扱えなければなりません。 そのためには Unicode は JIS の全ての機能の superset である必要があります。 そして、そうであれば JIS 以外の機能を持っている Unicode が JIS より低コストであることは不可能です。
日本語以外の環境でも全く同じです。 母国語の扱いを犠牲にしてまで他の言語を扱うなんて本末転倒もいいところです。 (そういう意味では GB18030 や ISO/IEC 2022 は健全といえよう。 w3m-m17n も同じポリシー。)
実は最近では、ユーザの立場としては Unicode だけの世界になる なんていう心配はほとんどしなくなりました。 上記の理由で、日本国内では Unicode だけ使えるアプリでは JIS だけ使えるアプリには勝てませんから、Unicode ベースであろうとも JIS も使えるか JIS の機能の superset である様になるはずだからです。 可哀想なのは Unicode (特に 2.0 レベル)だけ実装すれば 世界中どこででも喜んで使ってもらえると信じた(特に欧米の)開発者達ですね。 苦労して Unicode 3.x を実装して、 さらに苦労して各言語に正しく対応してください。 アジアの開発者の苦労が少しは分かると思いますよ(^^;
Message-Id: <20010226101717.04315@www2u.biglobe.ne.jp> Date: Mon, 26 Feb 2001 10:17:17 +0900 (JST) From: haska Subject: 引越済んだ
6年振りの"一人暮らし"ということで、 完全に感覚を忘れていて、次から次へとこまごまとしたものが 無いことに気づいて買いに行っていた週末でした。 # 金銭感覚が麻痺するぅ。
Message-Id: <20010224032614.09637@www2u.biglobe.ne.jp> Date: Sat, 24 Feb 2001 03:26:14 +0900 (JST) From: hsaka Subject: 引越
Message-Id: <20010223182848.26441@www2u.biglobe.ne.jp> Date: Fri, 23 Feb 2001 18:28:48 +0900 (JST) From: hsaka Subject: Unicode Unicode Unicode
私は、Unicode というのは国際英語(≠米語)のようなものだと思っています。 これが存在することで、
しかし、例えば日本語(JISコード)には日本特有かつ必須の機能が自然な形で 盛り込まれているわけであり、それを完全に国際英語(Unicode)で表現するのは 現実的ではありません。 なぜなら完全さを求めると国際英語(Unicode)の存在理由の一つの 比較的簡単という部分が失われます。 従って、国際英語(Unicode)と日本語(JISコード)は共存すべきなのです。
Message-Id: <20010222143554.27424@www2u.biglobe.ne.jp> Date: Thu, 22 Feb 2001 14:35:54 +0900 (JST) From: hsaka Subject: mapping of \
iconv で、
echo '\\' | iconv -f euc-jp -t utf-8
\\
これがバグなのは明らかだが、正しい答えは euc-jp の GL が US-ASCII か JIS X 0201 かという定義により変わってしまう。 そして、その原因は少々複雑。 まず、Unicode と他の文字コードとの間の変換で FULL/HALF width variant を 使う場合は文字集合(CCS)ベースではなく文字コード(CES,charset)ベースであり、 文字集合の規格である Unicode にエンコーディングを含む文字コードを 持ち込んだのが諸悪の根源。 これは、round trip を確保するために必要だったらしいが、 皮肉なことに、上記例の様に round trip を失敗させている原因になっている(^^;。 しかも、http://www.unicode.org/ にあるマッピングテーブルは文字集合ベースだったりするので、 良く理解せずに作ると上記例の様になってしまう。
で、一番の問題は、こういう事は 10年近く前から知られているはずだが、 いまだに根本的な対処(JIS X 0221 を改訂するとか unicode.org のテーブルを 文字コードベースにするとか)がされていないのはなぜ、ってことだな。
PS. なお、良く理解していない頃にコーディングしたため(^^; w3m-m17n も同じですが、修正(?)します。
PS.PS. TR#11 の問題はメールしてみたけど返事がくるかな?
Message-Id: <20010221231223.03987@www2u.biglobe.ne.jp> Date: Wed, 21 Feb 2001 23:12:23 +0900 (JST) From: hsaka Subject: TODO
こんなもんだろう。ま、引っ越してからだな(^^)
Message-Id: <20010221212223.06639@www2u.biglobe.ne.jp> Date: Wed, 21 Feb 2001 21:22:23 +0900 (JST) From: hsaka Subject: VISCII -> CP1258
で、w3m-m17n で VISCII から CP1258 に変換しようとして、 バグってるのが分かった(;_;)。-o pre_conv=0 なら問題ないのだが。
Message-Id: <20010220203656.08088@www2u.biglobe.ne.jp> Date: Tue, 20 Feb 2001 20:36:56 +0900 (JST) From: hsaka Subject: たった2日
最近、やっと ISO/IEC 2022 と Unicode (ISO/IEC 10646) の違いがまとまってきた。 ISO/IEC 2022 は、一つの言語に特化した幾つかのスクリプト からなるかもしれない幾つかの文字集合を切替える規格で、 Unicode は、主要な言語で使用可能な幾つかのスクリプトからなる一つの文字集合 の規格だ。 ちなみに JIS X 0208,0212,0213 は日本語に特化した幾つかのスクリプトからなる 文字集合の規格だ。 だから、基本的に ISO/IEC 2022 の目指すのは多言語化であり、 Unicode の目指すのは、ある言語での多スクリプト化だ。 そのため、現時点での Unicode の実装で多言語化は不可能で 多スクリプト化に過ぎないし、 Unicode で多言語化しようとすると Language Tags が必要というわけだ。 でも、Language Tags なんか入れたら ISO/IEC 2022 より面倒な気がする。 というか、最近の Unicode Technical Reports を、まともに実装するのってアプリケーションには辛すぎないかい?
Message-Id: <20010217015736.25151@www2u.biglobe.ne.jp> Date: Sat, 17 Feb 2001 01:57:36 +0900 (JST) From: hsaka Subject: w3m-m17n & xterm
久保田さんの XTerm の国際化のための patch がなかなか使える。 iconv が認識するほぼ全ての文字コードが使えるというのはすごいかも。 w3m-m17n のテストに活躍してくれそう。 でも、w3m-m17n も xterm のテストに使えると思うから、良い関係なのかな。 # FreeBSD + iconv-2.0_1 だと少々修正が必要だったけど。
Message-Id: <20010216203034.13854@www2u.biglobe.ne.jp> Date: Fri, 16 Feb 2001 20:30:34 +0900 (JST) From: 池上 Subject: いつのまにやら いつのまにやら掲示板が!早速挨拶。 ぼくも@niftyのcgi(perl)で遊んでますが、 まだ一から(零から?)組んだものはない・・・ 引越しですか。寮だっけ?やっぱり年齢制限? はあ、わたしも1/26で大台にのりました。 でわまた。 http://homepage1.nifty.com/georgeMI/
Message-Id: <20010216184342.02053@www2u.biglobe.ne.jp> Date: Fri, 16 Feb 2001 18:43:42 +0900 (JST) From: hsaka Subject: 脱帽
Message-Id: <20010215014908.12340@www2u.biglobe.ne.jp> Date: Thu, 15 Feb 2001 01:49:08 +0900 (JST) From: hsaka Subject: iconv & w3m-m17n-0.11
しかし、iconv って変態的な仕様だなぁ。 何で、iconv_open(3) と iconv(3) とで引数の順が逆なの?
cd = iconv_open("shift_jis", "euc-jp"); /* euc-jp -> shift_jis */ iconv(cd, &euc_buf, &euc_nbuf, &sjis_buf, &sjis_nbuf);
Message-Id: <20010214015451.22210@www2u.biglobe.ne.jp> Date: Wed, 14 Feb 2001 01:54:51 +0900 (JST) From: hsaka Subject: 「文字の海、ビットの舟」と XMLと文字メーリングリスト
また、そのメールで、 XMLと文字メーリングリスト という ML を教えてもらった。 これが無茶苦茶面白い。しばらくログを読ませてもらおう。
Message-Id: <20010212232158.13712@www2u.biglobe.ne.jp> Date: Mon, 12 Feb 2001 23:21:58 +0900 (JST) From: hsaka Subject: "信"と"仁" 引越したら、ISDN にするので Aterm を買った。 で、付属の CD-ROM のマニュアルを見ようと FreeBSD から mount してみたが、 一部のファイル名が変。もちろん、SJIS だから、 env LANG=ja_JP.SJIS w3m-m17n /cdrom として見たのだけど、「通信」となるべきが「通仁」になっている。 あとは問題なさそうなんでしばらく悩んだが、 echo 信仁 | nkf -s | od -c の結果 220 M 220 m を見て納得。case-insensitive で mount されるから SJIS の2バイト目も 問答無用で lowercase にされたんですね。 改めて SJIS で case-insensitive なファイルシステムを構築している Windows に脱帽。
Message-Id: <20010211031048.06440@www2u.biglobe.ne.jp> Date: Sun, 11 Feb 2001 03:10:48 +0900 (JST) From: hsaka Subject: 引越しの準備
ところで、 部屋にある本(中国史系小説、SF、コンピュータ系解説本、マンガ etc.) の数が半端じゃない…。 分かっていたことだけども整理するとなかなか凄いものがある。 特に中国史系のはハードカバーだけで優に 100冊はある。 ホントは HomePage にも中国史の話とかも書きたいんだけど、 他人の役に立つことなんて書けないから…。 コンピュータの話だったら多少は役に立つとは思うから、 どうしてもコンピュータ中心になってしまうんですよね。 ま、ここに適当に書こう。 (そういうネタを書きたいから作ったともいえる^^;)
ちなみに光武帝劉秀と陰麗華のカップルが好きなのだ。 悲しいのは彼らの時代に関連した書物がほとんど無いこと。 プロの作家が書いてくれないから、 Web 上で自分で小説を書く人が現れているくらい。
Message-Id: <20010210094442.25704@www2u.biglobe.ne.jp> Date: Sat, 10 Feb 2001 09:44:42 +0900 (JST) From: sakane Subject: Re: Where are you? お家のWindows98なパソコンからです。(^^; #さて、これから子供の面接に行かねば…
Message-Id: <20010210012143.04355@www2u.biglobe.ne.jp> Date: Sat, 10 Feb 2001 01:21:43 +0900 (JST) From: hsaka Subject: Where are you? ところで、坂根さん。 どこから書き込んでいるのですか?
Message-Id: <20010210011336.29647@www2u.biglobe.ne.jp> Date: Sat, 10 Feb 2001 01:13:36 +0900 (JST) From: hsaka Subject: Re: IP MessangerのURL
Message-Id: <20010210003621.07923@www2u.biglobe.ne.jp> Date: Sat, 10 Feb 2001 00:36:21 +0900 (JST) From: sakane Subject: IP MessangerのURL
Message-Id: <20010209124817.07711@www2u.biglobe.ne.jp> Date: Fri, 09 Feb 2001 12:48:17 +0900 (JST) From: hsaka Subject: GB18030
GB18030 と JISX0213 を比べて感じるのは、 やはり中国という国は権謀術数にたけた国だということ。 文字数や encoding 法などどうにでもなる。
Message-Id: <20010208215832.18919@www2u.biglobe.ne.jp> Date: Thu, 08 Feb 2001 21:58:32 +0900 (JST) From: hsaka Subject: w3m 連絡帳
Message-Id: <20010208034459.07962@www2u.biglobe.ne.jp> Date: Thu, 08 Feb 2001 03:44:59 +0900 (JST) From: hsaka Subject: 倚天屠龍記(第二巻)
Message-Id: <20010207142943.06001@www2u.biglobe.ne.jp> Date: Wed, 07 Feb 2001 14:29:43 +0900 (JST) From: hsaka Subject: Re: 富豪的プログラミング なんか無茶苦茶嬉しい(^^) この掲示板は、富豪的プログラミング でございます。 CGI で動的 HTML 生成なので、きっとサーバに負担を掛けまくってます。 でも大学で使っていたバンド計算プログラムや会社で開発していたプログラムは 配列演算が主でメモリや CPU を大量に消費するので貧乏症が染みついてます。 # 大学だとスパコンが 1〜7円/1sec だったので余計に…
Message-Id: <20010207102553.27638@www2u.biglobe.ne.jp> Date: Wed, 07 Feb 2001 10:25:53 +0900 (JST) From: aito Subject: Re: 富豪的プログラミング
富豪的プログラミングですが,研究用プログラムでは富豪的に やっています.数回しか走らないプログラムが多いし, メモリは1GBぐらいあるし.プログラムをスクリプト言語で書く のがそもそも富豪的ですよね.
でも普段メールの読み書きに使っているのは HP model712/60 (PA-RISC 60MHz)/メモリ32Mという赤貧マシンなので, ちょっと富豪的にやるのは勘弁...
(しかしw3mはちょっと貧乏症が過ぎるかと最近ちょっと反省して はいるのです.もうちょっと庶民的でもよいかも.)
Message-Id: <20010207021024.19587@www2u.biglobe.ne.jp> Date: Wed, 07 Feb 2001 02:10:24 +0900 (JST) From: hsaka Subject: 最近の w3m の話題
Message-Id: <20010207011417.23449@www2u.biglobe.ne.jp> Date: Wed, 07 Feb 2001 01:14:17 +0900 (JST) From: hsaka Subject: 日記のはずが... 日記のはずが昨日(2/6)は書いてない...どうでもいいことではあるが。 ま、生まれてこのかた日記帳なんて持ったことのない人だからな。
Message-Id: <20010205215458.09903@www2u.biglobe.ne.jp> Date: Mon, 05 Feb 2001 21:54:58 +0900 (JST) From: hsaka Subject: Re: JVim 3.0-j2.1a
Message-Id: <20010205214620.12147@www2u.biglobe.ne.jp> Date: Mon, 05 Feb 2001 21:46:20 +0900 (JST) From: hsaka Subject: JVim 3.0-j2.1a
Message-Id: <20010204231949.23610@www2u.biglobe.ne.jp> Date: Sun, 04 Feb 2001 23:19:49 +0900 (JST) From: hsaka Subject: Character Model for the World Wide Web 1.0
Message-Id: <20010204222755.17348@www2u.biglobe.ne.jp> Date: Sun, 04 Feb 2001 22:27:55 +0900 (JST) From: hsaka Subject: Re: あれ? Date: が出ない このサーバって perl4 なのね(;_;) コンテキスト依存の localtime が使えない。 自前で書きました。
Message-Id: <20010204221113.21066@www2u.biglobe.ne.jp> From: hsaka Subject: もっかい
Message-Id: <20010204220946.07357@www2u.biglobe.ne.jp> From: hsaka Subject: もっかい
Message-Id: <20010204220755.19323@www2u.biglobe.ne.jp> From: hsaka Subject: あれ? Date: が出ない
Message-Id: <20010204202023.13087@www2u.biglobe.ne.jp> From: hsaka Subject: 富豪的プログラミング
というのは建前で、本音としては、 w3m にケンカ売ってる としか思えん。
Message-Id: <20010204051525.15563@www2u.biglobe.ne.jp> From: hsaka Subject: 掲示版を作ってみました
# 引越しの用意もせずに何やってんだか。