Message-Id: <20020130183701.14875@www2u.biglobe.ne.jp> Date: Wed, 30 Jan 2002 18:37:01 +0900 (JST) From: hsaka Subject: echo $1000000000000000
struct { int i; } *a = NULL; int b = a->i;
Message-Id: <20020130163530.13535@www2u.biglobe.ne.jp> Date: Wed, 30 Jan 2002 16:35:30 +0900 (JST) From: hsaka Subject: mlterm-2.2.0
Message-Id: <20020128150417.20043@www2u.biglobe.ne.jp> Date: Mon, 28 Jan 2002 15:04:17 +0900 (JST) From: hsaka Subject: 縦書き mlterm
Message-Id: <20020120003743.20154@www2u.biglobe.ne.jp> Date: Sun, 20 Jan 2002 00:37:43 +0900 (JST) From: hsaka Subject: Debian GNU / NetBSD
Message-Id: <20020116122748.28159@www2u.biglobe.ne.jp> Date: Wed, 16 Jan 2002 12:27:48 +0900 (JST) From: hsaka Subject: 命名行為
Message-Id: <20020116091902.22277@www2u.biglobe.ne.jp> Date: Wed, 16 Jan 2002 09:19:02 +0900 (JST) From: kubota Subject: 追加
そうか、ソフトウェアを命名するという行為は、じつは圧縮をしていることに他ならないんだ。
Message-Id: <20020116091618.18163@www2u.biglobe.ne.jp> Date: Wed, 16 Jan 2002 09:16:18 +0900 (JST) From: kubota Subject: メール圧縮
どうも。はじめまして (なんちゃって)。こちらは初めてです。
も、けっきょくはふつうの圧縮と変わらないと思う。
「100ビット (2^100 個) の情報」の代わりに、 「1億ビット (2^1億個) の情報」とする (すべてのソフトウェアのサイズは 1 億ビットであると仮定します)。 そうして、そのビット空間の中でもっとも良く使う 200 ビットを、 「メールアドレス + ソフトウェア名」に写像する。 (メールアドレス、ソフトウェア名とも、およそ 100 ビットで表現可能と仮定します)。
もし、1 億ビットで表される表現すべてについて、 実際に誰かが「ソフトウェア」として制作して発表したことがあれば (つまり、世の中に 2^1億種類のソフトウェアがあれば)、 この圧縮は不可能になりますよね。
Message-Id: <20020115163422.25660@www2u.biglobe.ne.jp> Date: Tue, 15 Jan 2002 16:34:22 +0900 (JST) From: 大' Subject: Re: 可逆圧縮で1/100に
黒木のなんでも掲示板(リンク先の掲示は時間順)では,すげない扱いをされてます。(^^;;
個人的には,/. にあった
ってアルゴリズムが広く用いられているという事実が,もっと有名になって欲しいぞ。
Message-Id: <20020114220257.27930@www2u.biglobe.ne.jp> Date: Mon, 14 Jan 2002 22:02:57 +0900 (JST) From: hsaka Subject: 買った本
Message-Id: <20020114212150.24374@www2u.biglobe.ne.jp> Date: Mon, 14 Jan 2002 21:21:50 +0900 (JST) From: hsaka Subject: Re: 可逆圧縮で1/100に
Message-Id: <20020112114551.06242@www2u.biglobe.ne.jp> Date: Sat, 12 Jan 2002 11:45:51 +0900 (JST) From: ogawa Subject: re: 可逆圧縮で1/100に すみません。ツッコミとかじゃなくて、純粋に理解できなかった部分がある ので。 >圧縮というのは、例えば 100bit で表現できる情報の内、もっとも良く使う 10bit >(2^10 個)の情報を、10bit で表現して、それ以外を 100+αbit で表現することで、 ここは、10bit の情報を 1bit (とか、とにかく元の情報よりも少ない bit 数) とかで現して、それ以外を 1 + α bit で現すとかではないでしょうか。 いや、何か全然頓珍漢なことを言っている (俺がね) 気はしてるんですが...
Message-Id: <20020111115105.14669@www2u.biglobe.ne.jp> Date: Fri, 11 Jan 2002 11:51:05 +0900 (JST) From: aito Subject: Re: 1/100
Message-Id: <20020110194609.09851@www2u.biglobe.ne.jp> Date: Thu, 10 Jan 2002 19:46:09 +0900 (JST) From: hsaka Subject: 可逆圧縮で1/100に
本来、例えば 100bit で表現できる全ての情報を、 情報の欠落なく表現するには当然 100bit (以上)必要。 だから、どんな圧縮アルゴリズムであれ、全ての情報を 同率で圧縮することは不可能。 ところが、100bit で表現できる1個の情報なら 1bit だけで表せる。 圧縮というのは、例えば 100bit で表現できる情報の内、 もっとも良く使う 10bit (2^10 個)の情報を、10bit で表現して、 それ以外を 100+αbit で表現することで、もっとも良く使う部分の 圧縮率を 1/10 にしているようなもの。 良く使う部分の使用率が全体の 90% であれば、 平均の圧縮率は (0.9 / 10 + 0.1 / 1) 〜 1 / 5.3 程度になる。 実際には圧縮する部分としない部分に分かれるのではなくて、 重み付けとかしているのだろうけれど。 難しいのは、良く使う部分の選択で、もし最適値を見つけられれば、 圧縮率 1/100 も可能かもしれないとは思いますが、無理っぽい気がする。 圧縮できないめったに使わない部分を 1% 以下にするってのはねぇ。
などと、情報理論とか圧縮アルゴリズムとか全く学んだことのない 人間が書いてみました。(でも、トンデモ系じゃないよ。たぶん。)
Message-Id: <20020109135939.09125@www2u.biglobe.ne.jp> Date: Wed, 09 Jan 2002 13:59:39 +0900 (JST) From: hsaka Subject: dillo & amaya
amaya も入れてみましたが、 エディタ機能はようやるわぁという感じですね。
Message-Id: <20020107024754.09775@www2u.biglobe.ne.jp> Date: Mon, 07 Jan 2002 02:47:54 +0900 (JST) From: yuu Subject: Re: libwcで機種依存文字 >WcOption.fix_width_conv = WC_FALSE; を追加すると >変換できるようになります。 これでいけました。どうもありがとうございます。 >ちなみに、iconv (GNU-libiconv) なら、Shift_JIS の >代わりに CP932 を指定すると機種依存文字が扱えます。 なるほど…。GNU libiconv の位置付けを誤解していたようです。 これをmakeして、生成されたsoをPRELOADすることでも、確かに 機種依存文字を扱えました。
Message-Id: <20020107010241.02847@www2u.biglobe.ne.jp> Date: Mon, 07 Jan 2002 01:02:41 +0900 (JST) From: hsaka Subject: Re: libwcで機種依存文字
WcOption.fix_width_conv = WC_FALSE; を追加すると変換できるようになります。 sjis→utf8 が成功するのは半分バグです(_ _) libwc を使っていただいて嬉しいのですが、 今のところ、w3m 用に色々やっている部分があって、 文字コード変換ライブラリとしてはまだまだと思います。
ちなみに、iconv (GNU-libiconv) なら、Shift_JIS の代わりに CP932 を指定すると機種依存文字が扱えます。
Message-Id: <20020106214225.20581@www2u.biglobe.ne.jp> Date: Sun, 06 Jan 2002 21:42:25 +0900 (JST) From: yuu Subject: libwcで機種依存文字 こんにちわ。初めての書き込みです。 今、GNOMEのlibxml2で遊んでいるのですが、libxml2が呼んで いるiconv(3)では(わたしの環境では)丸付き数字などを扱えない ので、iconv依存部分をlibwcで置換しようとしています。 そこでちょっと教えて頂きたいのですが、 char in[3] = {0x87, 0x40}; /* 'CIRCLED DIGIT ONE' */ wc_ces in_ces = wc_charset_to_ces("shiftjis"); wc_ces out_ces = wc_charset_to_ces("utf8"); Str utf8 = wc_conv(in, in_ces, out_ces); Str sjis = wc_Str_conv(utf8, out_ces, in_ces); などと sjis->utf8->sjis の往復変換をしますと、 map/sjis_ext_ucs.map にリストされているコードポイントのうちいくつ かについては、(sjis->utf8は成功するものの) utf8->sjis 変換で元に戻 らずに 0x3f になってしまいます。 上の 0x8740 (CIRCLED DIGIT ONE) もそんな文字の一つです。うまくいく 文字も多数あります。 libwcのソースコードをあまり読んでいないので恐縮なのですが、もし上の コード片にあきらかなマチガイがありましたらご指摘頂けませんでしょうか.
Message-Id: <20020104003332.22683@www2u.biglobe.ne.jp> Date: Fri, 04 Jan 2002 00:33:32 +0900 (JST) From: hsaka Subject: Re: dillo
ところで、mlterm ですが、 Bidi, Shaping に加えて、最近 ISCII 対応も始まっています。
あ、「;」の件は w3m-dev に投げておきました。
Message-Id: <20020103064030.09158@www2u.biglobe.ne.jp> Date: Thu, 03 Jan 2002 06:40:30 +0900 (JST) From: さかい Subject: Re: dillo
あけましておめでとうございます。
Amayaにもアンカータグやヘッダ要素を別ウィンドウに表示する機能があって、そこから飛ぶことが出来ます。なかなか面白いですよ。
Message-Id: <20020103022259.18229@www2u.biglobe.ne.jp> Date: Thu, 03 Jan 2002 02:22:59 +0900 (JST) From: hsaka Subject: dillo
Message-Id: <20020103015855.10945@www2u.biglobe.ne.jp> Date: Thu, 03 Jan 2002 01:58:55 +0900 (JST) From: hsaka Subject: Re: 明けましておめでとうございます
Message-Id: <20020102213805.26463@www2u.biglobe.ne.jp> Date: Wed, 02 Jan 2002 21:38:05 +0900 (JST) From: Ikegami Subject: 明けましておめでとうございます 今年もよろしくお願いします。 高知に帰省してたんですね。 私もノートPCもって帰省中です。 あったかいと思ってたんだけど、 雪降ってるやん。寒い寒い
Message-Id: <20020101003412.17561@www2u.biglobe.ne.jp> Date: Tue, 01 Jan 2002 00:34:12 +0900 (JST) From: hsaka@高知 Subject: あけましておめでとうございます。