掲示板 - 2002年1月の Messages

 
Message-Id: <20020130183701.14875@www2u.biglobe.ne.jp>
Date: Wed, 30 Jan 2002 18:37:01 +0900 (JST)
From: hsaka
Subject: echo $1000000000000000

csh/tcsh で echo $1000000000000000 とかやると落ちるらしい。 確かに、落ちる。 ソースを見れば一目なんだけど、こんなバグが残ってるんだねぇ。 EWS4800 は平気だけど、修正されているんではなくて、こんなの
  struct { int i; } *a = NULL;
  int b = a->i;
が落ちないだけ。これはこれでどうかと思うが。
Message-Id: <20020130163530.13535@www2u.biglobe.ne.jp>
Date: Wed, 30 Jan 2002 16:35:30 +0900 (JST)
From: hsaka
Subject: mlterm-2.2.0

mlterm 2.2.0 がリリースされました。 /.J にもタレコみあり
Message-Id: <20020128150417.20043@www2u.biglobe.ne.jp>
Date: Mon, 28 Jan 2002 15:04:17 +0900 (JST)
From: hsaka
Subject: 縦書き mlterm

mlterm縦書き対応が入るとのこと(サンプル画像付き)。
Message-Id: <20020120003743.20154@www2u.biglobe.ne.jp>
Date: Sun, 20 Jan 2002 00:37:43 +0900 (JST)
From: hsaka
Subject: Debian GNU / NetBSD

Debian GNU / NetBSD。 でも、僕は、{Free,Net,Open}BSD や商用 UNIX と Linux の違いは、 OS としてのベースシステムがあるかないか(kernel と同期させて管理しているか) どうかだと思っていて、前者がいいと思っているので、 どっちかっていうと、*BSD / Linux が欲しい。 確かに、Debian は、 全てのソフトウェアを管理しようとしているけれど、 リソース的に難しいのじゃないかな。
Message-Id: <20020116122748.28159@www2u.biglobe.ne.jp>
Date: Wed, 16 Jan 2002 12:27:48 +0900 (JST)
From: hsaka
Subject: 命名行為

> ソフトウェアを命名するという行為は、じつは圧縮をしている
ですね。ソフトウェアにかぎらず。
言葉の圧縮率ってすごいのかも。可逆じゃないことも多いけどさ(^^;
Message-Id: <20020116091902.22277@www2u.biglobe.ne.jp>
Date: Wed, 16 Jan 2002 09:19:02 +0900 (JST)
From: kubota
Subject: 追加

そうか、ソフトウェアを命名するという行為は、じつは圧縮をしていることに他ならないんだ。


Message-Id: <20020116091618.18163@www2u.biglobe.ne.jp>
Date: Wed, 16 Jan 2002 09:16:18 +0900 (JST)
From: kubota
Subject: メール圧縮

どうも。はじめまして (なんちゃって)。こちらは初めてです。

  1. オリジナルの作者のメールアドレスを返す。
  2. 展開時に、作者に「もう一度送れ」とメールを投げる。

も、けっきょくはふつうの圧縮と変わらないと思う。

「100ビット (2^100 個) の情報」の代わりに、 「1億ビット (2^1億個) の情報」とする (すべてのソフトウェアのサイズは 1 億ビットであると仮定します)。 そうして、そのビット空間の中でもっとも良く使う 200 ビットを、 「メールアドレス + ソフトウェア名」に写像する。 (メールアドレス、ソフトウェア名とも、およそ 100 ビットで表現可能と仮定します)。

もし、1 億ビットで表される表現すべてについて、 実際に誰かが「ソフトウェア」として制作して発表したことがあれば (つまり、世の中に 2^1億種類のソフトウェアがあれば)、 この圧縮は不可能になりますよね。


Message-Id: <20020115163422.25660@www2u.biglobe.ne.jp>
Date: Tue, 15 Jan 2002 16:34:22 +0900 (JST)
From: 大'
Subject: Re: 可逆圧縮で1/100に

黒木のなんでも掲示板(リンク先の掲示は時間順)では,すげない扱いをされてます。(^^;;

個人的には,/. にあった

  1. オリジナルの作者のメールアドレスを返す。
  2. 展開時に、作者に「もう一度送れ」とメールを投げる。

ってアルゴリズムが広く用いられているという事実が,もっと有名になって欲しいぞ。


Message-Id: <20020114220257.27930@www2u.biglobe.ne.jp>
Date: Mon, 14 Jan 2002 22:02:57 +0900 (JST)
From: hsaka
Subject: 買った本

2002 年になってから買った本 作者が楽しんで書いていると思われるのがいい。 さて、何から読むかな。
Message-Id: <20020114212150.24374@www2u.biglobe.ne.jp>
Date: Mon, 14 Jan 2002 21:21:50 +0900 (JST)
From: hsaka
Subject: Re: 可逆圧縮で1/100に

言葉足らずでした。
『10bit (2^10 個)の情報』というのは『100bit で表現される 2^10 通りの情報』 という意味です。 これを表現するには少なくとも 10bit 必要です。
『それ以外』というのは、『それ以外の 2^100 - 2^10 通りの情報』という意味です。 これを表現するには少なくとも log2(2^100 - 2^10) bit = 100bit 必要です。
『α』としたのは両者の判別に必要だからです。
Message-Id: <20020112114551.06242@www2u.biglobe.ne.jp>
Date: Sat, 12 Jan 2002 11:45:51 +0900 (JST)
From: ogawa
Subject: re: 可逆圧縮で1/100に

すみません。ツッコミとかじゃなくて、純粋に理解できなかった部分がある
ので。

>圧縮というのは、例えば 100bit で表現できる情報の内、もっとも良く使う 10bit
>(2^10 個)の情報を、10bit で表現して、それ以外を 100+αbit で表現することで、

ここは、10bit の情報を 1bit (とか、とにかく元の情報よりも少ない bit
数) とかで現して、それ以外を 1 + α bit で現すとかではないでしょうか。

いや、何か全然頓珍漢なことを言っている (俺がね) 気はしてるんですが...

Message-Id: <20020111115105.14669@www2u.biglobe.ne.jp>
Date: Fri, 11 Jan 2002 11:51:05 +0900 (JST)
From: aito
Subject: Re: 1/100

フラクタル圧縮の一種かなあ.
Message-Id: <20020110194609.09851@www2u.biglobe.ne.jp>
Date: Thu, 10 Jan 2002 19:46:09 +0900 (JST)
From: hsaka
Subject: 可逆圧縮で1/100に

/.J でも取り上げられている 「100分の1以下を実現するデータ圧縮の新技術」。 まあ、これの真偽はともかく、コメントにある THcomp。 ネタだけど圧縮の本質はこれ。

本来、例えば 100bit で表現できる全ての情報を、 情報の欠落なく表現するには当然 100bit (以上)必要。 だから、どんな圧縮アルゴリズムであれ、全ての情報を 同率で圧縮することは不可能。 ところが、100bit で表現できる1個の情報なら 1bit だけで表せる。
圧縮というのは、例えば 100bit で表現できる情報の内、 もっとも良く使う 10bit (2^10 個)の情報を、10bit で表現して、 それ以外を 100+αbit で表現することで、もっとも良く使う部分の 圧縮率を 1/10 にしているようなもの。 良く使う部分の使用率が全体の 90% であれば、 平均の圧縮率は (0.9 / 10 + 0.1 / 1) 〜 1 / 5.3 程度になる。 実際には圧縮する部分としない部分に分かれるのではなくて、 重み付けとかしているのだろうけれど。
難しいのは、良く使う部分の選択で、もし最適値を見つけられれば、 圧縮率 1/100 も可能かもしれないとは思いますが、無理っぽい気がする。 圧縮できないめったに使わない部分を 1% 以下にするってのはねぇ。

などと、情報理論とか圧縮アルゴリズムとか全く学んだことのない 人間が書いてみました。(でも、トンデモ系じゃないよ。たぶん。)


Message-Id: <20020109135939.09125@www2u.biglobe.ne.jp>
Date: Wed, 09 Jan 2002 13:59:39 +0900 (JST)
From: hsaka
Subject: dillo & amaya

dillo ですが http://www.todo.org/download/dillo/ に、別の日本語(国際化) patch がある様ですね。 FreeBSD だと、make がちっくと面倒だったのだけど。
もっとも、個人的には、w3m/w3m-m17n/w3m-img と Mozilla/I/E との間にすき間がないので使わないと思いますが。

amaya も入れてみましたが、 エディタ機能はようやるわぁという感じですね。


Message-Id: <20020107024754.09775@www2u.biglobe.ne.jp>
Date: Mon, 07 Jan 2002 02:47:54 +0900 (JST)
From: yuu
Subject: Re: libwcで機種依存文字

>WcOption.fix_width_conv = WC_FALSE; を追加すると
>変換できるようになります。
これでいけました。どうもありがとうございます。

>ちなみに、iconv (GNU-libiconv) なら、Shift_JIS の
>代わりに CP932 を指定すると機種依存文字が扱えます。
なるほど…。GNU libiconv の位置付けを誤解していたようです。
これをmakeして、生成されたsoをPRELOADすることでも、確かに
機種依存文字を扱えました。

Message-Id: <20020107010241.02847@www2u.biglobe.ne.jp>
Date: Mon, 07 Jan 2002 01:02:41 +0900 (JST)
From: hsaka
Subject: Re: libwcで機種依存文字

yuu さん、はじめまして。

WcOption.fix_width_conv = WC_FALSE; を追加すると変換できるようになります。 sjis→utf8 が成功するのは半分バグです(_ _)
libwc を使っていただいて嬉しいのですが、 今のところ、w3m 用に色々やっている部分があって、 文字コード変換ライブラリとしてはまだまだと思います。

ちなみに、iconv (GNU-libiconv) なら、Shift_JIS の代わりに CP932 を指定すると機種依存文字が扱えます。


Message-Id: <20020106214225.20581@www2u.biglobe.ne.jp>
Date: Sun, 06 Jan 2002 21:42:25 +0900 (JST)
From: yuu
Subject: libwcで機種依存文字

こんにちわ。初めての書き込みです。

今、GNOMEのlibxml2で遊んでいるのですが、libxml2が呼んで
いるiconv(3)では(わたしの環境では)丸付き数字などを扱えない
ので、iconv依存部分をlibwcで置換しようとしています。

そこでちょっと教えて頂きたいのですが、

  char in[3] = {0x87, 0x40};  /* 'CIRCLED DIGIT ONE' */
  wc_ces in_ces = wc_charset_to_ces("shiftjis"); 
  wc_ces out_ces = wc_charset_to_ces("utf8");
  Str utf8 = wc_conv(in, in_ces, out_ces);
  Str sjis = wc_Str_conv(utf8, out_ces, in_ces);

などと sjis->utf8->sjis の往復変換をしますと、
map/sjis_ext_ucs.map にリストされているコードポイントのうちいくつ
かについては、(sjis->utf8は成功するものの) utf8->sjis 変換で元に戻
らずに 0x3f になってしまいます。
上の 0x8740 (CIRCLED DIGIT ONE) もそんな文字の一つです。うまくいく
文字も多数あります。

libwcのソースコードをあまり読んでいないので恐縮なのですが、もし上の
コード片にあきらかなマチガイがありましたらご指摘頂けませんでしょうか.

Message-Id: <20020104003332.22683@www2u.biglobe.ne.jp>
Date: Fri, 04 Jan 2002 00:33:32 +0900 (JST)
From: hsaka
Subject: Re: dillo

さかいさん、あけましておめでとうございます。
Amaya ですか。全く試したことはないのですが、今度、遊んでみます。
# Homepage が charset=iso-8859-1 なのは、なんか悲しい。

ところで、mlterm ですが、 Bidi, Shaping に加えて、最近 ISCII 対応も始まっています。

あ、「;」の件w3m-dev に投げておきました


Message-Id: <20020103064030.09158@www2u.biglobe.ne.jp>
Date: Thu, 03 Jan 2002 06:40:30 +0900 (JST)
From: さかい
Subject: Re: dillo

あけましておめでとうございます。

Amayaにもアンカータグやヘッダ要素を別ウィンドウに表示する機能があって、そこから飛ぶことが出来ます。なかなか面白いですよ。


Message-Id: <20020103022259.18229@www2u.biglobe.ne.jp>
Date: Thu, 03 Jan 2002 02:22:59 +0900 (JST)
From: hsaka
Subject: dillo

dillo にメニューからアンカータグに飛べる機能があるという話を読んだので、 ちょっと見てみると、 アンカータグ(<a name=???>〜</a?>)じゃなくて ヘッダ要素(<h?>〜</h?>)に飛べる様。
便利そうな気もするなぁ。w3m にも入れてみようかな。
Message-Id: <20020103015855.10945@www2u.biglobe.ne.jp>
Date: Thu, 03 Jan 2002 01:58:55 +0900 (JST)
From: hsaka
Subject: Re: 明けましておめでとうございます

> 今年もよろしくお願いします。
> 高知に帰省してたんですね。
どもども。今年もよろしくお願いします。
帰省してほとんど寝てました(^^; 明日(今日ともいうが)の夕方、神奈川へ帰ります。
Message-Id: <20020102213805.26463@www2u.biglobe.ne.jp>
Date: Wed, 02 Jan 2002 21:38:05 +0900 (JST)
From: Ikegami
Subject: 明けましておめでとうございます

今年もよろしくお願いします。
高知に帰省してたんですね。

私もノートPCもって帰省中です。
あったかいと思ってたんだけど、
雪降ってるやん。寒い寒い

Message-Id: <20020101003412.17561@www2u.biglobe.ne.jp>
Date: Tue, 01 Jan 2002 00:34:12 +0900 (JST)
From: hsaka@高知
Subject: あけましておめでとうございます。

あけましておめでとうございます。
今年もよろしくおねがいいたします。

ホームページへ 新着情報 コンピュータ コラム ダウンロード
用語集(索引) 用語集 プロフィール リンク w3m おぼえがき

このページへのお問い合わせは hsaka@mth.biglobe.ne.jp まで御願いします。